首頁>要聞 要聞
我國將打造1.2億詞級蒙古文文獻語料庫
新華社呼和浩特11月23日電(記者勿日汗)我國正在建設(shè)一個總字數(shù)將達到1.2億詞的大型蒙古文文獻語料庫,目前已完成800萬字語料的錄入校對工作。
記者從承擔(dān)這項工作的內(nèi)蒙古自治區(qū)社會科學(xué)院了解到,蒙古文文獻語料庫,將窮盡式收集和納入自蒙古文第一部文獻《成吉思汗碑文》(1225年)以來的中世紀傳統(tǒng)蒙古文文獻和近代蒙古文木刻本文獻。對于現(xiàn)代文獻,將按學(xué)科分類,即按法律法規(guī)、文學(xué)藝術(shù)、新聞媒體、醫(yī)藥醫(yī)學(xué)、應(yīng)用公文、教學(xué)教材、軍事、體育等擇優(yōu)選錄。
蒙古文文獻語料庫建設(shè)將通過錄入、校對、數(shù)據(jù)標(biāo)注加工等環(huán)節(jié),按照國際領(lǐng)先水準(zhǔn),設(shè)計蒙古文語料資源管理平臺網(wǎng)絡(luò)版。其最終目標(biāo)是建成世界最大、最全、最精的網(wǎng)絡(luò)版蒙古文文獻語料庫,為保護、開發(fā)、利用蒙古文文獻資料提供基礎(chǔ)。
2015年策劃開展的這項工作將于2024年結(jié)束。目前,正在進行共109卷的佛教經(jīng)典蒙古文《甘珠爾經(jīng)》的錄入工作。
編輯:曾珂
關(guān)鍵詞:我國將打造1.2億詞級蒙古文文獻語料庫