中国建成8000万词级蒙古语语料库
23.01.2016 11:43
本文来源: 内蒙古新闻网
新华社呼和浩特1月22日电(记者勿日汗) 经过10年的搜集、标注和撰写,中国已建成8000万词级蒙古语语料库。目前,这个语料库已上线运行。
记者从内蒙古自治区社会科学院了解到,2005年启动的蒙古语语料库建设工程,计划用20年建成中国首个2亿词级的蒙古语、达斡尔语、鄂温克语、鄂伦春语大型综合性语料库。工程分2期进行,目前,一期工程已完成,二期工程开始实施。
蒙古语语料库建设工程实施的10年间,课题组在使用蒙古语的中国8个省区、蒙古国的5个省市、俄罗斯布里亚特共和国和卡尔梅克共和国境内的97个采集点,搜集了6725人共4192小时的自然口语语料和4000多小时的书面语料,建成8000万词级蒙古语语料库。
据了解,蒙古语语料库建设工程将为抢救濒危民族语言、保护弱势语言、保存开发利用蒙古语等少数民族语言资源提供基础,并为蒙古语等少数民族语言文字的规范化、信息化提供一个理想的信息资源。
[责任编辑 魏佩 ]
本文来源: 内蒙古新闻网
23.01.2016 11:43
故
事
内蒙古总工会启动2018年“北疆工匠”选树活动
内蒙古自治区总工会日前启动2018年“北疆工匠内蒙古新闻网
大风!沙尘!大雪!内蒙古的天气突变,未来几天天气是这样的…
原标题:今起3天内蒙古中西部地区仍扬沙
内蒙古新闻网