基于语言模型的跨汉蒙信息检索技术研究

代理获取

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

随着Internet的发展及信息的全球化，人们对不同语言的信息需求越来越多。对于大多数不精通外语的用户来说，想要获取需求的信息存在一定的难度。因此有研究者提出了对跨语言信息检索的研究，目前在汉英等语言的跨语言检索方面已经有很多研究成果。但是，在蒙古文方面相关的检索还很少。而蒙古文是世界上很有影响力的语言，因此蒙古文信息检索的研究具有非常重要的意义。
　　影响一个跨语言信息检索系统的性能有很多因素，但最主要的是信息检索模型，其研究内容包括文档和查询的表示方法、评价文档和用户查询相关性的匹配策略、查询结果的排序方法和用户进行相关度反馈的机制。
　　由于查询扩展方法的好坏直接影响到检索的效果，因此本文提出了基于关联词与共现距离相结合的查询扩展方法，解决汉语查询项到蒙古文查询项进而到蒙古文文档的检索。在本论文中，我们是利用双语汉蒙词典和蒙汉词典对初始汉语查询项进行关联词的扩展，然后再利用共现距离模型对扩展后的蒙古文查询项进行再扩展，最后检索蒙古文文档，得出检索结果。
　　实验结果表明，蒙古文停用词表有效减少了索引大小，使用stemming规则使得索引中的Term个数减少了将近一半，并有效提高了检索的准确率和查全率；本文提出的基于关联词和共现距离相结合的查询扩展方法在查全率、平均准确率等方面均有一定的改善，有效提高了跨汉蒙信息检索的性能。

著录项

作者
巩文婧;
展开▼
作者单位

内蒙古大学;

展开▼
授予单位内蒙古大学;
学科计算机应用技术
授予学位硕士
导师姓名侯宏旭;
年度 2012
页码
总页数
原文格式 PDF
正文语种中文
中图分类检索机;
关键词
跨汉蒙信息检索; 查询翻译优化; stemming规则; 匹配策略; 查询结果;

相似文献

中文文献
外文文献
专利

1. 基于自注意力机制预训练跨蒙汉语言模型 [J] . 苏依拉 ,高芬 ,牛向华 . 计算机应用与软件 . 2021,第002期
2. 蒙汉跨语言信息检索在数字图书馆中的应用研究 [J] . 塔娜 . 呼伦贝尔学院学报 . 2012,第005期
3. 基于位置语言模型的中文信息检索系统的研究 [J] . 陈雅兰 ,胡小华 ,涂新辉 . 计算机科学 . 2015,第007期
4. 基于统计语言模型的信息检索演进探析 [J] . 李进华 ,周朴雄 . 图书情报知识 . 2010,第003期
5. 基于语言模型的信息检索研究 [J] . 康恺 . 科技风 . 2010,第023期
6. 基于RNN的蒙汉机器翻译语言模型的研究 [C] . JIYa-tu ,吉亚图 ,SUYi-la . 2016年全国高性能计算学术年会 . 2016
7. 跨汉蒙语文信息检索中的查询项翻译方法研究 [A] . 姜鑫 . 2011

基于语言模型的跨汉蒙信息检索技术研究

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅