首页> 中文学位 >基于语言模型的跨汉蒙信息检索技术研究
【6h】

基于语言模型的跨汉蒙信息检索技术研究

代理获取

摘要

随着Internet的发展及信息的全球化,人们对不同语言的信息需求越来越多。对于大多数不精通外语的用户来说,想要获取需求的信息存在一定的难度。因此有研究者提出了对跨语言信息检索的研究,目前在汉英等语言的跨语言检索方面已经有很多研究成果。但是,在蒙古文方面相关的检索还很少。而蒙古文是世界上很有影响力的语言,因此蒙古文信息检索的研究具有非常重要的意义。
   影响一个跨语言信息检索系统的性能有很多因素,但最主要的是信息检索模型,其研究内容包括文档和查询的表示方法、评价文档和用户查询相关性的匹配策略、查询结果的排序方法和用户进行相关度反馈的机制。
   由于查询扩展方法的好坏直接影响到检索的效果,因此本文提出了基于关联词与共现距离相结合的查询扩展方法,解决汉语查询项到蒙古文查询项进而到蒙古文文档的检索。在本论文中,我们是利用双语汉蒙词典和蒙汉词典对初始汉语查询项进行关联词的扩展,然后再利用共现距离模型对扩展后的蒙古文查询项进行再扩展,最后检索蒙古文文档,得出检索结果。
   实验结果表明,蒙古文停用词表有效减少了索引大小,使用stemming规则使得索引中的Term个数减少了将近一半,并有效提高了检索的准确率和查全率;本文提出的基于关联词和共现距离相结合的查询扩展方法在查全率、平均准确率等方面均有一定的改善,有效提高了跨汉蒙信息检索的性能。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号