依存语言模型在信息检索中的应用研究

代理获取

页面导航

目录
摘要
著录项
引文网络
相似文献
相关主题

摘要

统计语言模型是上世纪80年代兴起的语言建模方法.经过20多年的发展,它已经渗透到了计算语言学的各个层面,并且在以下各个领域都取得了极大的成功,如语音识别、手写识别、机器翻译、信息检索、中文自动分词、亚洲语言输入等.然而传统意义上的统计语言模型,也即n-gram模型,仅仅考虑了先后相邻的n个词之间的关系,即依据前面已经出现的词来预测下一个要出现的词,这样,在构建模型时便丢失了许多有用的信息,如词法关系、词之间的组合、共现信息及其邻接关系信息等,导致模型性能下降.该文提出了一种新颖的通过依存语言模型进行信息检索的方法,该方法在Unigram模型的基础上,引进词汇之间的链接关系作为其依存信息,并用于语言模型构建过程中.我们认为,句子里词与词之间的所有链接关系形成了无向、无环的平面图,基于此,文档生成查询的过程可分为两个步骤:首先是生成词与词之间的链接关系,其次,根据链接关系产生具体的词.同时,该文还解决了传统依存模型中存在的依存关系表征及其规范化的问题.在语言模型训练过程中,将无监督性的依存关系抽取过程与不同的语言模型统计平滑技术相结合,使得依存语言模型在信息检索领域获得成功的应用.通过在TREC文档集上进行实验,结果表明:依存语言模型较Unigram语言模型和经典的概率统计模型,在检索结果上有了统计意义上的显著提高.

著录项

作者
吴光远;
展开▼
作者单位

天津大学;

展开▼
授予单位天津大学;
学科计算机应用技术
授予学位硕士
导师姓名何丕廉;
年度 2004
页码
总页数
原文格式 PDF
正文语种中文
中图分类检索机;
关键词
语言模型; n-gram模型; 依存语言模型; 统计平滑; 信息检索;

相似文献

中文文献
外文文献
专利

1. 语言模型在信息检索中的应用 [J] . 苏绥 ,林原 ,林鸿飞 . 情报学报 . 2011,第007期
2. 统计语言模型在信息检索中的应用 [J] . 赵正文 ,康耀红 . 计算机工程与应用 . 2006,第036期
3. 统计语言模型在文本信息检索中的应用 [J] . 王志勇 ,耿亦兵 . 中国索引 . 2003,第001期
4. 依存句法语言模型对短语统计机器翻译性能的影响 [J] . 董人菘 ,王华 ,张晓钟 . 计算机科学 . 2014,第002期
5. 融合主题与语言模型的蒙古文信息检索方法研究 [J] . 斯日古楞 ,林民 ,田长波 . 计算机应用研究 . 2016,第012期
6. 信息检索中基于MLS的语言模型准确性分析 [C] . 蔡勋梁 ,赵军 . 中国中文信息学会二十五周年学术会议 . 2006
7. 基于依存关系语言模型的应用研究 [A] . 许亚堃 . 2012

依存语言模型在信息检索中的应用研究

目录

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅