基于文本检索的深度关联匹配模型算法的研究与改进

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着网络通信以及电子商务的高速发展，互联网已成为人们生活与工作获取信息的重要途径。对于互联网这个巨大的资源库，若缺乏有效的检索工具，人们很难从其中检索出自身所需的信息。为了提升检索有效信息的速度，减少人们检索信息的难度，信息检索系统由此而生。　　文本匹配在信息检索系统中占领着重要地位。在文本匹配过程中，存在“匹配失误”问题，“匹配失误”即两段文本由不同词表示同一意义时，模型不能判断其相似意义而导致的匹配错误。针对这个问题，目前大部分的研究工作均是通过增加查询词或文档词的近义词拓展文本，用于增加查询词与文档的匹配概率，以此缓解“匹配失误”问题，该方法能够在一定程度上解决匹配失误问题，但计算量大且需要耗费巨大的资源库；在深度学习中，研究学者利用词嵌入对近义词的相似度进行计算，但词与词的相似度仍存在偏差，因此也不能够很好地缓解“匹配失误”问题。针对文本匹配中的匹配失误问题，本文提出以下两个模型：(1)A Deep Top-K Relevance Matching Model(DTMM)模型，该模型的贡献是将文档词权重加入模型，以此缓解“匹配失误”问题。由于并非所有信号量都利于文本检索，模型将着重学习相似度和文档词权重都较高的K个信号量，使输入模型的信息量更加可靠有效，随后通过多层全连接层学习出查询与文档的得分；(2)基于知识图谱词拓展的检索模型，该模型首先提取出查询和文档中的所有实体，将实体对齐到知识图谱中。由于近义实体在知识图谱中符合语言学“距离相似性“原理，即意义相似的词上下文环境相同。本文利用SkipGram模型学习出实体词的词嵌入，并将其拓展文本以丰富文本语义表示。最后将拓展之后的文本信息输入DTMM进一步缓解“匹配失误”问题。　　另外，本文提出的两个模型均在MQ2007数据集以及Robust04数据集上进行了验证。实验结果表明，本文提出的DTMM模型以及基于知识图谱词拓展的检索模型均能够有效缓解“匹配失误”问题。

著录项

作者
杨州;
展开▼
作者单位

重庆理工大学;

展开▼
授予单位重庆理工大学;
学科计算机系统结构
授予学位硕士
导师姓名王越,朱小飞;
年度 2019
页码
总页数
原文格式 PDF
正文语种 chi
中图分类
关键词
信息检索,文本匹配,知识图谱,DTMM模型;

相似文献

中文文献
外文文献
专利

1. 基于双目视觉的深度图立体匹配算法研究改进 [J] . 周亦鹏 . 计算机测量与控制 . 2008,第009期
2. 基于深度图的影像密集匹配算法的改进 [J] . 冯申申 ,谭海 . 测绘与空间地理信息 . 2019,第006期
3. 改进的基于深度卷积网的图像匹配算法 [J] . 雷鸣 ,刘传才 . 计算机系统应用 . 2017,第001期
4. 基于本体概念关联度的信息匹配模型及算法 [J] . 张大陆 ,杨征宇 ,杨哲 . 计算机工程与应用 . 2006,第025期
5. 基于改进FP-Growth算法的CRHX型动车组牵引系统关联失效模型研究 [J] . 王艳辉 ,王淑君 ,李曼 . 铁道学报 . 2016,第009期
6. 基于距离关联动态模型的聚类改进算法 [C] . CHEN Xiongtao ,陈雄韬 ,YAN Qiuyan . 第32届中国数据库学术会议 . 2015
7. 基于文本检索的深度关联匹配模型算法的研究与改进 [A] . 杨州 . 2019

基于文本检索的深度关联匹配模型算法的研究与改进

目录

摘要

著录项

相似文献

相关主题

期刊订阅