面向检索信息的同义词挖掘

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着计算机技术的飞速发展，搜索引擎的应用深入到各行各业，使用搜索引擎对信息进行检索已经深入到人民群众的日常生活当中，信息的查找与获取变得越来越频繁的同时，信息的精准查找与获取也越来越有挑战性。如何从浩如烟海的信息资源库中，更加准确的理解用户想要搜索的关键词，使得关键词搜索内容能够得到拓展和更加准确的推荐，是信息检索领域一直以来的重要研究课题。传统的信息检索服务已渐渐不能满足用户的检索需求，智能的、基于概念的信息检索系统成为未来的发展方向。识别用户搜索关键词的可替代同义词是实现智能信息检索的重要方法之一，而要实现高效的同义词拓展，就需要一个强大的同义词表。本文中定义的同义词，是在相似的上下文语境中可以相互替代的词。随着时代的变化，语言的应用日新月异，使用传统的同义词词典查询的方法对同义词进行判别或者发现已完全不适用。使用更加智能的方法进行同义词挖掘，找到新的同义词表势在必行。近年来，随着自然语言处理技术的进步，关于同义词的研究越来越多，需要用到同义词的领域涉及方方面面，研究者们提出了众多先进的配对同义词辨析和基于语料库的同义词集提取方法。本文面向检索信息进行同义词挖掘，与使用基于特定业务的检索数据有一定的规则找出候选词对不同，本文通过设计对齐规则和短语对抽取规则，找到无特定业务query数据的同义词挖掘方法；将 Distributed Representation词向量应用于特征工程；通过训练机器学习模型，使用模型对同义词对做出判定，最终在浩瀚如海的信息中挖掘出同义词，提取同义词表。本文使用这类数据来挖掘同义词表，在相当程度上克服了传统同义词表过时、无法找到新词和未登录词等弊端；结合统计特征以及 Negative Sampling的Skip-gram共现矩阵模型训练的词向量特征进行模型训练。同义词的自动发现和识别，在基于概念的信息检索领域有着十分重大的研究意义和实际应用价值，本文在国内和国外短文本相似度算法、同义词识别算法进行研究和分析的基础上，对面向检索信息的同义词挖掘方法进行了深入研究。

著录项

作者
肖淋峰;
展开▼
作者单位

电子科技大学;

展开▼
授予单位电子科技大学;
学科计算机技术
授予学位硕士
导师姓名董强;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类计算技术、计算机技术;
关键词
检索信息; 同义词;

相似文献

中文文献
外文文献
专利

1. 面向信息检索的汉语同义词自动识别和挖掘 [J] . 陆勇 ,侯汉清 . 情报理论与实践 . 2006,第004期
2. 从传统信息检索到面向知识创新——信息检索课改革与发展前沿述评 [J] . 敬卿 ,王群 . 图书馆 . 2008,第001期
3. 信息检索中的同义词 [J] . 刘政 ,朱杰 ,吴树芳 . 电脑知识与技术 . 2009,第009期
4. 用于信息检索的同义词自动识别及其进展 [J] . 陆勇 ,侯汉清 . 南京农业大学学报（社会科学版） . 2004,第003期
5. 面向科研创新的研究生信息检索实习模式构建研究——以Web of Science检索平台在线分析为例 [J] . 朱卫东 ,兰月华 ,蔡德清 . 老区建设 . 2019,第010期
6. 试论信息检索系统及其发展趋势-面向对象的智能检索系统 [C] . 张春辉 ,席卫文 . 网络环境下信息资源的开发和利用学术研讨会 . 2000
7. 同义词挖掘及其在概念信息检索系统中的应用研究 [A] . 曹晶 . 2006

面向检索信息的同义词挖掘

目录

摘要

著录项

相似文献

相关主题

期刊订阅