首页> 中文学位 >基于HowNet树层次模型的语义相似度计算方法研究
【6h】

基于HowNet树层次模型的语义相似度计算方法研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第1章 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.3 本文的主要工作

1.4 本文的组织结构

第2章 语义相似度计算概述

2.1 词语相似度计算概述

2.2 句子相似度计算概述

2.3 本章小结

第3章 基于HowNet的词语相似度计算方法

3.1 HowNet概述

3.2 改进的基于Hownet和树层次的词语相似度计算

3.3 实验结果和分析

3.4 本章小结

第4章 基于HowNet多特征句子相似度计算方法

4.1 多特征的句子相似度计算方法

4.2 基于词语权重的多特征句子相似度计算方法

4.3 实验结果和分析

4.4 本章小结

结论

1. 本文的研究工作主要有以下几个方面

2. 下一步工作展望

参考文献

致谢

附录A攻读硕士学位期间发表的学术论文及专利

附录B攻读硕士学位期间所参与的科研

展开▼

摘要

随着互联网的快速发展和网络资源的日益丰富,从海量文本信息中准确返回用户所需内容的需求越发强烈,人们对计算机处理文本信息的能力要求越来越高。作为文本信息处理和自然语言处理的基础研究内容,语义相似度广泛应用于自动问答系统、基于实例的机器翻译、多文档、信息检索等领域。语义相似度的计算结果直接影响文本信息处理的效果,因此提高语义相似度计算的准确性十分必要。词语是构成句子最基本的语义和语法单位。词语相似度的计算是语义相似度最基本的研究内容,提高词语相似度计算效果能够更好的服务于上层应用研究。
  本文分析比较了主流的词语相似度计算方法,对基于HowNet的词语相似度展开研究。在 HowNet的基本结构和树层次模型的基础上,提出一种改进的基于节点概率密度比的词语相似度计算方法。将改进算法进行实验仿真并与最新算法比较,验证本文提出的算法更接近人工评估的结果。句子是表达一个完整语义的基本结构。句子相似度的计算涉及词法、词义、句法、上下文环境等内容,是一个具有挑战性的问题。针对单一特征的句子相似度计算方法在刻画句子相似度上存在片面性的问题,本文对基于HowNet多特征的计算方法开展研究。在 HowNet丰富的语义和独特的知识表达结构的基础上,综合词形特征、词义特征和句法特征,提出一种改进的基于词语权重的多特征句子相似度计算方法。将改进算法进行实验仿真并与原先算法比较,实验结果表明本文提出的算法效果有所提高。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号