首页> 中文学位 >基于语义分析的句子相似度计算研究
【6h】

基于语义分析的句子相似度计算研究

代理获取

目录

摘要

ABSTRACT

第一章 引论

1.1 研究背景及意义

1.2 研究的现状

1.3 本论文的组织

第二章 基础研究平台及资源

2.1 汉语自动分词

2.1.1 汉语自动分词算法

2.1.2 ICTCLAS分词系统

2.2 知网及其知识结构

2.3 本章小结

第三章 汉语词语相似度计算方法的研究

3.1 概述

3.2 词语相似度的定义与特点

3.3 词语相似度计算方法研究

3.3.1 基于语料统计的词语相似度方法

3.3.2 基于语义词典的方法

3.3.3 基于知网的词语相似度计算

3.4 本章小结

第四章 汉语句子相似度及其计算方法的研究

4.1 引言

4.2 句子相似度定义

4.3 汉语句子相似度计算的特点与难点

4.4 句子相似度计算的主要方法及其存在的问题

4.4.1 基于向量空间模型的TF-IDF方法

4.4.2 语义词典方法

4.4.3 基于词形词序的方法

4.4.4 依存树方法

4.5 本章小结

第五章 基于语义分析的句子相似度计算方法的研究

5.1 引言

5.2 语义分析理论

5.2.1 语义网络

5.2.2 语义依存

5.3 格语法

5.3.1 格语法理论

5.3.2 格框架语义分析法

5.3.3 语义词典

5.4 基于格语法的句子相似度计算

5.4.1 词语的语义相似度计算

5.4.2 句子相似度计算方法

5.5 实验设计及结果分析

5.5.1 实验设计架构

5.5.2 句子预处理

5.5.3 语义分析

5.5.4 相似度计算

5.5.5 实验结果及分析

5.6 本章小结

第六章 总结与展望

6.1 当前工作总结

6.2 下一步工作展望

参考文献

致谢

附录

在学期间发表的学术论文和参加科研情况

展开▼

摘要

在中文信息处理中,相似度计算是一项基础而又核心的工作,它直接决定着某些领域的研究发展状况,例如,在基于实例的机器翻译、信息检索、自动问答、拼写检查以及数据清理等方面,相似度计算都是一个非常关键的问题,长期以来一直是人们研究的一个热点和难点。本文分别对汉语中的词语和句子各自之间的相似度计算进行了研究。通过分析研究目前的词语相似度算法,对目前较流行的基于《知网》的词语相似度计算提出了改进的方法;通过对句子相似度算法研究,针对他们的不足,提出了一种基于语义分析的句子相似度计算方法。在实验中建立了简化的词语词典方便语义分析,通过实验对比结果验证了方法的有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号