首页> 中文学位 >知识库与语料库相结合的语义相似度的研究与实现
【6h】

知识库与语料库相结合的语义相似度的研究与实现

代理获取

目录

声明

致谢

摘要

序言

1 绪论

1.1 研究背景

1.2 研究意义

1.3 国内外研究现状

1.3.1 基于知识库的语义相似度计算方法

1.3.2 基于语料库的语义相似度计算方法

1.3.3 语义相似度混合计算方法

1.4 本文主要工作

1.5 论文组织结构

2 基于知识库与语料库相结合的词语相似度计算方法

2.1 WordNet中的关系

2.1.1 注释语义属性

2.1.2 上下位关系

2.1.3 同义关系

2.2 连续词袋模型

2.3 词语相似度计算方法

2.3.1 多原型词向量模型

2.3.2 知识库与语料库融合实验设计

2.3.3 单词相似度计算

2.4 实验与分析

2.4.1 语料库

2.4.2 语料预处理模块

2.4.3 基准数据集

2.5 实验数据与分析

2.6 本章小结

3 基于知识库与语料库综合特征的短文本分类方法

3.1 基于相似度矩阵的短文本相似度计算方法

3.2 实体间相似度计算方法

3.2.1 基于WordNet路径的相似度计算方法

3.2.2 基于WordNet信息内容的相似度计算方法

3.3 微软研究院释义语料库数据集

3.4 短文本相似度特征值的计算

3.5 文本分类方法

3.5.1 朴素贝叶斯分类算法

3.5.2 K近邻分类算法

3.5.3 支持向量机

3.6 实验与分析

3.6.1 实验环境

3.6.2 文本分类评价指标

3.6.3 实验结果及分析

3.7 本章小结

4 基于语义相似度的Web服务匹配

4.1 Web服务本体语言OWL-S

4.2 基于语义相似度的Web服务发现框架

4.2.1 Web服务相似度计算

4.2.2 Web服务匹配框架

4.3 Web服务测试数据集

4.4 实验与分析

4.4.1 实验环境

4.4.2 语义Web服务匹配评价指标

4.4.3 实验结果与分析

4.5 本章小结

5 总结与展望

5.1 总结

5.2 展望

参考文献

作者简历及攻读硕士学位期间取得的研究成果

学位论文数据集

展开▼

摘要

语义相似度计算作为自然语言处理的基础之一,在词义消歧、机器翻译、拼写修正、文本分类和自动问答系统等领域有着广泛的应用。当前语义相似度计算方法主要有两个发展方向,其一是基于语料库的空间向量模型的相似度计算方法;其二是基于知识库结构的语义相似度计算方法。词向量由大规模语料经过神经网络语言模型训练得到,由于缺少语义信息很难计算词与词之间的内在关系;知识库中包含了丰富的语义信息,能反映词与词之间的关系,但受制于语义词典的容量难以准确地计算文本之间的相似度。本文的创新点为在计算语义相似度时,结合了知识库与语料库的相似度计算方法,在词语的相似度计算和短文本的相似度计算上取得了较好的成果。
  针对词语相似度的计算,本文分析了基于知识库和基于语料库的相似度计算方法的优劣之处并取长补短,提出了基于知识库与语料库相结合的语义相似度计算方法。首先,基于连续词袋模型对语料库进行训练得到初始词向量,利用WordNet对词向量进行语义信息加强,然后,通过最大相似度计算模型计算得到词与词之间的相似度值,并在RG-65、MC-30和WS-353三个基准数据集上进行了实验验证。
  针对短文本相似度的计算,本文引入了相似度矩阵方法作为短文本相似度计算的主要方法,分别计算短文本的基于知识库的相似度特征、基于语料库的相似度特征、基于知识库与语料库相结合的相似度特征,在微软研究院释义数据集上的实验取得了较好的准确率、召回率以及F1值。
  最后本文将语义相似度计算应用到Web服务匹配领域,提出基于词语相似度计算的输入、输出属性相似度和基于短文本相似度计算的文本描述属性相似度的Web服务综合相似度计算方法,在OWLS-TC数据集上的Web服务匹配实验验证了该算法的可行性和有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号