首页> 中文学位 >基于语义向量的无导词义消歧
【6h】

基于语义向量的无导词义消歧

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第 1 章 引 言

1.1 研究背景和意义

1.2 国内外对词义消歧的研究1.2.1 国外的研究状况

第 2 章 词义消歧的方法和 HowNet

2.1 词义消歧的概述

2.2 知网的简介

2.3 本章小结

第 3 章 词义消歧的预处理

3.1 分词和词性标注

3.2 识别歧义词

3.3 上下文有效范围的确定

3.4 构造义项词语集合

3.5 本章小结

第 4 章 基于语义向量的汉语无导消歧

4.1 特征词的提取

4.2 构造语义向量和查询向量

4.3 确定语义向量各分量的权重

4.4 相似度的计算方法

4.5 本章小结

第 5 章 实验过程及结果分析

5.1 实验设计

5.2 实验结果

5.3 结果分析

5.3 本章小结

第 6 章 结论与展望

6.1 工作总结

6.2 后续工作展望

参考文献

致谢

攻读学位期间取得的科研成果

展开▼

摘要

词义消歧问题是计算语言学和自然语言处理领域一个重要的研究课题,在许多应用领域中具有重要的理论和实践意义。具有较高准确率和良好实用性的词义消歧方法会对包括:机器翻译、文本分类、自动文摘、信息检索、文本挖掘等问题的研究和具体实践应用产生巨大的帮助。
  有指导机器学习的词义消歧方法需要对训练语料的词语进行词义标注。为克服数据稀疏问题,并且为达到好的消歧效果,必须建立大规模的标记语料库,而标记语料库的获得需付出高昂的人工代价。针对这一问题,本文提出了基于语义向量的无指导词义消歧的方法。该方法不需要对训练样本的每个词语的进行人工词义标注,能够有效地解决数据稀疏问题。
  本文结合互信息和Z测试,在歧义词的上下文6个词范围内选取特征词,用义项词语来描述多义词的某一义项,借鉴传统信息检索中计算自然语言查询和文档的相似度的思想,将多义词的上下文看作信息检索中的查询,将义项词语看作信息检索中的文档。然后构造语义向量和待消歧词的上下文查询向量,通过计算各个语义向量和查询向量的相似度来确定多义词的正确义项。对150个典型多义词进行消歧,实验结果证明了本方法的有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号