基于语义向量的无导词义消歧

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

词义消歧问题是计算语言学和自然语言处理领域一个重要的研究课题，在许多应用领域中具有重要的理论和实践意义。具有较高准确率和良好实用性的词义消歧方法会对包括：机器翻译、文本分类、自动文摘、信息检索、文本挖掘等问题的研究和具体实践应用产生巨大的帮助。
　　有指导机器学习的词义消歧方法需要对训练语料的词语进行词义标注。为克服数据稀疏问题，并且为达到好的消歧效果，必须建立大规模的标记语料库，而标记语料库的获得需付出高昂的人工代价。针对这一问题，本文提出了基于语义向量的无指导词义消歧的方法。该方法不需要对训练样本的每个词语的进行人工词义标注，能够有效地解决数据稀疏问题。
　　本文结合互信息和Z测试，在歧义词的上下文6个词范围内选取特征词，用义项词语来描述多义词的某一义项，借鉴传统信息检索中计算自然语言查询和文档的相似度的思想，将多义词的上下文看作信息检索中的查询，将义项词语看作信息检索中的文档。然后构造语义向量和待消歧词的上下文查询向量，通过计算各个语义向量和查询向量的相似度来确定多义词的正确义项。对150个典型多义词进行消歧，实验结果证明了本方法的有效性。

著录项

作者
崔磊;
展开▼
作者单位

河北大学;

展开▼
授予单位河北大学;
学科计算机技术
授予学位硕士
导师姓名李新福;
年度 2012
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理;
关键词
词义消歧; 语义向量; 数据稀疏; 标记语料库; 信息检索;

相似文献

中文文献
外文文献
专利

1. 基于无导词义消歧的语义查询扩展 [J] . 王瑞琴 ,孔繁胜 . 情报学报 . 2011,第002期
2. 基于向量空间模型的无导词义消歧 [J] . 陈浩 ,程良伦 ,张小波 . 计算机工程与设计 . 2007,第005期
3. 基于向量空间模型中义项词语的无导词义消歧 [J] . 鲁松 ,白硕 ,黄雄 . 软件学报 . 2002,第006期
4. 基于向量空间模型的有导词义消歧 [J] . 鲁松 ,白硕 ,黄雄 . 计算机研究与发展 . 2001,第006期
5. 基于统计语言模型的无导词义消歧 [J] . 陈浩 . 电脑知识与技术 . 2015,第001期
6. 基于向量空间模型的无导词义消歧 [C] . 陈浩 ,何婷婷 ,代玲 . 第二届全国学生计算语言学研讨会 . 2004
7. 基于二阶上下文的无导词义消歧研究 [A] . 陈浩 . 2005

基于语义向量的无导词义消歧

目录

摘要

著录项

相似文献

相关主题

期刊订阅