基于知网义原词向量表示的无监督词义消歧方法

摘要

词义消歧一直是自然语言处理领域中的重要问题,本文将《知网》(HowNet)中表示词语语义的义原信息融入到语言模型的训练中.通过义原向量对词语进行向量化表示,本文实现了词语语义特征的自动学习,提高了特征学习效率.针对多义词的语义消歧,本文将多义词的上下文作为特征,形成特征向量,通过计算多义词词向量与特征向量之间相似度进行词语消歧.作为一种无监督的方法,本方法大大降低了词义消歧的计算和时间成本.在SENSEVAL-3的测试数据中准确率达到了37.7%,略高于相同测试集下其他无监督词义消歧方法的准确率.

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号