首页> 中国专利> 一种基于图卷积神经网络的中文词义消歧方法

一种基于图卷积神经网络的中文词义消歧方法

摘要

本发明涉及一种基于图卷积神经网络(Graph Convolution Network,GCN)的中文词义消歧方法。本发明首先对汉语语料进行预处理。该步骤对训练和测试语料包含歧义词的语句进行分词、词性标注和语义标注处理。以歧义词所在的句子,以及句中所包含的词形、词性和语义作为消歧特征并作为节点来构建词义消歧特征图,使用Word2Vec、Doc2Vec工具和点互信息(PMI)、TF‑IDF方法对节点和边进行嵌入权值。用训练语料训练GCN模型,将模型优化。用优化后的GCN模型,对测试语料进行词义消歧,可得到歧义词汇在各个语义类别下的概率分布。将概率最大值对应的语义类判别为歧义词汇的语义类。本发明具有较好的词义消歧效果,更准确的判断歧义词汇的真实含义。

著录项

  • 公开/公告号CN113095087A

    专利类型发明专利

  • 公开/公告日2021-07-09

    原文格式PDF

  • 申请/专利权人 哈尔滨理工大学;

    申请/专利号CN202110485038.2

  • 发明设计人 刘睿;仇化平;黄长帅;

    申请日2021-04-30

  • 分类号G06F40/30(20200101);G06F40/289(20200101);G06F40/268(20200101);G06F16/35(20190101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构

  • 代理人

  • 地址 150080 黑龙江省哈尔滨市南岗区学府路52号

  • 入库时间 2023-06-19 11:45:49

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-11-25

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号