首页> 中国专利> 一种藏文命名实体的标注方法

一种藏文命名实体的标注方法

摘要

本发明公开了一种藏文命名实体的标注方法,通过半监督学习方式,利用标注语料训练双粒度模型,即粗粒度级的基于词向量KNN聚类的NER和细粒度级的基于半马尔可夫的CRFs的NER,然后对未标注语料进行标注,并将新标注实体加入到标注语料进行双粒度模型的二次训练,迭代式提升双粒度NER。本发明克服了监督学习过度依赖标注语料的局限性、传统CRFs类方法单独式判别方式的问题,融合了实体语义特征、命名实体之间的相互作用等特征,以及结合了聚类和概率图,从命名实体的语义和语法结构的优势互补角度来提高模型拟合度,实现了集体式地NER,有效地提高了藏文命名实体识别的准确率和效率。

著录项

  • 公开/公告号CN108268447A

    专利类型发明专利

  • 公开/公告日2018-07-10

    原文格式PDF

  • 申请/专利权人 河海大学;

    申请/专利号CN201810059120.7

  • 发明设计人 夏建华;张进兵;韩立新;

    申请日2018-01-22

  • 分类号G06F17/27(20060101);G06K9/62(20060101);

  • 代理机构32224 南京纵横知识产权代理有限公司;

  • 代理人董建林

  • 地址 211100 江苏省南京市江宁开发区佛城西路8号

  • 入库时间 2023-06-19 05:53:48

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-08-03

    实质审查的生效 IPC(主分类):G06F17/27 申请日:20180122

    实质审查的生效

  • 2018-07-10

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号