首页> 中国专利> 一种基于半训练和句子选择的远程监督命名实体识别方法

一种基于半训练和句子选择的远程监督命名实体识别方法

摘要

本发明公开了一种基于半训练和句子选择的远程监督命名实体识别方法,该方法首先通过半训练策略将双向循环神经网络和条件随机场混合双向循环神经网络和条件随机场混合模型在人工标注数据集上的平衡F分数训练到预设半训练区间;然后采用FNN作为强化学习中的策略网络,来对远程监督数据集中的句子进行选择;接着采用软概率选择出置信度大于阈值的句子;然后将筛选出的句子和人工标注数据集进行合并作为新的训练集;最后利用新的训练集对双向循环神经网络和条件随机场混合双向循环神经网络和条件随机场混合模型进行训练,同时对策略网络进行更新。本发明方法能够有效提高基于远程监督的命名实体识别模型的性能。

著录项

  • 公开/公告号CN114004233B

    专利类型发明专利

  • 公开/公告日2022-05-06

    原文格式PDF

  • 申请/专利权人 之江实验室;

    申请/专利号CN202111644281.0

  • 申请日2021-12-30

  • 分类号G06F40/295;G06F40/242;G06F40/211;G06F40/216;G06F16/903;G06N3/04;G06N3/08;

  • 代理机构

  • 代理人

  • 地址 310023 浙江省杭州市余杭区文一西路1818号人工智能小镇10号楼

  • 入库时间 2022-08-23 13:35:50

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-02-01

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号