首页> 中国专利> 词性标注模型的训练方法、词性标注方法及电子设备

词性标注模型的训练方法、词性标注方法及电子设备

摘要

本发明涉及文本分析技术领域,具体涉及词性标注模型的训练方法、词性标注方法及电子设备,所述训练方法包括获取文本样本数据,以及所述文本样本数据中每个字对应的初始词性标签;获取所述文本样本数据中每个字属于其他词性类别的概率,并基于所述概率对所述初始词性标签进行平滑处理,确定目标词性标签;将所述文本样本数据输入词性标注模型中,确定所述文本样本数据中每个字对应的预测词性;根据所述预测词性以及所述目标词性标签,更新所述词性标注模型的参数,以确定目标词性标注模型。在平滑处理的过程中结合对应的概率,可以避免词性标注模型的输出过拟合到初始词性标签上,并且不会损害其分类能力,从而可以保证目标词性标注模型的准确性。

著录项

  • 公开/公告号CN114117051A

    专利类型发明专利

  • 公开/公告日2022-03-01

    原文格式PDF

  • 申请/专利权人 新华三大数据技术有限公司;

    申请/专利号CN202111441837.6

  • 发明设计人 刘万青;

    申请日2021-11-30

  • 分类号G06F16/35(20190101);G06F40/216(20200101);

  • 代理机构11250 北京三聚阳光知识产权代理有限公司;

  • 代理人陈刚

  • 地址 450000 河南省郑州市高新技术产业开发区杜英街166号总部大观B18号楼

  • 入库时间 2023-06-19 14:20:35

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-03-01

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号