首页> 中国专利> 一种应用于制造业科学技术文档的命名实体识别模型

一种应用于制造业科学技术文档的命名实体识别模型

摘要

本发明公开了一种应用于制造业科学技术文档的命名实体识别模型,其网络结构包括词嵌入层SciBERT,其用于将输入的词转换为固定长度的向量;BiLSTM层,其利用文本序列的上下文信息挖掘隐藏特征,其用于编码文本;注意力层,其用于降低实体内部不相关修饰词的权重,界定实体的边界,避免重要实体抽取的遗漏;CRF层,其作为网络结构的输出层,用于避免文本序列中的实体被错误标注。本发明的命名实体识别模型能从文本中提取信息和生成知识,能解析制造领域中的产品设计文本数据、工程测试文本数据、供应商数据数据、维护记录数据和产品使用数据等各种与制造科学技术相当的文档,能为企业实现各种数据资产互连提供技术基础,是促进企业的数字化转型的关键。

著录项

  • 公开/公告号CN114510940A

    专利类型发明专利

  • 公开/公告日2022-05-17

    原文格式PDF

  • 申请/专利权人 中云开源数据技术(上海)有限公司;

    申请/专利号CN202111643086.6

  • 发明设计人 王明浩;

    申请日2021-12-29

  • 分类号G06F40/295;G06F40/242;G06F40/247;G06F40/126;G06N3/04;G06N3/08;G06N5/02;

  • 代理机构上海伯瑞杰知识产权代理有限公司;

  • 代理人俞磊

  • 地址 200131 上海市浦东新区中国(上海)自由贸易试验区临港新片区环湖西一路99号主楼116A26室

  • 入库时间 2023-06-19 15:22:57

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-05-17

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号