首页> 中文期刊> 《计算机应用》 >公路桥梁定期检测领域命名实体识别语料库构建

公路桥梁定期检测领域命名实体识别语料库构建

         

摘要

针对目前业界缺少适应我国公路桥梁检测领域文本特性的中文命名实体语料库的现状,构建一个较大规模并具有较高标注质量的公路桥梁定期检测命名实体语料库。在分析该类型文本的领域特性基础上,定义了由桥梁实体、结构实体、结构病害实体等六种目标命名实体类别及其标注规范,完成了1 245份真实桥梁检测报告和1 400余万字相关网页文本信息的数据准备和预处理工作,选取了其中150份作为标注语料并完成了多轮迭代标注,标注总字数超过32万字,各类型实体最终标注一致性最高达到98.5%,最低达到85.2%。选取了当前命名实体识别领域主流算法和通用领域预训练模型对标注语料进行初步实验,实验结果表明其识别效果有较大提升空间。该语料库的提出可为后续研究提供识别目标定义,并奠定数据和评测基础。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号