首页> 中文期刊>计算机技术与发展 >基于词性标注和规则相结合的信息抽取方法

基于词性标注和规则相结合的信息抽取方法

     

摘要

实现对企业日常经营活动文本高效、准确的结构化信息抽取,推动企业数字化建设.抽取结果信息事关企业业务经营,希望模型在满足绝对精确率的基础上召回率越高越好,但现有研究方法不能满足企业实际应用.因此,提出一种基于词性标注和规则相结合的信息抽取方法,对文本分别采用基于词性标注和基于规则的信息抽取策略对文本进行信息抽取并得到抽取结果,再对结果信息进行合规判断和冲突避免,最后引入人工识别.使用石油企业设备日常监控文本数据2029条,对每条文本中10个不同数据值进行信息抽取实验并得到结构化输出结果.精确率P达到100%,召回率R达到99.87%,相比于单一信息抽取方法具有更好的效果,能有效满足企业实际应用需求.该方法已实际应用在本企业业务与档案管理系统项目中,极大地提高了企业业务管理工作效率,取得了良好的应用效果.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号