中文病历文本中时间信息自动标注

摘要

中文病历文本中的时间信息提取对于实现医疗信息结构化,促进临床决策支持、医疗信息挖掘等信息综合利用具有重大意义。本文通过时间表达提取和时间规范化表示两个步骤实现时间信息的提取,利用正则匹配方法实现时间表达的提取;提出了中文病历文本中时间信息参考时间的分类和选取规律,并参考国际时间标注标准制定了针对医学领域的时间规范化表示方法,实现时间规范化表示,最终实现中文病历文本中时间信息的提取。本研究利用147份实际病历文本进行实验,其中包含表达完整时间概念的时间信息1207条,实验结果表明该方法可涵盖病历文本语料中96%以上的时间信息,正确率可达91%。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号