首页> 中文期刊> 《中国医疗设备》 >基于标志词的正向自适应长度匹配的地址分词算法与缺失地址要素补充方法

基于标志词的正向自适应长度匹配的地址分词算法与缺失地址要素补充方法

         

摘要

目的 将电子病历中患者的非结构化地址信息转化成结构化地址信息,并补充地址中缺失的地址要素.方法 构建存储标准地址数据集的标准地址库和自定义的地址匹配规则库.依托标准地址库,采用基于地址要素标志的正向自适应匹配算法将地址进行分词.将分词得到的地址要素根据构建的自定义地址匹配规则库从后往前查找,得到完整的地址.结果 该方法实现了病历中地址数据的自动分词,同时补充了地址数据中缺失的地址要素,完成地址标准化的工作.结论 本研究极大地方便了临床病案首页中地址信息的自动获取、各类机构数据上报和数据统计分析工作,大幅减少人工数据处理的工作量,为后续其他信息的提取和标化打下坚实基础.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号