首页> 外国专利> AUTO-GENERATING GROUND TRUTH ON CLINICAL TEXT BY LEVERAGING STRUCTURED ELECTRONIC HEALTH RECORD DATA

AUTO-GENERATING GROUND TRUTH ON CLINICAL TEXT BY LEVERAGING STRUCTURED ELECTRONIC HEALTH RECORD DATA

机译:通过利用结构化电子健康记录数据自动生成地面真实性

摘要

A method improves performance of natural language processing by automatically generating ground truth from electronic health records comprising unstructured clinical notes and structured data comprising entries each having respective values for fields. The method includes: linking a given one of the notes to a given one of the entries responsive to determining that a specified field within the given entry matches an item of metadata for the given note; determining an initial set of the notes which satisfy criteria selected such that the criteria are a proxy for the ground truth, wherein the given note is determined to satisfy the criteria based at least in part on the given entry linked thereto; and designating at least a portion of the initial set of notes which satisfy the criteria, and the entries linked to the portion of the initial set of notes which satisfy the criteria, as the ground truth.
机译:一种方法通过从包括非结构化临床笔记的电子健康记录和包括每个具有字段的各个值的条目,从包括非结构化临床笔记和结构化数据的构造数据来提高自然语言处理的性能。 该方法包括:响应于确定给定条目中的指定字段与给定音符的元数据项匹配的指定字段,将给定的一个注意事项链接到给定的一个条目; 确定满足所选择标准的初始记录的初始集合,使得标准是地面真理的代理,其中确定给定的注意至少部分地基于与其连接的给定条目基于给定的条目来满足标准; 并指定满足标准的初始音符集的至少一部分,以及链接到满足标准的初始音符的部分的条目作为地面真理。

著录项

  • 公开/公告号US2021286821A1

    专利类型

  • 公开/公告日2021-09-16

    原文格式PDF

  • 申请/专利权人 INTERNATIONAL BUSINESS MACHINES CORPORATION;

    申请/专利号US202016814896

  • 发明设计人 JENNIFER J LIANG;DIWAKAR MAHAJAN;

    申请日2020-03-10

  • 分类号G06F16/25;G16H10/60;G06F16/332;G06F16/242;G06F16/383;G06F40/30;G06F40/295;G06F40/40;G06N20;

  • 国家 US

  • 入库时间 2022-08-24 21:05:04

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号