首页> 中文期刊>中国数字医学 >中文电子病历命名实体识别的主动学习方法研究

中文电子病历命名实体识别的主动学习方法研究

     

摘要

主动学习通过选择现有模型中未充分训练的数据进行迭代训练,从而利用少量标注数据训练出较高性能的模型.传统的主动学习方法只关注数据本身的信息量而忽略了该数据是否孤立.论文提出一种改进的主动学习方法,利用相似病历中出现的词汇往往雷同的特点,以文档中文字的分布衡量其在样本集的普遍程度,并以此对信息量进行加权.而后实现该方法,并进行了与消极学习和传统主动学习方法的对比实验.结果表明,该方法相对消极学习与传统的主动学习方法,效果有明显提升,能够减少对标注数据的需求.%Active learning can be trained iteratively by selecting incompletely trained data from the existing model,thus training model with a higher performance by using a small amount of labeled data.Traditional active learning methods focus only on the amount of information in the data itself,and ignore whether the data is isolated.This paper proposes an improved active learning method,uses the similar vocabulary in similar medical records,measures its prevalence in the sample set with the distribution of text in the document,and weights the amount of information.And then the method is implemented,and the comparative experiment of passive learning and traditional active learning method is done.The results show that the method significantly improves the effect of passive learning and traditional active learning method,and it can reduce the demand for labeled data.

著录项

  • 来源
    《中国数字医学》|2017年第10期|51-53|共3页
  • 作者单位

    哈尔滨工业大学计算机科学与技术学院语言技术研究中心网络智能研究室,150090;

    黑龙江省哈尔滨市南岗区西大直街92号;

    黑龙江特士信息技术有限公司;

    150000;

    黑龙江省哈尔滨市经开区哈平路集中区松花路9号;

    黑龙江特士信息技术有限公司;

    150000;

    黑龙江省哈尔滨市经开区哈平路集中区松花路9号;

    哈尔滨工业大学计算机科学与技术学院语言技术研究中心网络智能研究室,150090;

    黑龙江省哈尔滨市南岗区西大直街92号;

    哈尔滨工业大学计算机科学与技术学院语言技术研究中心网络智能研究室,150090;

    黑龙江省哈尔滨市南岗区西大直街92号;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 其他科学技术在医学上的应用;信息处理(信息加工);
  • 关键词

    实体识别; 主动学习; 电子病历;

  • 入库时间 2022-08-18 08:41:10

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号