首页> 中文学位 >中文电子病历信息提取方法研究
【6h】

中文电子病历信息提取方法研究

代理获取

目录

声明

摘要

插图索引

附表索引

第1章 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.2.1 国外研究现状

1.2.2 国内研究现状

1.3 论文主要工作及结构

1.3.1 论文主要工作

1.3.2 全文组织结构

第2章 电子病历信息抽取综述

2.1 电子病历信息抽取概述

2.1.1 信息抽取概述

2.1.2 中文分词技术

2.1.3 电子病历信息抽取任务

2.2 中文电子病历分析

2.2.1电子病历概念

2.2.2 中文电子病历结构特点

2.2.3 中文电子病历语言特点

2.3 中文电子病历信息抽取方法

2.3.1 基于规则的方法

2.3.2 基于统计学习模型的方法

2.3.3 统计学习模型和规则相结合的方法

2.4 小结

第3章 CRF和规则相结合中文电子病历命名实体识别

3.1 引言

3.2 CRF模型介绍

3.2.1 CRF的定义

3.2.2 势函数

3.2.3 CRF参数估计

3.3 语料构建

3.3.1 数据来源

3.3.2 数据标注规范介绍

3.3.3 数据标注

3.4 中文电子病历命名实体识别框架

3.5 基于CRF的中文电子病历命名实体识别

3.5.1 实体特征选取

3.5.2 CRF工具选取

3.5.3 特征模版构造

3.6 基于规则的后处理

3.6.1 规则词典构建

3.6.2 识别规则库建立

3.7 实验结果与分析

3.8 小结

第4章 基于SVM的中文电子病历实体修饰识别

4.1 引言

4.2 SVM模型

4.2.1 基本理论概念

4.2.3 支持向量机与核函数

4.3 基于SVM的中文电子病历实体修饰识别

4.3.1 向量特征构造

4.3.2 Kernel函数选取

4.3.3 训练和测试

4.4 实验结果与分析

4.5 小结

第5章 中文电子病历信息抽取系统设计与实现

5.1 开发环境

5.1.1 系统的框架模式

5.1.2 系统的搭建技术

5.2 系统设计与实现

5.2.1 系统设计

5.2.2 系统实现

5.3 小结

结论

参考文献

攻读学位期间所获得的研究成果

致谢

展开▼

摘要

信息技术的迅猛发展推动了医院信息化建设,国家政策的支持为电子病历系统等相关医学信息系统的建立奠定了坚实的基础,系统的普及带来了海量的医疗数据,其中电子病历受到广泛关注。电子病历是在医疗活动过程中产生的重要临床信息资源,包含了大量与患者健康状况密切相关的医疗知识,从电子病历中抽取有用的信息将大大推动医疗事业的发展。
  本文首先介绍电子病历信息抽取的国内外研究现状,然后对电子病历信息抽取进行了概述,分析了中文电子病历的语言和结构特点并总结了信息抽取的主要方法,并在此基础上提出了一种中文电子病历命名实体识别方法和一种实体修饰识别方法。本文的主要工作如下:
  (1)设计了一种CRF和规则相结合的中文电子病历命名实体识别方法。首先,针对目前可用于研究且公开的电子病历数据集匮乏的问题,本文从互联网上收集整理了200份大内科下的典型电子病例,基于《中文电子病历命名实体和实体关系》标注规范,组织人力对病例中的实体和实体的修饰类型进行了标注。然后提出了一种CRF和规则相结合的中文电子病历命名实体识别方法,实验证明本文提出的方法是有效的,在构建的测试集上该方法的最佳效果的F-measure值为92.68%。
  (2)提出了一种基于SVM的中文电子病历实体修饰识别方法。在完成命名实体识别任务的基础上,通过分析中文电子病历文本和与语法特性,构建了基于SVM的命名实体修饰识别分类器。该分类器使用的特征包括上下文特征,段落标题特征、词性特征和指示词特征四种特征。实验结果与分析表明,提出的基于SVM的医疗实体修饰识别方法具有良好的性能,系统的最佳F-measure值达到了94.10%。
  (3)设计并实现了中文电子病历信息抽取系统,为今后的研究和测试提供了测试平台和借鉴。系统主要依据前面提到的两种方法建立的模型对病历文本中的实体和医疗问题与治疗实体的修饰信息进行抽取并可视化展示以及结构化存储。
  本论文的完成能促进国内电子病历信息抽提和分析挖掘的研究,提升对于海量临床数据的利用,对于医院的深度信息化建设也有一定的帮助。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号