首页> 中文学位 >面向药品说明书的医疗实体关系抽取方法研究
【6h】

面向药品说明书的医疗实体关系抽取方法研究

代理获取

目录

声明

摘要

第1章 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.3 本文的主要工作

1.4 论文组织

第2章 数据处理与表示

2.1 药品说明书

2.2 医疗实体及医疗实体关系

2.3 语料标注

2.4 语料预处理

2.4.1 分句处理

2.4.2 中文分词

2.4.3 词性标注

2.5 实体对生成

2.6 特征提取

2.7 本章小结

第3章 医疗实体关系抽取方法

3.1 基于指代消解的指代关系抽取

3.2 基于有监督学习的医疗实体关系抽取方法

3.2.1 SVM模型

3.2.2 朴素贝叶斯模型

3.3 基于半监督学习的医疗实体关系抽取方法

3.4 本章小结

第4章 实验结果与分析

4.1 实验背景

4.2 实验结果

4.2.1 指代关系抽取结果

4.2.2 基于有监督学习的方法结果

4.2.3 基于半监督学习的方法结果

4.3 本章小结

5.1 结论

5.2 展望

致谢

参考文献

攻读学位期间的研究成果

攻读学位期间参加的科研项目

展开▼

摘要

实体关系抽取是信息抽取领域的一个分支,是研究从非结构的文本信息抽取结构化信息的课题,利用自然语言处理、机器学习、数据挖掘等技术精简语义信息,便于用户检索和进一步应用。领域无关的实体关系抽取研究蓬勃发展并取得不错的成绩,但是对于医疗专业领域的探索却刚刚起步。
  药品说明书作为选用药品的指南,包含大量的医疗实体,抽取其中的医疗实体关系为用药信息检索提供了数据基础,对医疗行业有极大的应用价值。本文在总结了较为完备的关系体系的背景下,将医疗实体关系抽取看做多分类问题,其中,考虑到指代关系的特殊性,采用基于指代消解的方法单独处理。本文针对药品说明书语料,基于有监督学习方法,采用实体类别、相对位置、上下位信息和线索词信息等特征,分别使用SVM和朴素贝叶斯分类模型预测关系类别,并取得了较为理想的结果。由于有监督学习方法需要大量有标注的训练样本,本文针对这一缺点又基于半监督学习方法,将不同规模的少量训练语料作为自训练算法的输入来进行关系类别预测。实验结果验证了半监督方法在医疗实体关系抽取的可行性,并且表明半监督学习方法在样本利用率上比有监督学习方法更有优势。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号