声明
致 谢
1 引言
1.1 研究背景及研究意义
1.2 研究内容及关键问题
1.3 研究创新点
1.4 技术路线
1.5 章节安排
2 文献综述和相关方法
2.1 文献综述
2.1.1 医学文本分词方法
2.1.2 医学文本结构化方法
2.1.3 语义分析和医学概念抽取
2.1.4 基于医学文本的决策支持
2.2 相关数据与方法
2.2.1 医学领域知识库
2.2.2 机器学习方法
2.2.3 大数据分析方法
2.2.4 评估方法和指标
2.3 本章小结
3 基于自然语言处理的医学文本结构化和标准化方法
3.1 医学文本特征和语义复杂性分析
3.1.1 医学文本数据的来源和特征
3.1.2 医学文本分析的N-Gram语言模型
3.1.3 医学文本语料库的使用及影响分析
3.2 基于医学文本语料库的文本结构化方法
3.2.1 基于字典的机械分词和N-Gram分词方法研究
3.2.2 基于序列标注的医学文本分词方法研究
3.2.3 基于语义理解的医学文本分析方法研究
3.3 中文超声检查报告文本分析和性能评估
3.3.1 专家辅助的超声检查报告文本标注方法
3.3.2 超声检查报告的文本结构化方法
3.3.3 超声检查报告的文本语义分析方法
3.3.4 标注系统的性能评估方法
3.3.5 标注系统的整体性能测试与分析
3.4 本章小结
4 基于医学领域知识的医学文本语义分析和知识发现方法
4.1 面向医学文本的语义相似度计算方法
4.1.1 语义关系与文本特征提取方法
4.1.2 基于加权Levenshtein距离和N-Gram的文本相似度计算方法
4.1.3 评估方法和实验分析
4.2 基于UMLS的医学概念相似度和相关性计算方法
4.2.1 医学文本语义相似度计算方法
4.2.2 医学文本语义相关性计算方法
4.2.3 相关方法的测试和分析
4.3 基于语义分析的计算机辅助ICD-11 编码方法
4.3.1 相关知识库
4.3.2 ICD-11编码语义模型
4.3.3 ICD-11编码规则建模方法
4.3.4 ICD-11候选编码相关性计算方法
4.3.5 相关方法的测试和分析
4.4 本章小结
5 面向决策支持的海量医学文本分析方法及应用案例研究
5.1 医学文本主题建模和知识发现方法
5.1.1 基于LDA的医学文本主题建模方法
5.1.2 知识约束下医学文本主题建模和预测方法
5.1.3 相关方法性能的对比分析
5.2 基于大数据分析的典型医学文本分析方法设计和分析
5.2.1 基于MapReduce模型的大规模数据集连接方法
5.2.2 基于MapReduce模型的大规模文档相似度计算方法
5.3 面向医疗大数据分析的Hadoop 性能自动调整优化方法
5.3.1 Hadoop性能自动调优框架设计方法
5.3.2 基于无导数优化理论的Hadoop最优参数搜索方法
5.3.3 典型MapReduce算法性能调优和实验分析
5.4 本章小结
6 总结与展望
6.1 总结
6.2 展望
参考文献
作者简历及攻读博士学位期间取得的研究成果
独创性声明
学位论文数据集
北京交通大学;