首页> 中文学位 >基于MeSH的医学文献主题分类与可视化研究
【6h】

基于MeSH的医学文献主题分类与可视化研究

代理获取

目录

声明

第一章 绪论

1.1 研究工作的背景与意义

1.2 医学文献国内外研究历史与现状

1.2.1 文献主题分类的研究

1.2.2 主题可视化研究

1.3 本文的主要贡献与创新

1.4 本文结构安排

第二章 基于组合特征向量的医学文献主题分类算法研究

2.1 算法主要解决问题

2.2 算法主要思想与原理

2.3 算法设计与实现

2.3.1 文献预处理阶段

2.3.2 特征构建阶段

2.3.3 文献主题分类模型构建

2.4 分类实验与结果分析

2.4.1 实验环境

2.4.2 文献数据集

2.4.3 特征构建与分类模型参数设置

2.4.4 评估标准与分类结果

2.5 结果讨论

2.6 本章小结

第三章 基于MeSH的医学文献主题可视化方法研究

3.1 文献主题研究进展与可视化问题分析

3.2 基于MeSH共现的文献主题可视化方法设计

3.2.1 方法原理

3.2.2 实现流程

3.3 医学文献主题可视化实验

3.3.1 实验环境

3.3.2 实验数据来源

3.3.3 主题交叉分析可视化实验验证

3.3.4 主题趋势可视化实验验证

3.4 结果分析

3.4.1 结构图图示说明

3.4.2 两种主题交叉可视化方法比较

3.4.3 趋势图图示说明

3.4.4 两种趋势图可视化方法比较

3.5 本章小结

第四章 总结与展望

致谢

参考文献

展开▼

摘要

医学文献数量爆炸式的增长,医生和研究人员如何快速分析大规模文献数据、迅速有效地获得有用信息是一个巨大的挑战。本文研究文献自动分类与文献主题可视化技术,能够将传统的数据分析方法与文献信息数据的处理算法相结合,帮助研究人员获取研究信息。 文献自动分类技术可以在文献探究的初步阶段作为知识发现、分析的启发式方法,进行有意义的经验聚集与内容比较。我们提出一种基于组合特征的医学领域文献主题分类算法,用于解决医学文献中由于医学文献术语复杂,数量多引起的分类问题。本文的算法首先提取文献信息构建基于MeSH(MedicalSubject Headings)主题词与LDA(Latent Dirichlet allocation)潜在概率的组合特征向量,可以进入语义层面提取文献特征;然后采用支持向量机(Support Vector Machine)作为算法的分类模型,在组合特征向量空间中构建可以将文献进行分类的最优超平面。本文使用TREC-2005中的文献集进行文献主题多分类实验,本文算法的准确率达到72%,相比于传统的基于MeSH分类算法65%、MeSH主题词加权的分类算法53%的准确率,有效地提高了医学文献主题分类精度。 本文还研究医学文献的主题可视化问题,主题可视化技术可以直观的展示大量文献信息。在医学文献的主题可视化方面,本文提出了一种基于MeSH的医学文献主题可视化方法。针对主题交叉信息多样、展示困难的问题,我们通过计算MeSH共现矩阵,使用VOS(Visualization of Similarities)映射技术生成结构图,利用结构图的缩放功能全面细致的展现主题之间关联信息;同时,我们基于MeSH词树状结构确定主题边界,解决现有基于关键词的主题趋势算法存在的文献关键词不规范、主题边界难确定等问题,通过流图研究主题沿着时间轴的流动状态,使用水平线图优化多重时间序列显示。本文针对Alzheimer's Disease主题进行文献主题可视化实验,以传统的可视化方法作为对照组。基于MeSH的主题结构图对比Citespace结构图,信息量更多,层次更分明。相比于百度走势图的单一主题走势,基于MeSH的趋势图可以对比多个主题的趋势变化情况。本文提出的可视化方法在主题领域边界确定、主题层次化分析、趋势图信息呈现方面有明显的改进。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号