首页> 中文学位 >基于主题模型的中医药隐含语义信息挖掘
【6h】

基于主题模型的中医药隐含语义信息挖掘

代理获取

目录

摘要

第1章 绪论

1.1 数据挖掘主题模型研究背景

1.1.1 数据挖掘的步骤

1.1.2 主题模型与潜在语义分析

1.2 语义Web简介

1.3 中医药信息学简介

1.3.1 中医的理论体系

1.3.2 中医药的科学属性

1.3.3 中医药和数据挖掘

1.3.4 Spora数据挖掘平台

1.4 本文的研究目的

1.5 本文主要研究内容

1.6 本文组织结构

1.7 本章小结

第2章 主题模型研究综述

2.1 向量空间模型

2.1.1 单词的权重

2.1.2 文档距离度量

2.2 奇异值分解与LSA

2.3 概率隐含语义分析pLSA

2.3.1 pLSA数学模型

2.3.2 求解模型参数

2.3.3 pLSA的一些改进版本

2.3.4 pLSA的优势和不足

2.4 潜在狄利克雷分配LDA

2.5 主题模型与非负矩阵分解

2.6 本章小结

第3章 主题模型应用于中医药数据挖掘

3.1 中医药数据挖掘与中西医药物发现

3.2 LDA模型的中医药处方数据解释

3.3 LDA策略

3.3.1 先验的设定

3.3.2 主题数目的确定

3.4 算法

3.4.1 Gibbs采样

3.4.2 基于Gibbs采样的LDA算法

3.5 改进Gibbs-LDA算法

3.6 实验结果

3.7 本章小结

第4章 主题模型的语义融合

4.1 本体和语义Web

4.1.1 资源描述框架RDF

4.1.2 中医药本体库

4.2 主题数据的语义表达

4.2.1 主题模型的语义

4.2.1 生成主题模型语义RDF文档

4.3 语义数据可视化

4.3.1 中医药主题模型可视化

4.3.2 生成网络图

4.3.3 实验结果

4.4 本章小结

第5章 主题模型集成到Spora数据挖掘平台

5.1 Spora数据挖掘平台

5.2 Spora数据挖掘平台工作原理

5.2.1 Spora的架构

5.2.2 实验的配置

5.3 集成主题模型挖掘算子

5.4 运行主题模型挖掘实验

5.5 本章小结

第6章 海量资源的用户权限管理

6.1 用户IAM系统简介

6.2 需求和挑战

6.3 系统设计和实现

6.3.1 MongoDB中数据集合设计

6.3.2 资源权限管理

6.3.3 权限验证流程

6.3.4 设计思想

6.4 本章小结

第7章 总结与展望

7.1 本文总结

7.2 未来展望

参考文献

攻读硕士学位期间主要的研究成果

致谢

展开▼

摘要

信息检索领域很多应用都需要挖掘隐含在字、词(中医药处方里面的药剂、化学成分)背后的含义,通过运用统计规律对样本进行学习,可以挖掘出这些词的潜在语义,进而克服单个字词精确匹配带来的一词多义的问题。另一方面,“取象比类”是贯穿中医药知识体系的思维模式,它本身包含了利用统计规律,来刻画中医药方剂的作用机制。
   LDA主题模型是一个三层贝叶斯模型:文档,主题-词汇,它能够很好地挖掘词语的潜在语义,将统计学习挖掘的方法应用在中医药知识发现的领域中,文档即中医处方,词汇对应于处方中的方剂、药品,通过运用主题模型对大量中医处方的数据挖掘,可以建立“处方,主题-药剂”之间的关系模型,并融合到已有的中医药语义Web的知识网络中,对中医药知识完整描述和新知识的发现意义重大。
   本文主要研究主题模型在中医药信息挖掘领域的应用,主要贡献有:
   改进Gibbs-LDA(Gibbs-Latent Dirichlet Allocation)算法,构建主题模型对中医药处方数据进行分析。
   将主题模型训练出来的知识使用RDF进行描述,并融合到中医药语义知识网络之中,设计并实现其语义网络图的可视化算法,为中医药之间的相互作用机理提供统计意义上的支持和形象的展示。
   在中医药数据挖掘平台Spora上增加基于主题模型的数据挖掘算子,使得普通用户能够共享主题模型进行中医药数据挖掘方法。
   设计和并实现用户对海量资源访问控制管理系统—lAM(Identify andAccess Management)。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号