首页> 中文学位 >基于数据几何特性的概率推理和统计学习研究
【6h】

基于数据几何特性的概率推理和统计学习研究

代理获取

目录

文摘

英文文摘

声明

第一章 绪论

1.1概率推理和统计学习的研究背景及意义

1.1.1概率推理和统计学习是发掘事物内在联系的工具

1.1.2概率推理和统计学习中的关键技术

1.1.3几何方法在概率推理和统计学习中的作用

1.2概率推理和统计学习的关键技术研究现状

1.2.1统计回归分析

1.2.2动态贝叶斯网络

1.2.3聚类数目估计

1.3本文的研究内容、方法与主要成果

第二章挖掘数据间几何关联的几何关联学习

2.1引言

2.2数据之间几何关联的挖掘

2.3曲线流形之间的几何回归

2.4最优回归模型

2.5基于几何关联的回归模型预测

2.6几何关联学习的预测性能

2.7实验结果

2.8本章小结

第三章基于几何模式相关的动态贝叶斯网络

3.1引言

3.2时间序列映射为几何模式

3.3几何模式的特征、调控子和调控时滞

3.4动态贝叶斯网络推理基因调控网络

3.5实验结果

3.6本章小结

第四章变结构动态贝叶斯网络的自适应学习

4.1引言

4.2时间序列的几何结构与分割

4.2.1时间序列映射为曲线流形

4.2.2几何结构的描述与时间序列的分割

4.3合理模型区域的寻找策略

4.4动态贝叶斯网络的结构学习

4.5动态贝叶斯网络模型的回访机制

4.6自适应学习方法中的参数

4.7实验结果

4.8本章小结

第五章基于两聚类几何模型的聚类数目估计

5.1引言

5.2两聚类的几何模型

5.3分析最优聚类结构的演化原理

5.4基于两聚类几何模型的系统能量和行为

5.5系统的状态和演化规则

5.6实验结果

5.7系统演化方法的适用性

5.8本章小结

第六章总结与展望

致谢

参考文献

攻读博士学位期间完成的论文和科研工作

展开▼

摘要

概率推理与统计学习是从数据中发掘客观事物之间关联和内在联系的重要工具,是一个具有挑战性与诸多困难的研究领域。本文对概率推理和统计学习的关键技术进行了深入探讨,以几何方法描述数据的几何特性并与概率推理和统计学习方法相结合为主线和特色,研究了利用数据间几何关联性的线性和支持向量回归方法、基于检测时间序列几何结构的变结构动态贝叶斯网络自适应学习、基于几何模式相关的动态贝叶斯网络、以及基于两聚类几何模型的聚类数目估计问题。主要研究工作总结如下: 1.针对目前线性回归和支持向量回归方法尚未关注挖掘和利用单个变量的数据关联性的问题,提出了几何关联学习方法(GcLeam)以利用这种关联性提高回归模型的预测性能。几何关联学习方法预测性能的理论分析表明,该方法具有比传统的线性回归和支持向量回归方法更好的预测性能,并给出了该方法的适用条件和判别准则。实验结果也验证了几何关联学习方法的有效性。该方法主要的创新点包括:提出挖掘单个变量的数据之间几何关联的方法、在曲线水平的几何回归方法和利用几何关联的回归模型预测方法。 2.提出了通过检测时间序列的几何结构来自适应学习变结构动态贝叶斯网络的方法(autoDBN),较好解决了从多变量时间序列数据中寻找较准确的模型区域和学习较准确的变结构动态贝叶斯网络的问题,并且求得的一系列模型自适应于多变量时间序列之间的变化依赖关系。该方法克服了现有方法无专门机制寻找模型区域和盲目搜索的弱点,实验结果表明其性能明显优于现有方法。具体的创新点包括:设计了时间序列转换为曲线流形的方法,提出了描述和检测时间序列几何结构的方法来分割时间序列;进而设计了确定合理模型区域的寻找策略;最后,提出了基于竞争F.检验的模型回访机制修正求得的一系列模型区域和动态贝叶斯网络模型的可能错误。 3.为了发现不同基因的表达水平在变化趋势上相关的基因调控关系,提出了基于几何模式相关的动态贝叶斯网络方法(Gp-DBN)。该方法较好地解决了基于趋势相关的基因调控关系的发现问题。真实基因表达数据的实验结果验证了该方法的有效性。该方法主要的创新点包括:提出的将基因表达的时间序列转换为几何模式的方法可以描述基因表达水平随时间上升与下降的变化趋势,用几何模式上的切向量表示几何模式特征的方法来有效地获取几何模式的离散特征量、确定调控子和估计调控时滞。 4.针对在使用PAM聚类算法的基因表达数据聚类分析中现有估计类数方法在聚类结构比较复杂的情况(例如小聚类靠近大聚类和聚类间有轻微重叠)下效果不佳的问题,提出了基于两聚类几何模型的系统演化方法这一类数估计方法。系统演化方法较好地解决了在基因表达数据的聚类分析中当小聚类靠近大聚类和聚类间有轻微重叠情况时的类数估计问题。实验结果表明,系统演化方法在估计聚类数目的准确性上明显优于现有方法。系统演化方法通过分析所有潜在聚类中最靠近的两个聚类(孪生聚类)是否可分来完成对整个聚类结构的分析,并提出了两聚类的几何模型用于分析孪生聚类的可分性。同时,该方法将一个数据集视为伪热力学系统,提出了依据孪生聚类之间能量关系的系统演化规则确定最优聚类数目。

著录项

  • 作者

    王开军;

  • 作者单位

    西安电子科技大学;

  • 授予单位 西安电子科技大学;
  • 学科 计算机应用技术
  • 授予学位 博士
  • 导师姓名 张军英;
  • 年度 2008
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.12;
  • 关键词

    数据发掘; 概率推理; 统计学习; 聚类结构;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号