首页> 中文学位 >基于结构方程模型的因果发现研究
【6h】

基于结构方程模型的因果发现研究

代理获取

摘要

结构方程模型的研究是一个新兴的热门领域,结构方程模型是连续的贝叶斯网络模型。针对结构方程模型结构学习目前所面临的学习精度和学习效率问题,对于符合任意分布的数据,高斯分布或非高斯分布,我们进行了结构学习方面的研究,提出了相关的学习算法,并将研究的成果在健康领域开展应用性探索。
   主要研究内容如下:
   1.针对目前线性结构方程模型结构学习所面临的学习精度和学习效率问题。首先,对于扰动符合任意分布并且互不相关的线性结构方程模型产生的数据,无论数据服从高斯分布与否,从理论上证明了可以用偏相关系数作为条件独立性测试的标准。然后,结合局部学习提出了PCB算法。为了缩小搜索空间,PCB算法基于偏相关系数选择目标节点的候选邻居节点,即父节点和子节点,从而构建贝叶斯网络的骨架;为了得到最终的因果结构,PCB算法进行受限的贪婪搜索对边进行定向。最后,我们从理论和试验方面说明了该算法的有效性。然而,算法的最佳阈值选择通过大量试验获得,需要研究更为有效的方法。
   2.针对第三章提出的PCB算法的最佳阈值选择通过试验获得,进一步探索阈值的选择问题。我们将联立方程方法与局部学习相结合,提出了基于联立方程模型的贝叶斯网络结构学习算法BSEM。我们从理论上说明了对于线性结构方程模型产生的数据,可以用联立方程的系数衡量变量的影响程度。BSEM算法通过联立方程的系数选择目标节点的候选邻居节点,从而缩小了搜索的空间;继而在受限的空间里,采用局部学习理论,进行受限的贪婪搜索,最终得到相应的因果结构。并从理论上和试验上说明了该算法的有效性。试验结果表明,该算法具有较高的准确度和较好的时间性能。特别的是,BSEM算法的阈值基于假设检验的方法,弥补了PCB算法的阈值选择问题,然而时间性能有所下降。在已知节点序的先验信息下,提出了基于递归联立方程的贝叶斯网络结构学习算法RSEM。RSEM算法利用节点序这一先验信息,直接基于方程系数从目标节点的前驱节点中选取父节点,在取得较高准确度的同时,时间性能得到了显著的提高。
   3.在PCB算法的研究基础之上提出了改进的基于偏相关的贝叶斯网络结构学习算法IPCB。首先,从理论上证明了对于线性结构方程模型产生的数据,在样本数不是很小的情况下,偏相关系数的统计量服从t分布。然后,结合局部学习提出了IPCB算法。IPCB算法结合假设检验方法和偏相关系数,选择目标节点的候选邻居节点,继而在受限的空间里进行受限的贪婪搜索,最终得到相应的因果结构。并从理论上和试验上说明了该算法的有效性。试验结果表明,该算法具有较高的准确度和较好的时间性能,既解决了PCB算法的阈值选择问题,又弥补了BSEM算法时间性能方面的不足。
   4.基于因果发现在健康领域开展应用性研究。将因果发现算法应用于横断面调查数据,发现隐含的因果联系。采用美国健康和营养调查(NHANES)提供的真实断面调查数据,使用LIMB算法,TC算法,PCB算法,BSEM算法,IPCB算法和Two-Phase算法进行因果发现,获取潜在的因果关系,结果表明这些算法能不同程度地从横断面调查数据发现相应的因果联系,这些因果联系可能有助于我们更好地理解生物学机制,服务医学研究。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号