首页> 中文学位 >因果图理论驱动下系统流行病学设计与分析的理论方法研究
【6h】

因果图理论驱动下系统流行病学设计与分析的理论方法研究

代理获取

目录

声明

摘要

Abstract

Denotation

Chapter 1 Causal Diagrams Theory

1.1 Causal diagrams

1.2 Path implied in causal diagrams

1.3 The d-Separation Rules Linking Causal Assumptions to Statistical Independencies

1.4 do-calculus proposed by Judea Pearl

1.5 Back-door criterion and Front door criterion

1.6 Instrumental variable

1.7 Markov Blanket and its algorithms

1.8 Outline of the dissertation

Chapter 2 Theory and Methodology of Causal inference based on Matching and Regression strategy

2.1 Background

2.2 Methods

2.2.1 Abrief introduction to matched case-control designs under causal diagrams

2.2.2 Simulation

2.3 Results

2.4 Discussion

Chapter 3 Omic biomarkers screening strategy based on conditional independence criterion

3.1 Background

3.2 Methods

3.2.1 Markov Blanket-based repeated-fishing strategy(MBRFS)

3.2.2 Simulation

3.2.3 Application

3.3 Results

3.3.1 Simulation results

3.3.2 Application results

3.4 Discussion

Chapter 4 Identification and calculation of pathogenic pathway effect based on do-calculus

4.1 Background

4.2 Methods

4.2.1 Complex network simplification rules(Figure 4-1)and calculation of causal effect

4.2.2 Segmented series multiplication statistic

4.2.3 Non-parametric permutation and bootstrap test

4.2.5 Simulation

4.2.5 Application

4.3 Results

4.3.1 Simulation

4.3.2 Application result

4.4 Discussion

Chapter 5 Conclusions

5.1 Innovations

5.2 Limitations

Appendix

参考文献

Acknowledge

攻读学位期间发表的学术论文

学位论文评阅及答辩情况表

附英文发表论文

展开▼

摘要

为了推断“暴露因子→组学生物标记→疾病终点”间的通路效应大小,需要在研究设计和数据分析层面上,解决一系列关键问题。
  (1)在设计层面上,虽然系统流行病学研究仍可借鉴传统流行病学研究的设计方法(如病例对照研究、队列研究和实验流行病学研究等),但因“暴露因子→组学生物标记→疾病终点”间往往存在复杂的网络调控关系(不仅存在着因果关系,还同时存在大量的非因果关系),使得准确识别因果通路并估计出其因果效应变得十分困难。需要从因果推断理论层面上探讨复杂网络环境下因果效应的推断方法。
  (2)在组学生物标记筛选层面上,虽然可以采用传统的统计学方法(如卡方检验,t检验,回归模型等)筛选出与疾病终点相关的生物标记,但这些筛选方法本质是关联分析而非标记与疾病终点之间的因果关系。
  (3)在特定“暴露因子→组学生物标记→疾病终点”因果通路(或病因网络)的识别及其效应估计方面,由于通路(或网络)节点之间不仅存在因果关系还存在复杂而广泛的非因果关系,因此,需要去除非因果关系并准确识别因果通路(或因果网络),进而估计通路效应大小。
  为了解决上述三个方面的问题,本论文进行了如下四个方而的研究工作:
  一、因果推断的图模型理论及因果推断准则(第一章)
  引入了近年来发展起来的因果图理论,在Judea Pearl提出的因果图模型框架内,概括综述了因果推断的基本理论和因果推断准则。
  二、基于因果推断的匹配策略与回归策略的理论方法研究(第二章)
  在系统流行病学研究中,推断暴露→组学标记、组学标记→组学标记、组学标记→疾病终点等各个环节的因果关系是识别暴露因子致病通路及其因果效应估计的核心。尽管在病因网络中,暴露因子、组学标记和疾病终点呈现出错综复杂的网络关系,但推断任何复杂因果网络节点之间的因果关系均可简化和缩减为三个节点之间三种核心关系:因果路(E→C→D)、混杂路(E←C→D)和碰撞路(E→C←D)。在推断暴露E对D的因果效应时,若对节点C施加条件(匹配或回归调整)则对因果路(E→C→D)和碰撞路(E→C←D)会造成过度调整,从而歪曲因果关系;而对混杂路(E←C→D)则可以消除混杂作用,从而能够准确推断E对D的因果效应。然而,对于复杂的病因网络中的任意三个节点而言,毕竟不仅仅包含上述三种关系,从因果拓扑结构上存在27中关系。为此,本研究首先定义了病因网络中的如下9种关系情形:a)C是暴露E和疾病D的混杂;b)C是暴露E和疾病D的共同原因并且E对D没有因果作用;c)C是疾病D的独立病因;d)C是E的原因但是对D没有直接因果作用;e)C是E和D的共同子节点;f)C是D的子节点;g)C是E的子节点;h)C是从E到D因果路上的中间环节;i)C是一个工具变量。进而,在Judea Pearl的因果图理论框架下,采用do-算子(do-caculus)和后门准则(back-door criterion)计算E→D的真实因果效应(β);以此作为金标准,从理论推导和统计模拟两个层面上,考察对C施加条件(包括匹配策略和回归调整策略)后,对估计E→D的真实因果效应(β)的偏倚((β)1-β)和精度(SE((β)1))的影响;从而,概括总结出系统流行病学研究中,使用匹配策略和回归调整策略的正确方法。
  主要结果:
  (1)当C为混杂(情形a)时,在传统分析流行病学研究中,认为匹配病例对照研究可以有效提高精度(即SE((β)1)),而且可以降低偏倚((β)1-β)。然而本研究经理论推导证明,匹配C对精度没有明显的提升;同时,也不能完全消除偏倚。在匹配后仍然需要采用条件logistic回归模型或非条件logistic回归模型对 C进行调整,但以非条件 logistic回归模型(logit(p(D=1| E,C))=β0+β1

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号