270d-fe0f

想要用临床经验直觉来建模做课题的临床医生:先写出你心中的因果

2026/05/21 发布 2026/05/22

——写给临床医生的因果推断(Directed Acyclic Graph, DAG)入门解读

本文面向临床医生和临床研究者。
目标不是把大家吓进统计学深水区,而是用临床研究中常见的问题,解释 DAG 为什么有用、什么叫变量,如何对待变量。 网络上现成的DAG工具如何成为我们的科研思维整理助手。
本文内容基于 DAG,结合一例微创手术研究案例的核心思想整理,看完即可入门。

很多临床医生做真实世界研究时,最先遇到的困难并不是“统计软件怎么用”,而是一个更前置的问题:

这个变量(某个临床数据)到底该不该调?

临床研究统计分析里的调整变量 = 在分析时把这个变量考虑进去,让比较结果尽量不被它干扰。
英文常说:adjust for a variable 或 control for a variable
中文常说:调整某变量、控制某变量、校正某变量、纳入协变量。

比如,研究微创手术是否降低术后并发症时,年龄要不要调?BMI 要不要调?术中出血要不要调?住院天数要不要调?如果我们把所有看起来相关的变量都塞进模型,结果会不会更可靠?

答案可能和直觉相反:

变量不是调得越多越好,而是要调得有道理。

DAG,也就是有向无环图,就是帮助我们把这种“有道理”画出来的工具。它不要求每个临床医生都变成统计学家,但它能帮助我们在研究开始之前,先把因果假设、混杂路径和潜在偏倚想清楚。

这张连环画用 12 个小场景,带你快速理解 DAG 如何帮助临床研究者避免常见错误,让观察性研究更规范、更透明,也更接近真正想回答的临床问题。

图片是对一篇经典 DAG 学术文章的解释:

Directed acyclic graphs for clinical research: a tutorial

ChatGPT Image 2026年5月21日 22_38_52.png


一、先看几个常见缩写和名词

在正式看 1–12 个小点之前,先把图里出现的几个英文缩写和术语解释一下。


1. DAG

DAG = Directed Acyclic Graph
中文常译作:有向无环图

可以把它理解成一张 “因果关系地图”

其中:

  • 有向(Directed):箭头有方向,表示“谁可能影响谁”
  • 无环(Acyclic):箭头不能绕一圈回到自己,也就是说不允许出现 A → B → C → A 这种闭环
  • 图(Graph):由一个个变量节点和连接它们的箭头组成

DAG 的主要作用不是直接做统计计算,而是帮助你在研究开始前先想清楚:

  • 我的研究问题到底是什么?
  • 哪些变量应该调整?
  • 哪些变量不能乱调?
  • 研究里可能有哪些偏倚(bias)?
  • 我现在比较的两组患者,是否真的“可比”?

一句话说:

DAG 是帮助临床研究者把“脑子里的因果假设”画出来的工具。


2. MIS

MIS = Minimally Invasive Surgery
中文:微创手术

图里用 MIS 做例子,是为了说明“某种治疗/暴露”如何影响结局。

在临床研究里,MIS 可以作为一个典型的:

  • 暴露(exposure)
  • 干预(intervention)

例如:

我们想研究:微创手术是否会降低术后并发症风险?

这个问题就不是单纯预测问题,而更接近一个因果问题。


3. BMI

BMI = Body Mass Index
中文:体重指数

BMI 常常会同时影响治疗选择和结局。

例如:

  • BMI 可能影响医生是否选择微创手术
  • BMI 也可能影响术后并发症风险

因此,在很多临床研究中,BMI 可能扮演 混杂因素(confounder) 的角色。


4. DAGitty

DAGitty 是一个专门用来画 DAG、检查调整变量的小工具网站。

网址:

https://dagitty.net

它的价值在于:

当你画完 DAG 后,DAGitty 可以帮助你识别:

  • 哪些是后门路径(backdoor paths)
  • 哪些变量需要调整
  • 哪些变量不该调整
  • 哪些是最小充分调整集(minimal sufficient adjustment sets)
  • 当前设计下是否还存在偏倚路径

要注意:

DAGitty 不会替你决定真实世界的因果结构。
它只是帮助你检查:在你当前假设的因果结构下,调整策略是否自洽。


5. 混杂因素(Confounder)

混杂因素(confounder) 是临床研究中最常见、最重要的概念之一。

可以把它理解成:

一个同时影响“暴露”和“结局”的变量。

例如,研究:

微创手术是否影响术后并发症?

年龄可能同时影响:

  • 患者是否接受微创手术
  • 患者发生术后并发症的风险

那么年龄就是 MIS 与术后并发症之间的 混杂因素

如果不控制年龄,就容易把“年龄的影响”误认为是“手术方式的影响”。


6. 后门路径(Backdoor Path)

后门路径(backdoor path) 听起来有点抽象,但可以这样理解:

从暴露走到结局的一条“非因果路径”,它会偷偷把混杂带进来。

例如:

MIS ← 年龄 → 术后并发症

这条路径不是:

MIS → 术后并发症

这样的真正因果路径。

它表达的是:

年龄同时影响 MIS 和术后并发症

所以这是一条后门路径。

如果不堵住这条路径,就会产生混杂偏倚。


7. 后门准则(Backdoor Criterion)

后门准则(backdoor criterion) 可以理解成一个 “选调整变量的规则”

简单说就是:

如果你能找到一组变量,把所有会带来混杂的后门路径都堵住,而且又不去错误调整某些不该调的变量,那么你就更有机会识别暴露对结局的因果效应。

临床直觉版:

后门路径要堵住,真正的因果路径要保留。


8. 碰撞点(Collider)

碰撞点(collider) 是 DAG 初学者最容易踩坑的地方之一。

典型结构是:

A → B ← C

这里中间的 B 就叫 碰撞点

碰撞点的特点是:

  • 不调它时,路径通常是关闭的
  • 一旦调它,或者只分析经过它筛选出来的人,反而可能把一条原本关闭的偏倚路径打开

这也是为什么:

并不是所有和结局有关的变量都该调。

临床研究中,以下情况都可能涉及碰撞点或碰撞点后代:

  • 只纳入接受某项检查的人
  • 只分析接受某种治疗的人
  • 只研究住进 ICU 的患者
  • 只看“有完整随访数据”的人群
  • 只分析“术后仍住院达到某时间”的患者

9. 中介(Mediator)

中介(mediator) 是位于因果路径中间的变量。

结构通常是:

暴露 → 中介 → 结局

例如:

微创手术 → 术中出血 → 术后并发症

如果你研究的是:

微创手术对术后并发症的总效应

那么通常不应调整“术中出血”。

原因是:

如果你调了中介,就相当于把暴露影响结局的一部分真实路径切断了。

一句话记住:

中介不是混杂。
混杂通常要调,中介不能随便调。


10. 偏倚(Bias)

偏倚(bias) 可以简单理解为:

研究结果系统性地偏离真实情况。

这里涉及的常见偏倚包括:

  • 混杂偏倚(confounding bias)
  • 选择偏倚(selection bias)
  • 碰撞点偏倚(collider bias)
  • 过度调整偏倚(overadjustment bias)
  • 未测量混杂偏倚(unmeasured confounding bias)

DAG 的重要作用之一,就是在研究设计阶段提前帮助你发现这些风险。


11. p 值(p-value)

p 值(p-value) 是统计检验里常见的显著性指标。

但要注意:

p 值适合做统计判断,不适合单独拿来决定“哪些变量应该作为混杂因素调整”。

换句话说:

  • 一个变量 p 值显著,不代表它因果上一定该调
  • 一个变量 p 值不显著,也不代表它因果上一定不重要

在因果推断中,是否调整一个变量,应该优先取决于它在因果结构中的角色,而不是只看 p 值。


二、逐点解读:1–12 个小点到底在讲什么?

ChatGPT Image 2026年5月21日 22_38_52.png

1. 什么是 DAG?

这一格的核心意思是:

DAG 是临床研究里帮助我们思考因果关系的工具。

很多观察性研究中,我们看到两个变量有关联,但:

有关联不等于有因果关系。

例如:

  • 接受微创手术的患者术后并发症更少
  • 但这是否一定说明微创手术本身降低了并发症?
  • 还是因为接受微创手术的患者本来就更年轻、病情更轻、基础状态更好?

DAG 的作用,就是把你脑子里对“谁影响谁”的假设画出来,让研究逻辑更清楚。

对临床医生来说,DAG 最实用的价值不是“画图很漂亮”,而是它能帮助你回答:

  • 这个变量到底该不该调?
  • 我现在的分析有没有把真正的因果路径搞坏?
  • 我的研究结论有没有可能被混杂或选择偏倚扭曲?
  • 我的观察性研究能不能更接近“同类比同类”?

临床要点

DAG 是研究设计工具,不只是统计图。


2. 什么是 DAG?——基本组成

这一格是在讲 DAG 的三个基本构件:


2.1 节点(node)

节点就是图里的一个圆点,代表一个变量。

比如:

  • 年龄
  • BMI
  • 病情严重程度
  • 微创手术
  • 术中出血
  • 术后并发症

2.2 箭头(arrow)

箭头表示一个 假设中的因果方向

例如:

年龄 → 手术方式
年龄 → 并发症
手术方式 → 并发症

这里要强调一个重要点:

箭头表示“你假设有因果影响”,不代表这个因果关系已经被证实。

DAG 是把你的理论假设画出来,而不是把数据分析结果画出来。


2.3 无环(acyclic)

无环就是不能出现回路。

例如,下面这种是不允许的:

A → B → C → A

因为这意味着 A 最终又影响回 A 自己,形成了闭环。

DAG 要求因果方向不能这样绕回去。


图中用的例子是:

微创手术(MIS)是否影响术后并发症?

这是一个典型的临床因果问题。

临床要点

DAG 里的箭头是因果假设,不是回归系数,也不是相关性。


3. 目标:识别 MIS 对并发症的因果效应

这一格是在告诉读者:

我们研究 DAG,不是为了画图本身,而是为了更接近真实的因果效应。

在观察性研究里,接受 MIS 的患者和接受开放手术的患者,往往并不“天然可比”。

比如,两组患者可能在这些方面不同:

  • 年龄
  • BMI
  • 基础疾病
  • 癌症严重程度
  • 病情复杂度
  • 既往血栓史
  • 手术适应证
  • 医院或医生偏好

所以,如果你直接比较两组术后并发症发生率,得到的结果可能混合了:

  • 手术方式本身的影响
  • 年龄的影响
  • 病情严重程度的影响
  • 合并症的影响
  • 其他未测量因素的影响

DAG 的作用就是帮助你找出:

  • 哪些差异是混杂
  • 哪些变量要调整
  • 哪些变量不该调整
  • 怎么让比较尽量接近“同类比同类”

临床要点

观察性研究里的两组患者,通常不是天然可比的。
DAG 帮你想清楚:怎样让比较更接近公平比较。


4. 路径的类型:链式、叉式、碰撞点

这一格很关键,因为它是后面所有判断的基础。

DAG 中常见的三种基本结构包括:

  1. 链式(chain)
  2. 叉式(fork)
  3. 碰撞点(collider)

4.1 链式(Chain)

结构:

A → B → C

意思是:

A 通过 B 影响 C。

B 处在因果链条中间。

例如:

手术方式 → 术中出血 → 术后并发症

这里“术中出血”可能就是一个中介变量。

直觉上可以理解为:

B 像一段中间通道,连接 A 和 C。


4.2 叉式(Fork)

结构:

A ← B → C

意思是:

B 同时影响 A 和 C。

B 是 A 和 C 的共同原因,也就是典型的混杂来源。

例如:

MIS ← 年龄 → 术后并发症

年龄同时影响:

  • 是否接受 MIS
  • 是否发生术后并发症

如果不处理年龄,MIS 和并发症之间的关系就可能被年龄混杂。


4.3 碰撞点(Collider)

结构:

A → B ← C

这里 B 是碰撞点。

这类结构最反直觉的地方在于:

  • 不调 B:A 和 C 这条路通常是关着的
  • 调 B:A 和 C 反而会变得相关,偏倚路径被打开

例如:

病情严重程度 → 是否住 ICU ← 手术复杂度

如果你只研究“住 ICU 的患者”,就相当于对“是否住 ICU”这个变量进行了条件化,可能会引入选择偏倚。

临床要点

叉式结构提示混杂,通常要考虑调整;
碰撞点结构提示陷阱,通常不能乱调。


5. 后门路径与后门准则

这一格是在讲 DAG 最实用的规则之一。


5.1 什么是后门路径?

从暴露到结局,如果路径一开始不是从暴露向外走,而是从一个箭头“进入暴露”,通常就是后门路径。

例如:

暴露 ← 混杂因素 → 结局

具体到临床例子:

MIS ← 年龄 → 术后并发症

这条路径不是:

MIS → 术后并发症

这样的真正因果路径。

它表达的是:

年龄同时影响 MIS 和术后并发症。


5.2 为什么要堵后门路径?

因为后门路径会让你误以为:

暴露和结局之间的关联,是暴露导致的。

但其实可能是共同原因造成的。

例如,如果年轻患者更容易接受 MIS,也更不容易发生并发症,那么你看到的 MIS 保护作用,可能有一部分来自年龄差异。


5.3 后门准则的临床直觉版

如果你能找到一组变量,把所有重要的混杂路径都堵住,同时又不去错误调整中介或碰撞点,那么你的估计会更接近真实因果效应。

可以把它理解成:

后门路径要堵,真正的因果路径要留。

临床要点

DAG 选变量的核心,不是“哪些变量 p 值显著”,而是“哪些变量能堵住后门路径”。


6. 例 1:需要调整混杂因素

这一格举的是最经典的例子:

年龄同时影响 MIS 和术后并发症。

结构是:

年龄 → MIS
年龄 → 术后并发症
MIS → 术后并发症

于是就形成了后门路径:

MIS ← 年龄 → 术后并发症

这说明年龄是混杂因素。


临床含义

如果你不调整年龄,你观察到的“手术方式与并发症的关系”里,就混进了年龄的影响。

例如:

  • 年轻患者更可能接受 MIS
  • 年轻患者本身并发症风险更低
  • 于是 MIS 看起来可能更“安全”
  • 但这其中有一部分可能只是年龄造成的

该怎么做?

在分析里应当把年龄作为调整变量之一。

调整后,MIS 与并发症之间的关系会更接近“手术方式本身”的因果影响。

临床要点

同时影响暴露和结局的变量,往往是混杂因素,需要认真考虑调整。


7. 例 2:碰撞点的陷阱,也就是选择偏倚

这一格特别适合提醒临床医生:

有时候越认真筛病人,越可能筛出偏倚。

图里想表达的是:

如果你只分析某一类“被选中的患者”,就可能无意间打开一条偏倚路径。

例如,“是否手术”可能由两个因素共同决定:

病情严重程度 → 是否手术 ← 医生/患者对 MIS 的选择倾向

那么“是否手术”就可能是一个碰撞点。


为什么危险?

如果你只看“已经手术”的患者,相当于对碰撞点进行了条件化。

这可能会导致:

  • 原本没有关联的因素变得有关联
  • 病情严重程度和手术选择之间产生额外关联
  • 进而扭曲手术方式与并发症之间的关系

临床直觉版理解

“只研究某一类被筛出来的人”并不总是更科学。

有时,这种筛选本身就是选择过程,会把偏倚引进来。

例如:

  • 只分析接受某种检查的人
  • 只纳入住院患者
  • 只看 ICU 患者
  • 只看随访完整的患者
  • 只研究接受治疗的人

这些限制条件都需要认真思考:

它是不是一个碰撞点?
它是不是碰撞点的后代?
我是否因为这个选择条件打开了一条偏倚路径?

临床要点

碰撞点不是混杂因素。
调了碰撞点,可能不是减少偏倚,而是制造偏倚。


8. 例 3:过度调整的陷阱

这一格讲的是:

不是调得越多越好。

图里举的是中介变量:

MIS → 术中出血 → 术后并发症

这里“术中出血”位于因果链中间,是中介。


如果你研究的是“总效应”

也就是:

MIS 总体上会不会影响术后并发症?

那你一般不应调整术中出血。

因为一调它,就会把这条真实因果路径切断。


结果会怎样?

可能出现这些问题:

  • 估计到的效应变小
  • 甚至错误地以为 MIS 没什么作用
  • 实际上你只是把 MIS 通过“术中出血”传递的那部分作用删掉了

什么时候可以研究中介?

如果你的研究问题本来就是:

MIS 对并发症的影响,有多少是通过减少术中出血实现的?

那这就是中介分析问题。

这时可以专门设计中介分析。

但这和估计总效应不是同一个问题。

临床要点

中介不是混杂。
如果研究总效应,不要随便调整暴露之后才发生的中介变量。


9. 如何用 DAG 选择调整变量?

这一格可以理解成“临床操作步骤”。


第一步:先画出你认为合理的因果结构

基于临床知识,而不是先跑回归。

你要问自己:

  • 哪些变量会影响暴露?
  • 哪些变量会影响结局?
  • 哪些变量同时影响暴露和结局?
  • 哪些变量位于因果路径中间?
  • 哪些变量可能是筛选条件?
  • 哪些变量可能是碰撞点?
  • 哪些变量是暴露之后才出现的?

第二步:找所有后门路径

看看从暴露到结局之间,有没有那些“非因果但会带来混杂”的路。

例如:

暴露 ← 混杂因素 → 结局

第三步:选择一组变量把后门路径堵住

这些变量通常就是要调整的对象。

例如:

MIS ← 年龄 → 术后并发症

可以通过调整年龄来堵住这条后门路径。


第四步:避免乱调

尤其不要轻易去调:

  • 碰撞点
  • 碰撞点的后代
  • 中介变量
  • 暴露之后才出现的变量
  • 纯粹由暴露影响、又影响结局的路径中间变量

这一格最重要的一句话

画对图,比“跑模型筛变量”更重要。

临床要点

变量调整不是越多越好,而是要调对位置上的变量。


10. 传统的 p 值筛选方法可能有害

这一格是在提醒:

仅凭 p 值来决定是否把某变量纳入模型,可能会出错。

很多人习惯这样做:

  1. 先做单因素分析
  2. p < 0.05 的进多因素模型
  3. p ≥ 0.05 的就删掉

但在因果推断里,这种做法并不可靠。


为什么?

因为一个变量“统计上显著”,不等于它“因果上该调”。

反过来,一个变量“统计上不显著”,也不等于它“因果上不重要”。


可能带来的问题

只靠 p 值筛变量,可能导致:

  • 把不该调的变量调进去
  • 把中介当混杂调了
  • 把碰撞点当混杂调了
  • 把真正的混杂因素漏掉
  • 导致偏倚的因果效应估计

更好的原则

更好的做法是:

理论先行,数据验证。

也就是说:

  1. 先基于临床知识和领域知识画 DAG
  2. 再决定变量调整策略
  3. 然后再做统计分析
  4. 最后用敏感性分析和稳健性分析检验结论是否可靠

临床要点

p 值能告诉你变量在数据里是否“显著相关”,
但不能单独告诉你它在因果结构里是否“该调整”。


11. 用 DAGitty 画图超方便

这一格的目的是把方法落地。

DAGitty 可以帮助临床研究者:

  • 把脑子里的因果结构画出来
  • 标记暴露(exposure)
  • 标记结局(outcome)
  • 标记已调整变量(adjusted variables)
  • 标记未观测变量(unobserved variables)
  • 查看偏倚路径
  • 找最小充分调整集
  • 检查你的调整方案是否合理

它适合谁?

DAGitty 尤其适合:

  • 刚开始学 DAG 的临床医生
  • 已经有课题构想,但不确定变量怎么选的人
  • 想把研究设计写得更规范、更透明的人
  • 想在论文或补充材料中展示因果假设的人
  • 想和统计师、数据科学家更高效沟通的人

它最有价值的地方

DAGitty 最有价值的地方不是替你决定因果结构。

而是帮助你检查:

在我当前这套因果假设下,我的调整策略是否自洽?

例如,它可以提示:

  • 是否存在未被关闭的后门路径
  • 当前调整变量是否足够
  • 是否错误调整了中介变量
  • 是否因为调整碰撞点而打开了偏倚路径

临床要点

DAGitty 是辅助工具,不是因果真相机器。
真正重要的仍然是临床知识和研究问题本身。


12. 小结

最后这一格是在给临床医生一个最实用的总结。

DAG 帮你做三件事。


第一,画出因果假设

把原来脑子里模糊的:

我觉得可能是这样

变成一张明确的图。

这样有助于:

  • 自己想清楚研究问题
  • 和合作者沟通
  • 和统计师沟通
  • 在论文中增加透明度
  • 提高研究设计的可重复性

第二,选择合适的调整变量

根据后门准则找需要调整的混杂因素,而不是凭直觉或只看 p 值。

DAG 会帮助你思考:

  • 哪些变量是混杂因素
  • 哪些变量是中介
  • 哪些变量是碰撞点
  • 哪些变量不在数据里,但可能造成未测量混杂
  • 哪些变量调了反而会出问题

第三,避开常见偏倚

尤其是:

  • 漏掉真正的混杂因素
  • 调了不该调的碰撞点
  • 调了中介
  • 过度调整
  • 用 p 值筛选混杂因素
  • 忽略选择过程造成的偏倚

最后一句话送给临床医生读者

DAG 不只是一个图。
它是一种让临床研究设计更清楚、更透明、更接近真实因果问题的思维工具。


三、给临床医生的超简版记忆口诀

如果你想把整张图浓缩成几句话,可以记成下面这版。


口诀 1

先画图,后分析。

意思是:

不要一上来就跑回归、筛 p 值。
先把研究问题和因果结构想清楚。


口诀 2

堵后门,留因果。

意思是:

把会带来混杂的后门路径堵住,
但不要把真正的因果路径切断。


口诀 3

混杂要调,中介别乱调,碰撞点更别乱调。

意思是:

不是所有变量都该调。
变量在因果图中的位置决定了它该不该调。


口诀 4

不要只靠 p 值选变量。

意思是:

p 值不是混杂因素筛选器。
因果问题要靠因果结构来判断。


口诀 5

DAG 是研究设计工具,不只是统计图。

意思是:

DAG 最重要的价值在于研究设计阶段,
而不是在论文写完后补一张漂亮图。


四、术语小词典


DAG

英文全称:Directed Acyclic Graph
中文:有向无环图

用于表达研究者假设的因果结构。


Directed

中文:有向

表示箭头有方向。

例如:

A → B

表示 A 可能影响 B。


Acyclic

中文:无环

表示不能形成因果闭环。

例如,不能有:

A → B → C → A

Graph

中文:图

由节点和边组成的结构。

在 DAG 里:

  • 节点代表变量
  • 边通常表现为箭头
  • 箭头表达假设中的因果方向

Node

中文:节点

DAG 中的一个变量。

例如:

  • 年龄
  • BMI
  • 治疗方式
  • 术后并发症

Arrow / Edge

中文:箭头 / 边

表示一个假设中的因果方向。

例如:

年龄 → 并发症

表示研究者假设年龄可能影响并发症风险。


Exposure

中文:暴露

研究中的主要原因变量或处理变量。

例如:

  • 是否接受微创手术
  • 是否使用某种药物
  • 是否接受某种干预
  • 是否暴露于某种风险因素

Outcome

中文:结局

研究关心的结果。

例如:

  • 死亡
  • 复发
  • 并发症
  • 再入院
  • 血栓事件
  • 实验室指标变化

Confounder

中文:混杂因素

同时影响暴露和结局的变量。

例如:

暴露 ← 混杂因素 → 结局

Confounding

中文:混杂

当暴露与结局之间的观察关联被共同原因扭曲时,就发生了混杂。

例如:

MIS ← 年龄 → 术后并发症

如果不调整年龄,MIS 与术后并发症之间的关系可能被年龄影响。


Backdoor Path

中文:后门路径

从暴露到结局之间的非因果路径,通常由共同原因造成,会引入混杂。

例如:

MIS ← 年龄 → 术后并发症

Backdoor Criterion

中文:后门准则

用于判断哪些变量需要调整,才能堵住后门路径、识别因果效应的规则。

临床直觉版:

找到一组变量,把混杂路径堵住,但不要切断真正的因果路径。


Chain

中文:链式结构

结构:

A → B → C

B 位于 A 到 C 的因果路径中间。

例如:

手术方式 → 术中出血 → 术后并发症

Fork

中文:叉式结构

结构:

A ← B → C

B 是 A 和 C 的共同原因,常常提示混杂。

例如:

MIS ← 年龄 → 术后并发症

Collider

中文:碰撞点

结构:

A → B ← C

B 是碰撞点。

调了碰撞点,可能打开偏倚路径。


Mediator

中文:中介变量

位于暴露和结局之间的变量。

结构:

暴露 → 中介 → 结局

如果研究总效应,通常不应随便调整中介。


Conditioning

中文:条件化 / 设定条件 / 控制

可以理解为:

  • 在模型中调整某变量
  • 分层分析某变量
  • 限制只分析某变量取特定值的人群

例如,只分析“接受手术的患者”,就是对“是否手术”进行了条件化。


d-Separation

中文:d 分离 / 有向分离

DAG 中用于判断两个变量在给定某些变量后是否独立的规则。

临床医生不一定需要掌握完整数学定义,但需要知道:

d-separation 是 DAG 判断路径是否被堵住的核心规则。


d-Connected

中文:d 连接

如果两个变量之间的路径没有被堵住,它们就是 d-connected。

临床直觉是:

这条路径仍然可能传递关联或偏倚。


Minimal Sufficient Adjustment Set

中文:最小充分调整集

意思是:

为了识别某个因果效应,足以堵住所有后门路径的一组最小变量集合。

“最小”不是说变量越少越好,而是说在当前 DAG 假设下,这组变量已经足够,不必无原则地继续加变量。


Bias

中文:偏倚

研究结果系统性偏离真实情况。


Confounding Bias

中文:混杂偏倚

由于混杂因素没有被合理控制,导致暴露与结局之间的关系被扭曲。


Collider Bias

中文:碰撞点偏倚

由于调整了碰撞点或对碰撞点进行筛选,打开了原本关闭的偏倚路径。


Selection Bias

中文:选择偏倚

由于研究对象进入分析的过程与暴露和结局相关,导致结果发生系统性偏差。

例如,只研究某个被筛选出来的患者群体,可能改变变量之间的关系。


Overadjustment Bias

中文:过度调整偏倚

由于调整了不该调整的变量,例如中介变量,导致真实效应被削弱或扭曲。


Unmeasured Confounding

中文:未测量混杂

有些重要混杂因素没有被记录、没有被测量,或无法进入分析模型。

例如:

  • 病情严重程度没有可靠结构化记录
  • 医生选择治疗方式的偏好无法测量
  • 患者经济状况或依从性没有数据

p-value

中文:p 值

统计检验中的显著性指标。

在因果推断里,不能单独依赖 p 值决定是否调整变量。


M-bias

中文:M 型偏倚

M-bias 是一种由于错误调整碰撞点而产生的偏倚。

它之所以叫 M-bias,是因为相关 DAG 的形状看起来像字母 M。

临床直觉版:

有些变量看起来和暴露、结局都相关,但如果它是碰撞点,调它反而会制造偏倚。


DAGitty

一个在线 DAG 工具,可以用于:

  • 绘制 DAG
  • 标记暴露和结局
  • 检查后门路径
  • 找调整变量
  • 识别潜在偏倚路径

网址:

https://dagitty.net


对临床医生来说,DAG 的核心价值不在于“画了一张复杂的图”,而在于它迫使我们在分析之前先回答几个关键问题:

  • 我真正想估计的因果效应是什么?
  • 暴露和结局之间有哪些非因果路径?
  • 哪些变量是混杂因素?
  • 哪些变量是中介?
  • 哪些变量是碰撞点?
  • 我的调整策略是否会减少偏倚,还是制造新的偏倚?

因此,DAG 不是统计学家的专属工具,而是临床研究者进行高质量观察性研究时的一种思维方式。

一句话总结:

先画 DAG,再跑模型;
先想清楚因果结构,再决定调整变量。

还没有评论,赶紧评论下,抢个沙发?