想要用临床经验直觉来建模做课题的临床医生:先写出你心中的因果
——写给临床医生的因果推断(Directed Acyclic Graph, DAG)入门解读
本文面向临床医生和临床研究者。
目标不是把大家吓进统计学深水区,而是用临床研究中常见的问题,解释 DAG 为什么有用、什么叫变量,如何对待变量。 网络上现成的DAG工具如何成为我们的科研思维整理助手。
本文内容基于 DAG,结合一例微创手术研究案例的核心思想整理,看完即可入门。
很多临床医生做真实世界研究时,最先遇到的困难并不是“统计软件怎么用”,而是一个更前置的问题:
这个变量(某个临床数据)到底该不该调?
临床研究统计分析里的调整变量 = 在分析时把这个变量考虑进去,让比较结果尽量不被它干扰。
英文常说:adjust for a variable 或 control for a variable
中文常说:调整某变量、控制某变量、校正某变量、纳入协变量。
比如,研究微创手术是否降低术后并发症时,年龄要不要调?BMI 要不要调?术中出血要不要调?住院天数要不要调?如果我们把所有看起来相关的变量都塞进模型,结果会不会更可靠?
答案可能和直觉相反:
变量不是调得越多越好,而是要调得有道理。
DAG,也就是有向无环图,就是帮助我们把这种“有道理”画出来的工具。它不要求每个临床医生都变成统计学家,但它能帮助我们在研究开始之前,先把因果假设、混杂路径和潜在偏倚想清楚。
这张连环画用 12 个小场景,带你快速理解 DAG 如何帮助临床研究者避免常见错误,让观察性研究更规范、更透明,也更接近真正想回答的临床问题。
图片是对一篇经典 DAG 学术文章的解释:
Directed acyclic graphs for clinical research: a tutorial

一、先看几个常见缩写和名词
在正式看 1–12 个小点之前,先把图里出现的几个英文缩写和术语解释一下。
1. DAG
DAG = Directed Acyclic Graph
中文常译作:有向无环图
可以把它理解成一张 “因果关系地图”。
其中:
- 有向(Directed):箭头有方向,表示“谁可能影响谁”
-
无环(Acyclic):箭头不能绕一圈回到自己,也就是说不允许出现
A → B → C → A这种闭环 - 图(Graph):由一个个变量节点和连接它们的箭头组成
DAG 的主要作用不是直接做统计计算,而是帮助你在研究开始前先想清楚:
- 我的研究问题到底是什么?
- 哪些变量应该调整?
- 哪些变量不能乱调?
- 研究里可能有哪些偏倚(bias)?
- 我现在比较的两组患者,是否真的“可比”?
一句话说:
DAG 是帮助临床研究者把“脑子里的因果假设”画出来的工具。
2. MIS
MIS = Minimally Invasive Surgery
中文:微创手术
图里用 MIS 做例子,是为了说明“某种治疗/暴露”如何影响结局。
在临床研究里,MIS 可以作为一个典型的:
- 暴露(exposure)
- 或 干预(intervention)
例如:
我们想研究:微创手术是否会降低术后并发症风险?
这个问题就不是单纯预测问题,而更接近一个因果问题。
3. BMI
BMI = Body Mass Index
中文:体重指数
BMI 常常会同时影响治疗选择和结局。
例如:
- BMI 可能影响医生是否选择微创手术
- BMI 也可能影响术后并发症风险
因此,在很多临床研究中,BMI 可能扮演 混杂因素(confounder) 的角色。
4. DAGitty
DAGitty 是一个专门用来画 DAG、检查调整变量的小工具网站。
网址:
它的价值在于:
当你画完 DAG 后,DAGitty 可以帮助你识别:
- 哪些是后门路径(backdoor paths)
- 哪些变量需要调整
- 哪些变量不该调整
- 哪些是最小充分调整集(minimal sufficient adjustment sets)
- 当前设计下是否还存在偏倚路径
要注意:
DAGitty 不会替你决定真实世界的因果结构。
它只是帮助你检查:在你当前假设的因果结构下,调整策略是否自洽。
5. 混杂因素(Confounder)
混杂因素(confounder) 是临床研究中最常见、最重要的概念之一。
可以把它理解成:
一个同时影响“暴露”和“结局”的变量。
例如,研究:
微创手术是否影响术后并发症?
年龄可能同时影响:
- 患者是否接受微创手术
- 患者发生术后并发症的风险
那么年龄就是 MIS 与术后并发症之间的 混杂因素。
如果不控制年龄,就容易把“年龄的影响”误认为是“手术方式的影响”。
6. 后门路径(Backdoor Path)
后门路径(backdoor path) 听起来有点抽象,但可以这样理解:
从暴露走到结局的一条“非因果路径”,它会偷偷把混杂带进来。
例如:
MIS ← 年龄 → 术后并发症
这条路径不是:
MIS → 术后并发症
这样的真正因果路径。
它表达的是:
年龄同时影响 MIS 和术后并发症
所以这是一条后门路径。
如果不堵住这条路径,就会产生混杂偏倚。
7. 后门准则(Backdoor Criterion)
后门准则(backdoor criterion) 可以理解成一个 “选调整变量的规则”。
简单说就是:
如果你能找到一组变量,把所有会带来混杂的后门路径都堵住,而且又不去错误调整某些不该调的变量,那么你就更有机会识别暴露对结局的因果效应。
临床直觉版:
后门路径要堵住,真正的因果路径要保留。
8. 碰撞点(Collider)
碰撞点(collider) 是 DAG 初学者最容易踩坑的地方之一。
典型结构是:
A → B ← C
这里中间的 B 就叫 碰撞点。
碰撞点的特点是:
- 不调它时,路径通常是关闭的
- 一旦调它,或者只分析经过它筛选出来的人,反而可能把一条原本关闭的偏倚路径打开
这也是为什么:
并不是所有和结局有关的变量都该调。
临床研究中,以下情况都可能涉及碰撞点或碰撞点后代:
- 只纳入接受某项检查的人
- 只分析接受某种治疗的人
- 只研究住进 ICU 的患者
- 只看“有完整随访数据”的人群
- 只分析“术后仍住院达到某时间”的患者
9. 中介(Mediator)
中介(mediator) 是位于因果路径中间的变量。
结构通常是:
暴露 → 中介 → 结局
例如:
微创手术 → 术中出血 → 术后并发症
如果你研究的是:
微创手术对术后并发症的总效应
那么通常不应调整“术中出血”。
原因是:
如果你调了中介,就相当于把暴露影响结局的一部分真实路径切断了。
一句话记住:
中介不是混杂。
混杂通常要调,中介不能随便调。
10. 偏倚(Bias)
偏倚(bias) 可以简单理解为:
研究结果系统性地偏离真实情况。
这里涉及的常见偏倚包括:
- 混杂偏倚(confounding bias)
- 选择偏倚(selection bias)
- 碰撞点偏倚(collider bias)
- 过度调整偏倚(overadjustment bias)
- 未测量混杂偏倚(unmeasured confounding bias)
DAG 的重要作用之一,就是在研究设计阶段提前帮助你发现这些风险。
11. p 值(p-value)
p 值(p-value) 是统计检验里常见的显著性指标。
但要注意:
p 值适合做统计判断,不适合单独拿来决定“哪些变量应该作为混杂因素调整”。
换句话说:
- 一个变量 p 值显著,不代表它因果上一定该调
- 一个变量 p 值不显著,也不代表它因果上一定不重要
在因果推断中,是否调整一个变量,应该优先取决于它在因果结构中的角色,而不是只看 p 值。
二、逐点解读:1–12 个小点到底在讲什么?
1. 什么是 DAG?
这一格的核心意思是:
DAG 是临床研究里帮助我们思考因果关系的工具。
很多观察性研究中,我们看到两个变量有关联,但:
有关联不等于有因果关系。
例如:
- 接受微创手术的患者术后并发症更少
- 但这是否一定说明微创手术本身降低了并发症?
- 还是因为接受微创手术的患者本来就更年轻、病情更轻、基础状态更好?
DAG 的作用,就是把你脑子里对“谁影响谁”的假设画出来,让研究逻辑更清楚。
对临床医生来说,DAG 最实用的价值不是“画图很漂亮”,而是它能帮助你回答:
- 这个变量到底该不该调?
- 我现在的分析有没有把真正的因果路径搞坏?
- 我的研究结论有没有可能被混杂或选择偏倚扭曲?
- 我的观察性研究能不能更接近“同类比同类”?
临床要点
DAG 是研究设计工具,不只是统计图。
2. 什么是 DAG?——基本组成
这一格是在讲 DAG 的三个基本构件:
2.1 节点(node)
节点就是图里的一个圆点,代表一个变量。
比如:
- 年龄
- BMI
- 病情严重程度
- 微创手术
- 术中出血
- 术后并发症
2.2 箭头(arrow)
箭头表示一个 假设中的因果方向。
例如:
年龄 → 手术方式
年龄 → 并发症
手术方式 → 并发症
这里要强调一个重要点:
箭头表示“你假设有因果影响”,不代表这个因果关系已经被证实。
DAG 是把你的理论假设画出来,而不是把数据分析结果画出来。
2.3 无环(acyclic)
无环就是不能出现回路。
例如,下面这种是不允许的:
A → B → C → A
因为这意味着 A 最终又影响回 A 自己,形成了闭环。
DAG 要求因果方向不能这样绕回去。
图中用的例子是:
微创手术(MIS)是否影响术后并发症?
这是一个典型的临床因果问题。
临床要点
DAG 里的箭头是因果假设,不是回归系数,也不是相关性。
3. 目标:识别 MIS 对并发症的因果效应
这一格是在告诉读者:
我们研究 DAG,不是为了画图本身,而是为了更接近真实的因果效应。
在观察性研究里,接受 MIS 的患者和接受开放手术的患者,往往并不“天然可比”。
比如,两组患者可能在这些方面不同:
- 年龄
- BMI
- 基础疾病
- 癌症严重程度
- 病情复杂度
- 既往血栓史
- 手术适应证
- 医院或医生偏好
所以,如果你直接比较两组术后并发症发生率,得到的结果可能混合了:
- 手术方式本身的影响
- 年龄的影响
- 病情严重程度的影响
- 合并症的影响
- 其他未测量因素的影响
DAG 的作用就是帮助你找出:
- 哪些差异是混杂
- 哪些变量要调整
- 哪些变量不该调整
- 怎么让比较尽量接近“同类比同类”
临床要点
观察性研究里的两组患者,通常不是天然可比的。
DAG 帮你想清楚:怎样让比较更接近公平比较。
4. 路径的类型:链式、叉式、碰撞点
这一格很关键,因为它是后面所有判断的基础。
DAG 中常见的三种基本结构包括:
- 链式(chain)
- 叉式(fork)
- 碰撞点(collider)
4.1 链式(Chain)
结构:
A → B → C
意思是:
A 通过 B 影响 C。
B 处在因果链条中间。
例如:
手术方式 → 术中出血 → 术后并发症
这里“术中出血”可能就是一个中介变量。
直觉上可以理解为:
B 像一段中间通道,连接 A 和 C。
4.2 叉式(Fork)
结构:
A ← B → C
意思是:
B 同时影响 A 和 C。
B 是 A 和 C 的共同原因,也就是典型的混杂来源。
例如:
MIS ← 年龄 → 术后并发症
年龄同时影响:
- 是否接受 MIS
- 是否发生术后并发症
如果不处理年龄,MIS 和并发症之间的关系就可能被年龄混杂。
4.3 碰撞点(Collider)
结构:
A → B ← C
这里 B 是碰撞点。
这类结构最反直觉的地方在于:
- 不调 B:A 和 C 这条路通常是关着的
- 调 B:A 和 C 反而会变得相关,偏倚路径被打开
例如:
病情严重程度 → 是否住 ICU ← 手术复杂度
如果你只研究“住 ICU 的患者”,就相当于对“是否住 ICU”这个变量进行了条件化,可能会引入选择偏倚。
临床要点
叉式结构提示混杂,通常要考虑调整;
碰撞点结构提示陷阱,通常不能乱调。
5. 后门路径与后门准则
这一格是在讲 DAG 最实用的规则之一。
5.1 什么是后门路径?
从暴露到结局,如果路径一开始不是从暴露向外走,而是从一个箭头“进入暴露”,通常就是后门路径。
例如:
暴露 ← 混杂因素 → 结局
具体到临床例子:
MIS ← 年龄 → 术后并发症
这条路径不是:
MIS → 术后并发症
这样的真正因果路径。
它表达的是:
年龄同时影响 MIS 和术后并发症。
5.2 为什么要堵后门路径?
因为后门路径会让你误以为:
暴露和结局之间的关联,是暴露导致的。
但其实可能是共同原因造成的。
例如,如果年轻患者更容易接受 MIS,也更不容易发生并发症,那么你看到的 MIS 保护作用,可能有一部分来自年龄差异。
5.3 后门准则的临床直觉版
如果你能找到一组变量,把所有重要的混杂路径都堵住,同时又不去错误调整中介或碰撞点,那么你的估计会更接近真实因果效应。
可以把它理解成:
后门路径要堵,真正的因果路径要留。
临床要点
DAG 选变量的核心,不是“哪些变量 p 值显著”,而是“哪些变量能堵住后门路径”。
6. 例 1:需要调整混杂因素
这一格举的是最经典的例子:
年龄同时影响 MIS 和术后并发症。
结构是:
年龄 → MIS
年龄 → 术后并发症
MIS → 术后并发症
于是就形成了后门路径:
MIS ← 年龄 → 术后并发症
这说明年龄是混杂因素。
临床含义
如果你不调整年龄,你观察到的“手术方式与并发症的关系”里,就混进了年龄的影响。
例如:
- 年轻患者更可能接受 MIS
- 年轻患者本身并发症风险更低
- 于是 MIS 看起来可能更“安全”
- 但这其中有一部分可能只是年龄造成的
该怎么做?
在分析里应当把年龄作为调整变量之一。
调整后,MIS 与并发症之间的关系会更接近“手术方式本身”的因果影响。
临床要点
同时影响暴露和结局的变量,往往是混杂因素,需要认真考虑调整。
7. 例 2:碰撞点的陷阱,也就是选择偏倚
这一格特别适合提醒临床医生:
有时候越认真筛病人,越可能筛出偏倚。
图里想表达的是:
如果你只分析某一类“被选中的患者”,就可能无意间打开一条偏倚路径。
例如,“是否手术”可能由两个因素共同决定:
病情严重程度 → 是否手术 ← 医生/患者对 MIS 的选择倾向
那么“是否手术”就可能是一个碰撞点。
为什么危险?
如果你只看“已经手术”的患者,相当于对碰撞点进行了条件化。
这可能会导致:
- 原本没有关联的因素变得有关联
- 病情严重程度和手术选择之间产生额外关联
- 进而扭曲手术方式与并发症之间的关系
临床直觉版理解
“只研究某一类被筛出来的人”并不总是更科学。
有时,这种筛选本身就是选择过程,会把偏倚引进来。
例如:
- 只分析接受某种检查的人
- 只纳入住院患者
- 只看 ICU 患者
- 只看随访完整的患者
- 只研究接受治疗的人
这些限制条件都需要认真思考:
它是不是一个碰撞点?
它是不是碰撞点的后代?
我是否因为这个选择条件打开了一条偏倚路径?
临床要点
碰撞点不是混杂因素。
调了碰撞点,可能不是减少偏倚,而是制造偏倚。
8. 例 3:过度调整的陷阱
这一格讲的是:
不是调得越多越好。
图里举的是中介变量:
MIS → 术中出血 → 术后并发症
这里“术中出血”位于因果链中间,是中介。
如果你研究的是“总效应”
也就是:
MIS 总体上会不会影响术后并发症?
那你一般不应调整术中出血。
因为一调它,就会把这条真实因果路径切断。
结果会怎样?
可能出现这些问题:
- 估计到的效应变小
- 甚至错误地以为 MIS 没什么作用
- 实际上你只是把 MIS 通过“术中出血”传递的那部分作用删掉了
什么时候可以研究中介?
如果你的研究问题本来就是:
MIS 对并发症的影响,有多少是通过减少术中出血实现的?
那这就是中介分析问题。
这时可以专门设计中介分析。
但这和估计总效应不是同一个问题。
临床要点
中介不是混杂。
如果研究总效应,不要随便调整暴露之后才发生的中介变量。
9. 如何用 DAG 选择调整变量?
这一格可以理解成“临床操作步骤”。
第一步:先画出你认为合理的因果结构
基于临床知识,而不是先跑回归。
你要问自己:
- 哪些变量会影响暴露?
- 哪些变量会影响结局?
- 哪些变量同时影响暴露和结局?
- 哪些变量位于因果路径中间?
- 哪些变量可能是筛选条件?
- 哪些变量可能是碰撞点?
- 哪些变量是暴露之后才出现的?
第二步:找所有后门路径
看看从暴露到结局之间,有没有那些“非因果但会带来混杂”的路。
例如:
暴露 ← 混杂因素 → 结局
第三步:选择一组变量把后门路径堵住
这些变量通常就是要调整的对象。
例如:
MIS ← 年龄 → 术后并发症
可以通过调整年龄来堵住这条后门路径。
第四步:避免乱调
尤其不要轻易去调:
- 碰撞点
- 碰撞点的后代
- 中介变量
- 暴露之后才出现的变量
- 纯粹由暴露影响、又影响结局的路径中间变量
这一格最重要的一句话
画对图,比“跑模型筛变量”更重要。
临床要点
变量调整不是越多越好,而是要调对位置上的变量。
10. 传统的 p 值筛选方法可能有害
这一格是在提醒:
仅凭 p 值来决定是否把某变量纳入模型,可能会出错。
很多人习惯这样做:
- 先做单因素分析
- p < 0.05 的进多因素模型
- p ≥ 0.05 的就删掉
但在因果推断里,这种做法并不可靠。
为什么?
因为一个变量“统计上显著”,不等于它“因果上该调”。
反过来,一个变量“统计上不显著”,也不等于它“因果上不重要”。
可能带来的问题
只靠 p 值筛变量,可能导致:
- 把不该调的变量调进去
- 把中介当混杂调了
- 把碰撞点当混杂调了
- 把真正的混杂因素漏掉
- 导致偏倚的因果效应估计
更好的原则
更好的做法是:
理论先行,数据验证。
也就是说:
- 先基于临床知识和领域知识画 DAG
- 再决定变量调整策略
- 然后再做统计分析
- 最后用敏感性分析和稳健性分析检验结论是否可靠
临床要点
p 值能告诉你变量在数据里是否“显著相关”,
但不能单独告诉你它在因果结构里是否“该调整”。
11. 用 DAGitty 画图超方便
这一格的目的是把方法落地。
DAGitty 可以帮助临床研究者:
- 把脑子里的因果结构画出来
- 标记暴露(exposure)
- 标记结局(outcome)
- 标记已调整变量(adjusted variables)
- 标记未观测变量(unobserved variables)
- 查看偏倚路径
- 找最小充分调整集
- 检查你的调整方案是否合理
它适合谁?
DAGitty 尤其适合:
- 刚开始学 DAG 的临床医生
- 已经有课题构想,但不确定变量怎么选的人
- 想把研究设计写得更规范、更透明的人
- 想在论文或补充材料中展示因果假设的人
- 想和统计师、数据科学家更高效沟通的人
它最有价值的地方
DAGitty 最有价值的地方不是替你决定因果结构。
而是帮助你检查:
在我当前这套因果假设下,我的调整策略是否自洽?
例如,它可以提示:
- 是否存在未被关闭的后门路径
- 当前调整变量是否足够
- 是否错误调整了中介变量
- 是否因为调整碰撞点而打开了偏倚路径
临床要点
DAGitty 是辅助工具,不是因果真相机器。
真正重要的仍然是临床知识和研究问题本身。
12. 小结
最后这一格是在给临床医生一个最实用的总结。
DAG 帮你做三件事。
第一,画出因果假设
把原来脑子里模糊的:
我觉得可能是这样
变成一张明确的图。
这样有助于:
- 自己想清楚研究问题
- 和合作者沟通
- 和统计师沟通
- 在论文中增加透明度
- 提高研究设计的可重复性
第二,选择合适的调整变量
根据后门准则找需要调整的混杂因素,而不是凭直觉或只看 p 值。
DAG 会帮助你思考:
- 哪些变量是混杂因素
- 哪些变量是中介
- 哪些变量是碰撞点
- 哪些变量不在数据里,但可能造成未测量混杂
- 哪些变量调了反而会出问题
第三,避开常见偏倚
尤其是:
- 漏掉真正的混杂因素
- 调了不该调的碰撞点
- 调了中介
- 过度调整
- 用 p 值筛选混杂因素
- 忽略选择过程造成的偏倚
最后一句话送给临床医生读者
DAG 不只是一个图。
它是一种让临床研究设计更清楚、更透明、更接近真实因果问题的思维工具。
三、给临床医生的超简版记忆口诀
如果你想把整张图浓缩成几句话,可以记成下面这版。
口诀 1
先画图,后分析。
意思是:
不要一上来就跑回归、筛 p 值。
先把研究问题和因果结构想清楚。
口诀 2
堵后门,留因果。
意思是:
把会带来混杂的后门路径堵住,
但不要把真正的因果路径切断。
口诀 3
混杂要调,中介别乱调,碰撞点更别乱调。
意思是:
不是所有变量都该调。
变量在因果图中的位置决定了它该不该调。
口诀 4
不要只靠 p 值选变量。
意思是:
p 值不是混杂因素筛选器。
因果问题要靠因果结构来判断。
口诀 5
DAG 是研究设计工具,不只是统计图。
意思是:
DAG 最重要的价值在于研究设计阶段,
而不是在论文写完后补一张漂亮图。
四、术语小词典
DAG
英文全称:Directed Acyclic Graph
中文:有向无环图
用于表达研究者假设的因果结构。
Directed
中文:有向
表示箭头有方向。
例如:
A → B
表示 A 可能影响 B。
Acyclic
中文:无环
表示不能形成因果闭环。
例如,不能有:
A → B → C → A
Graph
中文:图
由节点和边组成的结构。
在 DAG 里:
- 节点代表变量
- 边通常表现为箭头
- 箭头表达假设中的因果方向
Node
中文:节点
DAG 中的一个变量。
例如:
- 年龄
- BMI
- 治疗方式
- 术后并发症
Arrow / Edge
中文:箭头 / 边
表示一个假设中的因果方向。
例如:
年龄 → 并发症
表示研究者假设年龄可能影响并发症风险。
Exposure
中文:暴露
研究中的主要原因变量或处理变量。
例如:
- 是否接受微创手术
- 是否使用某种药物
- 是否接受某种干预
- 是否暴露于某种风险因素
Outcome
中文:结局
研究关心的结果。
例如:
- 死亡
- 复发
- 并发症
- 再入院
- 血栓事件
- 实验室指标变化
Confounder
中文:混杂因素
同时影响暴露和结局的变量。
例如:
暴露 ← 混杂因素 → 结局
Confounding
中文:混杂
当暴露与结局之间的观察关联被共同原因扭曲时,就发生了混杂。
例如:
MIS ← 年龄 → 术后并发症
如果不调整年龄,MIS 与术后并发症之间的关系可能被年龄影响。
Backdoor Path
中文:后门路径
从暴露到结局之间的非因果路径,通常由共同原因造成,会引入混杂。
例如:
MIS ← 年龄 → 术后并发症
Backdoor Criterion
中文:后门准则
用于判断哪些变量需要调整,才能堵住后门路径、识别因果效应的规则。
临床直觉版:
找到一组变量,把混杂路径堵住,但不要切断真正的因果路径。
Chain
中文:链式结构
结构:
A → B → C
B 位于 A 到 C 的因果路径中间。
例如:
手术方式 → 术中出血 → 术后并发症
Fork
中文:叉式结构
结构:
A ← B → C
B 是 A 和 C 的共同原因,常常提示混杂。
例如:
MIS ← 年龄 → 术后并发症
Collider
中文:碰撞点
结构:
A → B ← C
B 是碰撞点。
调了碰撞点,可能打开偏倚路径。
Mediator
中文:中介变量
位于暴露和结局之间的变量。
结构:
暴露 → 中介 → 结局
如果研究总效应,通常不应随便调整中介。
Conditioning
中文:条件化 / 设定条件 / 控制
可以理解为:
- 在模型中调整某变量
- 分层分析某变量
- 限制只分析某变量取特定值的人群
例如,只分析“接受手术的患者”,就是对“是否手术”进行了条件化。
d-Separation
中文:d 分离 / 有向分离
DAG 中用于判断两个变量在给定某些变量后是否独立的规则。
临床医生不一定需要掌握完整数学定义,但需要知道:
d-separation 是 DAG 判断路径是否被堵住的核心规则。
d-Connected
中文:d 连接
如果两个变量之间的路径没有被堵住,它们就是 d-connected。
临床直觉是:
这条路径仍然可能传递关联或偏倚。
Minimal Sufficient Adjustment Set
中文:最小充分调整集
意思是:
为了识别某个因果效应,足以堵住所有后门路径的一组最小变量集合。
“最小”不是说变量越少越好,而是说在当前 DAG 假设下,这组变量已经足够,不必无原则地继续加变量。
Bias
中文:偏倚
研究结果系统性偏离真实情况。
Confounding Bias
中文:混杂偏倚
由于混杂因素没有被合理控制,导致暴露与结局之间的关系被扭曲。
Collider Bias
中文:碰撞点偏倚
由于调整了碰撞点或对碰撞点进行筛选,打开了原本关闭的偏倚路径。
Selection Bias
中文:选择偏倚
由于研究对象进入分析的过程与暴露和结局相关,导致结果发生系统性偏差。
例如,只研究某个被筛选出来的患者群体,可能改变变量之间的关系。
Overadjustment Bias
中文:过度调整偏倚
由于调整了不该调整的变量,例如中介变量,导致真实效应被削弱或扭曲。
Unmeasured Confounding
中文:未测量混杂
有些重要混杂因素没有被记录、没有被测量,或无法进入分析模型。
例如:
- 病情严重程度没有可靠结构化记录
- 医生选择治疗方式的偏好无法测量
- 患者经济状况或依从性没有数据
p-value
中文:p 值
统计检验中的显著性指标。
在因果推断里,不能单独依赖 p 值决定是否调整变量。
M-bias
中文:M 型偏倚
M-bias 是一种由于错误调整碰撞点而产生的偏倚。
它之所以叫 M-bias,是因为相关 DAG 的形状看起来像字母 M。
临床直觉版:
有些变量看起来和暴露、结局都相关,但如果它是碰撞点,调它反而会制造偏倚。
DAGitty
一个在线 DAG 工具,可以用于:
- 绘制 DAG
- 标记暴露和结局
- 检查后门路径
- 找调整变量
- 识别潜在偏倚路径
网址:
对临床医生来说,DAG 的核心价值不在于“画了一张复杂的图”,而在于它迫使我们在分析之前先回答几个关键问题:
- 我真正想估计的因果效应是什么?
- 暴露和结局之间有哪些非因果路径?
- 哪些变量是混杂因素?
- 哪些变量是中介?
- 哪些变量是碰撞点?
- 我的调整策略是否会减少偏倚,还是制造新的偏倚?
因此,DAG 不是统计学家的专属工具,而是临床研究者进行高质量观察性研究时的一种思维方式。
一句话总结:
先画 DAG,再跑模型;
先想清楚因果结构,再决定调整变量。
