——写给临床医生的因果推断（Directed Acyclic Graph, DAG）入门解读

本文面向临床医生和临床研究者。
目标不是把大家吓进统计学深水区，而是用临床研究中常见的问题，解释 DAG 为什么有用、什么叫变量，如何对待变量。网络上现成的DAG工具如何成为我们的科研思维整理助手。
本文内容基于 DAG，结合一例微创手术研究案例的核心思想整理，看完即可入门。

很多临床医生做真实世界研究时，最先遇到的困难并不是“统计软件怎么用”，而是一个更前置的问题：

这个变量（某个临床数据）到底该不该调？

临床研究统计分析里的调整变量 = 在分析时把这个变量考虑进去，让比较结果尽量不被它干扰。
英文常说：adjust for a variable 或 control for a variable
中文常说：调整某变量、控制某变量、校正某变量、纳入协变量。

比如，研究微创手术是否降低术后并发症时，年龄要不要调？BMI 要不要调？术中出血要不要调？住院天数要不要调？如果我们把所有看起来相关的变量都塞进模型，结果会不会更可靠？

答案可能和直觉相反：

变量不是调得越多越好，而是要调得有道理。

DAG，也就是有向无环图，就是帮助我们把这种“有道理”画出来的工具。它不要求每个临床医生都变成统计学家，但它能帮助我们在研究开始之前，先把因果假设、混杂路径和潜在偏倚想清楚。

这张连环画用 12 个小场景，带你快速理解 DAG 如何帮助临床研究者避免常见错误，让观察性研究更规范、更透明，也更接近真正想回答的临床问题。

图片是对一篇经典 DAG 学术文章的解释：

Directed acyclic graphs for clinical research: a tutorial

ChatGPT Image 2026年5月21日 22_38_52.png

一、先看几个常见缩写和名词

在正式看 1–12 个小点之前，先把图里出现的几个英文缩写和术语解释一下。

1. DAG

DAG = Directed Acyclic Graph
中文常译作：有向无环图

可以把它理解成一张 “因果关系地图”。

其中：

有向（Directed）：箭头有方向，表示“谁可能影响谁”
无环（Acyclic）：箭头不能绕一圈回到自己，也就是说不允许出现 A → B → C → A 这种闭环
图（Graph）：由一个个变量节点和连接它们的箭头组成

DAG 的主要作用不是直接做统计计算，而是帮助你在研究开始前先想清楚：

我的研究问题到底是什么？
哪些变量应该调整？
哪些变量不能乱调？
研究里可能有哪些偏倚（bias）？
我现在比较的两组患者，是否真的“可比”？

一句话说：

DAG 是帮助临床研究者把“脑子里的因果假设”画出来的工具。

2. MIS

MIS = Minimally Invasive Surgery
中文：微创手术

图里用 MIS 做例子，是为了说明“某种治疗/暴露”如何影响结局。

在临床研究里，MIS 可以作为一个典型的：

暴露（exposure）
或 干预（intervention）

例如：

我们想研究：微创手术是否会降低术后并发症风险？

这个问题就不是单纯预测问题，而更接近一个因果问题。

3. BMI

BMI = Body Mass Index
中文：体重指数

BMI 常常会同时影响治疗选择和结局。

例如：

BMI 可能影响医生是否选择微创手术
BMI 也可能影响术后并发症风险

因此，在很多临床研究中，BMI 可能扮演 混杂因素（confounder） 的角色。

4. DAGitty

DAGitty 是一个专门用来画 DAG、检查调整变量的小工具网站。

网址：

https://dagitty.net

它的价值在于：

当你画完 DAG 后，DAGitty 可以帮助你识别：

哪些是后门路径（backdoor paths）
哪些变量需要调整
哪些变量不该调整
哪些是最小充分调整集（minimal sufficient adjustment sets）
当前设计下是否还存在偏倚路径

要注意：

DAGitty 不会替你决定真实世界的因果结构。
它只是帮助你检查：在你当前假设的因果结构下，调整策略是否自洽。

5. 混杂因素（Confounder）

混杂因素（confounder） 是临床研究中最常见、最重要的概念之一。

可以把它理解成：

一个同时影响“暴露”和“结局”的变量。

例如，研究：

微创手术是否影响术后并发症？

年龄可能同时影响：

患者是否接受微创手术
患者发生术后并发症的风险

那么年龄就是 MIS 与术后并发症之间的 混杂因素。

如果不控制年龄，就容易把“年龄的影响”误认为是“手术方式的影响”。

6. 后门路径（Backdoor Path）

后门路径（backdoor path） 听起来有点抽象，但可以这样理解：

从暴露走到结局的一条“非因果路径”，它会偷偷把混杂带进来。

例如：

MIS ← 年龄 → 术后并发症

这条路径不是：

MIS → 术后并发症

这样的真正因果路径。

它表达的是：

年龄同时影响 MIS 和术后并发症

所以这是一条后门路径。

如果不堵住这条路径，就会产生混杂偏倚。

7. 后门准则（Backdoor Criterion）

后门准则（backdoor criterion） 可以理解成一个 “选调整变量的规则”。

简单说就是：

如果你能找到一组变量，把所有会带来混杂的后门路径都堵住，而且又不去错误调整某些不该调的变量，那么你就更有机会识别暴露对结局的因果效应。

临床直觉版：

后门路径要堵住，真正的因果路径要保留。

8. 碰撞点（Collider）

碰撞点（collider） 是 DAG 初学者最容易踩坑的地方之一。

典型结构是：

A → B ← C

这里中间的 B 就叫 碰撞点。

碰撞点的特点是：

不调它时，路径通常是关闭的
一旦调它，或者只分析经过它筛选出来的人，反而可能把一条原本关闭的偏倚路径打开

这也是为什么：

并不是所有和结局有关的变量都该调。

临床研究中，以下情况都可能涉及碰撞点或碰撞点后代：

只纳入接受某项检查的人
只分析接受某种治疗的人
只研究住进 ICU 的患者
只看“有完整随访数据”的人群
只分析“术后仍住院达到某时间”的患者

9. 中介（Mediator）

中介（mediator） 是位于因果路径中间的变量。

结构通常是：

暴露 → 中介 → 结局

例如：

微创手术 → 术中出血 → 术后并发症

如果你研究的是：

微创手术对术后并发症的总效应

那么通常不应调整“术中出血”。

原因是：

如果你调了中介，就相当于把暴露影响结局的一部分真实路径切断了。

一句话记住：

中介不是混杂。
混杂通常要调，中介不能随便调。

10. 偏倚（Bias）

偏倚（bias） 可以简单理解为：

研究结果系统性地偏离真实情况。

这里涉及的常见偏倚包括：

混杂偏倚（confounding bias）
选择偏倚（selection bias）
碰撞点偏倚（collider bias）
过度调整偏倚（overadjustment bias）
未测量混杂偏倚（unmeasured confounding bias）

DAG 的重要作用之一，就是在研究设计阶段提前帮助你发现这些风险。

11. p 值（p-value）

p 值（p-value） 是统计检验里常见的显著性指标。

但要注意：

p 值适合做统计判断，不适合单独拿来决定“哪些变量应该作为混杂因素调整”。

换句话说：

一个变量 p 值显著，不代表它因果上一定该调
一个变量 p 值不显著，也不代表它因果上一定不重要

在因果推断中，是否调整一个变量，应该优先取决于它在因果结构中的角色，而不是只看 p 值。

二、逐点解读：1–12 个小点到底在讲什么？

1. 什么是 DAG？

这一格的核心意思是：

DAG 是临床研究里帮助我们思考因果关系的工具。

很多观察性研究中，我们看到两个变量有关联，但：

有关联不等于有因果关系。

例如：

接受微创手术的患者术后并发症更少
但这是否一定说明微创手术本身降低了并发症？
还是因为接受微创手术的患者本来就更年轻、病情更轻、基础状态更好？

DAG 的作用，就是把你脑子里对“谁影响谁”的假设画出来，让研究逻辑更清楚。

对临床医生来说，DAG 最实用的价值不是“画图很漂亮”，而是它能帮助你回答：

这个变量到底该不该调？
我现在的分析有没有把真正的因果路径搞坏？
我的研究结论有没有可能被混杂或选择偏倚扭曲？
我的观察性研究能不能更接近“同类比同类”？

临床要点

DAG 是研究设计工具，不只是统计图。

2. 什么是 DAG？——基本组成

这一格是在讲 DAG 的三个基本构件：

2.1 节点（node）

节点就是图里的一个圆点，代表一个变量。

比如：

年龄
BMI
病情严重程度
微创手术
术中出血
术后并发症

2.2 箭头（arrow）

箭头表示一个 假设中的因果方向。

例如：

年龄 → 手术方式
年龄 → 并发症
手术方式 → 并发症

这里要强调一个重要点：

箭头表示“你假设有因果影响”，不代表这个因果关系已经被证实。

DAG 是把你的理论假设画出来，而不是把数据分析结果画出来。

2.3 无环（acyclic）

无环就是不能出现回路。

例如，下面这种是不允许的：

A → B → C → A

因为这意味着 A 最终又影响回 A 自己，形成了闭环。

DAG 要求因果方向不能这样绕回去。

图中用的例子是：

微创手术（MIS）是否影响术后并发症？

这是一个典型的临床因果问题。

临床要点

DAG 里的箭头是因果假设，不是回归系数，也不是相关性。

3. 目标：识别 MIS 对并发症的因果效应

这一格是在告诉读者：

我们研究 DAG，不是为了画图本身，而是为了更接近真实的因果效应。

在观察性研究里，接受 MIS 的患者和接受开放手术的患者，往往并不“天然可比”。

比如，两组患者可能在这些方面不同：

年龄
BMI
基础疾病
癌症严重程度
病情复杂度
既往血栓史
手术适应证
医院或医生偏好

所以，如果你直接比较两组术后并发症发生率，得到的结果可能混合了：

手术方式本身的影响
年龄的影响
病情严重程度的影响
合并症的影响
其他未测量因素的影响

DAG 的作用就是帮助你找出：

哪些差异是混杂
哪些变量要调整
哪些变量不该调整
怎么让比较尽量接近“同类比同类”

临床要点

观察性研究里的两组患者，通常不是天然可比的。
DAG 帮你想清楚：怎样让比较更接近公平比较。

4. 路径的类型：链式、叉式、碰撞点

这一格很关键，因为它是后面所有判断的基础。

DAG 中常见的三种基本结构包括：

链式（chain）
叉式（fork）
碰撞点（collider）

4.1 链式（Chain）

结构：

A → B → C

意思是：

A 通过 B 影响 C。

B 处在因果链条中间。

例如：

手术方式 → 术中出血 → 术后并发症

这里“术中出血”可能就是一个中介变量。

直觉上可以理解为：

B 像一段中间通道，连接 A 和 C。

4.2 叉式（Fork）

结构：

A ← B → C

意思是：

B 同时影响 A 和 C。

B 是 A 和 C 的共同原因，也就是典型的混杂来源。

例如：

MIS ← 年龄 → 术后并发症

年龄同时影响：

是否接受 MIS
是否发生术后并发症

如果不处理年龄，MIS 和并发症之间的关系就可能被年龄混杂。

4.3 碰撞点（Collider）

结构：

A → B ← C

这里 B 是碰撞点。

这类结构最反直觉的地方在于：

不调 B：A 和 C 这条路通常是关着的
调 B：A 和 C 反而会变得相关，偏倚路径被打开

例如：

病情严重程度 → 是否住 ICU ← 手术复杂度

如果你只研究“住 ICU 的患者”，就相当于对“是否住 ICU”这个变量进行了条件化，可能会引入选择偏倚。

临床要点

叉式结构提示混杂，通常要考虑调整；
碰撞点结构提示陷阱，通常不能乱调。

5. 后门路径与后门准则

这一格是在讲 DAG 最实用的规则之一。

5.1 什么是后门路径？

从暴露到结局，如果路径一开始不是从暴露向外走，而是从一个箭头“进入暴露”，通常就是后门路径。

例如：

暴露 ← 混杂因素 → 结局

具体到临床例子：

MIS ← 年龄 → 术后并发症

这条路径不是：

MIS → 术后并发症

这样的真正因果路径。

它表达的是：

年龄同时影响 MIS 和术后并发症。

5.2 为什么要堵后门路径？

因为后门路径会让你误以为：

暴露和结局之间的关联，是暴露导致的。

但其实可能是共同原因造成的。

例如，如果年轻患者更容易接受 MIS，也更不容易发生并发症，那么你看到的 MIS 保护作用，可能有一部分来自年龄差异。

5.3 后门准则的临床直觉版

如果你能找到一组变量，把所有重要的混杂路径都堵住，同时又不去错误调整中介或碰撞点，那么你的估计会更接近真实因果效应。

可以把它理解成：

后门路径要堵，真正的因果路径要留。

临床要点

DAG 选变量的核心，不是“哪些变量 p 值显著”，而是“哪些变量能堵住后门路径”。

6. 例 1：需要调整混杂因素

这一格举的是最经典的例子：

年龄同时影响 MIS 和术后并发症。

结构是：

年龄 → MIS
年龄 → 术后并发症
MIS → 术后并发症

于是就形成了后门路径：

MIS ← 年龄 → 术后并发症

这说明年龄是混杂因素。

临床含义

如果你不调整年龄，你观察到的“手术方式与并发症的关系”里，就混进了年龄的影响。

例如：

年轻患者更可能接受 MIS
年轻患者本身并发症风险更低
于是 MIS 看起来可能更“安全”
但这其中有一部分可能只是年龄造成的

该怎么做？

在分析里应当把年龄作为调整变量之一。

调整后，MIS 与并发症之间的关系会更接近“手术方式本身”的因果影响。

临床要点

同时影响暴露和结局的变量，往往是混杂因素，需要认真考虑调整。

7. 例 2：碰撞点的陷阱，也就是选择偏倚

这一格特别适合提醒临床医生：

有时候越认真筛病人，越可能筛出偏倚。

图里想表达的是：

如果你只分析某一类“被选中的患者”，就可能无意间打开一条偏倚路径。

例如，“是否手术”可能由两个因素共同决定：

病情严重程度 → 是否手术 ← 医生/患者对 MIS 的选择倾向

那么“是否手术”就可能是一个碰撞点。

为什么危险？

如果你只看“已经手术”的患者，相当于对碰撞点进行了条件化。

这可能会导致：

原本没有关联的因素变得有关联
病情严重程度和手术选择之间产生额外关联
进而扭曲手术方式与并发症之间的关系

临床直觉版理解

“只研究某一类被筛出来的人”并不总是更科学。

有时，这种筛选本身就是选择过程，会把偏倚引进来。

例如：

只分析接受某种检查的人
只纳入住院患者
只看 ICU 患者
只看随访完整的患者
只研究接受治疗的人

这些限制条件都需要认真思考：

它是不是一个碰撞点？
它是不是碰撞点的后代？
我是否因为这个选择条件打开了一条偏倚路径？

临床要点

碰撞点不是混杂因素。
调了碰撞点，可能不是减少偏倚，而是制造偏倚。

8. 例 3：过度调整的陷阱

这一格讲的是：

不是调得越多越好。

图里举的是中介变量：

MIS → 术中出血 → 术后并发症

这里“术中出血”位于因果链中间，是中介。

如果你研究的是“总效应”

也就是：

MIS 总体上会不会影响术后并发症？

那你一般不应调整术中出血。

因为一调它，就会把这条真实因果路径切断。

结果会怎样？

可能出现这些问题：

估计到的效应变小
甚至错误地以为 MIS 没什么作用
实际上你只是把 MIS 通过“术中出血”传递的那部分作用删掉了

什么时候可以研究中介？

如果你的研究问题本来就是：

MIS 对并发症的影响，有多少是通过减少术中出血实现的？

那这就是中介分析问题。

这时可以专门设计中介分析。

但这和估计总效应不是同一个问题。

临床要点

中介不是混杂。
如果研究总效应，不要随便调整暴露之后才发生的中介变量。

9. 如何用 DAG 选择调整变量？

这一格可以理解成“临床操作步骤”。

第一步：先画出你认为合理的因果结构

基于临床知识，而不是先跑回归。

你要问自己：

哪些变量会影响暴露？
哪些变量会影响结局？
哪些变量同时影响暴露和结局？
哪些变量位于因果路径中间？
哪些变量可能是筛选条件？
哪些变量可能是碰撞点？
哪些变量是暴露之后才出现的？

第二步：找所有后门路径

看看从暴露到结局之间，有没有那些“非因果但会带来混杂”的路。

例如：

暴露 ← 混杂因素 → 结局

第三步：选择一组变量把后门路径堵住

这些变量通常就是要调整的对象。

例如：

MIS ← 年龄 → 术后并发症

可以通过调整年龄来堵住这条后门路径。

第四步：避免乱调

尤其不要轻易去调：

碰撞点
碰撞点的后代
中介变量
暴露之后才出现的变量
纯粹由暴露影响、又影响结局的路径中间变量

这一格最重要的一句话

画对图，比“跑模型筛变量”更重要。

临床要点

变量调整不是越多越好，而是要调对位置上的变量。

10. 传统的 p 值筛选方法可能有害

这一格是在提醒：

仅凭 p 值来决定是否把某变量纳入模型，可能会出错。

很多人习惯这样做：

先做单因素分析
p < 0.05 的进多因素模型
p ≥ 0.05 的就删掉

但在因果推断里，这种做法并不可靠。

为什么？

因为一个变量“统计上显著”，不等于它“因果上该调”。

反过来，一个变量“统计上不显著”，也不等于它“因果上不重要”。

可能带来的问题

只靠 p 值筛变量，可能导致：

把不该调的变量调进去
把中介当混杂调了
把碰撞点当混杂调了
把真正的混杂因素漏掉
导致偏倚的因果效应估计

更好的原则

更好的做法是：

理论先行，数据验证。

也就是说：

先基于临床知识和领域知识画 DAG
再决定变量调整策略
然后再做统计分析
最后用敏感性分析和稳健性分析检验结论是否可靠

临床要点

p 值能告诉你变量在数据里是否“显著相关”，
但不能单独告诉你它在因果结构里是否“该调整”。

11. 用 DAGitty 画图超方便

这一格的目的是把方法落地。

DAGitty 可以帮助临床研究者：

把脑子里的因果结构画出来
标记暴露（exposure）
标记结局（outcome）
标记已调整变量（adjusted variables）
标记未观测变量（unobserved variables）
查看偏倚路径
找最小充分调整集
检查你的调整方案是否合理

它适合谁？

DAGitty 尤其适合：

刚开始学 DAG 的临床医生
已经有课题构想，但不确定变量怎么选的人
想把研究设计写得更规范、更透明的人
想在论文或补充材料中展示因果假设的人
想和统计师、数据科学家更高效沟通的人

它最有价值的地方

DAGitty 最有价值的地方不是替你决定因果结构。

而是帮助你检查：

在我当前这套因果假设下，我的调整策略是否自洽？

例如，它可以提示：

是否存在未被关闭的后门路径
当前调整变量是否足够
是否错误调整了中介变量
是否因为调整碰撞点而打开了偏倚路径

临床要点

DAGitty 是辅助工具，不是因果真相机器。
真正重要的仍然是临床知识和研究问题本身。

12. 小结

最后这一格是在给临床医生一个最实用的总结。

DAG 帮你做三件事。

第一，画出因果假设

把原来脑子里模糊的：

我觉得可能是这样

变成一张明确的图。

这样有助于：

自己想清楚研究问题
和合作者沟通
和统计师沟通
在论文中增加透明度
提高研究设计的可重复性

第二，选择合适的调整变量

根据后门准则找需要调整的混杂因素，而不是凭直觉或只看 p 值。

DAG 会帮助你思考：

哪些变量是混杂因素
哪些变量是中介
哪些变量是碰撞点
哪些变量不在数据里，但可能造成未测量混杂
哪些变量调了反而会出问题

第三，避开常见偏倚

尤其是：

漏掉真正的混杂因素
调了不该调的碰撞点
调了中介
过度调整
用 p 值筛选混杂因素
忽略选择过程造成的偏倚

最后一句话送给临床医生读者

DAG 不只是一个图。
它是一种让临床研究设计更清楚、更透明、更接近真实因果问题的思维工具。

三、给临床医生的超简版记忆口诀

如果你想把整张图浓缩成几句话，可以记成下面这版。

口诀 1

先画图，后分析。

意思是：

不要一上来就跑回归、筛 p 值。
先把研究问题和因果结构想清楚。

口诀 2

堵后门，留因果。

意思是：

把会带来混杂的后门路径堵住，
但不要把真正的因果路径切断。

口诀 3

混杂要调，中介别乱调，碰撞点更别乱调。

意思是：

不是所有变量都该调。
变量在因果图中的位置决定了它该不该调。

口诀 4

不要只靠 p 值选变量。

意思是：

p 值不是混杂因素筛选器。
因果问题要靠因果结构来判断。

口诀 5

DAG 是研究设计工具，不只是统计图。

意思是：

DAG 最重要的价值在于研究设计阶段，
而不是在论文写完后补一张漂亮图。

四、术语小词典

DAG

英文全称：Directed Acyclic Graph
中文：有向无环图

用于表达研究者假设的因果结构。

Directed

中文：有向

表示箭头有方向。

例如：

A → B

表示 A 可能影响 B。

Acyclic

中文：无环

表示不能形成因果闭环。

例如，不能有：

A → B → C → A

Graph

中文：图

由节点和边组成的结构。

在 DAG 里：

节点代表变量
边通常表现为箭头
箭头表达假设中的因果方向

Node

中文：节点

DAG 中的一个变量。

例如：

年龄
BMI
治疗方式
术后并发症

Arrow / Edge

中文：箭头 / 边

表示一个假设中的因果方向。

例如：

年龄 → 并发症

表示研究者假设年龄可能影响并发症风险。

Exposure

中文：暴露

研究中的主要原因变量或处理变量。

例如：

是否接受微创手术
是否使用某种药物
是否接受某种干预
是否暴露于某种风险因素

Outcome

中文：结局

研究关心的结果。

例如：

死亡
复发
并发症
再入院
血栓事件
实验室指标变化

Confounder

中文：混杂因素

同时影响暴露和结局的变量。

例如：

暴露 ← 混杂因素 → 结局

Confounding

中文：混杂

当暴露与结局之间的观察关联被共同原因扭曲时，就发生了混杂。

例如：

MIS ← 年龄 → 术后并发症

如果不调整年龄，MIS 与术后并发症之间的关系可能被年龄影响。

Backdoor Path

中文：后门路径

从暴露到结局之间的非因果路径，通常由共同原因造成，会引入混杂。

例如：

MIS ← 年龄 → 术后并发症

Backdoor Criterion

中文：后门准则

用于判断哪些变量需要调整，才能堵住后门路径、识别因果效应的规则。

临床直觉版：

找到一组变量，把混杂路径堵住，但不要切断真正的因果路径。

Chain

中文：链式结构

结构：

A → B → C

B 位于 A 到 C 的因果路径中间。

例如：

手术方式 → 术中出血 → 术后并发症

Fork

中文：叉式结构

结构：

A ← B → C

B 是 A 和 C 的共同原因，常常提示混杂。

例如：

MIS ← 年龄 → 术后并发症

Collider

中文：碰撞点

结构：

A → B ← C

B 是碰撞点。

调了碰撞点，可能打开偏倚路径。

Mediator

中文：中介变量

位于暴露和结局之间的变量。

结构：

暴露 → 中介 → 结局

如果研究总效应，通常不应随便调整中介。

Conditioning

中文：条件化 / 设定条件 / 控制

可以理解为：

在模型中调整某变量
分层分析某变量
限制只分析某变量取特定值的人群

例如，只分析“接受手术的患者”，就是对“是否手术”进行了条件化。

d-Separation

中文：d 分离 / 有向分离

DAG 中用于判断两个变量在给定某些变量后是否独立的规则。

临床医生不一定需要掌握完整数学定义，但需要知道：

d-separation 是 DAG 判断路径是否被堵住的核心规则。

d-Connected

中文：d 连接

如果两个变量之间的路径没有被堵住，它们就是 d-connected。

临床直觉是：

这条路径仍然可能传递关联或偏倚。

Minimal Sufficient Adjustment Set

中文：最小充分调整集

意思是：

为了识别某个因果效应，足以堵住所有后门路径的一组最小变量集合。

“最小”不是说变量越少越好，而是说在当前 DAG 假设下，这组变量已经足够，不必无原则地继续加变量。

Bias

中文：偏倚

研究结果系统性偏离真实情况。

Confounding Bias

中文：混杂偏倚

由于混杂因素没有被合理控制，导致暴露与结局之间的关系被扭曲。

Collider Bias

中文：碰撞点偏倚

由于调整了碰撞点或对碰撞点进行筛选，打开了原本关闭的偏倚路径。

Selection Bias

中文：选择偏倚

由于研究对象进入分析的过程与暴露和结局相关，导致结果发生系统性偏差。

例如，只研究某个被筛选出来的患者群体，可能改变变量之间的关系。

Overadjustment Bias

中文：过度调整偏倚

由于调整了不该调整的变量，例如中介变量，导致真实效应被削弱或扭曲。

Unmeasured Confounding

中文：未测量混杂

有些重要混杂因素没有被记录、没有被测量，或无法进入分析模型。

例如：

病情严重程度没有可靠结构化记录
医生选择治疗方式的偏好无法测量
患者经济状况或依从性没有数据

p-value

中文：p 值

统计检验中的显著性指标。

在因果推断里，不能单独依赖 p 值决定是否调整变量。

M-bias

中文：M 型偏倚

M-bias 是一种由于错误调整碰撞点而产生的偏倚。

它之所以叫 M-bias，是因为相关 DAG 的形状看起来像字母 M。

临床直觉版：

有些变量看起来和暴露、结局都相关，但如果它是碰撞点，调它反而会制造偏倚。

DAGitty

一个在线 DAG 工具，可以用于：

绘制 DAG
标记暴露和结局
检查后门路径
找调整变量
识别潜在偏倚路径

网址：

https://dagitty.net

对临床医生来说，DAG 的核心价值不在于“画了一张复杂的图”，而在于它迫使我们在分析之前先回答几个关键问题：

我真正想估计的因果效应是什么？
暴露和结局之间有哪些非因果路径？
哪些变量是混杂因素？
哪些变量是中介？
哪些变量是碰撞点？
我的调整策略是否会减少偏倚，还是制造新的偏倚？

因此，DAG 不是统计学家的专属工具，而是临床研究者进行高质量观察性研究时的一种思维方式。

一句话总结：

先画 DAG，再跑模型；
先想清楚因果结构，再决定调整变量。