小伙伴关心的问题:举例说明因果关系的复杂性(举例说明因果关系的类型),本文通过数据整理汇集了举例说明因果关系的复杂性(举例说明因果关系的类型)相关信息,下面一起看看。

举例说明因果关系的复杂性(举例说明因果关系的类型)

入门因果推断,通过看Brady大神的课程视频受益良多,做了一些潦草的笔记用于个人理解,非喜勿喷,欢迎留言交流。

因果关系不等于相关关系!

相关关系

T与Y相关,显然并不意味着T决定了Y,比如妈妈和孩子的长相是正相关的,但是孩子的长相一部分基因也来自于父亲,所以并不是母亲的长相决定了孩子的长相。

因果关系

事件A直接引起B发生。假设艾滋病毒母子传播率100%,那么母亲得艾滋病必然导致出生的胎儿艾滋病。

举个例子

下图为每年由于泳池淹死的人数和nicholas cage演电影的次数

从图中可以看到红黑两条曲线的趋势基本相同,难道我们能得出结论:每年因落入游泳池而溺水的人数与 Nicolas Cage 每年出演的电影数量具有高度相关性吗?很显然两者并没有因果关系,只是存在某种虚假的相关性。

再举个例子

假设我们有穿鞋睡觉和醒来后头痛的数据。结果发现,在大多数情况下,如果有人穿鞋睡觉,醒来后会头痛。而在大多数情况下,如果 *** 鞋睡觉,醒来后不头痛。那么我们同样不可以得出这样的结论:“穿鞋睡觉会导致人们醒来头痛”。

它们都是由一个共同的原因引起的:前一天晚上喝酒(喝醉了大概率才会穿鞋睡觉),这里喝酒就是我们常说的 "混杂因子(confounder)。观察到的total association可以由混杂关联confounding association(图中红色箭头)和因果关联causal association(图中蓝色箭头)组成。可能的情况是,穿鞋睡觉确实对醒来后的头痛有一丢丢的因果关系。那么,总的关联将不只是混杂关联,也不只是因果关联,它将是两者的混合。例如,在图1.4中,因果关系沿着从穿鞋睡觉到头痛醒来的蓝色箭头流动。而混杂关联则沿着从穿鞋睡觉到喝酒再到头痛的红色路径流动。因果关系是蓝色箭头,即穿鞋--->头疼,因为穿鞋,直接造成头疼的关系,但是这个例子中在穿鞋和头疼之间,还存在confounding混杂因子,这些confounders可能对穿鞋的原因和头疼的原因都有影响,所以是相关关系。

为什么我们不可以这样比较,因为以穿鞋T=1, *** 鞋T=0来划分两个group,这两个group的人群(特征等分布)是完全不一样的,也就是辛普森悖论,辛普森悖论的关键因素是各个类别的非均匀性,也就是两组人群不一样,没有可比性,就像上一个例子中,穿鞋睡觉的人和 *** 鞋睡觉的人differ in a key way:形象化表示:

那么如何解决这个问题?---随机实验

随机实验

我们在处理问题时候通常会遇到un-observated data,可以理解为某些confounder是观测不到的。

随机试验的magic之处就在于他可以make it no un-observed confounding。

为什么随机试验很magic:

comparable and covariant balance:intuition

由于喝酒是一个confounder,导致了穿鞋组(T=1)大部分喝了酒的, *** 鞋组(T=0)大部分都是清醒的。

treatment组和对照组除了treatment以外,完全相同(covariants X 分布相同: P(X∣T=1)=dP(X∣T=0)P(X \mid T=1) \stackrel{d}{=} P(X \mid T=0) ,因为在这个例子中,T(穿鞋与否)不是由 X决定的,是由抛硬币决定的,所以​ ​ T⊥XT \perp X ,即

P(X∣T=1)=dP(X)P(X∣T=0)=dP(X)P(X∣T=1)=dP(X∣T=0)\begin{array}{c} P(X \mid T=1) \stackrel{d}{=} P(X) \\ P(X \mid T=0) \stackrel{d}{=} P(X) \\ P(X \mid T=1) \stackrel{d}{=} P(X \mid T=0) \end{array}

下面证明,为什么covariants balance,就意味着association is causation

Exchangability(可交换性)

即干预的潜在结果和观测结果是独立的:如果小明没有完成大学教育,他的收入只有1000这件事和他完成了大学教育潜在结果是2000无关。

No backdoor path

变成了这样:于是就不存在backdoor path了,即使存在某些un-observed variable。

更多举例说明因果关系的复杂性(举例说明因果关系的类型)相关信息请关注本站,本文仅仅做为展示!