本
文
摘
要
该问题的本质确实是贝叶斯公式。看到有答主提到了医学中的阳性检测,3Blue1Brown曾经做过一期视频,提到一个类似的问题:
已知某种疾病在人群中的发病率为1%,医院通过某种检测技术来检测一个人是否患有该疾病,该检测技术的“准确率”为90%,现在你到医院进行检测,发现结果为阳性,问你实际患有该疾病的几率是多少?答案是8.3%左右。
有人肯定要问这不都检测出阳性了吗,而且检测的“准确率”高达90%呢,怎么结论反而是不太可能患病。这里需要注意的是“准确率”这个词,到底用哪个数除以哪个数?
首先把样本空间的这个理念要先搞懂,它分为4类:真阳性(TP)、假阳性(FP)、假阴性(FN)和真阴性(TN),这里的“阳性”(Positive)和“阴性”(Negative)指检测结果,前缀的“真”(True)和“假”(False)代表检测结果与实际情况是否相符,比如“假阳性”代表检测结果为阳性(患病)但实际并没有患病。评估检测手段的指标如下:
敏感度(Sensitivity)
敏感度=真阳性 / (真阳性+假阴性)
既有患者检出率,可以理解为只考虑该疾病实际患者样本,计算检测手段的正确率即阳性率。
特异度(Specificity)
特异度=真阴性 / (真阴性+假阳性)
可以理解为只考虑该疾病非患者的样本,计算检测手段的正确率即阴性率。
敏感度和特异度的值可以不一样,在上述的阳性检测问题中,所谓检测的“准确度”指的就是敏感度和特异度都是90%,即,给你100个对照样本,你能正确检测出其中90个,或者给你100个患者样本,你能正确检测出其中90个。
精确度(Positive predicitive value, PPV)
PPV=真阳性 / (真阳性+假阳性)
检测结果为阳性时的置信度,上述案例8.3%的计算方法。
负预测性(Negative predictive value, NPV)
NPV=真阴性 / (真阴性+假阴性)
检测结果为阴性时的置信度,上述案例中为99.9%。
在医学中通常将敏感度和精确度结合使用,或者将特异度和负预测性结合使用来进行评估。
准确度(Accuracy)
Accuracy=(真阳性+真阴性) / 总样本数
即检测结果与实际情况相符的百分比,上述案例的Accuracy为89%。
注意这里的准确度是一种非常笼统、粗略的指标,在医学中较少使用,因为在阴性样本和阳性样本的比例相差较大时几乎没有参考意义。还是以刚才的案例来说明,比如你发明了一种新的检测方法,把990名正常人和10名患者都检测为阴性,看起来准确度达到了99%,实际情况是一个患者都没检测出来。
回到末日预言问题,两位预言家的准确率到底是上述5种指标的哪一种呢?刚才说了Accuracy是一种非常笼统且粗略的指标,不适合用来评估准确程度,所以较为合理的指标应该是Sensitivity和 Specificity,姑且认为二者相等,即第一位预言家所作预言的Sensitivity和 Specificity均为90%,而第二位均为30%,但是缺失了末日实际发生的概率,所以无法直接计算。跟前述案例类似,需要注意在“末日实际发生的概率非常低”这个前提条件下,即使第一位看起来“准确率”很高的预言家作出了“末日即将降临”的预言,实际也很有可能是“假阳性”。我随便编个数,比如事件“末日降临”发生的概率为十亿分之一,那么当这位“十预九验”的预言家预言“末日降临”的时候,末日实际降临的几率比十亿分之一还要小一点点。
【参考文献】
【官方双语】医检阳性≠得了病?重新理解贝叶斯定理b23.tv/TgNzHC4