本
文
摘
要
谢
王懂邀
我尝试从效益主义(Utilitariani *** , 又译 功利主义)的和最大似然估计(Maximum likelihood)的角度回答这个问题,并证明“宽容”是基于先验概率的最优理性选择。
1.定义问题:
效益主义最初由边沁(Jeremy Bentham)提出。在谈效益主义前,先定义效益:
所谓效益,意指一种外物给当事者求福避祸的那种特性,由于这种特性,该外物就趋于产生福泽、利益、快乐、善或幸福(所有这些,在目前情况下,都是一回事),或者防止对利益攸关之当事者的祸害:痛苦、恶或不幸(这些也都是一回事)
边沁认为,人类的一切行为动机以及合理性依据都根源于快乐和痛苦。它们是人类行为的根本原因。人是一种追求快乐与避免痛苦的动物,趋乐避苦是人的本性 。简单来说,在效益主义概念下,人们该如何选择决策,取决于事件相关方的最大化效益,或者说追究快乐的最大化。
比如说,一个是是否选择杀人,取决于这件事情会给他和想要杀害对象的的预期快乐净值。在一般状态下,杀一个人会给被杀对象造成极大的痛苦,对行使杀人者来说,会带来律法的追究,这也是痛苦,因此该行为的预期是非常痛苦的,所以不应当杀人。但是在一些特殊情况下,比如正当防卫,如果不杀对方,则可能造成对很多人的生命威胁,此时按照效益主义,则应当选择杀之。
然后考虑最大似然的定义:
假设X为离散随机变量,f为模型,θ为模型参数。{x_1, x_2, ..., x_n}为独立同分布的采样。参数为θ的模型f在n次采样下产生{x_1, x_2, ..., x_n}的分布,表示为
定义似然函数为
两边取对数,为对数似然:
同时可以定义平均似然:
举个例子以便理解:
抛硬币40次,正面记作H,反面记作T,得到采样{x_1, x_2, ..., x_40}。其中得到H的次数为23,T的次数为17。假设这枚硬币是某个暗箱中取出的,暗箱中有两枚硬币。这两枚硬币抛出正面的概率分别为1/2和2/3,那么用作采样的硬币跟可能是哪一个呢。这时候我们可以考虑似然概率:
可见,这枚硬币是抛出正面概率为1/2的那枚的可能性更大。根据这个例子,我们可以直观的理解,最大似然概率是一种根据已知采样求未知决策的方法。
将最大似然应用于效益主义模型:
考虑一件事情,我们做它可能让我们高兴,也可能让我们不高兴,在以往的n次做这件事情后,我们都记录下结果,得到n次采样M. 让我们高兴记作1,让我们不高兴时记作0,即
M={y_1,y_2,...,y_n}. 这n次采样让我们高兴的总值为
假设做这件事情让我们高兴的概率为p,符合伯努利分布,则n次做这件事情让我们高兴的期望为
现在我们反过来看,假设我们已经知道做这件事情让我们高兴的概率为p,那么我们可以推导,在我们采样的n次试验中,得到r次高兴的结果的概率。
对于伯努利分布
可以定义熵H:
有最大熵分布
其中
由于
所以
从而最大熵分布函数为
现在,我们可以把上面投硬币的例子换一种说法:
有做某事的经验40次,结果让人高兴记作H,不高兴记作T,得到采样{x_1, x_2, ..., x_40}。其中得到H的次数为23,T的次数为17。我们另外定义该做的事情和不该做的事情,该做的事情让我们高兴的概率分别为2/3,不该做的事情让我们高兴的概率为1/3,那么下次我们应该是选择做还是不做,或者说这件事是该做的还是不该做的呢。
所以,如果理性的选择,这件事是应该做的。这种选择对应的熵函数值更大。
2.宽容与熵函数
在1部分的简化模型下,我们可以暂时定义宽容为效益主义概念下,基于有限经验(有限已知采样)的最优理性选择(熵函数值更大)。
对于生活很多事件,我们无法得知它确切的让我们高兴的概率,但是我们自己有很多次以往的经验,再加上前人告诉我们的生活经历,于是我们自己对这件事有有限采样,基于这个采样可以作出决策。但是相比于别人的经验,我们更相信我们自己的经历。因此采样受到个人经历的影响更大,别人的经验往往会踢出样本,不予采信。在我们生活的初始阶段,比如儿童时期,虽然书本教育我们不要嘲笑他人的缺陷,但是我们往往会反其道行之,因为嘲笑一个人会让我们有优越感,还会带动其他人一起嘲笑,让我们有归宿感,这种快乐给我们的感觉被过分强化了,我们甚少体验到被嘲笑的痛苦和长期的恶果,因而对被嘲笑对象的感受不予考虑而做出了这样的决策。事件相关方的概念在我们心中也是模糊的,因而我们不会得到合理的熵函数。直到我们长大,有过足够的经历(采样),我们更多的认同别人的经验,同时有了足够的自己的经验,这时才会做出更为理性的选择:宽容别人的缺陷。
历史上由于传教和信仰的关系,发生过多次冲突:十字军东征,宗教改革与新教-天主教冲突,英国的清教徒受到排挤而被迫移民北美,印巴冲突……不一而足。宗教冲突同时对人的生命、财产还有社会文化都会造成极大的损失。于是当人类社会有了足够的经验之后,逐渐认识到宗教宽容才是最优的理性的选择:宽容别人的信仰。由于遗忘,我们一般相信最近的经验胜于以往的经验,这也会让熵函数不合理,因为最近的采样得到了不该有的加权。比如最近几十年的恐怖袭击,很多与 *** 教有关。 *** 在众人心目中几乎成为愚昧和血腥的同义词, *** 在街上也会受到更多的注意,特别是最近爆发的恐怖事件,使得仇恨 *** 教的人越来越多,人们关于宗教宽容的经验受到了挑战。
对于不了解的事物,我们由于缺少采样,不能构造合理的熵函数。如果我们根据以往的经验贸然加以揣测,难免会闹笑话。对于别人面临的问题,由于我们并未实际的经历他们的苦难,没有面对他们的困境,经常的,我们很难给出合理的决策建议。把我们的意见强加于人,因而是粗鲁的,不合适的,我们显摆智慧和经验的尝试通常会受到了他人内心的鄙视,结局也容易让自己尴尬。因此我们要宽容不了解的事物。
但我们面对伤害时,我们容易怒火焚身,不合适的加权自己的痛苦,因而急于报仇雪恨。复仇对于复仇对象,自然完全没有什么效益可言了。复仇的急切心情,使我们忘记了复仇者只在复仇施行的时刻会带来快乐。在这前后会导致到更大的负面影响,思前想后,难以忘记整个事件。这会让自己Keeping Wounds Green,受到第二次伤害。理性的选择应该是,淡忘仇恨,宽容你的敌人。
关于1部分的模型,自然是有很多问题,包括但不限于:
无法量化快乐和痛苦的程度,很多时候并不能等价于1或0来考虑
事件相关方的范围,以及对相关个人的感受的加权不好定义事件每次出现,自有他们各自的情况,并不会每次都相同,因而使用过往的采样并不是一定合适的事件的结果并不一定是纯粹的快乐或者痛苦,而是可能两种都有,而且持续的时间不一样,怎么对这两种结果加权不好定义……实际的情况可能非常复杂,因而构造的函数往往也会过于复杂而无法计算。但是宽容是基于人们多年的经验的,虽然宽容往往会违背你的直觉,他你是基于先验概率的最优理性选择。
为了做到宽容,需要:
审慎面对事情,保持冷静,不应情绪而做决定(不给最近的采样以不适当的加权)多多学习和接触,了解到自己认识的局限,同时敬畏未知(认识到熵函数适用的界限)汲取前人的经验和旁人的经验(积累采用,采用越多构造的熵函数越合理)……