复读-无辜的几率

你已经阅读了每月两篇免费文章中的一篇。学习更多的知识。

无辜的几率

数字如何改变正义的天平。

遗传物质是现代犯罪现场的确凿证据。刑事审判中的陪审团经常被鼓励考虑DNA分析……由Coralie Colmez&Leila Schneps撰写

G遗传物质是现代犯罪现场的确凿证据。刑事审判中的陪审团通常被鼓励将DNA分析视为一门精确的科学,在这门科学中,皮肤、头发和血液的蛛丝马迹可以精确地识别罪犯,并排除任何可能的错误身份。然而,统计数字却说明了一个不同的情况。

从构成人类基因组的数万个基因中,科学家们将名单缩减到13对左右,这些基因在不同人群中差异最大。他们利用这些配对来制作一个叫做“电泳图”的图形,在这个图形中,每一组基因产生一个特定高度的峰值。据估计,两个人拥有所有13个峰对的可能性约为400万亿分之一,是地球上人口数量的许多倍。因此,如果发现两个侧面在每个峰值都完全匹配,那么它们不太可能来自同一个人,或者来自同一对双胞胎。

然而,也有可能,样本并不完全清晰——例如,样本可能含有几个人的DNA的混合物,它可能被降解,或者它可能非常小。因此,在法庭上,DNA匹配总是伴随着一个被称为“随机匹配概率”(RMP)的概率数字。这代表了一个人在街上随机挑选的DNA样本匹配的几率。样本越不清晰,RMP越高。

将概率引入法庭可以将明显的有罪转变为无罪的可能性。数学可以在看似几乎不可能的事件和看似不可能的事件之间改变平衡,引入不确定性元素,可以避免“超越合理怀疑”的定罪,正如刑事标准所要求的那样。它还可以纠正常识的错误朋友。在阿曼达·诺克斯(Amanda Knox)案中,一名西雅图年轻女子就2007年在意大利佩鲁贾镇杀害英国室友的谋杀指控为自己辩护,上诉法官的拒绝重新测试在菜刀上发现的受害者有争议的部分DNA,可以说是因为没有把握多个不确定的测试可以产生更确定的结果这一事实。

这样的错误太常见了,更糟糕的是,统计语言无处不在,鼓励人们认为他们很理解它,他们知道百分比的含义,他们理解概率是如何工作的。但事实上,管理不太可能发生的事情是非常棘手的,而且有许多普遍存在的误解,只要有一点数学知识就可以很容易地纠正。

Sapolsky_TH-F1

这是我们所知道的基因的末端

我们都已经看到了明显的头条新闻:“富有和成功是你的基因”(卫报,7月12日);“一项新的基因测试有助于确定儿童的成功”(新闻周刊,7月10日);“我们的算命基因”造就了我们(华尔街日报,11月16日);和阅读更多

统计学的语言无处不在,鼓励人们认为自己很了解统计学。

解释DNA图谱的一个重要工具是贝叶斯定理。它是一个允许条件概率推理的方程,比较给定事件状态的结果的可能性,与没有该事件状态的结果的可能性。贝叶斯可以帮助陪审员评估新证据的重要性,衡量被告无罪时出现的几率和被告有罪时出现的几率。

至关重要的是,贝叶斯理论表明DNA测试的RMP是就像一个人找到匹配的概率,实际上就是DNA的来源。将这两种情况合并在一起就是所谓的“检察官谬误”的一个例子:未能意识到某人事实上符合证据(A)是无辜的(B),而不是一个无辜的人在街上捡的概率符合证据。在数学表示法中,这用P(B | A)表示≠ P(A | B)。

这种区别在20世纪90年代英国的一个著名案例中得到了体现。1991年4月6日清晨,M小姐(她后来在法庭文件中被认出来)在伦敦和朋友出去玩了一晚后正回家。一个男人走近她问时间。当她低头看手表时,他突然从后面抓住她,把她摔倒在地,强奸了她,然后逃跑。

当M小姐向警方报告强奸案时,她能够向警方粗略描述袭击她的人。她说他20出头,白种人,胡子刮得干干净净,带有当地口音。此外,法医科学家从M小姐的尸体上采集了袭击者的精液样本。这产生了一份DNA档案,最终发现与当地一名男子安德鲁·迪恩(不是他的真名)的DNA档案相匹配,该男子的档案在犯罪后被添加到DNA数据库中,因为他犯下了无关的性罪行。

迪恩案例的RMP是2亿分之一,这表明非常匹配。在拥有6000万人口的英国,可以想象但不太可能找到另一个拥有相同DNA图谱的人。但是迪恩的身份存在一些问题。在警察列队辨认时,M小姐无法认出他。当迪安被指给她看时,她说他不可能是攻击她的人,因为他“比她大得多”。迪恩不是20多岁,实际上已经37岁了。此外,他有不在场证明,一个女朋友说她那晚和他在一起。

在迪恩的审判中,陪审团实际上必须权衡两种不同类型的证据:DNA比对(指向有罪)和非科学证据(指向无罪不在场证明)以及M小姐无法认出迪恩的事实。

辩方提出用贝叶斯推理平衡这一证据。它邀请牛津大学(University of Oxford)统计学教授彼得·唐纳利(Peter Donnelly)作为专家证人。他说,利用贝叶斯,人们可以通过将先前的犯罪几率乘以与新材料相对应的“似然比”,来评估一项新证据应该如何影响犯罪的可能性。可能性比衡量的是被告有罪时看到证据的相对机会,与被告无罪时看到证据的相对机会。可计算如下:

(如果被告有罪,看到该证据的可能性)

÷

(在被告无罪的情况下看到证据的可能性)

唐纳利随后分发了一份调查问卷,要求陪审员对证据碎片使用上述计算方法。他还为每个陪审团成员和法官带来了计算器,并给他们演示了一个示例,尽管他鼓励陪审团对涉及的概率做出自己的估计。(当他讲到计算器“应该显示31.6”时,法官大声说,“但我的却显示为零!”)

在迪恩的审判中,陪审团实际上不得不权衡两种不同类型的证据:指向有罪的DNA匹配,以及指向无罪的非科学证据。

唐纳利建议,在审判开始时,无罪推定意味着他们可以假定被告不比该地区任何其他男性更可能有罪。考虑到该地区的当地男性人数(约150000人)以及迪安是当地男性的可能性(唐纳利估计约为75%),唐纳利认为迪安有罪的可能性约为1/200000或1÷(150000÷0.75)。

接下来,法庭上出示的每一份证据都会产生一个似然比,可以依次乘以该似然比,以便“更新”对有罪的评估。关于M小姐未能确认迪安身份的影响,唐纳利举例说明了在迪安有罪的情况下,这种失败的概率为10%(在分数的顶部),在迪安无罪的情况下,这种失败的概率为90%(在分数的底部)。这使得迪恩有罪的可能性比率为1/9。

然后,对迪恩的女友声称他们在一起过夜的说法进行同样的计算,唐纳利估计,有罪的被告有25%的机会提出这一证据,而无辜的被告有50%的机会。这使得迪恩不在场证明的可能性比为25比50,或1比2。

因此,在引入DNA证据之前,陪审员可能会估计迪恩犯罪的可能性是以下原因造成的:

(1/200000)x(1/9)x(1/2)=1/3600000,或360万分之一。

现在,计算陪审团对DNA比对的权重也可以用同样的方法。分数的顶部是DNA样本与迪恩有罪的概率,等于100%。分数的底部是迪恩无罪时匹配的概率。这是RMP测量的数字,即0.0000005%(或2亿分之一)。这一计算得出了与DNA证据相关的犯罪可能性比为2亿比1(或迪恩无罪的可能性比为2亿比1)。

因此,Dean有罪的概率可以通过将这些证据的似然比相乘来计算:

(1/3600000)x(200000000/1)

= 200 ÷ 3.6

=55.55,或大约55比1有利于有罪。

换句话说,使用唐纳利的数据和他的贝叶斯分析,迪恩无罪的概率是55分之一,尽管他的DNA样本匹配得很好。如果陪审团只考虑2亿分之一的RMP,那么他是无辜的可能性就会大大增加。

尽管唐纳利作了证词,迪安一案的陪审团还是投票宣判有罪。然而,他的定罪在上诉中被撤销,他被送回重审,第二次被定罪,上诉被驳回。在每一个案件中,上诉法官都表示不喜欢贝叶斯方法,认为“陪审员不仅通过数学公式或其他方法评估证据并得出结论,而且通过将他们个人的常识和世界知识联合应用于他们面前的证据。”

美国和英国的法院都对让陪审团过分依赖概率专家证据持谨慎态度。他们似乎担心,数学可能会把太多的权力交给专家,并把陪审员变成机械的数字计算者,而不是感觉、推理、敏感和明智的裁判。这种怀疑主义有着悠久的传统,至少可以追溯到法学家劳伦斯部落(Laurence Tribe),他在1971年的《哈佛法律评论》(Harvard Law Review)上发表了一篇文章,名为《数学审判:“法律程序中的精确和仪式”认为,看似“无情”的数字可能“恐吓”陪审团,并侵蚀他们本打算带入决策的“社区价值观”。

法官对数学推理的不信任并不是它在法庭上使用的唯一障碍。数学家们自己还没有就贝叶斯定理的恰当形式达成一致,也没有就向陪审团解释他们的计算的最佳方式达成一致。即便如此,概率推理仍然是一种强有力的工具,它可以对抗人类直觉中关于不可能性的缺陷,为它找到合适的角色是一个急需解决的问题——尤其是在dna匹配证据被视为如此可恶,以至于它常常盖过其他一切的气候下。


莱拉·施奈普斯是一位神秘作家,也是巴黎朱西数学学院的数学家。Coralie Colmez是伦敦的一名数学家教。Colmez是Schneps的女儿,两人都是Bayes和法律研究协会的成员。他们是这本书的作者审判中的数学:数字在法庭上如何被使用和滥用,2013年出版。

6评论-加入讨论