我1月,非洲裔美国人罗伯特·威廉姆斯(Robert Williams)因不准确的面部识别算法而被错误逮捕。面部识别算法是一种计算机化的方法,通过分析人脸,并与数据库中已知人物的图像进行对比来识别人脸。底特律警方在未告知原因的情况下,在家人面前给他戴上手铐并逮捕了他,然后在警察拍下了他的面部照片、指纹和DNA样本后,将他关了一夜。
第二天,侦探展示了威廉姆斯一家在销售手表的商店的非裔美国人的监视视频图像。它立即显然,他不是威利尼亚姆斯。详细说明他的逮捕华盛顿邮报,威廉姆斯写道,“警察互相看了。我听说有人说'电脑必须已经错了。'“威廉姆斯学会在调查商店的盗窃方面,面部识别系统已经将他的驾驶执照照片标记为匹配监视图像。但下一步,调查人员首先确认匹配的地方,然后寻求更多的证据进行逮捕,仍然糟糕,威廉姆斯被带进来。他不得不在监狱里度过30个小时,然后在他被释放之前发布1,000美元的债券。
据美国公民自由联盟(American Civil Liberties Union)报道,威廉姆斯被捕的独特之处在于它受到了公众的关注。1有超过4000个警察部门使用面部识别,几乎可以肯定,其他人也被错误地牵连到犯罪中。2019年,布朗大学学生阿马拉·马吉德(Amara Majeed)被面部识别错误地认定为斯里兰卡恐怖主义爆炸袭击的嫌疑人。斯里兰卡警方收回了这个错误,但马吉德收到了死亡威胁。即使一个人获得了自由,他或她的个人数据仍然被列在犯罪记录中,除非采取特别措施删除它。
国家标准与技术研究所最近的研究和马萨诸塞术学院2已经证实,计算机面部识别在匹配非裔美国人的面部时不如白人的准确。造成这种差异的一个原因是,计算机算法所依据的数据集中缺少非白种人的面孔。来自世界各地的有色人种的代表性不足,以及他们的面部特征和肤色的差异,造成了研究人员所谓的技术内置的“人口偏见”。
F常规识别技术通过其与广泛监视和巨大商店的照片的关联具有广泛的影响。在20世纪20年代,调查人员开始窃取电话以追踪犯罪活动。在20世纪70年代,模拟闭路电视增加了远程视觉监控人。但数字方法通过与互联网和警察部门联系的相机大大扩大了监视的力量和规模。在房屋,企业和公共场所普遍存在,预计将投入十亿个相机,将在2021多个国家置于2021多个国家,其中每八人在地球上。
为了识别嫌疑人,联邦调查局和警方将监控摄像头和其他来源的图像与照片数据库进行比较。其中包括一些犯罪嫌疑人的面部照片,但大部分图片来自非犯罪来源,如护照和州驾照汇编;也就是说,这些数据库主要将普通的、通常是无辜的公民暴露在刑事调查中。这种方法是在9/11之后发展起来的,当时美国政府提出了“全面信息意识”(Total Information Awareness),这是一个全球性的项目,旨在收集人们的数据,并通过各种方式识别他们,包括面部识别。乔治城大学隐私与技术中心断言,半数的美国成年人,即1.17亿人,出现在警方可以访问的数据库中。3.2019年,美国房屋监督委员会前的证词透露,联邦调查局可以扫描6.4亿张照片面部匹配。4
警察们面面相觑。我听一个人说:“一定是电脑弄错了。”’”
联邦调查局和警方通过计算机程序扫描这些大量的照片,并将其数字化以识别身份。开发这项技术的一条重要线索始于美国数学家、人工智能先驱伍德罗·威尔逊·“伍迪”·布莱索。1959年,他和一位同事发明了一台识别字母数字字符的机器,然后又发展到面部识别。
他们的第一个想法是通过将其覆盖到矩形的像素阵列来分析一个字符。根据它是否包含在图像的一部分,每个像素接收到二进制1或0。在称为“n元组”的相邻组中对像素进行采样,以考虑它们之间的空间关系。进一步的操纵产生了体现“A”的一组二进制数字。此过程找到并存储了每个字符的比分和结果的唯一分数;然后通过将其分数与存储器中的值进行比较来识别未知字符。该方法工作,正确识别高达95%的手写和印刷数字。
然而,对于面部的复杂性而言,N元组织对其外观也随着照明,头部,面部表情和受试者年龄而变化。Bledsoe的团队转向了从面孔照片测量的人类运营商,例如眼睛的瞳孔或耳朵顶部到底部之间的距离。51967年,研究人员展示了一种计算机,它使用了储存的数千张照片的面部测量数据,使人们为了匹配一张新照片而需要筛选的图像数量减少了99%。然后在1973年,日本计算机科学家金德武夫(Takeo Kanade)用一个计算机程序自动化了整个过程,该程序可以从一张脸部图像中提取眼睛、嘴巴等,无需人工干预。
Bledsoe的基础面部识别工作由国防部资助,或根据一些证据,中央情报局,其中任何一个都将限制他发布结果的自由。5但今年年初,作家绍伦扎维斯描述《连线》杂志1995年布莱索去世后,他研究了布莱索的生平,并将他的工作档案交给了德克萨斯大学。6Raviv报告说,识别实验从400名男性白种人的照片数据库开始。在档案中,拉维夫没有看到任何关于女性、人或肤色的资料,也没有看到几十张必须代表布莱索面部尺寸的标记照片中的她们的照片。
自从布莱索的最初研究以来,其他技术也出现了,这些技术得到了更强大的计算机和更大的数据库的支持,用于开发和测试算法。现在人工智能方法的引入带来了最新的变化;但是,由于布莱索的形成数据集缺乏多样性,这种偏见仍然存在于这些先进的方法中,原因大致相同。
F美国国家标准与技术研究所(NIST)已邀请面部识别算法的生产商提交这些算法进行测试。2019年,NIST展示了来自99个主要是商业开发者的189种算法的分析。7这些校验了1800万人的联邦数据库,用于一般准确性,在不同的人口群中,在两个应用中:1:1匹配,其中脸部与存储的图像进行验证,如确认有效期护照和1:n匹配,脸部与整个数据集相比,通常是为了找到犯罪嫌疑人。对于每种算法,研究人员确定了假底片的数量,其中应该与数据库中的一个匹配的脸部不是,并且脸部与错误的阳性相匹配。
数据显示,面部识别能力有了显著提高。提交的人脸与数据库中的人脸不匹配的比率从2014年的4%下降到2018年的0.2%。更新的算法对困扰早期研究的面部变化也不那么敏感。NIST的研究人员将这些成果归因于面部识别领域的“工业革命”,即深度卷积神经网络(CNN)的应用。
一项测试产生了非洲面孔比欧洲人更高的假阳性率63倍。
神经网络是一个计算系统,可以教导来执行某些任务,稍微像生物脑中的连接神经元一样。CNN模仿人类视觉感知。在我们的大脑中,视觉皮层的专门区域中的神经元在眼睛看到的某些一般元素中,例如物体的边缘,线倾斜地倾斜的线条和颜色。大脑将这些结果组成为一个有意义的整体,允许一个人,例如,即使在模糊或不同的条件下也能够快速识别朋友。
与n元组方法一样,在CNN中,形成图像的像素是在空间相邻的块中进行分析的,但随后的阶段提供更深入的分析。就像大脑中的区域一样,每个阶段都在寻找不同类型的一般图像元素,就像大脑发现的那样,而不是寻找眼睛、鼻子等。经过数学处理的结果通过各个阶段传递和增强,最终生成一张完整的面孔。至关重要的是,这是通过首先将CNN暴露于各种面部图像的大数据集来实现的。这“训练”了系统,使其发展出一种分析人脸的综合方法。
在NIST的测试中,基于CNN的算法表现最佳;但总的来说,算法在他们确定不同种族,性别和年龄的人的程度上有所不同。这些结果回应了早期的1:1匹配,是第一个探讨1:N匹配的人口效应。每个申请中的错误产生不同的不良结果。1:1搜索中的假阳性可以允许未经授权的访问;一个假阳性在1:n寻找犯罪嫌疑人时,将主题投入有义务的指责。
在1:n匹配中,NIST的数据表明,最精确的算法也是最可靠的。在美国联邦调查局的160万张面部照片数据库中,那些不太熟练的人给出的非裔美国女性与非裔美国男性以及白人男性和女性的假阳性率更高。在1:1匹配中,一些算法错误匹配非裔美国人和亚洲人的面孔的频率是白种人面孔的10到100倍。然而,值得注意的是,一些来自亚洲国家的算法给出的亚洲人的假阳性比白种人的少。报告指出,这表明训练数据集的多样性程度可能会强烈影响CNN的人口统计表现。
“面部识别不应该被用来剥夺人们的自由。”
其他研究更充分地探索了缺乏多样性如何影响神经网络的训练。2012年,密歇根州立大学(Michigan State University)的B.F. kare和A.K. Jain及其同事对警方的面部照片进行了1:1的面部匹配测试。8他们研究的不同类型的算法对非裔美国人面孔的准确性都低于白人或西班牙人面孔。研究的一种算法是由其训练数据集定义的神经网络。研究人员发现,当这个数据集仅限于非洲裔美国人的面孔时,结果与非洲裔美国人的匹配度提高了,同时,当训练数据集拥有同等数量的非洲裔美国人、西班牙裔和白人面孔时,也提高了多样性。
这表明如何使有偏见的培训数据库更加公平。在最近的一次演示中,生物识别技术公司Onfido的研究人员让人口统计学上不平衡的数据集减少了偏差。9它的面部图像来自不同的大陆,比例各不相同,比如0.5%来自非洲,61%来自欧洲。结果显示,非洲面孔的假阳性率是欧洲面孔的63倍。但当研究人员使用统计方法训练更多的非洲面孔时,差异减少到2.5倍,这是未来可能性的标志。
但据生物统计员帕特里克养殖,领先科学家为NIST报告,严重的警察行动应该需要不仅仅是一种算法的匹配。他解释说,算法实际上返回了可能的候选人的列表。在理想的下一步中,寻求嫌疑人的调查员必须确认此列表中有很好的匹配。只有这样,侦探才会寻求目击者或法医数据等其他证据,以证明逮捕和对象充电。来自人类调查员的“不匹配”可以推翻错误的机器识别,应该放心,但这已经太晚拯救了威廉姆斯免受错误的逮捕和反应。
Andrew Guthrie Ferguson是美国大学华盛顿大学法学院教授,他研究了技术和公民权利。回应我的查询,他写道,“面部识别不应剥夺人们的自由。”它是“以不受管制的方式使用的工具太危险。威廉姆斯的案例是停止的信号特别指定在无法挽回的不公正发生之前采用面部识别。”
修复面部识别技术的缺陷并非易事,因为这个复杂的领域包括数十个有不同程度偏见的软件生产商,以及数千个可以选择其中任何一种算法的执法机构。也许只有联邦政府努力建立标准并规范遵守这些标准才有必要,否则我们就不会再有罗伯特·威廉姆斯(Robert Williams)这样的人,不会再有任何少数群体的成员,也不会再有任何公民不公正地在监狱度过一夜或更糟糕的日子。
西德尼·珀科维茨(Sidney Perkowitz)是埃默里大学(Emory University)坎德勒物理学荣誉退休教授,他写过有关警察算法的文章,目前正在写一本相关的书。他最近的书是物理:一个非常简短的介绍和真正的科学家不打领带。
参考文献
1. Garvie,C.由于人脸识别而涉及他们没有提交的罪行中的未统一的人。Aclu.org/news(2020)。
2. Buolamwini,J.&Gebru,T.性别色调:商业性别分类中的交叉准确性差异。机器学习研究进展811 - 15,(2008)。
3. Garvie,C.,Bedoya,A.,&Frankle,J.这是永久的阵容。乔治城隐私与技术法律中心(2016年)。
4.政府监管机构对FBI 6.4亿张照片面部识别数据库提出质疑。《福布斯》(2019).
5.Boyer R.S. (Ed)。自动推理:纪念伍迪布莱索的文章Kluwer Academic Publishers,Dordrecht,荷兰(1991)。
6. Raviv,S.面部识别的秘密历史。《连线》杂志(2020)。
7.颜志强,黄志强,黄志强,等。人脸识别厂商测试。国家标准与技术研究所(2018)。
8. Klare,B.F.,Burge,M.J.,Klontz,J.C.,Vorder Bruegge,R.W.,A.K.面部识别性能:人口统计信息的作用。IEEE关于信息取证和安全的交易7, 1789 - 1801(2012)。
9.Bruveris, M., Mortazavian, P., Gietema, J., & Mahadevan, M.,减少人脸识别的地理表现差异。arXiv(2020)。检索自DOI: 2002.12093
引导图像:greenbutterfly /Shutterstock







