仅凭DNA还原嫌疑犯3D人脸,加拿大警方一通操作却被网友骂惨了
萧箫 羿阁 发自 凹非寺
量子位 | 公众号 QbitAI
只凭DNA就还原出罪犯的长相,还是3D版的?
没错,只需要一个AI模型,就能还原出这人的年龄、肤色、瞳色、甚至整个3D头像……
即使在此之前,没有任何人目击过这个嫌疑犯也没关系,用它合成的照片直接就能发布通缉令。
据提供这项技术的公司介绍,他们之前用这种手段合成过一张照片,最后捉到的嫌犯和照片中长得几乎一模一样。
听起来不仅高科技,甚至有点魔幻了。
消息一出,不少网友闻讯赶来围观,但他们很快发现了不对劲的地方。
从这家公司其他的DNA表型分析照片来看,嫌犯和照片长得比较像,更多情况下是一种“巧合”。
他们还扒出这家公司之前发布过的一张罪犯照片,两人除了性别以外,可以说是长得毫不相干……
△找相同(doge)
那么这种技术,真的能用在罪犯通缉这么严肃的事情上吗?
一个备受争议的例子
事情还要追溯到2019年冬天的一个凌晨,加拿大埃德蒙顿警察局接到了一个报警电话。
一位20多岁的女性被强奸后丢在了路边,全身只有一件衬衫。
那天的气温接近零下20多度,她一度被冻得失去知觉,因此凌晨5点多醒来后才找到路人报了警。
由于嫌疑人戴着面罩,又穿着厚厚的外套,受害人没有看清他的长相,只知道他说话带点口音、身高1.63米(5.3英尺)左右。
案件的侦查也一直没有进展,就这样过去了3年。
就在上周二,事情迎来了新转机,加拿大警方找到一家专门从事DNA分析服务的公司,对该案犯人留下的DNA进行表型分析,得到了一张3D人像。
警方把它作为通缉令,发布在了其官网和推特等社交平台上,并声称这是“在所有调查途径都用尽后的最后手段”。
不过老实讲,从通缉令上可以看出的信息并不多,能确定的似乎只有他是一名年轻的黑人男性。
其他特征像嫌疑人的具体年龄、发型、是否有纹身、是否有疤痕都不得而知。
而且,让加拿大警方没想到的是,通缉令一经发布,就在网上引起了轩然大波。
许多隐私专家表示,警方这一举动是极其有害的,很有可能加剧种族偏见和侵犯DNA数据库隐私。
美国电子隐私信息中心的全球隐私顾问Callie Schroeder就转发了该推文,并对3D人像的实用性提出了质疑:
如果你看到这条消息,你会如何思考?难道怀疑看到的每个身高1.63米的黑人吗?
他还进一步解释:不了解DNA表型知识的人看到合成图像,很可能会相信嫌疑人长得和3D人像完全一样。
他们意识不到这只是一个近似值,年龄、体重、发型和脸型都可能相差很大,而且肤色、发色、眼睛颜色也可能有细微区别。
在reddit论坛上,热评前几也几乎都是质疑声。
我不明白这怎么可能有用。
当警察缺乏必要的证据时,这将被操纵用来专门针对某人,或者只是为了骚扰他们不喜欢的人,这个主意太可怕了。
有网友甚至还举了自己因为和通缉令上的头像长得相似,被误认为是嫌疑人的例子,力证这一行为的不靠谱:
最后,在巨大的舆论压力下,加拿大警方不得不删除了这一通缉令,并表示会继续寻找其他方法破案。
不过话说回来,用DNA还原3D人脸,真的没有前途吗?
DNA还原3D人脸,什么原理?
给警方提供DNA还原3D人脸照片的这家公司名叫Parabon NanoLabs。
公司成立于2008年,大约在2015年初推出了一个名叫Snapshot DNA的DNA表型分析工具,可以基于DNA推测一个人的肤色、发色和种族等信息。
这项工具一发布,就受到了警方的热烈欢迎,当年美国国防部还给Snapshot DNA专门提供了200万美元的研发资金。
2015年6月,Snapshot DNA成功协助美国警方侦破了一起长达三年的谋杀案,如今罪犯已经在监狱服刑。
同时一些专家也认为,Snapshot DNA在一定程度上具有科学依据,包括人类的发色、瞳色、肤色以及身高都与基因有关。
BUT,这项技术发布以来一直在遭到质疑——
毕竟DNA既不能解释由于吸烟、饮酒、受伤(包括纹身)等引起的个人外貌变化,甚至连实际人脸大小都无法预测。
生物信息学&Snapshot部门技术主管、哈佛大学博士Ellen Greytak对此回应称,尽管这项技术没有将一个人的所有细节特征还原出来,但“提供了一种针对罪犯长相的描述”。
Ellen Greytak进一步介绍称,Snapshot是基于机器学习技术来根据DNA合成3D人像的,训练数据来自公开DNA数据集和对应的人脸长相。
但对于Snapshot DNA背后的详细算法原理,Parabon NanoLabs拒绝公布。
当然,目前学术界已经有不少针对类似算法的研究。
此前发表在PNAS(美国国家科学院院刊)上的一篇文章就试图通过1061个来自不同种族和年龄段的志愿者DNA/人像样本,训练出仅凭DNA还原肤色、身高、年龄等信息的3D模型。
虽然这个AI经过训练后,脸型和肤色看起来比较接近:
但从实际数据来看,DNA对于年龄等数据的预测准确度还有待提升:
所以,这些公开的DNA数据是怎么来的?
主要来源于两个家谱分析网站GEDmatch和FamilyTree DNA。
在这些免费公开的网站上,人们只需要上传自己的DNA信息,就能知道哪些名人or网友和自己有亲属关系。
甚至如果你上传照片和出生年月等信息,各种家谱网站还能帮你整理好一整个系的图谱,但这些信息如今却被用在训练AI合成模型上了。
如此来看,这项技术距离真正精确用上还有不少的路要走。
参考链接:
[1]https://www.pnas.org/doi/10.1073/pnas.1711125114
[2]https://www.edmontonpolice.ca/News/MediaReleases/DNAPhenotypeOct4
[3]https://www.edmontonpolice.ca/News/MediaReleases/StatementonDNAPhenotyping
[4]https://www.vice.com/en/article/pkgma8/police-are-using-dna-to-generate-3d-images-of-suspects-theyve-never-seen