您现在的位置是:恒跃网>社会>利用人脸识别技术找寻被拐儿童,精度远比传统方法高,但为何难以

利用人脸识别技术找寻被拐儿童,精度远比传统方法高,但为何难以

作者:匿名 时间:2019-10-23 13:07:50 阅读量:3499

本文发表在2019年第29期《三联生活周刊》上,原标题为《人工智能在寻找亲人方面的进展与困难》。严禁未经许可转载,侵权行为必须受到调查。

温/王子辉

通过新的跨年龄人脸识别技术,一些长期被绑架的儿童找到了他们的亲生父母。

如果一个孩子被绑架了,找到他有多难?在当前充满摄像头的环境下,可能会有很大的希望。但是十年前,答案是残酷的。

直到2017年12月,公安部刑事调查局副局长陈士渠仍然记得他几年前监督的拐卖儿童案件。主要罪犯在2014年被捕前绑架了13名儿童,其中只有3名在同一年被绑架。2008年至2010年被绑架的10名儿童仍然下落不明。据说原因是“主要罪犯只供认了3个孩子,如果供认了第四项刑事责任,死刑可能会加重。”

负责殴打和翻身的警察并非没有努力。他们已经想到了许多方法。根据专责小组本身披露的历史,2015年,他们联系了著名的刑事外貌专家,中国刑事警察学院的赵文成教授,根据孩子们童年的照片画出他们十几岁的外貌。工作组随后将这些肖像带到广东省,在那里出售儿童,并提取学龄儿童的照片,“用肉眼来了解这种感觉”。经过10天的观察,工作队带回了300多张可疑照片,并组织家长进行鉴定。最终确定了176个可疑物体,但没有一个被发现。他们还试图将失踪儿童的照片与成千上万张可能的裸眼照片进行比较,但无法一一找到。这是寻找被绑架儿童的传统方法。

这也让唐海鹏在2017年12月提及此案,称腾讯正在做一些跨年龄人脸识别算法,可能会尝试。当时,陈士渠正在调查腾讯,唐海鹏是腾讯安全管理部门的安全专家。就这样,在距离对话几千英里的广东,笼罩在10名被绑架儿童身上的迷雾终于被撕开了。

但是事情并不像唐海鹏想的那么简单。简而言之,人脸识别技术是指通过比较人脸的视觉特征信息进行识别的技术。然而,我们手机上使用的人脸识别技术并不难应用,因为它识别的对象是现在的你,而且你的面部特征不会在短时间内发生显著变化。然而,跨年龄人脸识别要困难得多,尤其是在青春期,当面部特征变化最大时,许多人长大后回过头来看童年照片时就认不出来了。

得到这个项目后,唐海鹏回来与腾讯负责图像识别技术研发的Youtu团队沟通。直到那时,他才发现了一个大问题,因为当时他们没有这个能力。“那时,我们也许可以通过数百张成人照片中的婴儿照片找到一个人。”唐海鹏告诉本报。然而,这种能力显然不能满足在数十万张照片中找到一个人的需要。

回想起来,只有一线希望。但是由于这个项目的特殊性,他们决定尽力而为。只有一种方法。“这是为了让机器知道当一个人的脸随着年龄变化时恒定的量是多少。”研究员程潇说。然后他们将这些面部特征转换成相应的计算机语言。

具体来说,由十几名医生组成的团队自行开发了一套算法,对0-18岁之间的人脸的生长和变化进行建模,生成人脸样本进行学习,然后使用深层神经网络算法让机器学习这些人脸在生长过程中的变化。学习材料很难找到,所以研究人员用他们年轻时不同时期的照片告诉电脑,“这是一个人1岁、5岁、10岁和20岁时的样子。”

幸运的是,计算机技术的进步通常是指数级的。2018年3月,人工智能比较的成功率提高到可以尝试的程度,第一次比较的时间到了。然而,出现了意想不到的问题。“起初,我们得到的照片实际上是父母用手机翻拍的。我们发现信息损失巨大,根本无法使用。”唐海鹏回忆道。我不得不再次与四川警方讨论,并说这部分家长是否可以发送原始电影。我没想到这个过程还会持续几个星期。

唐海鹏说,很多家长不愿意把原版电影寄出,因为这么多年后,那张照片可能是留给孩子的唯一东西,可能已经没有其他东西了,这些照片被分发给四川几个城市的不同家长。但是没有办法,警方只能硬着头皮劝说父母可以提供照片。唐海鹏仍然记得一个细节。当四川警方收集照片并带到上海漕河泾开发区软件园的优图实验室时,他们慢慢打开袋子,看到了几个油纸包。他们一层一层地打开油纸。里面是一张小照片。他们使用数字高清仪器提取照片。每张照片的大小可以从几百kb改变到10mb,最终使比较变得可行。

2018年4月,在警方提供的一个房间里,优图团队的研究人员将这10张照片放入广东省提供的数据库,开始测试。两小时后,在电脑上生成了10个文件夹压缩包,每个文件夹中有101张照片。第一张照片是被绑架儿童的原始照片,其余100张照片是100名12岁左右的儿童的照片。他们根据满分100分按降序排列,得分在75分以上。唐海鹏说:“75是万分之一的门槛,80是十万分之一的门槛,85是百万分之一的门槛。”。以75为例,如果两张脸的得分超过75,那么两张脸就是万分之一

这1000张照片被移交给四川警方,然后四川警方要求他们的父母一张一张地看,看看他们认为哪一张相似,这样又删除了几十张。最后,在信息筛选之后,范围缩小到不到10张,并且该过程花费了4个月。最后一个环节是dna比较。据说在四川省公安局,参与镇压的警察充满期待。有些人很乐观,并猜测这种比较可能有几个。做了多年警察的旧刑事调查是保守的。猜二。"我们都在祈祷,想如果能找到一个,我们会很感激的。"唐海鹏说道。最终结果与4相比较。

27年后,失踪儿童的亲属第一次通过视频连接遇到了离家很远的儿童。正是跨年龄人脸识别技术帮助他们相互联系。

第一次成功后,研究人员继续优化算法。正如程潇所说,在现实条件下,照片的质量、人脸的角度、遮挡和光线可能会影响人工智能的判断,他们必须教会人工智能克服其他因素的影响,获得尽可能多的面部特征。今年年初,随着人工智能的识别准确率提高到近96%,他们对三个被绑架的孩子进行了一个接一个的比较。

四川事件后,几个类似的案例开始尝试使用这种跨年龄人脸识别技术。今年6月,深圳警方还发现了一名通过这项技术被绑架了19年的儿童。然而,一个问题出现了:为什么这种技术没有大规模地推广到全国,只能在个案的基础上一个一个地推广?

“它需要一个复杂的过程才能大规模应用。这是一个层次。另一个层面是,事情本身非常复杂。”唐海鹏用了几个“复杂因素”来不断强调这件事棘手的方面。从理论上讲,如果对全国所有人的dna进行测试和比较,就不会有无法破解的贩卖儿童案件,但每个人都知道这在实践中是不可能的。

复杂的不是技术,而是一个难以实施但更难触及的道德伦理难题。这也使得推动看起来非常实用的新技术变得困难。“虽然该系统现在已经成熟,但如果要在全国推广和使用,这一过程将非常漫长,因为有许多事情需要协调。如您所见,仅在一个省,我们就为一个案件协调了几个月。”唐海鹏说道。

这是技术进步给整个社会带来的新挑战。传统的击打和翻转方法仍然是基于现场调查和人像识别,基本需求协调是在政府部门内部进行的。然而,人工智能在跨年龄人脸识别中的应用将涉及其他社会领域的数据使用。例如,寻找18岁以下的儿童需要教育部的数据。然而,它可能是使用这些数据的商业组织。这些协调管理工作是整个监管层面的空白。「举例来说,教育署亦会担心,虽然他们收集了这些儿童的资料,但并没有法例规定可以做甚么和不可以做甚么。」一位参与搜寻亲属的人告诉本报。

这个难题以前没有成熟的解决办法,我们只能努力向前迈进。由于敏感性,一些决策过程无法进行。“有很多伦理道德问题。我们压力很大。”回想起来,唐海鹏的语气仍然沉重。有时候道德问题比技术问题更难,“我们只能小心谨慎,避免一些负面影响。”

四次比较的结果出来后,整个搜索团队欣喜若狂,但不得不开始更激烈的讨论。他们试图为可能的负面影响做充分的准备。"例如,我们得到了前十名的比较结果,但是我们如何得到他们的dna呢?"唐海鹏问道。例如,即使比较4名被绑架的儿童无疑是一个好消息,当所有10名被绑架儿童中只有一部分被找到时,是否应该通知4个家庭的父母?因为一旦消息传出,可能会影响后续的搜索工作;但是长时间不通知父母就找到被绑架的孩子在道德上有争议吗?“事实上,这东西似乎是‘科学技术是好的’,但要真正做到科学技术是好的真的不那么容易。”

“我认为这些争议主要是由于新技术的快速发展,这使得人们不太确定如何使用许多当前的技术工具。”针对这种情况,中国人民大学法学院副教授、未来法治研究所执行主任张继禹在接受本报采访时说。作为人工智能法律专家,她告诉本报,在这种基于公共利益的高度合法的应用场景中,是否有可能对个人数据使用的原始规范做出一些平衡的衡量,这也是学术界目前正在讨论的一个重要话题。

一些母亲告诉本报,如果她知道孩子的学校照片是为了找回被绑架的孩子,她肯定会感到不舒服。张继禹认为,在保护个人隐私的基础上,必须在公共利益之间取得一定的平衡。“总的来说,‘相称性原则’将是一个非常重要的衡量标准,以确定这项新技术是否给我们的社会带来了新的价值。如果它带来新的价值并损害其他一些利益和价值,这取决于这种手段是否必要。”

“随着新技术的不断发展,我们的伦理道德也需要更多的发展和适应,在这方面的讨论可以更快。”她总结道。

在唐海鹏看来,如果你想想象人工智能寻找亲人的常规使用方法,也许这是一种通过国家救援站系统的相对可行的方法。“因为上面基本上是救援站本身的照片和主动找到的人的照片,这些数据并没有太大争议。事实上,如果我们能与我们的技术相匹配,我认为有机会实现标准化。”

然而,这个应用场景实际上是针对另一个群体迷失的人。“因为被绑架的儿童不会自愿将照片上传到这些平台,除非他们对童年记忆留下深刻印象,所以不会有比较数据。”唐海鹏说道。

目前,全国失踪人员的主要搜索平台是民政部下属的“国家救援和家庭搜索网”(NatIONAL Rescue and Family Search Network),该网发布了全国各地救援管理机构发布的救助人员家庭搜索公告。事实上,他们已经启动了“人脸比较和寻找亲人”的功能,他们使用的人脸识别技术是由百度提供的。

2016年,民政部与百度建立了合作关系。随后,百度为民政救助追踪系统提供了一个带有人脸识别技术的服务器。一方面,它在民政救助管理系统中增加了人脸识别功能。当获救人员进入救援站时,工作人员可以上传他们的照片,并将他们的脸与数百万历史救援数据进行比较。如果他们得到了救援,他们可以根据记录快速识别自己的身份,并帮助失踪人员更快地回家。另一方面,家庭成员和志愿者也可以向系统上传失踪人员的照片。一个键用于与救援站中所有被困人员的照片进行实时比较,系统将给出相似度排序较高的结果。

在过去的五年里,来自山东的家庭主妇谭颖昌作为志愿者帮助了800多名失踪者找到了他们的家人。她主要依靠“愚蠢的方法”。在收到相关搜索组的家庭成员的照片或视频信息后,她将在国家救援搜索网等网络平台上寻找可能的对象。"失踪人员的亲属不常使用互联网。"换句话说,谭颖说,“他们中的许多人年龄更大,或者在农村。”如果人工智能人脸识别没有得到类似的结果,谭颖将自己再次找到它。主要技术是仔细比较面部特征和脸型。"你怎样再改变这只耳朵,它会怎样改变?"如果她看到可疑的物体,她会打电话询问细节,这也使她每月的电话费超过了300元。

虽然谭颖昌有时觉得人工智能识别不太相似,但人工智能人脸识别在过去两年里为像她这样的志愿者节省了很多时间。2016年,陕西人张洪钧在父母陪同下前往北京接受治疗,因为他患有间接精神疾病。在医疗过程中,张洪钧于8月7日失踪。在八个月的搜寻中,两个70多岁的老人守在十字路口,不停地寻找你和询问路人。2017年4月,在志愿者的帮助下,将唯一的身份证照片上传到人工智能搜索平台后,系统给出了8张相似度很高的照片。经过初步检查,张福和张穆确认,这名名叫“陶家军”的男子应该是他的儿子张洪钧,最后前往北京昌平中西医结合医院抢救站,成功确认了他的亲属。

根据谭颖-陈的经验,国家救援和家庭搜索网的人工智能人脸识别系统一般可以找到近年来失踪的人。如果他们失踪了10到20年,那将是非常困难的。“因为有些人已经失踪多年了,所以他们年轻时拍的照片发生了很大变化。”谭颖则不然。

但是技术总是在进步。2017年3月,百度开始与专业追踪机构“宝贝之家”(Baby Home)合作,并开始应用跨年龄人脸识别技术寻找走失的孩子。对第一批20,000多个跟踪图像数据访问系统进行了比较和评估,初步筛查出30例疑似病例。第一个失踪的孩子是在4月份成功找到的。那个案件中的“孩子”已经失踪27年了。

陈士渠表示,这些孩子的康复“充分证明了人工智能在寻找被绑架多年的孩子方面可以发挥重要作用。”但是,随着社会监督的加强,通过盗窃、抢劫、绑架等手段绑架和贩卖儿童的案件基本上可以迅速侦破。就在最近,浙江“失踪女孩张子欣”案也在6天内得到解决。

作为前公安工作者,唐海鹏称人脸识别技术的进步是“dna技术出现后的第二次技术突破”。他唯一提醒的是,在进行这样的技术创新时,他必须记住一句老话“技术是一把双刃剑”。"对我们来说,如何使用技术将是一个永恒的考验."

河北快三