DeepFakes的技术原理
DeepFakes的核心是一个“自动编码器”,这个“自动编码器”实际上是一个深度神经网络,它能够接收数据输入,并将其压缩成一个小的编码,然后从这个编码中重新生成原始的输入数据。
在这个标准的自动编码器设置中,网络将尝试学习创建一个编码,从中网络能够重新生成输入的原始图片。只要有足够多的图像数据,网络就能学会创建这种编码。
DeepFakes让一个编码器把一个人脸压缩成一个代码和两个解码器,一个将其还原成人物A(Fallon),另一个还原成人物B(Oliver)。下面的图能够帮助你理解:
在这个案例中,使用的编码器是一样的,但是Fallon和Oliver的解码器是不同的。在训练的过程中,输入的人脸会被扭曲,从而模拟一个“我们希望得到这样的人脸”的概念。
下面将介绍算法训练的三个步骤:
1. 首先,我们给编码器输入了一张Jimmy扭曲脸的图片,并尝试用解码器A来重新还原他的脸,这就使得解码器A必须要学会在纷繁复杂的图片中识别并且还原出Jimmy的脸。
2. 然后,把Oliver扭曲脸的图片输入至同一个编码器,并用解码器B来还原Oliver的脸。
3. 我们不断重复上面的操作,直到两个解码器能够分别还原出两个人的脸,同时编码器也能够学会通过抓取人脸关键信息,从而分辨出Jimmy和Oliver的脸。
等到以上的训练步骤都完成以后,我们就能把一张Jimmy的照片输入至编码器,然后直接把代码传输至解码器B,将Jimmy的脸换成Oliver的脸。
这就是我们通过训练模型完成换脸的全过程。解码器获取了Jimmy的脸部信息,然后把信息交给解码器B,这时候解码器B会作出这样的反应:“这又是一条干扰信息,这不是Oliver的脸,那么我就把你换成Oliver吧。”
一条算法仅通过观察许多图片就能够再次生成、还原这些图片,这听起来挺不可思议的,但DeepFakes确确实实做到了,而且效果还相当不错。
用AI假里辨真
如何辨别“AI换脸术”?值得庆幸的是,科学界正在应对这个问题,而主要“杀手锏”是运用AI技术假里辨真。
纽约州立大学奥尔巴尼分校教授吕斯卫领导的团队发现了伪造视频的漏洞:假脸极少甚至不会眨眼,因为它们都是使用睁眼的照片进行训练的。
研究人员表示,伪造视频往往忽略了“自发的、无意识的生理活动,例如呼吸、脉搏和眼球运动”。吕斯卫说:“因此,缺少眨眼是判断一个视频真假的好方法之一。”
这种作为“反AI变脸”技术通过有效预测眼睛的状态,准确率达99%。此项研究已由美国国防高级研究计划局资助,作为甄别媒体假新闻,推进媒体取证计划的一部分。
在伪造视频的后期处理中手动添加眨眼,其实并非一个巨大挑战,而且一些伪造视频已包含眨眼。从长远来看,实际上这是一场通过AI制作假视频和检测假视频之间的持续战斗。
此外,还有专家指出,“通过强制记录照片和视频拍摄的时间、地点,既在区块链上记录照片和视频不可篡改的时空戳方法,也可进行鉴别”。
至于大家很关心的问题,目前的人脸识别技术还安全吗?毕竟很多手机都是人脸解锁、而且支持人脸支付。对此,专家表示,目前人脸识别活体检测技术能够毫秒级辨别,成功率高达99.9%,防控技术还是有的,大家无需过于担忧。
AI面前,人类必须保持敬畏之心。科技的突破与进步是无罪的,关键要看我们如何去利用它。作为研发者和使用者,堃乾智能呼吁,我们不仅应该关注科技进步的最新风向,同时也应该关注技术与社会的融合趋势,在众多方向之中,摸准市场的痛点,潜心优化,快速布局。AI换脸技术究竟会走向何方,我们且静观其变。