具备极高欺骗性的深度伪造技术引发了诸多争议,例如AI软件自动生成裸照,奥巴马、普京等政治人物的深度伪造视频等,给个人和社会带来了相应的风险和挑战。这是AI来临后前期不可避免的网络风险,与此同时该技术的应用如果得到正面的引导,也会给人们带来许多积极的价值。
深度伪造的由来根源
深度伪造技术(Deepfake)是一种利用AI程序和深度学习算法实现视、音频模拟和伪造的技术,投入深度学习的内容库越大,合成的视音频真实性越高,甚至可以达到以假乱真的程度。
深度伪造技术不仅能实现换脸,更可以通过深度学习模拟真人声音、创造出现实不存在的人物肖像。利用该技术,可以以视频这一较为可信的方式让某人说不曾说过的话,做不曾做的事,达到混淆观众的目的。
虽然操纵数字文件并不是什么新鲜事儿,但这种可信的伪造行为是通过使用一种人工智能形式的计算机程序完成的。
一个算法被训练来识别特定人的实际音频或视觉记录中的模式,这个过程被称为深度学习。就像修改过的图片一样,一段音频或视频内容可以通过更换新元素,比如更换别人的脸或声音来改变,并无缝地将两者结合起来。
与语音克隆技术结合使用时,这种手法最容易让人产生误导。语音克隆技术将音频录音分解成半音节的片段,然后可以重新组合成新词,与苹果的Siri和亚马逊的Alexa等语音助手的创建方法相同。
深度伪造视频的制作离不开AI技术,而AI技术的实现则离不开机器学习和深度学习技术,通过这个技术,让计算机在生成具有统计相似性的假实例之前从真实数据中学习,模仿语音和形象,进而创造出另类的现实,让人们真假难辨。
技术的主要风险
随着AI技术发展,视频换脸技术门槛降低,普通人也能制作换脸视频。这项技术被用于恶搞视频、色情视频合成上,其不良效应也引发了社会的关注和担忧:放任自流,可能成为侵害他人合法权益和危害社会公共安全的工具。
①由于深度伪造技术可以运用在包括总统在内的任何官员身上,美国两党开始担心该技术将成为针对美国和其他西方国家发起虚假信息战争的最新武器。
②制作虚假的色情视频是深度伪造技术常见的运用方式之一。利用该技术能实现将一些公众人物的脸移转到色情明星的身体上,伪造逼真的色情场景。这些虚假的色情视频一经传播,受害人的名誉将严重受损,个人隐私还随时有可能受到侵犯。
③深度伪造技术对企业首次募股(IPO)同样有不可估量的负面影响。深度伪造技术可以借用企业负责人的公开谈话视频,篡改表情及谈话内容,散播虚假信息,让社会公众发生错误认识,直接影响公司的信誉及经济利益。
④就像图片处理软件Photoshop一样,深度伪造则是一套由人工智能驱动的视频伪造软件,它可以让人们看起来在做或说他们从未做过的事情。对视频的数字操纵并不是什么新鲜事,但深度伪造这个工具存在的意义是,被操纵的视频片段更容易被制作出来,而且还会越来越难被区分为欺诈。
⑤深度伪造技术可能会过度损害声誉,甚至引发骚乱。想象一下,在伪造的视频中,总统候选人猥亵儿童,警察局长煽动针对少数群体的暴力行为,或者士兵犯下战争罪,结果不堪设想。
技术的正面价值
互联网时代下,先进的AI技术和开放的数据流动给社会带来巨大的信息红利。信息流动载体从原始的文本、到语音、至视频、后进化至如今的虚拟现实,数据的巨大量和更高的开放程度允许越来越多消费者参与进来。而今随着AI、深度伪造技术的发展,信息更能以重塑现实的方式丰富用户的体验。
与AI结合的深度学习算法用于科学研究上,能帮助改善医学图像分析,还能用于弥补听力缺陷,帮助有听力障碍的人理解别人的话语等。
该技术用于制作、真实还原历史人物的肖像、相关音频和视频,或者让艺术作品中的静态的人物角色生活起来,实现教育大众、丰富人们精神世界的目的。
该技术实际上与深度学习运用的技术一样,这意味着在面对深度伪造带来的潜在风险时,不是全部禁止深度伪造技术的应用,而是有效管控其风险,尤其是对可能造成特定伤害的深度伪造的虚假信息进行规制,同时不妨碍其在教育、艺术、社交、虚拟现实、个人发展、医疗等等领域的应用。
深度伪造技术是AI发展到一定阶段的产物,技术本身是中立的。技术并不导致社会矛盾,只是技术的出现加剧了这种社会矛盾。所以我们不应该因此而禁止深度伪造技术。与此相比,更重要的是提高针对深度伪造的检测技术、完善相关认证机制。
结尾:
这是一个眼见为实的世界,所有人都相信自己亲眼看到的事情,但是随着人工智能技术的不断发展,眼见有时也绝非为实,它给人们根深蒂固的观念带来了冲击。
但与此同时也有越来越多人在学习、研发相关的检测技术,掌握判断真伪的技能。随着深度伪造技术越来越成熟,相应的检测深度伪造的技术也会越来越先进,这将是一场永无休止的竞赛。
转至公众号——AI芯天下