文/陈根
这两年,深度合成让人们越来越多地感受到技术时代里的“以假乱真”。本质上来看,深度合成技术是人工智能发展到一定阶段的产物,源于人工智能系统生成对抗网络(GAN)的进步。典型的“深度合成”主要包括人脸替换、人脸再现、人脸合成以及语音合成四种形式。
作为一种基于人工智能的人体图像合成技术,深度合成的起初只是程序员用于自制搞笑的“换头”视频的简单想法。而当两个深度学习的算法相互叠加,最终创造了一个复杂的系统。
人工智能的进步令这个复杂的系统用途也得以扩充。从特定用户实时匹配面部表情,并无缝切换生成换脸视频,到其可以模仿的对象不再被限制。不论是明星政客,还是任何普通人,都可以在深度合成技术下达到“以假乱真”的程度。这也让深度合成有了新名字,即深度伪造。
深度伪造带来的最大问题,就是让人们难辨真假,基于此,近日,英特尔宣布,他们已经开发了一个名为 FakeCatcher 的 Deepfake 检测工具,该工具声称在检测被 AI 篡改的视频方面有 96% 的准确性。更重要的是,英特尔称 FakeCatcher 是实时检测,在几毫秒内出结果。
其中,Deepfake 视频就是使用人工智能算法制作的伪造视频,可以将一个人的脸拼接到另一个人的脸上,甚至模仿他们的声音。而FakeCatcher的原理则是识别视频人物皮肤的静脉血液流动。如果是真人,血液时刻在体内循环,皮肤上的静脉就会有周期性的深浅变化,深度伪造的人就没有。
这也让我们看到用技术来解决技术带来的问题的可能性。在深度伪造技术下,回应深度伪造对社会真相的消解,弥补信任的崩坏,并对这项技术进行治理已经不可忽视。2019年,斯坦福大学研究员Tom Van de Weghe联合计算机、新闻等行业的专家,成立了深度造假研究小组,以提升公众对这一现象的认知度,设计深度造假的识别应对方案。
然而,技术发展速度往往高于破解速度。随着鉴别器在识别假视频方面做得越来越好,生成器在创建假视频方面也做得越来越好。而可以预见,未来,深度伪造与鉴别深度伪造在这种“道高一尺魔高一丈”的反复中博弈下去。