《Tech Times》by Joseph Henry on February 17, 2022
初创公司Sonantic展示了其AI拟人配音技术的能力,所开发的深度伪造音频可以和人开玩笑或者调情。
Sonantic实际研发的产品是一个音频编辑器,该编辑器内含有不同的语音模型,基于实际的配音演员声音开发。现在开发的合成音频可以和人进行交流,在加入非语音的音频后,发出的音频更像是人的活动而产生的。在开发语音时,通过模拟加入了细微的情感,公司称为音频的PS,所能表达的情绪有欢喜、伤悲、害怕、愤怒等,更不用说和人开玩笑、调情。该公司主要和娱乐工作室合作,但是也和奔驰合作帮助车载数据助理。
Sonantic的深度伪造音频是建立在机器学习上的一个重大进展,对于以后在若干方向的发展有重大意义,包括游戏、娱乐。开发者通过声音的类型来获得注意力,让声音根据场景更为独特、适合。深度伪造的声音不但可以用来模拟人的讲话,也可以用在坏主意上。黑客可以使用这个技术骗银行工作人员,有报道说有人使用人工智能增强的声音盗取了银行3千5百万美元。针对深度伪造,中国官方增加了对人工智能技术的监管和对社交平台的监控。