西班牙的一家人工智能公司推出了一些“人工智能人”,可以让人们在视频游戏中实时修改自己的声音。
总部位于巴伦西亚的 Voicemod 于周三发布了 20 个类人角色,从 20 多岁的女性到老年男性不等。这些声音是根据专业人类配音演员的声音进行训练的。
在与 CNBC 的通话中演示这项技术时,Voicemod 的首席执行官 Jaime Bosch 展示了自己经常说话并将其更改为几种不同的声音,从高音调的女声到男中音。
游戏玩家可以在他们的Apple上下载该应用程序
Mac 或 Windows PC,并将 Voicemod 的技术整合为“虚拟麦克风”,位于他们使用的麦克风应用程序之间,通过替代角色开始说话。
Voicemod 汇集了来自瓦伦西亚和巴塞罗那一流技术大学的人才,自 2014 年以来一直致力于语音合成和交互式音频功能,其员工中有许多专门从事音乐技术和音频。
超过 4000 万人使用 Voicemod 的技术,社交应用程序 Discord 中的人们可以使用它在玩游戏时用不同于自己的声音相互交谈。
博世在接受 CNBC 采访时说:“我们有一个了不起的创意社区,主要是利用它来找乐子,与朋友一起享受并获得归属感。”
“我最喜欢的最大用例之一是害羞的人——我们有些人写信给我们说我无法与现在能够做到这一点的人真正交往。”
这是对话式人工智能领域的一个里程碑。虽然当今的许多 AI 算法允许人们提交文本并接收 AI 生成的内容,但确保实时完成这项工作要困难得多。
该技术需要大量的计算能力。生产其背后的专有算法模型并为其申请专利需要大量投资和人才。
为此,Voicemod 已经从 Leadwind 和 Bitkraft Ventures 等几家风险投资家那里筹集了 2300 万美元现金。
“这是我每天都在想的事情,我们公司每天在创作声音时都在考虑的事情,”他说。
该公司即将完成一个“水印”解决方案,该解决方案可以识别语音是否是使用修改系统生成的。它还在与其他公司讨论此类系统的标准化,并确保安全发布变声技术。