首页 科技开发工具 娱乐游玩工具 热门工具   APP 登录/注册 联系/合作
   
 
语音生成平台 推出检测工具
语音生成平台 ElevenLabs 融资 1900 万美元,推出检测工具
ElevenLabs是用于创建合成语音的病毒式 AI 驱动平台,已筹集了新一轮现金。今天,这家初创公司宣布结束由企业家 Nat Friedman 和 Daniel Gross 以及 Andreessen Horowitz 共同领投的 1900 万美元 A 轮融资。其他参与者包括重量级人物 Creator Ventures、SV Angel、Instagram 联合创始人 Mike Krieger、Oculus 联合创始人 Brendan Iribe、Deepmind 和 Inflection AI 联合创始人 Mustafa Suleyman 以及 O'Reilly Media 创始人 Tim O'Reilly。

一位熟悉此事的消息人士告诉 TechCrunch,这部分资金对 ElevenLabs 的估值为 9900 万美元——这是一个可观的数字,尤其是考虑到这家初创公司刚刚成立一年多。

“这项投资将用于继续建设 ElevenLab的尖端语音人工智能研究中心,并推出一系列附加产品以支持特定的垂直市场,例如出版、游戏、娱乐和对话应用程序,”联合创始人兼首席执行官Mati Staniszewski 通过电子邮件告诉 TechCrunch。

ElevenLabs由曾在 Palantir 工作过的 Staniszewski 和他儿时的朋友 Piotr Dabkowski(前 Google 员工)创立,这家公司在过去几个月里因既好又坏的原因成为头条新闻。受到在祖国波兰长大的平庸美国电影配音的启发,两人着手设计一个可以做得更好的平台——当然是利用人工智能。

ElevenLabs 可以使用合成声音、克隆声音或模仿不同性别、年龄和种族的人的声音的全新“人造”声音将文本转换为语音。该公司的 AI 文本转语音模型与语言无关,允许企业客户对其进行微调,并在此基础上构建自己的专有语音模型。

恰逢 A 轮融资,拥有 15 名员工的 ElevenLabs 正在启动 Projects,这是一个用于编辑和创建长篇口语内容的工作流程。借助 Projects,用户无需离开平台即可生成对话片段甚至有声读物。

“对于企业对企业的合作伙伴,我们的技术可用于可扩展和多语言有声读物创作、视频游戏中的角色配音、数字文章配音、支持视障人士访问在线书面内容以及为 AI 广播提供动力等领域,”Staniszewski说。

ElevenLabs 于 1 月下旬推出测试版,由于其生成的声音质量极高、生成速度快和免费套餐慷慨,因此迅速崛起。但正如之前提到的,宣传并不总是正面的——尤其是当不良行为者开始利用该平台达到自己的目的时。
ElevenLabs 提供的工具可以利用 AI 克隆(或从头开始生成)逼真的声音。

臭名昭著的留言板 4chan 以其阴谋论内容而闻名,它使用ElevenLabs 的工具来分享模仿演员艾玛·沃特森 (Emma Watson) 等名人的仇恨信息。在其他地方,The.Verge 的 James Vincent 能够利用 ElevenLabs 在几秒钟内克隆目标的声音——生成的音频样本包含从暴力威胁到种族主义和跨性别恐惧症表达的一切内容。

作为回应,ElevenLabs 表示将引入一套新的保护措施,例如将语音克隆限制在付费账户、禁止多次违反其服务条款的用户以及提供新的 AI 检测工具。

该检测工具今天推出。它被称为 AI Speech Classifier,可作为“选定”合作伙伴的 API 使用,旨在检测上传的音频样本是否包含来自 ElevenLabs 的 AI 生成的内容。

Staniszewski 说:“确保生成式 AI 平台能够被安全地接受是整个 AI 生成领域的主要挑战,包括文本、图像和语音平台。” “我们必须确保人们了解生成媒体领域的本质,并知道此类内容就在那里——我们致力于构建工具来帮助人们检测人工智能生成的内容,以提高透明度。”

一个自愿的检测工具——假设它甚至像宣传的那样工作——不一定能阻止不良行为。但 ElevenLabs 还没有解决房间里的另一头大象:其技术对配音演员构成的生存威胁。

Motherboard写道,越来越多的配音演员被要求签署他们的声音权利,以便客户可以使用人工智能生成最终可以取代他们的合成版本——有时无需额外补偿。与此同时,纽约时报看到的内部电子邮件表明,世界上最大的游戏发行商之一动视暴雪正在开发人工智能辅助“语音克隆”的工具。

ElevenLabs 似乎将此视为事物的自然发展,宣传其与 Storytel 等出版商以及 TheSoul Publishing 和 MNTN 等媒体平台在有声读物、视频游戏和广播内容方面的合作。(Storytel 和 TheSoul Publishing 是战略投资者。)该公司声称在创意、娱乐和出版领域拥有超过 100 万注册用户,他们创造了十年的音频内容。

ElevenLabs 计划最终将其人工智能模型扩展到语音配音,追随Papercup和Deepdub等初创公司的脚步,并建立它所谓的“能够将情感和语调从一种语言转移到另一种语言的基础”。

ElevenLabs 在一份新闻稿中写道:“这将使任何视频都能够以一种引人入胜、有效且可扩展的方式被配音成任何语言,同时保持原始说话者的声音。” “[我们]已经与行业合作伙伴进行了多项测试,以实现大规模的 AI 配音。”

ElevenLabs 拥有 2100 万美元的银行存款(其中 200 万美元来自 1 月份的种子轮融资),其结果是该死的——专注于在新兴的生成语音领域击败竞争对手。它们包括亚马逊、谷歌和微软等老牌企业,以及Murf、Tavus、Resemble AI、Respeecher、Play.ht 和Lovo等初创公司。
最新文章:
所有文章资讯、展示的文字、图片、数字、视频、音频、其它素材等内容均来自网络媒体,仅供学习参考。内容的知识产权归属原始著作权人所有。如有侵犯您的版权,请联系我们并提供相应证明,本平台将仔细验证并删除相关内容。
工具综合排行榜
TOP 1
双计算器 双计算器
同时用两个计算器,用于价格对比、数字分别计算等
TOP 2
推算几天后的日期 推算几天后的日期
推算从某天开始,增加或减少几天后的日期
TOP 3
随机密码生成 随机密码生成
随机生成安全复杂的密码,自由设置密码长度及复杂度
TOP 4
推算孩子的血型 推算孩子的血型
根据父母的血型推测子女的血型
TOP 5
日期转中文大写 日期转中文大写
把数字日期转成中文大写,是财务或商务合同常用的工具
热门内容:       双计算器       推算孩子的血型       随机密码生成       日期转中文大写       推算几天后的日期       达轻每日一景       高校分数线       高校查询       周公解梦大全
首页 科技开发工具大全
娱乐游玩工具大全
登录/注册
联系我们
  用户咨询/建议
kf@ss3316.com


商务合作/推广
hz@ss3316.com

达轻工具 APP

访问手机版网站
使用本平台必读并同意:任何内容仅供谨慎参考,不构成建议,不保证正确,平台不承担任何责任,同意用户协议隐私政策   
BaiduTrust安全认证签章
© 达轻科技 版权所有 增值电信业务经营许可证 ICP备 沪B2-20050023-3