首页 科技开发工具 娱乐游玩工具 热门工具   APP 登录/注册 联系/合作
   
 
斯坦福大学研究人员开发用于语音合成的脑机接口
斯坦福大学的研究人员开发了一种脑机接口(BCI),用于从患者大脑中捕获并由递归神经网络(RNN)处理的信号合成语音。原型系统可以以每分钟62个单词的速度解码语音,比以前的BCI方法快3.4倍。

该系统在bioRxiv上发表的一篇论文中进行了描述。研究小组与一名因肌萎缩侧索硬化症(ALS)而失去语言能力的患者合作,使用植入患者大脑的微电极来捕获患者试图说话时产生的神经活动信号。这些信号被传递给RNN,特别是门控循环单元(GRU)模型,该模型被训练为将神经信号解码为语音合成的音素。当训练50个单词的有限词汇时,系统实现了9.1%的错误率,23k单词词汇表的错误率为8.125%。根据研究人员的说法:

[我们]展示了一种语音BCI,它可以以每分钟62个单词的速度从大词汇中解码不受约束的句子,这是BCI第一次远远超过替代技术可以为瘫痪者提供的通信速率......我们的演示证明了从皮层内录音中解码尝试说话运动是一种有前途的方法,但它还不是一个完整的临床上可行的系统。

使用深度学习模型来解释人类大脑活动是一个活跃的研究领域,InfoQ已经涵盖了几个涉及辅助设备的BCI项目。其中许多使用植入患者大脑的传感器,因为它们提供最佳的信号质量;2019年,InfoQ报道了Meta开发的一个系统,该系统使用这样的信号允许用户通过想象自己说话来“打字”。InfoQ还涵盖了使用外部或“可穿戴”传感器的系统,例如佐治亚理工学院在2021年开发的系统,它允许用户通过想象活动来控制视频游戏。

斯坦福系统使用四个微电极阵列植入患者的腹侧前运动皮层和布罗卡区域。为了收集训练RNN的数据,患者每天被给予几百个句子,她“嘴巴”或哑剧说话,产生神经信号,这些信号被微电极捕获。总体而言,该团队收集了10,850个句子。使用来自语音识别领域的“自定义机器学习方法”,研究人员训练RNN输出一系列音素。

为了评估该系统,该团队对患者进行了从未在培训中使用的口句;测试句子包括一些仅使用50个单词词汇和125k词汇的句子。研究人员还尝试在解码器中添加语言模型,将错误率从23.8%提高到17.4%,并减少训练和测试RNN之间的时间,以消除神经活动的日常变化。他们的结论是,通过语言建模和更强大的解码技术的进一步研究,该系统可以看到“性能的实质性提高”。

首席研究员弗兰克·威利特(Frank Willett)在Twitter上发布了有关这项工作的信息,并回答了几个问题。在回答关于RNN是否预测下一个单词的问题时,Willett回答说:

没有下一个单词预测 - 语言模型只是输出迄今为止产生的所有RNN输出的最佳解释。

威利特还表示,该团队将在工作“发表在同行评审的期刊上”后发布他们的代码和数据。
最新文章:
所有文章资讯、展示的文字、图片、数字、视频、音频、其它素材等内容均来自网络媒体,仅供学习参考。内容的知识产权归属原始著作权人所有。如有侵犯您的版权,请联系我们并提供相应证明,本平台将仔细验证并删除相关内容。
工具综合排行榜
TOP 1
双计算器 双计算器
同时用两个计算器,用于价格对比、数字分别计算等
TOP 2
推算几天后的日期 推算几天后的日期
推算从某天开始,增加或减少几天后的日期
TOP 3
随机密码生成 随机密码生成
随机生成安全复杂的密码,自由设置密码长度及复杂度
TOP 4
推算孩子的血型 推算孩子的血型
根据父母的血型推测子女的血型
TOP 5
日期转中文大写 日期转中文大写
把数字日期转成中文大写,是财务或商务合同常用的工具
热门内容:       双计算器       推算孩子的血型       随机密码生成       日期转中文大写       推算几天后的日期       达轻每日一景       高校分数线       高校查询       周公解梦大全
首页 科技开发工具大全
娱乐游玩工具大全
登录/注册
联系我们
  用户咨询/建议
kf@ss3316.com


商务合作/推广
hz@ss3316.com

达轻工具 APP

访问手机版网站
使用本平台必读并同意:任何内容仅供谨慎参考,不构成建议,不保证正确,平台不承担任何责任,同意用户协议隐私政策   
BaiduTrust安全认证签章
© 达轻科技 版权所有 增值电信业务经营许可证 ICP备 沪B2-20050023-3