在德克萨斯大学奥斯汀分校的生物医学成像中心,研究人员使用 fMRI 扫描仪收集的参与者数十小时的大脑活动数据训练他们的语义解码器。
根据周一发表在《自然神经科学》Nature Neuroscience杂志上的一项同行评审研究,科学家们开发了一种非侵入式人工智能系统,专注于将人的大脑活动转化为文本流。
该系统被称为语义解码器,最终可以使因中风、瘫痪或其他退化性疾病而失去肢体交流能力的患者受益。
得克萨斯大学奥斯汀分校的研究人员部分通过使用变压器模型开发了该系统,该模型类似于支持谷歌的聊天机器人 Bard 和 OpenAI 的聊天机器人 GPT 的模型。
该研究的参与者通过在 fMRI 扫描仪中收听几个小时的播客来训练解码器,fMRI 扫描仪是一种测量大脑活动的大型机器。该系统不需要手术植入物。
博士生 Jerry Tang 准备在德克萨斯大学奥斯汀分校的生物医学成像中心收集大脑活动数据。
一旦人工智能系统经过训练,它就可以在参与者聆听或想象讲述新故事时生成文本流。生成的文本不是精确的抄本,而是研究人员设计它的目的是捕捉一般的想法或想法。
根据一份新闻稿,经过训练的系统在大约一半的情况下生成的文本与参与者原始单词的预期含义非常接近或精确匹配。
例如,当参与者在实验中听到“我还没有驾照”这句话时,其想法会转化为“她甚至还没有开始学开车”。
“对于一种非侵入性方法,与以前所做的相比,这是一个真正的飞跃,以前通常是单个单词或短句,”该研究的负责人之一亚历山大·胡特 (Alexander Huth) 在新闻稿中说。“我们正在让模型用复杂的想法长时间解码连续的语言。”
该新闻稿称,参与者还被要求在扫描仪中观看四个没有音频的视频,人工智能系统能够准确地描述他们的“某些事件”。
解码器不能在实验室环境之外使用,因为它依赖于 fMRI 扫描仪。但研究人员认为,它最终可以通过更便携的脑成像系统使用。该研究的主要研究人员已经为该技术提交了 PCT 专利申请。
文中部分图片由AI生成
关注【达轻工具】让你出去聊天时有见识