卡耐基梅隆大学
对于机器人学习来说,这是一个激动人心的时刻。组织花费了数十年的时间构建复杂的数据集,并开创了不同的方法来教导系统执行新任务。在部署能够即时适应和学习的技术方面,我们似乎正处于一些真正突破的风口浪尖。
在过去的一年里,我们看到了大量令人着迷的研究。以卡内基梅隆大学 6 月份展示的VRB(视觉机器人桥)为例。该系统能够将从 YouTube 视频中学到的知识应用到不同的环境中,因此程序员不必考虑每种可能的变化。
上个月,谷歌的 DeepMind 机器人团队以 RT-2(机器人变形金刚 2)的形式展示了自己令人印象深刻的作品。该系统能够抽象出执行任务的细节。在给出的例子中,告诉机器人扔掉一件垃圾并不需要程序员教机器人识别特定的垃圾,捡起它并扔掉它以执行看似简单的任务(对于人类来说,至少)任务。
卡内基梅隆大学本周强调的其他研究将其工作与早期人类学习进行了比较。具体来说,将机器人人工智能代理与一个三岁的幼儿进行比较。根据上下文,学习水平分为两类——主动学习和被动学习。
在这种情况下,被动学习是通过向系统展示视频或在上述数据集上进行训练来教导系统执行任务。主动学习正如它听起来的那样——走出去执行一项任务并进行调整,直到你把它做好。
RoboAgent是 CMU 和 Meta AI(是的,就是那个 Meta)的共同努力,它结合了这两种类型的学习,就像人类一样。这意味着通过互联网观察正在执行的任务,并通过远程操作机器人进行主动学习。据该团队介绍,该系统能够从一种环境中学习并将其应用到另一种环境中,类似于上面提到的 VRB 系统。
卡内基梅隆大学机器人研究所的 Shubham Tulsiani 表示:“能够进行这种学习的智能体使我们更接近通用机器人,它可以在各种看不见的环境中完成各种任务,并随着收集更多经验而不断发展。” “RoboAgent 可以使用有限的域内数据快速训练机器人,同时主要依靠互联网上大量可用的免费数据来学习各种任务。这可以使机器人在家庭、医院和其他公共场所等非结构化环境中更加有用。”
所有这一切中最酷的一点是该数据集是开源的并且可以普遍访问。它还设计用于与现成的现成机器人硬件一起使用,这意味着研究人员和公司都可以利用和构建不断增长的机器人数据和技能。
“RoboAgents 能够比其他人拥有更丰富、更复杂的技能,”机器人研究所的 Abhinav Gupta 说道。“我们展示了比现实世界中单个机器人代理所实现的任何技能都更加多样化的技能,并且具有效率和对未见过的场景的独特泛化规模。”
卡耐基梅隆大学
当涉及到构建和部署多用途机器人系统并着眼于最终的通用机器人时,这些都是非常有前途的东西。我们的目标是创造能够超越高度结构化环境中的重复机器的技术,当我们想到工业机器人时,我们往往会想到这种机器。当然,实际的使用和扩展说起来容易做起来难。
当谈到这些机器人学习方法时,我们已经更接近开始了,但我们正在经历新兴多用途系统的一个令人兴奋的时期。