跟上像 AI这样快速发展的行业 是一项艰巨的任务。因此,在 AI 可以为您做这件事之前,这里有一份关于机器学习领域上周故事的便捷综述,以及我们没有单独介绍的著名研究和实验。
本周,包括OpenAI 首席执行官 Sam Altman 在内的 AI 行业的推动者和影响者开始了与政策制定者的亲善之旅——为他们各自的 AI 监管愿景提供理由。Altman 在伦敦对记者发表讲话时警告说,欧盟拟议的 AI 法案将于明年定稿,这可能导致 OpenAI 最终从欧盟撤出其服务。
“我们将努力遵守,但如果我们不能遵守,我们将停止运营,”他说。同样在伦敦的谷歌 CEO 桑达尔·皮查伊 (Sundar Pichai) 强调需要不扼杀创新的“适当”人工智能护栏。微软的布拉德史密斯在华盛顿与立法者会面时,提出了人工智能公共治理的五点蓝图。
就存在共同点而言,科技巨头表示愿意接受监管——只要不影响他们的商业野心。例如,史密斯拒绝解决未解决的法律问题,即根据美国的合理使用原则,是否允许使用受版权保护的数据训练人工智能(微软这样做)。水平,对于微软及其竞争对手来说,这样做可能会付出高昂的代价。
就 Altman 而言,他似乎对 AI 法案中的条款提出异议,该条款要求公司发布他们用于训练 AI 模型的受版权保护数据的摘要,并让他们对下游系统的部署方式负部分责任。减少人工智能训练的能源消耗和资源使用的要求——一个众所周知的计算密集型过程——也受到了质疑。
海外监管路径仍不明朗。但在美国,世界上的 OpenAI 最终可能会如愿以偿。上周,奥特曼向参议院司法委员会的成员提出了关于人工智能危险的精心设计的声明,以及他对人工智能进行监管的建议。参议员约翰·肯尼迪 (R-LA) 特别恭敬:“这是你们的机会,伙计们,告诉我们如何做到这一点……用通俗易懂的英语告诉我们要实施什么规则,”他说。
布朗大学技术责任中心主任 Suresh Venkatasubramanian 在对 The Daily Beast 的评论中也许对此做了最好的总结:“我们不要求纵火犯负责消防部门。” 然而,这正是 AI 面临的危险。立法者有责任抵制他们对技术高管的甜言蜜语,并在需要的地方取缔。只有时间会证明他们是否这样做。
以下是过去几天的其他 AI 头条新闻:
GPT 适用于更多设备: Sarah写道,尽管OpenAI 的 GPT 应用程序在扩展到 11 个以上的全球市场之前仅在美国和 iOS上运行,但它的开端非常出色。应用追踪器称,该应用在头六天内的下载量已超过 50 万次。这使它成为今年和去年表现最好的新应用程序之一,仅次于 2022 年 2 月特朗普支持的 Twitter 克隆 Truth Social 的到来。
OpenAI 提出了一个监管机构: 人工智能发展得足够快——它可能带来的危险也足够明显——以至于 OpenAI 的领导层认为,世界需要一个类似于监管核电的国际监管机构。OpenAI 的联合创始人本周辩称,人工智能的创新步伐如此之快,以至于我们不能指望现有的权威机构能够充分控制这项技术,因此我们需要新的权威机构。
生成人工智能来到谷歌搜索: 谷歌 本周宣布,在本月早些时候的I/O 活动中取笑它们之后,它开始在搜索中开放对新的生成人工智能功能的访问谷歌表示,通过这次新的更新,用户可以轻松地了解一个新的或复杂的话题,发现针对特定问题的快速提示,或者获得客户评级和产品搜索价格等深入信息。
TikTok 测试机器人:聊天机器人很热门,因此得知 TikTok 也在试用自己的机器人也就不足为奇了。这款名为“Tako”的机器人正在特定市场进行有限测试,它将出现在 TikTok 界面的右侧,位于用户个人资料和其他点赞、评论和书签按钮上方。点击后,用户可以向 Tako 询问有关他们正在观看的视频的各种问题,或者通过寻求推荐来发现新内容。
谷歌关于 AI 协议:谷歌的 Sundar Pichai 已同意与欧洲立法者合作制定所谓的“AI 协议”——这似乎是在制定正式的 AI 法规时的一套自愿规则或标准的权宜之计。根据一份备忘录,欧盟打算在上述泛欧盟 AI 法案的法定期限之前启动一项“让所有主要的欧洲和非欧洲 AI 参与者自愿参与”的 AI 公约。
人,但由 AI 创造:通过 Spotify 的 AI DJ,该公司用真人的声音训练了 AI——其文化伙伴关系负责人兼播客主持人Xavier “X” Jernigan 的声音。现在看来,主播可能会将同样的技术用于广告。根据 The Ringer 创始人比尔·西蒙斯 (Bill Simmons) 的声明,流媒体服务正在开发 AI 技术,该技术将能够使用播客主持人的声音来制作主持人阅读的广告——而主持人实际上不必阅读和录制广告文案。
通过生成 AI 生成产品图像: 在本周的 Google Marketing Live活动中,谷歌宣布推出 Product Studio,这是一种新工具,可让商家使用生成 AI 轻松创建产品图像。品牌将能够在 Merchant Center Next 中创建图像,这是谷歌的平台,供企业管理其产品在谷歌搜索中的显示方式。
微软将聊天机器人融入 Windows: 微软正在将其 基于 的Bing 体验直接构建到 Windows 11 中——并添加一些小改动,允许用户请求代理帮助导航操作系统。新的 Windows Copilot 旨在让 Windows 用户更轻松地查找和调整设置,而无需深入研究 Windows 子菜单。但这些工具也将允许用户从剪贴板中总结内容,或撰写文本。
Anthropic 筹集了更多资金: Anthropic是一家由 OpenAI 资深人士共同创立的知名生成式 AI 初创公司,在 Spark Capital 领投的 C 轮融资中筹集了 4.5 亿美元。Anthropic 不愿透露该轮对其业务的估值。但我们在 3 月份获得的一份推介会表明它可能在 40 亿美元左右。
Adobe 将生成 AI 引入 Photoshop: 本周 Photoshop 注入了生成 AI,增加了许多功能,允许用户使用 AI 生成的背景将图像扩展到边界之外,向图像添加对象,或使用新的生成填充功能可以比以前可用的内容感知填充更精确地删除它们。目前,这些功能仅在 Photoshop 测试版中可用。但它们已经让一些平面设计师对其行业的未来感到震惊。
其他机器学习
比尔盖茨可能不是人工智能方面的专家,但他很有钱,而且他以前做的事情都是对的。事实证明,他看好个人 AI 代理,正如他告诉《财富》杂志的那样:“无论谁赢得个人代理,这都是一件大事,因为你永远不会再去搜索网站,你永远不会去生产力网站,你会永远不要再去亚马逊了。” 这将如何发挥作用并没有说明,但他的直觉认为人们宁愿不通过使用受损的搜索或生产力引擎来找麻烦,这可能离他不远。
评估人工智能模型中的风险是一门不断发展的科学,也就是说我们对此几乎一无所知。谷歌 DeepMind(由 Google Brain 和 DeepMind 组成的新成立的超级实体)和全球的合作者正在努力向前推进,并为“极端风险”(如“强大的操纵、欺骗、网络攻击技能”)制定了模型评估框架。进攻,或其他危险的能力。” 嗯,这是一个开始。
粒子物理学家正在寻找有趣的方法将机器学习应用到他们的工作中:“我们已经证明,我们可以从极少的数据中推断出非常复杂的高维光束形状,” SLAC 的 Auralee Edelen 说。他们创建了一个模型来帮助他们预测加速器中粒子束的形状,这通常需要数千个数据点和大量计算时间。这样效率更高,可以帮助使各地的加速器更易于使用。接下来:“通过实验证明算法重建完整的 6D 相空间分布。” 好的!
Adobe Research 和麻省理工学院合作解决了一个有趣的计算机视觉问题:判断图像中的哪些像素代表相同的材料。由于一个对象可以是多种材料以及颜色和其他视觉方面,这是一个非常微妙的区别,但也是一个直观的区别。他们必须构建一个新的合成数据集才能做到这一点,但起初它没有用。因此,他们最终根据该数据微调了现有的 CV 模型,并且它是正确的。为什么这有用?很难说,但它很酷。
出于多种原因,大型语言模型通常主要使用英语进行训练,但显然它们越早用西班牙语、日语和印地语训练越好。BLOOMChat 是建立在 BLOOM 之上的新模型,目前支持 46 种语言,可与 GPT-4 等竞争。这仍然是非常实验性的,所以不要用它来生产,但它可能非常适合用多种语言测试与 AI 相邻的产品。
NASA 刚刚宣布了一批新的 SBIR II 资金,其中有一些有趣的 AI 点点滴滴:
Geolabe正在使用经过卫星数据训练的 AI 检测和预测地下水变化,并希望将该模型应用于今年晚些时候发射的新 NASA 卫星星座。
Zeus AI正致力于根据卫星图像通过算法生成“3D 大气剖面图”,本质上是我们已有的温度、湿度等 2D 地图的厚版。
在太空中,你的计算能力非常有限,虽然我们可以在太空中进行一些推理,但训练马上就完成了。但 IEEE 研究人员希望制造一种SWaP 高效的神经形态处理器,用于原位训练 AI 模型。
在高风险情况下自主运行的机器人通常需要一名看护人,而Picknick正在考虑让这些机器人以视觉方式传达它们的意图,比如它们如何伸手去开门,这样看护人就不必过多干预。可能是个好主意。