计算机视觉已在无数行业中变得司空见惯,但创建和控制这些视觉人工智能模型的方法并不那么容易。Viso正在构建一个低/无代码端到端平台,让公司可以推出自己的计算机视觉堆栈,他们刚刚筹集了 920 万美元来扩大规模。
当然,有大量的计算机视觉模型和服务,但很多都符合“模型即 API”的描述。假设您想要进行人物识别并对其是站着还是坐着进行评分,这样您就可以知道火车站或餐厅的繁忙程度。
有完整的选项供您进行人员和姿势识别,但它们可能不适合您的用例或安全模型,或者它们太昂贵而无法扩展。建立自己的团队是一种选择,但训练和部署现代 CV 模型所需的专业知识并非易事:除非您有时间和金钱来组建真正的团队,否则这可能超出您的能力范围。
Viso 希望通过提供一个平台来创建您自己的企业级简历模型,而无需投入通常需要的时间和资源,从而解决这种情况。
“在采用周期的早期,公司诉诸购买/租赁预制计算机视觉系统。然而,他们最终需要将所有计算机视觉举措整合在一起(精简),并深度集成和定制它们,并“拥有”它们,因为数据是敏感的,技术具有战略价值。这就是为什么这些行业的公司开始聘请人工智能工程师。”Viso 联合创始人兼联合首席执行官 Gaudenz Boesch 解释道。
iso 支持的计算机视觉应用程序示例
但与许多其他企业级需求不同,计算机视觉缺乏“专用基础设施”来有效构建和部署它。
“公司必须从头开始构建它,试图在整个组织中组装大量互不相连的软件和硬件平台(相机、服务器),”他继续说道。这反过来又需要跨多个领域的专业知识,而这些专业知识很快就会变得过于昂贵。
对于任何在其他环境中使用过无代码工具的人来说,Viso 的方法可能看起来很熟悉。它相当于一系列预构建和可定制的模块,允许用户根据需要选择、训练和部署计算机视觉模型。
模型创建过程的一种视图
当然,您仍然需要一定程度的专业知识——应该运行哪种对象识别模型?训练数据将保存在哪里?如何处理推理?但少数工程师可以在一个地方完成更多的工作,而不是分散在十几个工具、API 和代码笔记本中。
Viso说是端到端的,这似乎并不夸张。计算机视觉需要从数据开始,需要训练过程,然后是实施、托管、合规工作等等——它似乎真的是一个“从头到尾”的解决方案,将所有这些都放在一个地方:
这是一个很大的清单
因此,如果您正在制作之前的“繁忙探测器”,那么可以想象您只需要一百个小时的镜头就可以完成它,并在一两周后得到完整的产品。这将包括原始数据的低级分析和存储、注释和标签、基本模型的培训和测试、产品集成、在线或离线部署、分析、更新和备份,以及访问和安全……所有这些都无需离开Viso,并且可能没有触及分号或括号键。(这里有各种案例研究。)
尽管还有其他计算机视觉平台,但 Boesch 表示,没有一个平台“旨在大规模管理高度复杂的计算机视觉应用程序并持续维护它们”,而是更专注于上述列表中的少数任务。Viso 旨在支持尽可能多的模型和方法、硬件和用例,同时确保客户拥有最终结果。
我自己不是一名开发人员,我无法说出不同的用例可能有多困难或容易,但使用它肯定有一个基本的吸引力(正如其他低代码和端到端工具的流行所证明的那样)更少但更全面的平台,而不是将一系列互不相关的平台拼接在一起。
Viso 的投资者似乎也是这么认为的,该公司已筹集了 920 万美元的种子期资金,由 Accel 领投,多位天使投资人参与其中。有趣的是,该公司自 2018 年在瑞士成立以来一直处于自力更生的状态。
博施表示,爆炸性的需求导致公司进行了加薪,从人工智能公司的角度来看,与现有产品和现有客户相比,加薪幅度相当有限。他表示,Viso 已被普华永道、DHL 和 Orange 等多家大公司采用,自 2022 年以来新客户增长了 6 倍。