在图像上加水印以标记自己的信息在无数领域中都具有价值,但如今这比仅仅在角落添加徽标更困难。Steg.AI允许创作者使用深度学习嵌入几乎看不见的水印,这违背了通常的“调整大小和重新保存”对策。
数字资产的所有权经历了复杂的几年,NFT 和人工智能的产生撼动了之前强度相当低的领域。如果您确实需要证明某个媒体的出处,可以使用多种方法将该数据编码为图像或音频,但这些方法很容易被一些琐碎的更改(例如将 PNG 保存为 JPEG)所击败。更强大的水印往往是可见或可听的,就像图像上清晰可见的图案或代码。
隐形水印可以轻松应用,也很容易检测到,并且对转换和重新编码具有鲁棒性,这是许多创作者会利用的东西。无论是有意还是无意,知识产权盗窃在网上都很普遍,而能够说“看,我可以证明这是我做的”——或者人工智能做到了——变得越来越重要。
Steg.AI 多年来一直致力于解决这个问题的深度学习方法,2019 年的 CVPR 论文以及获得第一阶段和第二阶段 SBIR 政府资助就证明了这一点。联合创始人(兼合著者)Eric Wengrowski 和 Kristin Dana 在此之前从事学术研究多年;达纳是温格罗斯基的博士生导师。
Wengrowski 指出,尽管自 2019 年以来他们取得了许多进展,但该论文确实展示了他们方法的总体形式。
“想象一下,一家生成式人工智能公司创建了一张图像,Steg 在将其交付给最终用户之前为其添加了水印,”他在给 TechCrunch 的电子邮件中写道。“最终用户可能会将人工智能生成的图像发布到社交媒体上。即使图像被调整大小、压缩、截屏或删除其传统元数据,部署的图像的副本仍将包含 Steg.AI 水印。Steg.AI 水印非常强大,可以从电子显示屏上扫描,也可以使用 iPhone 相机打印出来。”
尽管他们不想提供该过程的确切细节,这是可以理解的,但它的工作原理或多或少是这样的:该公司没有必须在媒体上笨拙地分层的静态水印,而是拥有一对匹配的机器学习模型自定义图像的水印。编码算法以人们不会察觉的方式识别修改图像的最佳位置,但解码算法可以轻松挑选出来 - 因为它使用相同的过程,所以它知道在哪里查看。
该公司将其描述为有点像隐形且基本上不可变的二维码,但没有透露媒体中实际上可以嵌入多少数据。如果它真的是类似于 QR 码的东西,它可以有 1 或 3 KB,这听起来不是很多,但对于 URL、哈希值和其他纯文本数据来说已经足够了。多页文档或视频中的帧可能具有唯一的代码,从而使该数量成倍增加。但这只是我的猜测。
Steg.AI 提供了多张带有水印的图像供我检查,您可以在此处看到其中嵌入的一些图像。我还获得了(并要求不要分享)匹配的水印前图像;虽然仔细检查时可以看到一些扰动,但如果我不知道寻找它们,我很可能会错过它们,或者将它们作为普通的 JPEG 伪像而被忽略。
您可以想象这样一个微妙的标记对于图库摄影提供商、在 Instagram 上发布图像的创作者、分发功能预发行副本的电影制片厂或希望标记其机密文件的公司可能会有多大用处。这些都是 Steg.AI 正在研究的用例。
这从一开始就不是一个本垒打。早期,在与潜在客户交谈后,“我们意识到我们最初的很多产品创意都很糟糕,”温格罗斯基回忆道。但他们发现,鲁棒性是他们方法的一个关键区别因素,绝对是有价值的,从那时起,他们就在“消费者对泄露信息有强烈兴趣的公司”(例如消费电子品牌)中找到了吸引力。
“我们真的对看到我们产品深层价值的客户的呼吸感到惊讶,”他写道。他们的方法是提供企业级 SaaS 集成,例如与数字资产管理平台的集成,这样就无需在发送之前添加水印;作为正常处理过程的一部分,所有介质都会被标记和跟踪。
图像可以追溯到其来源,并且可以想象,沿途所做的更改也可以被检测到。或者,应用程序或 API 可以提供图像未被操纵的置信度——许多编辑摄影经理都会欣赏这一点。
这类东西有可能成为行业标准——既因为他们想要它,也因为将来可能需要它。人工智能公司最近刚刚同意围绕人工智能内容加水印进行研究,在考虑更深入的检测生成媒体的方法时,类似的事情将是一个有用的权宜之计。
Steg.AI 已经获得了总计 120 万美元的 NSF 拨款和天使投资,但刚刚宣布获得由 Paladin Capital Group 领投的 500 万美元 A 轮融资,Washington Square Angels、纽约大学创新风险基金和天使投资人 Alexander Lavin 参与其中、伊莱·阿德勒、布莱恩·厄尔利和陈平于。