广告和营销、零售、消费品 (CPG)、旅游和酒店、媒体和娱乐以及金融服务等多个行业的公司越来越希望用业务合作伙伴的数据来补充他们的数据,以构建完整的视图他们的生意。
让我们以营销用例为例。品牌、出版商及其合作伙伴需要使用存储在许多渠道和应用程序中的数据集进行协作,以提高其活动的相关性并更好地与消费者互动。同时,他们也想保护敏感的消费者信息,杜绝原始数据的共享。数据洁净室允许多家公司在私人环境中分析他们的集体数据,有助于解决这一挑战。
然而,建立数据洁净室是困难的。它需要复杂的隐私控制、保护每个协作者数据的专用工具,以及数月的开发时间来定制分析工具。当添加新的协作者或需要不同类型的分析时,工作量和复杂性会增加,因为公司必须花费更多的开发时间。最后,公司更愿意尽可能地限制数据移动,这通常会导致协作减少并错失产生新业务洞察力的机会。
今天介绍 AWS Clean Rooms
,我很高兴地宣布AWS Clean Rooms全面上市,我们在 AWS re:Invent 2022 上首次宣布并于 2023 年 1 月发布了预览版。AWS Clean Rooms 是 AWS 应用程序的一项分析服务,可帮助公司及其合作伙伴可以更轻松、更安全地分析和协作处理他们的集体数据集,而无需共享或复制彼此的数据。AWS Clean Rooms 使客户能够生成有关广告活动、投资决策、临床研究等的独特见解,同时帮助他们保护数据。
现在,借助 AWS Clean Rooms,公司能够在几分钟内在 AWS 云上轻松创建一个安全的数据洁净室,并与其合作伙伴协作。他们可以对洁净室使用广泛的内置隐私增强控件。这些控件允许公司自定义对每个洁净室参与者运行的查询的限制,包括查询控件、查询输出限制和查询日志记录。AWS Clean Rooms 还包括高级加密计算工具,即使在处理查询时也能保持数据加密,以帮助遵守严格的数据处理策略。
AWS Clean Rooms 的主要功能
让我与您分享主要功能以及与 AWS Clean Rooms 协作的轻松程度。
创建您自己的洁净室
AWS Clean Rooms 可帮助您在几分钟内开始协作,然后选择您想与之协作的其他公司。您可以与任何同意参与洁净室协作的合作伙伴协作。您可以按照几个步骤创建协作。
在 AWS Clean Rooms 中创建 协作后,您可以选择可以贡献的其他协作成员。目前,AWS Clean Rooms 最多支持五名协作成员,包括作为协作创建者的您。
下一步是定义哪个协作成员可以与成员能力 设置协作执行查询。
然后,协作成员将在其账户中收到通知,查看协作的详细信息,并通过在其 AWS Clean Rooms 控制面板中选择创建成员资格来决定是否加入协作 。
无需将数据移出 AWS 即可进行协作
AWS Clean Rooms 通过分析就地的 Amazon S3 数据来工作。这消除了公司将数据复制和加载到协作成员各自 AWS 环境之外的目的地或使用第三方服务的需要。
每个协作成员都可以创建配置表,这是一种 AWS Clean Rooms 资源,其中包含对 AWS Glue 目录的引用以及定义数据使用方式的基础数据。配置的表可以在许多协作中使用。
保护数据
AWS Clean Rooms 为您提供了一组广泛的隐私增强控制来保护您的客户和合作伙伴的数据。每个协作成员都可以灵活地确定在协作中可以访问哪些列。
除了列级隐私控制,如上例所示,AWS Clean Rooms 还提供称为分析规则的细粒度查询控制。借助内置的灵活分析规则,客户可以根据特定业务需求定制查询。AWS Clean Rooms 提供两种类型的分析规则供客户使用:
聚合分析规则允许在可选维度上使用 COUNT、SUM 和 AVG 函数在不泄露用户级信息的情况下聚合分析的查询。
列表分析规则允许查询输出用户级属性分析客户的表和可以查询的成员的表之间的重叠。
两种分析规则类型都允许数据所有者要求在他们的数据集和运行查询的协作者的数据集之间进行连接。这将结果限制为协作者数据集的交集。
定义分析规则后,可以查询和接收结果的成员可以根据每个参与协作成员定义的限制开始编写查询。以下是协作中的示例查询。
分析规则允许协作成员限制可以针对其数据集执行的查询类型以及查询结果的可用输??出。下面的截图是一个查询不会成功的例子,因为它不满足分析规则,因为该hashed_email 列不能在查询中使用 SELECT 。
完全编程访问
AWS Clean Rooms 提供的任何功能也可以使用 AWS 开发工具包或 AWS CLI 通过 API 访问。这使您可以更轻松地将 AWS Clean Rooms 集成到您的产品或工作流程中。这种程序化访问还为您提供了使用自己的品牌为客户托管洁净室的机会。
查询记录
此功能允许协作成员查看和审核使用其数据集的查询,以确保数据按预期使用。使用查询日志记录,具有查询控制权的协作成员和其数据是查询一部分的其他成员,如果启用查询日志记录,则可以接收日志。
如果启用此功能,查询日志将写入每个协作成员账户中的 Amazon CloudWatch Logs。您可以从协作仪表板访问过去 7 天的日志查询摘要。
密码计算
使用此功能,您可以选择使用密码计算对敏感数据执行客户端加密。您可以加密您的数据集以添加保护层,并且数据将使用称为私有集交集的加密计算协议来保持数据加密,即使在查询运行时也是如此。
使用密码计算功能,您需要下载并使用C3R加密客户端对您的数据进行加解密。C3R 在 AWS Clean Rooms 中使用时对您的数据进行加密保护。C3R 支持 SQL 查询的一个子集,包括 JOIN、SELECT、GROUP BY、COUNT 和其他受支持的关于加密保护数据的语句。
下图显示了如何在创建协作时启用加密计算:
AWS Clean Rooms 帮助公司及其合作伙伴更轻松、更安全地分析和协作处理他们的集体数据集,而无需共享或复制彼此的数据。在AWS Clean Rooms页面上了解有关优势、用例、入门方法和定价详细信息的更多信息。Donnie Prakoso 是 AWS 的一名软件工程师、自称咖啡师和首席开发倡导者。拥有超过 17 年的技术行业经验,从电信、银行到初创公司。他现在专注于帮助开发人员了解各种技术,以将他们的想法转化为执行。他喜欢喝咖啡,喜欢讨论从微服务到 AI/ML 的任何话题。