在2021 年 9 月发布的这篇博文中,Jeff Barr宣布全面推出Amazon QuickSight Q。回顾一下,Amazon QuickSight Q 是一种自然语言查询功能,让业务用户可以针对他们的数据提出简单的问题。
QuickSight Q 由机器学习 (ML) 提供支持,允许您使用简单的语言查询数据,从而提供自助式分析,因此无需摆弄仪表板、控件和计算。随着去年发布的 QuickSight Q,您可以提出一些简单的问题,例如“谁在 2021 年 EMEA 的销售额最高”,并在几秒钟内得到您的答案(以及相关的可视化效果,如图形、地图或表格)。
用于分析的数据通常存储在像Amazon Redshift这样的数据仓库中,不幸的是,这些数据倾向于通过 SQL 进行编程访问而不是自然语言交互进行优化。此外,可以理解,BI 团队倾向于优化数据源以供仪表板作者、BI 工程师和其他数据团队使用,因此使用针对仪表板优化的技术命名约定(例如,“CUST_ID”而不是“Customer”)和SQL查询。这些技术命名约定对于业务用户来说并不直观。
为了解决这个问题,BI 团队花费数小时手动将技术名称翻译成常用的业务语言名称,为自然语言问题准备数据。
今天,我很高兴地宣布Amazon QuickSight Q的自动数据准备。自动数据准备利用机器学习来推断有关数据的语义信息,并将其作为有关列(字段)的元数据添加到数据集中,使您可以更快地准备数据以支持自然语言问题。
QuickSight Q 中的主题快速概览 随着 QuickSight Q
的推出,主题变得可用。主题是一个或多个数据集的集合,代表您的业务用户可以提出问题的主题领域。看前面提到的例子(“谁在 2021 年在 EMEA 的销售额最高”),在创建此 Topic 时会选择一个或多个数据集(例如Sales/Regional Sales
作为作者,一旦主题被创建:
您将花时间从数据集中选择最相关的列以添加到主题(例如,排除 time_stamp、date_stamp 列等)。这可能具有挑战性,因为如果不了解仪表板和报告中列的使用数据,您会发现很难客观地决定哪些列与您的业务用户最相关以包含在主题中。
然后,您将花费数小时查看数据并手动整理数据以设置特定于自然语言的配置(例如,将“Area”添加为“Region”列的同义词)。
最后,您需要花时间格式化数据,以确保它在呈现时更有用。
QuickSight Q 主题
Amazon QuickSight Q 的自动数据准备如何工作?
从分析创建:Amazon QuickSight Q 新的自动化数据准备通过启用从分析创建主题的功能来节省时间,从而通过自动选择用户友好的名称和同义词来节省您进行所有翻译所花费的时间经过 ML 训练的模型,旨在为相关数据字段寻找同义词和常用术语。此外,您无需选择最相关的列,Amazon QuickSight Q 的自动数据准备会根据它们在分析中的使用方式自动选择高价值列。然后它将主题绑定到这个现有分析的数据集,并准备数据中唯一字符串值的索引以启用自然语言搜索。
自动字段选择和分类:我之前提到过,Amazon QuickSight Q 的自动数据准备会选择高价值列,但它如何知道哪些列是高价值的?Amazon QuickSight Q 的自动数据准备根据来自现有 QuickSight 资产(例如报告或控制面板)的信号自动选择列,以帮助您创建与业务用户相关的主题。除了从数据集中选择高价值字段外,Amazon QuickSight Q 的自动数据准备还会导入作者在分析中创建的新计算字段,因此不需要他们在主题中重新创建这些字段。
自动语言设置:在本文开头,我谈到了对业务用户而言不直观的技术命名约定。现在,您无需花时间翻译这些技术名称,列名称会自动更新为使用常用术语的友好名称和同义词。查看我们的Sales数据集示例,已为 CUST_ID 分配了一个友好名称“Customer”和许多同义词。同义词现在将自动添加到列中(可以选择进一步自定义)以支持可能与您的业务用户相关的广泛词汇。
列的友好名称和同义词
自动元数据设置:Amazon QuickSight Q 的自动数据准备Semantic Type根据列值检测列并自动更新相应的配置。如果答案中出现特定列,现在将设置要使用的值格式。这些格式源自您可能在分析中定义的格式。
语义类型设置
今日可用
适用于 Amazon QuickSight Q 的自动数据准备功能现已在所有提供 QuickSight Q 的 AWS 区域推出。要了解更多信息,请访问Amazon QuickSight Q页面。加入 QuickSight 社区,与 QuickSight 社区中的其他人一起提问、回答和学习。撰写,韦利斯瓦·博亚,Veliswa Boya 是一名高级开发倡导者,常驻南非,与撒哈拉以南非洲的建设者社区密切合作。她在技术领域担任过许多角色,从开发人员到分析师,从架构师到云工程师,现在是一名开发人员。Veliswa 特别喜欢与技术新手以及刚开始使用 AWS 的人一起工作。