今天,我们发布了 Dataplex 业务词汇表,现已提供公共预览版。Dataplex是一种智能数据结构,提供了一种大规模管理、监视和治理分布式数据的方法。Dataplex业务词汇表为用户提供了一种云原生方式来维护和管理他们的业务术语和定义,建立一致的业务语言,提高对数据的信任,并实现数据的自助使用。
在小型、中型或大型企业中,有许多不同的团队。随着时间的推移,每个团队都会开发出自己的语言。例如,对于公司团队而言,“客户”可能意味着“法人实体”,而对于中央平台团队而言,它可能是个人/法人实体/政府实体等。这种不协调可能导致协作挑战,更糟糕的是,对数据的误解并影响洞察力和决策。这种不协调还使不熟悉该地区的用户无法使用自助服务路径,从而使他们依赖于组织中的部落知识。导航它会引入手动开销,并且很难及时了解更改。
Dataplex 业务词汇表以多种方式支持数据从业者。首先,它促进了跨团队定义和解释数据的语义一致性,这有助于最大程度地减少冗余并减少使用数据时混淆和误解的可能性。例如,对于术语“零售交易”的集中定义,当两个团队生成两个不同的数据资产以捕获零售交易的详细信息时,他们将根据定义的术语一致地构建这些数据资产。
语义一致性反过来又加强了对数据的理解和信任。当附加到数据资产时,词汇表术语提供了额外的一层集中管理和一致的业务上下文,使用户能够自信地确定数据资产适合其目的的程度。在上面的客户数据示例中,搜索“显示所有客户表”的分析师不必担心对已识别数据资产的不同解释,即它们是指个人客户还是法人实体等。使用业务词汇表,正确的解释是通过相关的词汇表术语建立的,这些术语为这些数据资产提供了所需的上下文,并允许分析师更可靠地识别所发现数据的相关性。
然后,以上所有解锁数据的自助使用,允许用户利用词汇表内容来发现数据资产(例如,通过搜索查询,如“显示所有在其定义中的任何位置附加词汇表术语引用‘零售交易’的条目” ——注意如何在识别数据资产时,搜索可以解决不同的术语元数据,包括描述和相关的数据管理员),了解这些数据资产的语义,并因此识别这些数据资产的适用使用场景。
此外,Dataplex 业务词汇表可以支持数据治理,数据治理团队使用词汇表上下文来通知数据治理策略配置决策。例如,这些团队可以考虑与引用“客户”的词汇表术语相关联的数据资产,以获得与客户数据处理相关的额外访问控制策略。
总之,您可以利用 Dataplex 业务词汇表以及广泛的 Dataplex 数据治理功能,使用户能够建立通用且一致的业务语言,加强对数据的信任,促进自助服务使用,并从您的数据中获取价值。