受治理的数据监管在数据和业务之间架起了一座桥梁,连通了两者。
随着越来越多的数据源变得更加复杂、多样,数据管理如今在现代 BI 部署中显得尤为重要。随着越来越多的工作人员使用数据来推动决策,企业必须确保其数据本身及其在分析中使用时的准确性。要实现这一点,数据管理软件必不可少。
企业已经转向数据管理,以应对更广泛的数据访问带来的数据管理和管控挑战。数据管理囊括了一个企业捕捉、清理、定义和排列不相关数据的方式。此流程架起了数据与其实际应用之间的桥梁。
企业已经在将数据定义集成到分析工具的技术上花费重金,用来帮助分析数据,旨在消除团队和企业之间的模糊性。相应地,数据管理工具和流程(比如数据目录和语义管控)正在与商业智能平台融合,将数据与业务环境联系起来。
数据目录可充当数据源和公用数据定义的企业业务术语表。像数据工程师和数据管理员等主题专家可以为数据源和字段添加描述和定义,以作为标签来方便查找,甚至还可以添加有用的数据质量指标 — 包括对可信内容认证的通知,或者对数据资产的维护或折旧。
普通用户不需要知道数据在数据源中的具体位置,但是他们需要了解数据在现实世界中表示什么内容。例如,内容的分析师和使用者常常需要验证一段数据的来源(也称为谱系分析)。如果数据集发生变化,数据工程师和数据管理员需要分析下游影响,了解这如何影响他们管理的表或计划所关联的资产。将数据目录和商业智能平台结合有助于简化上述所有任务,提供使用指标来快速识别访问最频繁的数据源和仪表板。
尽管数据目录非常必要,但在语义管控领域,可能存在比元数据管控更好的提升机会。语义不仅有助于连接数据的上下文,还有助于连接分析操作的意图,例如通过映射同义词来连接“订货量 (order size)”和“数量 (quantity)”等命令。这使得数据工作者能够以新模式与数据进行全方位交互,并迅速得出新见解。一种方法是通过自然语言交互,在此过程中,商业智能平台理解涉及多个查询的语义层,例如“突出显示最高值、最低值和平均值”。
随着这些技术和流程的不断融合,数据管理和语义将为余下的分析体验提供更坚实的基础。这将统一数据生态系统中更多不相干的组件(如清理和下游分析),并为表、联接和数据模型提供更强大的机器生成的建议。最终,数据管理的进步将使工作人员不仅可以在分析过程中对数据提出问题,还能转而对其业务提出问题。