白皮书
Tableau Data Management
为大规模自助式分析提供值得信赖、一目了然且管控有序的数据
Tableau 提供的现代自助式分析技术彻底颠覆了商业智能的竞争格局。它让在各自领域拥有专长的人都能进行直观的可视化分析,也就是说,人们不需要依赖 IT 部门的帮助,就可以着手探索自己的数据问题,并根据分析结果轻松迭代改进,从而发现新的洞见。如今,随着现代分析技术的部署规模不断扩大,IT 部门在整理、管理和推广合适的数据方面面临着诸多挑战,而业务用户也难以找到相关且值得信赖的数据进行分析。
为践行我们帮助人们查看并理解数据的使命,Tableau 在数据管理方面不断投入,旨在为我们的用户提供独到的数据管理功能。用户在自己的分析环境中可以直接使用这款高度可视化的解决方案;有了这款解决方案,组织中的每一个人都能确信自己采用的是正确的数据,可以依靠它们来作出决策。让用户能够更加清楚地了解数据的情况、更容易发现数据且更加信赖数据,有助于扩展管控有序的数据环境。这意味着,IT 部门可以更好地管控数据源和分析内容的无序激增,而最终用户也能够更快找到自己所需的数据,信心十足地进行分析。
传统的数据管理流程无法再扩展
要想成功运用现代分析技术,组织必须兼顾赋能与管控,同时又不能牺牲安全性。为了扩大部署规模,必须转变数据管理方法,让数据的情况一目了然,从而帮助最终用户找到值得信赖的数据。
曾几何时,组织只需收集和管理相关的企业数据。如今,从营销与销售部门到财务部门,每一个部门都有多种不同类型的数据,而且需要满足各自独特的分析需求,才能实现价值最大化。人们在收集数据时甚至都不知道数据的用途,而有些部门数据及其应用方式可能都不在 IT 部门的监控范围内。
为便于分析,需要将数据整理成合适的形式和格式,而这方面的工作也在一定程度上造成了数据的这种无序激增。采用传统模式时,通常由 IT 部门负责为具体的分析用例准备数据,然后他们还要继续维护数据库或文件。随着数据的不断积累,IT 部门需要确保稳定性以便支持数据环境,但在弃用表和数据源方面面临重重挑战,因为他们不清楚这样做对下游用户有何影响,担心会破坏对业务至关重要的仪表板。
在现代分析技术的推动下,IT 部门的角色已从生成报告转变为维护和保护各种系统,让整个组织的人员都能自行使用这些系统作出数据驱动型决策。如今,业务用户正在不断地引入对他们重要的各类数据,但这种数据引入方式尚不具备可扩展性。很多流程仍然是手动完成的,而且可能涉及到将数据从受管控的系统转移到不受管控的系统以进行分析。IT 部门实施管控的目的是为数据和分析探索提供保护,而不是限制访问和带来瓶颈。不过,IT 部门仍肩负着扩大自助式分析的部署规模,从而让更多受众都能使用的责任,而这项工作则需要让流程实现有序运转和自动化,同时还需要兼顾可控性与敏捷性。
随着组织越来越依靠数据驱动型决策来推行组织变革,越来越多的人员要求访问和分析数据。虽然有些业务用户在不断培养更加精良的数据技能,但多数都不知道应采用哪些数据或者该去哪里寻找这些数据。从命名规范到复杂的数据结构,对日常用户来说,了解数据库以及需要联接哪些表极具挑战性。以往公司内只有较少的人员有权访问数据时,直接去找数据专家咨询还算比较容易。而现在,随着数据用例越来越多,现代分析技术快速普及,这种做法已经无法满足日益增长的需求了。
说到弄清楚整个组织的数据资产使用情况,以往要么无法做到精准确凿(“谁在以何种方式使用这些数据?”),要么就是一个难以攻克的编程难题,需要抓取内容来试图找到答案。不妨假设某个 ETL(提取、转换和加载)作业失败,或者有一个表需要从数据库中移除。按照传统的数据管理模式,管理员可能需要更新 Wiki 或者群发电子邮件,期盼那些将受到影响的人能够注意到这条消息。即使组织建立了企业数据目录,其中包含有帮助的数据说明,明文载述的数据世系以及反映数据新鲜度的各项指标,那么最终用户在开始分析前,是否会频繁登录这样的系统来了解自己使用的数据是否值得信赖且是最新的?
各种合规要求也使得确保用户使用正确的数据变得日益困难,而这又会影响外界对组织是否正确管理敏感数据的看法。如果 IT 部门希望最终用户了解应该使用什么数据以及数据是否存在质量问题,那么用户就需要在其分析环境中获得关于数据质量的信息,而不是需要再进入另外的系统或工具才能获得这样的信息。将这样的元数据直接显示给用户有助于他们知道自己所用的数据值得信赖。
根据 Gartner 的调查结果,数据的使用者要求加速提供数据,而数据的产生者在快速访问、审查、鉴定和提供数据方面则面临着更大的压力。这两点都是传统的数据管理(特别是集成方面)解决方案所无力应对的。
Tableau 在数据管理方面的做法有何不同
通过与客户进行无数次的交流,我们了解到种类纷繁的数据存在明显的问题,在数据仓库及其他管理工具方面存在未能有效利用的投资,在确保用户获得正确的数据来据以作出决策方面存在诸多难题。我们采取的数据管理做法与传统解决方案的不同之处在于,它会在用户已经开始使用的 Tableau 分析平台中直接显示元数据并集成管理流程。这不仅提供了对 IT 部门和日常用户大有裨益的可视化体验,而且可以扩展客户斥资部署的现有数据管理解决方案的功能。
传统的数据管理解决方案在设计时通常都未考虑有多个最终用户的情况。为了扩展有多个用户同时访问数据的自助式环境,我们认识到有必要将一部分传统数据管理责任从管理员转移到最终用户。
其他的数据管理解决方案可能旨在帮助迁移数据或集成应用程序,而 Tableau 的数据管理解决方案依然侧重于数据分析。我们深知,直接在用户的分析流程中恰当其时地为他们提供所需的信息非常重要。
我们认为,可视化界面是与数据交互的最佳方式。不管您是要搜寻合适的数据,还是要准备数据以进行分析,亦或是要探索数据中蕴藏的真谛,通过可视化界面进行互动都可以加快并简化整个过程。
我们知道,随着您的企业数据环境不断演化,充分发挥现有投资的价值十分重要。因此,我们提供了无可匹敌的选择余地,包括丰富的部署选项,众多本机数据连接器等;而且在数据管理解决方面也提供了同样无可匹敌的灵活性和可扩充性。
重磅推出 Tableau Data Management Add-on
凭借我们的数据管理做法,我们让 IT 部门能够在当今日新月异的数据形势下,开发和维护一个可扩展、管控有序且自给自足的数据环境。Tableau Data Management Add-on 包含 Tableau Prep Conductor 和 Tableau Catalog。
清楚了解数据情况
让用户能够更清楚地了解您组织的数据资产,这样可以更加高效地管理您的环境。
管控有序且值得信赖
在整个组织范围内针对用来作出决策的数据建立管控机制,让全组织的用户都信赖这些数据。
易于发现
让数据更易发现,这样用户就能信心十足地快速找到合适的数据进行分析。
可扩展
通过可重复的流程大规模地有效管理数据,确保数据和元数据始终保持最新。
Tableau Prep Conductor
对于使用 Tableau Prep Builder 创建的流程,可以安排其在一个可扩展且可靠的集中式服务器环境中运行,从而使您组织的数据始终保持最新状态。管理员可以清楚了解整个组织内的自助式数据准备情况。借助 Tableau Prep Conductor,您可以使用自己的 Tableau Server 或 Tableau Cloud 环境来管理、监视和保护流程。了解更多信息。
Tableau Catalog
通过一个全面展示 Tableau 环境中数据情况的视图,来管理您的数据分析。借助强大的搜索、数据词典、世系和影响分析功能,所有用户都能查找、理解和使用值得信赖的数据。这款产品可以使用元数据 API 与您现有的元数据系统集成,使其可以与 Tableau 交换有价值的元数据,以显示用户是在哪里执行分析的。了解更多信息。
与 Tableau 平台紧密集成
在用户需要关键信息的位置,也就是他们的分析环境中,直接就可以向他们提供所需的这些信息。业务用户在 Tableau 内即可轻松找到管控有序的数据,而无需在 Wiki 中搜索,也不用登录企业目录来确认这些数据是否值得信赖,是否为最新数据。此外,IT 部门还可以充分利用 Tableau 平台的现有功能,比如安全保护、管控、权限、监视、管理等功能。而且,无需任何设置工作:Tableau Server 环境中的数据资产会自动编入目录。
Tableau Data Management Add-On 与您部署的 Tableau Server 或 Tableau Online 是分开许可的。
Tableau Data Management 如何让您组织内的每个人都能受益
您的数据在提取并存储后,经过准备、分析阶段,然后会在整个组织范围内共享。我们将数据管理流程(例如刷新准备流程,添加和访问元数据以及了解数据世系)紧密集成到了 Tableau Server 和 Tableau Online 中,这样,IT 和业务用户不用离开他们已经开始的分析工作流程,即可管理数据。
数据整理与发现
数据管家和数据工程师可以为数据库、表和列添加说明和元数据,还可以对数据资产进行认证,以帮助用户找到值得信赖和推荐的数据。开发人员也可以使用 Tableau Server REST API 中的元数据方法,以编程方式更新某些元数据。得益于此,数据工程师和数据库管理员将可以根据使用情况元数据来在表中做出更改,从而优化数据源。
内容作者可以在 Tableau Server 和 Tableau Online 中搜索现有的数据源、数据库和文件或者表,看看他们需要的数据是否已经存在,这有助于最大限度减少重复的数据源。内容使用者在浏览时可以看到数据资产的说明、使用情况和认证信息,因而能更轻松地找到值得信赖的数据。在查看可视化时,用户可以在仪表板的“数据详细信息”标签中轻松访问字段说明,这让他们能够确信自己是在使用正确的数据进行分析。
世系与影响分析
IT 人员可以执行影响分析,来了解哪些数据资产和用户会受到更改(比如数据库管理员或数据工程师更改了某个列或表,或者数据管家修改了某项计算)的影响。IT 人员在 Tableau 平台内就可以发送电子邮件告知受影响的数据资产所有者。
业务用户甚至在打开可视化之前,就可以快速查看他们用于分析的数据的世系,包括这些数据的来源和所有者、这些数据是否已获得认证以及准备流程的运行历史记录。更高级的用户则可以查找已经发布到 Server 上的分析内容,还可以深入探索工作簿中的计算。
质量警告和通知
数据工程师和数据管家可以直接在 Server 环境中设置质量警告,也可通过 API 进行设置。这些指示标志(“警告”、“已弃用”、“陈旧数据”或“维护中”)有助于向用户通知数据资产的状态并提供额外的信息,比如刷新是否出现了延迟,或者是否缺少数据,从而可能会影响分析。如果准备流程运行失败(比如在数据库超时或缺少列的情况下),准备流程的所有者(比如数据管家或分析师)可以直接收到通知,因而能快速采取措施。
在 Tableau 中,业务用户直接在自己的分析环境中就可以看到数据资产的指示标志。这有助于各种技能水平的人员有把握地依据数据作出业务决策;在出现警告时,他们也能查看 IT 人员发送的信息,据以决定是否要继续分析。
元数据 API 集成
IT 人员可以利用元数据 API 来扩展现有元数据管理解决方案的功能。可以将数据库管理员和工程师在元数据表或企业目录中整理的元数据提取到 Tableau 中;也可以从 Tableau 中提取元数据,以便在其他数据应用程序和业务流程中使用。
业务用户在 Tableau 中的分析环境中,就可以清楚查看 IT 人员对来自企业目录的有价值元数据所做的处理。而他们在 Tableau 中的分析环境,正是他们最有可能查看和使用这些信息的位置。
在试用 Tableau Server 的过程中,不妨也试试 Tableau Data Management Add-on。马上行动吧!
*Gartner 不对其研究出版物中述及的任何供应商、产品或服务表示认可,也不建议技术用户仅选择获得最高评分或其他荣誉称号的供应商。Gartner 研究出版物仅代表 Gartner 研究机构的观点,不应视为事实陈述。Gartner 声明不对本研究提供任何明示或暗示保证,包括适销性或适合特定用途的任何保证。