通过 Tableau 和 Alation 实现大规模管控:GoDaddy 的故事

当看到客户利用强大工具和最佳做法推动分析大规模采用的成功故事时,我们希望在社区中强调这些事例,分享这些值得学习的经验。通过与 Tableau 和我们的数据编目合作伙伴 Alation 合作,GoDaddy 做到了这一点。

任何企业级分析解决方案的关键都是对推动决策的数据建立信任。

过去,这种信任是通过限制数据访问权限实现的。数据本身以及生成的报告都被锁定,整个组织中只有少数人拥有访问权限。

但是,当今员工需要大量数据来开展工作,这种模式无法充分满足其需求。我们可以看到,Tableau 在各种规模的公司中迅速普及,这证明了人们对自助式分析的需求日益增长。

无论是在 Tableau 的开发过程中,还是在对大规模部署分析进行指导时,对数据的信任和管控始终是我们的重中之重。

借助 Tableau Server 的 Data Server,用户可以将新数据源发布到中央服务器,进行共享和管理,以便供整个组织使用。

数据模型的开放性促进了采用,同时为分析平台管理员提供了许多管控和监督功能。

当看到客户利用强大工具和最佳做法推动分析大规模采用的成功故事时,我们希望在社区中强调这些事例,分享这些值得学习的经验。通过与 Tableau 和我们的数据编目合作伙伴 Alation 合作,GoDaddy 做到了这一点。

在数据管控方面,作为对 Tableau 方法的有益补充,Alation 可让最终用户轻松发现来自多个源的数据,并深入了解数据的细微差别。Alation 采用独特的自动化方式实现上述目的:除组织中的可用数据外,还对分析中使用的业务语义和 SQL 查询中嵌入的逻辑进行抓取和编目。

在提高分析师工作效率的同时,Alation 还基于这种通过自动化方式获得的数据知识,使平台管理员能够对其用户的 Tableau 工作簿中的源数据进行深入的沿袭和影响分析。

GoDaddy 如何使用 Tableau 和 Alation

GoDaddy 有数百个数据源,分布在数十个平台之上,而且拥有超过 850 位 Tableau Server 用户,因此该团队需要采用一种更好的方式来管控大规模自助式分析。Sharon Graves 是 Tableau 的推广者,也是 GoDaddy 的系统管理员,她接受了这一挑战。

“我们的数据遍布多个服务器平台,”Sharon 说。“其中存在许多重复数据。一些计算字段没有得到记录。从商业智能的角度来看,我们并不能确信地说‘行了,这正是我制作报告所需的数据。’”

Sharon 表示,对数据源缺乏管控严重影响了团队从数据中获取见解的能力。

“分析和数据发现不是你想象的那样。它并不是挖掘数据,然后说‘让我们来看看这些异常值’,而是‘找到这些数据,分析出它是什么,我们如何使用它’。它并没有你想象的那么有趣。”她说。

GoDaddy 的 IT 团队需要采用更好的方式来管控其数据源。该团队当时使用的是 MySQL、MSSQL、Cassandra、Hive、Pig、Spark 以及第三方数据系统(例如 Google Analytics 和 LinkedIn)。分析师的所有时间都耗费在了确定应使用哪些数据源中的哪些字段,没有足够的时间执行有意义的分析。这一过程令人沮丧,且速度太慢。

因此,GoDaddy 决定结合使用 Alation 和 Tableau。通过结合使用 Alation 和 Tableau,GoDaddy 的 IT 团队可大规模管控 Tableau:对数据进行编目和标记,检查表格的沿袭情况,搜索多个数据源以查找某个字段,以及提高可见性和控制力。

Alation 的搜索功能可显示最频繁访问每个数据源的用户,这样一来您便知道可向哪些内部资源寻求进一步帮助。借助 Alation 与 Tableau 的无缝协作,您可轻松地将数据发送到 Data Server,并直接从 Alation 中创建和查看工作簿。

借助 Alation 和 Tableau,GoDaddy 的分析师可以专注于他们最擅长的工作,即探索和分析数据。

“商业智能分析师现在有了充足的时间来进行分析。”Sharon 说,“他们可以做自己想做且擅长做的事。分析师接受相关培训并不是为了寻找数据,发出‘采集率是什么意思?’这样的疑问。这不是我们希望他们做的工作。”

Alation 如何与 Tableau 协同工作

Alation 连接到 Tableau Server,对 Tableau 现有的管控功能进行补充,有助于实现大规模自助式分析。

  1. 项目整合:通过 Tableau 项目,Alation 可在本地支持 Tableau 中的数据管控过程。数据管理员和数据管控团队可以使用 Alation 来发布并自动更新 Tableau 数据源与获得数据管控许可的 Tableau 项目之间的关联。
  2. Tableau 标签:通过结合使用 Alation 和 Tableau,数据管理员可以使用标签直接向 Tableau 中的数据使用者传达数据管控策略和最佳做法的上下文。标签会在 Alation 和 Tableau Server 之间自动同步,以便 Tableau 用户立即以此作为筛选条件,查找和理解 Tableau 工作簿和数据源。
  3. 深层次影响分析:数据管道用于向 Tableau 用户传送数据,而 Alation 可自动让用户深入了解管道信息。Alation 使 Tableau 具有高度的管道感知能力,如果底层的源数据库或文件结构出现更改,并可能会影响分析的准确性,Alation 就会通过电子邮件通知 Tableau 数据使用者。
  4. 数据目录:结合使用 Alation 后,Tableau 用户还能通过 Alation 数据目录在高度分布式大数据环境中搜索数据,并直接从 Alation 中生成工作簿。除了跨系统提供各数据集的样本外,此单一参考点还提供关于数据及其使用(由数据整理专家和数据用户共同管理)的详细说明。

若要深入了解 Alation 如何与 Tableau 协同实现大规模管控,请观看此网络讲座并阅读此白皮书