执行摘要
2013 年 11 月,我们运行了可扩展性测试来了解 Tableau 8.1 的可扩展性,进而更深入地了解此版本中实施的更高可扩展性的影响。具体而言,我们想要更加深入地了解 Tableau Server 8.1 会如何在各种不同的配置和工作负载之间扩展。
有很多因素都会影响 Tableau Server 部署的可扩展性,这其中包括工作簿复杂程度、数据量、硬件以及浏览器和网络设置。
我们尝试着根据客户现场常见的情况模拟了实际使用情况。我们定义了一个包含“只读”用户和“interactor”用户的工作负载。只读用户只查看报告,而 interactor 用户则执行选择、筛选视图、更改选项卡并对报告执行类似交互操作。然后,在不断增大的用户负载和不同的只读用户与 interactor 用户组合工作负载比率情况下,我们研究了饱和状态(吞吐量最大)下系统的行为。
这些结果表明,Tableau Server 8.1 几乎是线性扩展。根据我们的测试和客户使用情况预估,我们假定系统中的并发用户为 10%。并依此展示了 Tableau Server 从 16 核单节点群集上合计 1900 位用户扩展到 64 核 4 节点群集上合计 5540 位用户的过程。这适用于常见的工作负载组合,其中 40% 的用户与报告进行交互,其他 60% 则只能查看报告。
注意: 在分布式环境中运行时,将一台物理机指定为主服务器,其他物理机则指定为工作服务器。此外,我们还对更加活动的工作负载进行了测试。在 100% 的用户都与报告交互的场景下,仍然基于 10% 的并发率,Tableau Server 可支持 16 核单台主服务器上合计 1190 位用户到 64 核单个主群集加上 3 节点工作群集上合计 3470 位用户。
本白皮书介绍了可扩展性测试、方法和测试结果。
我们也将提供一些真实的有关 Tableau Server 可扩展性的扩展示例、介绍 Tableau 实现性能和可扩展性的方法、设定一些基准来帮助您理解可扩展性测试的各种元素、检查试验结果,最后指导您如何将这些成果应用到您自己的试验中。
从用户扩展到企业
Tableau 深知数据可视化可以大大提高掌握信息的能力。
我们希望采取一个对“以文本形式分析数据后再创建结果的可视化效果”标准流程进行改良的解决方案。
因此,我们研发了一种在分析过程中实施可视化的技术,来取代最后执行可视化。这一发明称为 VizQL,很快就受到用户的关注。随着这些用户发现 VizQL 可以非常轻松地为其创建自己的数据可视化,而其他一些用户则发现可视化为其业务提供了大量价值,企业组织很快便从中获利。
2013 年 11 月,我们发布了软件版本 8.1。我们实施的许多增强功能都是为了满足客户对 Tableau 产品不断增长的需求,用于支持大型企业级部署。
随着更多的用户发现了可视化、自助分析和报告的强大功能,IT 也发现自身需要满足通过配置和管理 Tableau 软件和服务器来支持各种用户、组和交互的要求。
自然而然地,CIO、IT 经理和 IT 架构师非常关注 Tableau Server 的可扩展性。他们希望能够保证 Tableau 可以支持企业部署。并且希望了解能够获得的性能,以便引导架构决策。
使用自家产品:Tableau Public 故事
随着我们对 Tableau 功能的改进,能够支持非常庞大的用户群,我们也需要一种方法来测试和完善这些功能。我们希望测试尽可能符合实际情况,甚至能重现最恶劣的业务状况。
作为产品发布的一部分以及使用自家产品工程文化的核心所在,我们将最新的 Tableau Server 预发布软件融入了 Tableau Public。这样一来,我们便可以在关键任务生产环境中广泛部署我们的产品,并在客户遇到与可扩展性相关的问题之前了解、确定并解决这些问题。
如今,Tableau Server 作为 Tableau Public 解决方案的组成部分在我们自己的数据中心运行。
对于不熟悉本产品的用户而言,任何人都可以通过 Tableau Public 这项免费服务向 Web 发布交互数据。数据上传后,所有人都可与该数据进行交互、下载该数据或者将其用来创建自己的可视化,而不需要任何编程技巧。Tableau Public 已为 2 亿不同的范例提供服务,此数据仍将继续增长。一小时内我们最多可以记录 94,000 份视图。这些流量是通过 Tableau Server 的纵向和横向架构来实现的。
Tableau Public 配置与 Tableau Server 的公司部署类似,但有几点不同:
Tableau Public 的核心组件与 Tableau Server 相同,但 Tableau Public 用户受到固定的提取大小限制。此外,Tableau Public 用户不用面临数据安全问题,因为所有数据都是公开的。
但 Tableau Public 每天会运行成千上万条查询。虽然数据大小相对较小,但其变化性很大。除了 Tableau Public,Tableau 还在企业内部部署和使用 Tableau Server 来为销售、工程、支持、运营和其他关键业务职能提供支持。广泛地使用我们自己的产品是 Tableau 文化的核心组成部分。