大规模部署 Tableau 的 8 个提示

要想最大限度缩短停机时间,并确保分析平台能够满足企业不断增长的需求,务须正确进行部署和可扩展性规划。在建立可随业务增长而扩展的企业环境时,需要考虑诸多因素。 以下 8 个快速提示有助于您使用可扩展性框架设置 Tableau 环境。

TabJoltTabJolt

各种规模的组织纷纷使用 Tableau 大规模地提供真正意义上的自助式分析。这些组织都在进行战略转型,着力打造一种对组织的未来至关重要的分析文化。随着这种文化逐渐成形,分析平台变得对组织至关重要,停机时间则成为切实担忧的问题。要想最大限度缩短停机时间,并确保分析平台能够满足企业不断增长的需求,务须正确进行部署和可扩展性规划。

设置企业环境时需考虑诸多事项,下面 8 个快速提示可帮助您使用可扩展性框架设置 Tableau 环境。

1.设计外观和性能俱佳的工作簿

我们之所以会听到客户说自己的工作簿太慢,很多时候都是因为在设计工作簿的过程中并未重视性能。如果单用户负载时间很长,该工作簿的响应时间在高负载下也会很长。

在构建分析文化的同时,您可以通过提供相应的途径和组建相应的团队,让用户在“管家”的帮助下设计出外观漂亮、见解丰富、性能优良的工作簿。这种做法同样可以确保您构建和提供可扩展的可视化。设计高效工作簿是一份白皮书,该白皮书更加深入地介绍了如何构建性能良好的高效仪表板。

2.考虑自己的数据策略

最终用户体验的合计响应时间包含了多个组成部分,但最主要的是 Tableau 消耗的时间和数据检索时间。如果后端数据库速度慢,或者查询时间长,可视化也会比较慢。

考虑自己的数据策略非常重要。组织中的数据源往往是经过整理的共享数据源。您必须确保自己提供可以提高业务用户工作效率的重要数据。这意味着优化数据。例如,您应该确保最佳的联接以及相关的聚合级别,以便对索引表进行快速检索。要使可视化和仪表板保持良好的性能,良好的数据清理流程非常重要。

3.必要时,使用 Tableau 数据提取

如果数据库查询速度慢,并且您无法获得 DBA 和 IT 团队的协助来优化性能,请考虑使用数据提取来提升查询性能。数据提取存储在服务器本地并在内存中运行,因此用户无需向数据库提出请求就可以快速访问这些数据。可轻松地筛选和聚合数据提取。必要时,您可以轻松地指导最终用户,使他们能够在将数据提取发布到服务器之前,通过在正确级别聚合和隐藏未使用的字段来优化数据提取。数据提取可以显著改善响应时间,让用户进入连贯的分析流。

4.在非高峰时段安排更新和分隔后台程序

数据源通常会实时更新,但用户只是每天或每周才需要一次数据。将数据提取安排在非高峰时段,可以减轻数据库和 Tableau Server 在高峰时段的负载。不仅如此,还可以在专用硬件上添加更多后台程序,但前提是您有充足的核心容量。如果希望以更快的速度完成数据提取,不妨考虑此方案。

通过识别不必要的数据提取刷新来消除周期浪费。例如,如果一个大型数据提取每小时刷新一次,但使用该数据提取的工作簿的上次使用时间是一年多以前,则询问业务用户是否确实需要每小时刷新一次该数据提取。从服务器中移除不相关和/或对业务无关紧要的作业,这能够为用户提供更优化的体验。

5.缓存

Tableau 中的缓存跨群集分布,同样地,只需添加更多缓存服务器,即可跨群集节点分布扩展服务器的内存使用。缓存服务器专门缓存查询结果,在较多用户同时查看已缓存查询结果的可视化用例中,缓存服务器将提升规模。要了解您命中还是缺少缓存,请在服务器上启用 JMX 监视,并使用您喜欢的 JMX 监视工具或使用 TabMon。

6.调整配置

默认配置适用于大多数小型部署。但是,执行自己的可扩展性测试时,请记住您可能需要调整多个 VizQL Server、缓存服务器、数据引擎和数据服务器的配置。考虑您是否应根据所测试的硬件,调整内部进程监视器 (SRM) 的内存设置 (vizqlserver.memory_limit_per_process_gb)。内部进程监视器检测到系统超过阈值且容量不足时,会重启服务器进程。

7.利用 TabJolt

考虑使用 TabJolt 实现负载测试自动化,因为它不需要您更新和维护测试自动化脚本。维护用于临时分析的测试自动化脚本可能非常耗时并会限制覆盖范围。此处的视频介绍了如何开始使用 TabJolt。

8.在 VMWare 上运行

如果在 VMWare 上运行 Tableau Server,请务必与您的 VMWare vSphere 管理员沟通,确保其分配了足够的 CPU 预留,以便 Tableau 能够收到处理可视化的密集型工作负荷所需的核心计算。

有关扩展 Tableau 部署的其他提示,请查看我们关于 Tableau Server 可扩展性的白皮书