Prévia do Tableau 9.0: Melhorias no desempenho das consultas
Quando você consegue fazer perguntas com mais rapidez, sem esperar demais por uma consulta ou pelo carregamento da página, pode continuar no fluxo da análise. Assim, é capaz de se concentrar nos dados e explorar de forma criativa as informações que eles têm a oferecer, sem interrupções. Por isso, fizemos melhorias de desempenho em todo o Tableau 9.0 para ajudar você a obter resultados com mais rapidez e a fazer perguntas mais complexas.
Veja alguns exemplos das diversas melhorias que fizemos no Tableau 9.0. Cada exemplo ilustra como essas melhorias afetaram o desempenho em um laptop comum de quatro núcleos. É claro que o desempenho pode variar de acordo com a quantidade de dados, com o tipo de consulta e com o banco de dados subjacente que você está usando. Lembre-se de que esses são apenas exemplos, e não necessariamente refletem ganhos de desempenho esperados para quaisquer conjuntos de dados.
Melhorias no Processador de dados
A Tableau tem um forte histórico de inovações na área de desempenho, e a principal delas é o Processador de dados lançado inicialmente no Tableau 6.0. O Processador de dados é um banco de dados de análise na memória, desenvolvido para agilizar muito mais as consultas.
As melhorias no Processador de dados no Tableau 9.0 tornaram o processamento de dados de análise ainda mais rápido, com recursos desenvolvidos para aproveitar o hardware ao máximo. Este exemplo mostra um desempenho 10 vezes mais rápido com um conjunto de dados que tem 173 milhões de linhas de dados:
Essa visualização foi criada com um arquivo de extração de dados do Tableau que contém 173 milhões de linhas com dados referentes ao pagamento de gorjetas a táxis em 2013. A consulta nessa exibição obtém o valor médio das gorjetas por trimestre e mostra que os passageiros são mais generosos no período próximo ao final do ano.
Se abrirmos esta planilha no Tableau 8.3, podemos ver que a consulta já é bastante rápida para o tamanho do conjunto de dados: cerca de 7 segundos. Fazer exatamente a mesma consulta com essa planilha no Tableau 9.0 leva menos de 1 segundo. Sim, menos de 1 segundo! Devido às melhorias no Processador de dados do Tableau, o desempenho ficou 10 vezes mais rápido. Agora os usuários terão uma experiência ainda melhor e ininterrupta ao explorar seus dados com o Processador de dados do Tableau.
Consultas paralelas
O Tableau 9.0 também aproveita melhor os recursos dos bancos de dados de origem para executar mais consultas simultaneamente. O novo recurso “Consultas paralelas” melhora o desempenho do painel no Tableau Desktop e no Tableau Server. Este exemplo mostra um desempenho nove vezes mais rápido com um conjunto de dados que tem 157 milhões de linhas de dados:
Este painel mostra dados de voos por companhia aérea, no período de 1988 a 2013, com base em 157 milhões de linhas de dados armazenadas em um arquivo de extração de dados do Tableau. Carregar esse painel executará diversas consultas, como o número de voos das três principais companhias, os voos ao longo do tempo e a proporção de voos para cada companhia por estado.
Além de agilizar cada uma das consultas, consultas independentes são iniciadas simultaneamente no Tableau 9.0. Isso resulta em uma melhora significativa no desempenho geral. No Tableau 8.3, o tempo total de carregamento (do início da primeira consulta até o final da última consulta) é de 9,5 segundos. No Tableau 9.0, o tempo de cada consulta foi melhorado, e as consultas independentes são executadas em paralelo, reduzindo o tempo de carregamento para pouco mais de 1 segundo. Carregar essas consultas no painel está nove vezes mais rápido.
Fusão de consultas
O que é melhor do que consultas mais rápidas? Menos consultas! O Tableau 9.0 possui uma nova tecnologia de conexão a bancos de dados chamada Fusão de consultas, que analisa todas as consultas em seus painéis e encontra formas de simplificá-las, reduzindo o número de consultas. Isso resulta em menos trabalho para o banco de dados e respostas mais rápidas para o usuário. Este exemplo mostra um desempenho duas vezes mais rápido em um banco de dados do Amazon Redshift:
Esta visualização usa o mesmo conjunto de dados com 173 milhões de linhas de dados sobre táxis que o primeiro exemplo, mas desta vez os dados estão armazenados no Amazon Redshift. Duas planilhas medem a soma das corridas por hora e a média das gorjetas combinadas em um painel, mostrando uma tendência interessante entre 4h e 5h da manhã. Como elas têm o mesmo nível de detalhe, as consultas podem ser mescladas em uma única consulta.
O recurso Fusão de consultas identifica que as duas consultas possuem o mesmo nível de detalhe e simplesmente traça a agregação das duas. Este gráfico mostra que era necessário fazer duas consultas no Tableau 8.3, enquanto no Tableau 9.0 basta apenas uma para obter o mesmo resultado. Este recurso aprimorou o tempo de execução da consulta agregada de 3,7 segundos para 1,7 segundos, um desempenho duas vezes mais rápido.
Armazenamento em cache de consultas externo Agora imagine se não fosse preciso executar nenhuma consulta, e a ferramenta ficasse totalmente em segundo plano durante as análises? Ao carregar uma pasta de trabalho pela primeira vez, o Tableau consulta a fonte de dados para obter os valores para criar as visualizações. Mas e na segunda vez? Se os dados não tiverem mudado (como no caso de pastas de trabalho baseadas em extração), qual o sentido em consultar a fonte de dados?
O Tableau 9.0 salvará o cache da consulta como parte da pasta de trabalho, no Tableau Desktop e no Tableau Server, oferecendo carregamentos praticamente instantâneos para as pastas de trabalho equivalentes. Não é necessário repetir a consulta para obter as respostas, porque os resultados já estão armazenados, e os usuários só precisam atualizar para substituí-los no cache.
Imagine poder apenas reabrir uma pasta de trabalho que já foi aberta localmente, ou que já tenha sido visualizada no Tableau Server, e ter um tempo de carregamento praticamente instantâneo. No Tableau 9.0, um dos recursos que melhora o desempenho da consulta é não precisar executar consulta alguma. Este exemplo mostra um desempenho 50 vezes mais rápido com um conjunto de dados que tem 157 milhões de linhas de dados:
Para demonstrar o armazenamento em cache, este exemplo usará o mesmo painel do segundo exemplo, que mostra o recurso Consultas paralelas. O painel exibe dados de voos em um arquivo de extração de dados do Tableau com 157 milhões de linhas. A diferença é que o painel está sendo aberto pela segunda vez.
O recurso Armazenamento em cache de consultas externo no Tableau 9.0 salvou os resultados da consulta, obtidos quando o painel foi aberto pela primeira vez. Consequentemente, apenas uma única e rápida consulta foi executada para acessar o cache. O Tableau 8.3 reabria a pasta de trabalho com um desempenho semelhante ao da primeira vez (cerca de 10 segundos), já o Tableau 9.0 reabriu a planilha em 0,2 segundo. Isso é cinco vezes mais rápido do que a primeira vez que a pasta de trabalho foi aberta (1,1 segundo), mas, em comparação com o Tableau 8.3, o desempenho da reabertura está 50 vezes mais rápido.
Esses são apenas alguns dos exemplos dos ótimos recursos que melhoram o desempenho do Tableau 9.0. Eles se somam para oferecer um desempenho sem precedentes aos usuários. As consultas são executadas com mais rapidez em extrações, executadas em paralelo para permitir tempos de carregamento mais rápidos, executadas em menor número e, em alguns casos, todas as consultas de uma exibição serão eliminadas com o uso do cache. O Tableau 9.0 é mais rápido, e ainda temos outros recursos a oferecer que lhe permitirão ter uma experiência mais imersiva com seus dados.
Quer saber mais?
Confira o restante de nossa série de postagens no blog do Tableau 9.0
Histórias relacionadas
Subscribe to our blog
Receba em sua caixa de entrada as atualizações mais recentes do Tableau.