Tecnologia Tableau

Inovações constantes

Em 2003, o Tableau surgiu na Universidade Stanford com o VizQL™, uma tecnologia que mudou completamente a forma de trabalhar com os dados ao permitir arrastar e soltar funções para criar visualizações sofisticadas. A inovação fundamental é uma linguagem de consulta patenteada que traduz suas ações em uma consulta de banco de dados e expressa a resposta de forma gráfica.

A inovação seguinte foi a capacidade de fazer análises ad hoc de bilhões de linhas em segundos com o Hyper, a tecnologia de processamento de dados do Tableau. Como tecnologia básica da plataforma Tableau, o Hyper usa técnicas patenteadas de geração de código dinâmico e paralelismo de ponta a fim de obter um rápido desempenho para a criação de extrações e a execução de consultas.

Hyper

O Hyper é uma tecnologia de processamento de dados na memória de alto desempenho que ajuda os clientes a analisar conjuntos de dados grandes ou complexos de forma mais rápida, avaliando com eficácia as consultas analíticas diretamente no banco de dados transacional. Como tecnologia básica da plataforma Tableau, o Hyper usa técnicas patenteadas de geração de código dinâmico e paralelismo de ponta a fim de obter um rápido desempenho para a criação de extrações e a execução de consultas.

O design exclusivo do Hyper

Na última década, os processadores de dados na memória e as tecnologias de banco de dados analíticas proporcionaram melhorias incríveis no desempenho de consultas, por meio de técnicas como amostragem e sumarização. No entanto, essas melhorias de desempenho tiveram um preço. Muitos sistemas sacrificam o desempenho de gravação, que é fundamental para a rápida criação de extrações e o desempenho de atualização, em favor da otimização do desempenho da carga de trabalho analítica. Baixas velocidades de gravação resultam em dados obsoletos e desconectados. O resultado? Uma defasagem entre as pessoas e os dados que elas querem analisar. Nossa missão com o Hyper é aproximar as pessoas dos seus dados, proporcionando rápida velocidade de gravação e alto desempenho da carga de trabalho analítica. Em resumo, o Hyper fornece dados atualizados de maneira muito mais rápida, para que você possa analisar uma exibição maior e mais completa dos seus dados.

Repensando a arquitetura do sistema: um único estado para transações e consultas analíticas

Com o Hyper, as transações e as consultas analíticas são processadas no mesmo repositório de colunas, sem exigir pós-processamento após a ingestão dos dados. Isso reduz os dados obsoletos e minimiza a defasagem de conexão entre sistemas especializados. A abordagem única do Hyper permite uma verdadeira combinação de cargas de trabalho com operações intensas de leitura e gravação em um único sistema. Isso significa que você pode ter a criação rápida de extrações sem sacrificar a velocidade de desempenho das consultas. (Ou seja, todos saem ganhando.)

Uma nova abordagem para a execução de consultas: geração de código dinâmico

O Hyper usa um modelo original de execução de compilação just-in-time. Muitos outros sistemas usam um modelo de execução de consultas tradicional que não é capaz de tirar o máximo proveito de componentes de hardware modernos com vários núcleos. Em vez disso, o Hyper otimiza e compila consultas em um código de máquina personalizado para fazer melhor uso dos componentes de hardware subjacentes. Quando o Hyper recebe uma consulta, ele cria uma árvore, otimiza logicamente essa árvore e depois a utiliza como modelo para criar um programa exclusivo, que então é executado. O resultado final é uma utilização aprimorada de componentes de hardware modernos para que as consultas sejam executadas com mais rapidez.

Aproveitando mais do seu hardware: paralelização com base em fragmentos

Desenvolvemos o Hyper do zero com ambientes grandes e de vários núcleos em mente. Nosso modelo de paralelização é baseado em unidades de trabalho muito pequenas (fragmentos). Esses fragmentos são atribuídos de forma eficiente em todos os núcleos disponíveis, permitindo que o Hyper responda de forma mais eficiente às diferenças na velocidade dos núcleos. Isso se converte em uma utilização de hardware mais eficiente e em um desempenho mais rápido.

O Hyper começou como um projeto de pesquisa acadêmica na Universidade Técnica de Munique (TUM) em 2010. Em 2015, uma organização independente foi criada com o objetivo de trazer o Hyper para a indústria e disponibilizar uma versão comercial da tecnologia. O Hyper foi adquirido pela Tableau em 2016. Agora, ele é a tecnologia básica que compõe o processador de dados do Tableau.

VizQL™

Nativamente visual e, portanto, mais rápido

No coração do Tableau existe uma tecnologia própria que torna a visualização de dados interativa parte integrante do entendimento dos dados. Uma ferramenta de análise tradicional força você a analisar os dados em linhas e colunas, escolher um subconjunto de seus dados para apresentar, organizar esses dados em uma tabela e, em seguida, criar um gráfico com essa tabela. O VizQL elimina essas etapas e cria uma representação visual de seus dados imediatamente, fornecendo um feedback visual à medida que você faz análises. Consequentemente, você entende melhor os dados e pode trabalhar até 100 vezes mais rápido do que com os métodos convencionais.

O VizQL permite uma ampla gama de visualizações

Uma nova linguagem para os dados significa que você pode dizer mais

Essa arquitetura essencialmente nova faz para as interações com dados em formato visual o que o SQL fez para as interações com dados em formato de texto. As instruções do VizQL descrevem inúmeras visualizações multidimensionais sofisticadas. Com o VizQL, é possível ter uma única interface de análise e uma ferramenta de visualização de banco de dados para produzir uma grande quantidade de resumos gráficos.O Tableau pode criar uma quantidade incrível de visualizações, desde gráficos de linhas e barras até mapas e exibições associadas sofisticadas. Essa flexibilidade permite que você entenda os dados de uma forma completamente nova. Assim, é possível encontrar informações que ficariam perdidas se você tivesse que explorar seus dados com modelos de gráficos rígidos.

Compatível com padrões de raciocínio naturais.

Pensar consiste naturalmente em perguntar e responder, gerando um avanço incremental à medida que novas informações são obtidas. Quando você começa uma análise, dificilmente sabe exatamente aonde quer chegar. Mas é isso o que as ferramentas tradicionais de BI exigem de você.Há uma alternativa: o VizQL permite que você explore seus dados visualmente e encontre a melhor representação deles. Você aprende à medida que avança, adiciona mais dados se precisar e, consequentemente, obtém informações mais aprofundadas. Chamamos isso de ciclo da análise visual. Com esse ciclo, você poderá transmitir uma história muito mais rica sobre os seus dados.

Você não encontrará nada parecido.

O VizQL tornou as análises rápidas e a visualização de dados uma realidade. Pessoas com pouco ou nenhum treinamento podem ver e entender os dados mais rápido do que nunca e de maneiras inteiramente novas. E isso é o que faz a diferença.