Inovações constantes

Em 2003, o Tableau surgiu na Universidade de Stanford com o VizQL™, uma tecnologia que mudou completamente a forma de trabalhar com os dados, pois ele permite arrastar e soltar funções para criar visualizações sofisticadas. A inovação fundamental é uma linguagem de consulta patenteada que traduz suas ações em uma consulta de banco de dados e expressa a resposta de forma gráfica. A inovação seguinte foi a capacidade de fazer análises ad-hoc de milhões de linhas em segundos com o Processador de Dados do Tableau. O Processador de Dados é um banco de dados de análise de alto desempenho no seu PC. Ele tem os benefícios de rapidez das soluções tradicionais na memória sem a limitação de que seus dados precisam caber na memória. E com a tradição da Tableau de criar ferramentas avançadas acessíveis para todos, não é necessário criar um script para usar o Processador de Dados.

VizQL™

Originalmente visual – e, por isso, mais rápido.

No coração do Tableau existe uma tecnologia própria que torna a visualização de dados interativa parte integrante do entendimento dos dados. Uma ferramenta de análise tradicional obriga você a analisar dados em linhas e colunas, escolher um subconjunto de seus dados para apresentar, organizar esses dados em uma tabela e, em seguida, criar um gráfico a partir dessa tabela. O VizQL elimina essas etapas e cria uma representação visual de seus dados imediatamente, fornecendo um feedback visual à medida que você faz análises. Consequentemente, você entende melhor os dados e podem trabalhar até 100 vezes mais rápido do que com os métodos convencionais.
O VizQL permite uma ampla gama de visualizações

Uma nova linguagem para os dados significa que você pode dizer mais.

Essa nova arquitetura fundamental faz para as interações com dados em um formato visual o que o SQL fez para as interações de dados em um formato de texto. As instruções do VizQL descrevem uma classe infinita de visualizações multidimensionais sofisticadas. Com o VizQL, as pessoas têm uma única interface de análise e uma ferramenta de visualização de banco de dados para produzir uma grande quantidade de resumos gráficos. O Tableau pode criar uma incrível quantidade de visualizações, desde gráficos de linhas e barras até mapas e sofisticadas exibições associadas. Essa flexibilidade permite que você entenda os dados de uma forma completamente nova. Assim, é possível encontrar informações que ficariam perdidas se você tivesse que explorar seus dados com modelos de gráficos rígidos.

Compatível com padrões de pensamento naturais.

Pensar consiste naturalmente em perguntar e responder, gerando um avanço incremental à medida que novas informações são obtidas. É difícil saber exatamente aonde você está indo ao começar uma análise. Contudo, é isso o que as ferramentas traducionais de BI exigem. Há uma alternativa: O VizQL permite que você explore seus dados visualmente e encontre sua melhor representação. Você aprende à medida que avança, adiciona mais dados se precisar e, consequentemente, obtém informações mais aprofundadas. Chamamos isso do ciclo da análise visual. Depois de passar por esse ciclo, você poderá se comunicar uma história bem melhor sobre os seus dados.

Não existe nenhum outro lugar no mundo.

O VizQL tornou as análises rápidas e a visualização uma realidade. Pessoas com pouco ou nenhum treinamento podem ver e entender os dados mais rápido do que nunca e de maneiras inteiramente novas. E isso é o que faz a diferença.

O Processador de Dados

Desenvolvido para superar os limites

O Processador de Dados é um banco de dados de análise inovador desenvolvido para superar os limites dos bancos de dados existentes e dos silos de dados para proporcionar o processo da análise visual. Ele foi criado para refletir os recursos dos hardwares mais recentes e a hierarquia de memória completa, desde o disco até o cache L1. O Processador de Dados do Tableau muda a curva entre grandes volumes de dados e análises rápidas.
O Processador de Dados: análise de um volume muito grande de dados

A evolução dos grandes volumes de dados

Os bancos de dados evoluíram consideravelmente nos últimos anos. Os bancos de dados herdados têm seu foco nos dados que estão no disco e na pré-computação. Embora isso permitisse mais poder de computação do que antes, havia a desvantagem da lentidão exigindo que os usuários definissem as perguntas que precisavam responder (sua carga de trabalho de consulta) antes de criar o banco de dados. Os bancos de dados mais recentes melhoraram seus desempenhos apenas usando os níveis mais altos de hierarquia de memória e exigindo que todos os dados residissem na memória. Essas soluções “na memória” tornaram a computação mais rápida, mas o tamanho dos dados ficava limitado ao tamanho da memória disponível.

Objetivos do Processador de Dados do Tableau

Desenvolvemos o Processador de Dados para:
  1. Aproveitar todos os hardwares da geração atual para obter respostas imediatas às consultas de centenas de milhões de linhas de dados em hardwares comuns, como um laptop da empresa.
  2. Oferecer suporte à consulta ad-hoc por meio de um desempenho de consulta previsível e consistente para todas as consultas e sem requisitos para cargas de trabalho de consulta ou pré-computação de agregações ou resumos.
  3. Oferecer uma integração contínua com a infraestrutura e os data warehouses corporativos existentes.
  4. Não ser limitado por um requisito de um conjunto de dados inteiro carregado para residir na memória a fim de atingir seus objetivos de desempenho.
  5. Fornecer uma carga e conexões muito mais rápidas para as fontes de dados.

Design adequado à arquitetura

A estrutura principal do Processador de Dados é uma representação baseada em colunas que usa a compactação, que é compatível com a execução de consultas sem descompactação. Aproveitando novas abordagens de gráficos gerador por computador, os algoritmos foram cuidadosamente criados para permitir a utilização de todos os processadores modernos com um uso muito bom dos caches L1 e L2, de resultados intermediários mínimos e das técnicas inovadoras para gerenciar o fluxo de dados do disco, evitando a perda de taxa de transferência. Assim, evitamos a limitação comum de exigir que os conjuntos de dados sejam carregados na memória antes que a análise seja realizada.

Processador de Dados para conexão em tempo real – e vice-versa

O Processador de Dados foi criado para integrar-se diretamente com a tecnologia de “conexão em tempo real” do Tableau, permitindo que os usuários alternem, com um único clique, entre uma conexão direta com o banco de dado corporativo (enviando consultas SQL extremamente ajustadas e específicas da plataforma) e consultas em uma parte desses dados carregados no Processador de Dados (e vice-versa), com cálculos cuidadosamente precisos e semântica de agrupamento. Essa integração permite que as empresas façam análises em amostras de dados (GBs) e as redirecione para um warehouse extremamente paralelo, como o Teradata para executar a análise final (ou relatórios) em petabytes de dados.

Consultas ad-hoc verdadeiras

O Processador de Dados foi desenvolvido com uma linguagem de consulta e um otimizador de consulta para oferecer suporte às consultas típicas das análises corporativas imediatas. Ao trabalhar com os dados na velocidade do pensamento, é comum precisar executar consultas complexas, como filtros multidimensionais muito grandes ou consultas de co-ocorrência complexas. Os bancos de dados existentes geralmente apresentam um desempenho ruim para esses tipos de consultas, enquanto o Processador de Dados as processa instantaneamente.

Modelo de dados flexível

Uma das principais diferenças entre o Processador de Dados e as outras soluções na memória é que podemos operar os dados diretamente em sua representação no banco de dados no disco. Portanto, não é necessário uma modelagem de dados ou scripts para usar o Processador de Dados. Um dos aspectos mais importantes do Processador de Dados é que você pode definir, como com qualquer outro banco de dados relacional, novas colunas calculadas ou você pode considerar isso um tipo de modelagem de dados ad-hoc a qualquer momento.

Carga de instância e tempo de conexão

O Processador de Dados é único nisso, porque, depois que os dados são carregados nele, ele tem um tempo de inicialização muito rápido. Só precisamos ler essa parte dos dados em que nossas consultas realmente se encontram. Você pode ter muitos dados em um banco de dados que não é relevante para uma determinada análise, mas nunca precisará esperar para que o Processador de Dados leia esses dados.