A visão da Tableau sobre Big Data


Visão geral | O que você aprenderá: 

A Tableau tem como missão ajudar as pessoas a ver e a entender seus dados. Para cumprir essa missão, acreditamos principalmente na democratização dos dados, o que significa que “as pessoas que conhecem os dados devem ser aquelas com o poder de fazer perguntas para eles”. Os profissionais da área de conhecimento devem poder acessar facilmente os dados onde quer que eles estejam. Esses mesmos profissionais também devem poder analisar e descobrir informações sobre os dados sem a ajuda de uma minoria privilegiada: os cientistas de dados e os desenvolvedores de TI.

Independentemente do tamanho dos dados, visualizá-los é muito importante, porque eles contêm informações úteis que podem ajudar na tomada de decisão. A abordagem de visualização de Big Data é especialmente importante porque os custos com armazenamento, preparação e consulta de dados são muito altos. Por isso, as organizações devem aproveitar fontes de dados bem estruturadas e aplicar rigorosamente as práticas recomendadas para que os profissionais da área de conhecimento consultem diretamente o Big Data. Nos últimos anos, houve muitas inovações na área de Big Data. Isso resultou em uma grande diversidade de opções, cada uma com suas diferentes vantagens. A visão da Tableau é ser compatível com todas as plataformas de Big Data que sejam relevantes para nossos usuários e ajudá-los a facilitar a comunicação em tempo real com seus dados.

Também separamos as páginas iniciais do whitepaper para você ler. Baixe o PDF à direita para ler o restante do documento.


Estratégia de Big Data da Tableau

A Tableau tem como missão ajudar as pessoas a ver e a entender seus dados. Para cumprir essa missão, acreditamos principalmente na democratização dos dados, o que significa que “as pessoas que conhecem os dados devem ser aquelas com o poder de fazer perguntas para eles”. Os profissionais da área de conhecimento devem poder acessar facilmente os dados onde quer que eles estejam. Esses mesmos profissionais também devem poder analisar e descobrir informações sobre os dados sem a ajuda de uma minoria privilegiada: os cientistas de dados e os desenvolvedores de TI.

Independentemente do tamanho dos dados, visualizá-los é muito importante, porque eles contém informações úteis que podem ajudar na tomada de decisão. A abordagem de visualização de Big Data é especialmente importante porque os custos com armazenamento, preparação e consulta de dados são muito altos. Por isso, as organizações devem aproveitar fontes de dados bem estruturadas e aplicar rigorosamente as práticas recomendadas para que os profissionais da área de conhecimento consultem diretamente o Big Data. Nos últimos anos, houve muitas inovações na área de Big Data. Isso resultou em uma grande diversidade de opções, cada uma com suas diferentes vantagens. A visão da Tableau é apoiar todas as plataformas de Big Data que sejam relevantes para nossos usuários e ajudá-los a facilitar a comunicação em tempo real com seus dados.

Para concretizar essa visão para Big Data, a Tableau se concentrou em seis pilares:

  1. Acesso abrangente a plataformas de Big Data – Parte da nossa visão é permitir a análise de Big Data, onde quer que ele esteja. O software Tableau atualmente oferece suporte a mais de 40 fontes de dados diferentes e aceita inúmeras outras por meio de nossas opções de extensibilidade. Conforme novas fontes de dados surgem e se tornam valiosas para nossos usuários, elas são incorporadas ao nosso produto para tornar mais suave o acesso aos dados. Nossos conectores nomeados para o ecossistema de Big Data incluem:
    • Hadoop: Cloudera Impala & Hive, Hortonworks Hive, MapR Hive, Amazon EMR com Impala &
    • Hive, Pivotal HAWQ e IBM BigInsights
    • NoSQL: MarkLogic e Datastax
    • Spark: Apache Spark SQL
    • Nuvem: Amazon Redshift e Google BigQuery
    • Dados operacionais: Splunk
    • Bancos de dados de análises rápidos: Actian Vectorwise & ParAccel, Teradata Aster, HP Vertica, SAP Hana, SAP Sybase, Pivotal Greenplum e EXASOL EXASolution
  2. Autoatendimento para visualização de Big Data por usuários comerciais – Os usuários comerciais podem visualizar seus dados com o recurso “arrastar e soltar”, sem precisar escrever códigos SQL/Java complexos ou trabalhos do MapReduce. O Tableau simplifica a análise de dados – Os usuários podem descobrir informações visuais em seus dados mais rápido do que nunca.
  3. Arquitetura de dados híbrida para otimizar o desempenho da consulta – O Tableau pode se conectar em tempo real a fontes de dados ou armazená-las na memória. A conexão em tempo real é ideal para mecanismos de consulta interativos e conjuntos de dados grandes. No entanto, também podemos melhorar e acelerar fontes de dados mais lentas criando uma extração dos dados e armazenando-a em nosso Processador de dados na memória.
  4. Combinação de dados para analisar simultaneamente várias fontes de dados – Muitas vezes, trabalhar com dados dispersos é mais complicado do que trabalhar com Big Data. É raro os dados de um analista estarem armazenados de forma organizada em um só lugar. Normalmente, eles estão espalhados e residem em tecnologias e plataformas diferentes. O Tableau permite que seus usuários trafeguem de uma fonte de dados à outra, combinando o Big Data com demais fontes de dados (por exemplo, Salesforce, MySQL e arquivos do Excel), permitindo que as organizações mantenham os ativos de dados em seus locais de origem.
  5. Desempenho global de consulta da plataforma – À medida que os volumes de dados crescem, a Tableau continua investindo nas principais melhorias de desempenho de consultas, que ajudam a facilitar a comunicação em tempo real com os dados. Recentemente, isso inclui recursos como consultas paralelas, fusão de consultas e cache de consulta externo. Agora, o Tableau também aproveita a vetorização para processadores com suporte para esse recurso.
  6. Interface visual avançada e homogênea para os dados – O Tableau oferece recursos de análise, como a capacidade de filtrar dados, executar previsões e fazer análises de linha de tendência com ações simples. Ele também interpreta as ações de usuário e escolhe a melhor forma de representar os dados com base nas práticas recomendadas visuais. A partir do momento que você se conecta aos dados, o Tableau também oferece uma interface visual unificada que é usada em todas as fontes de dados.

Nossa visão está alinhada com a forma como o cenário global dos dados está se desenvolvendo. O normal agora é que muitos clientes lidem com um conjunto diverso de tecnologias de Big Data. Tecnologias como Hadoop e Spark agora fazem parte da arquitetura dos dados junto com data warehouses, devido à sua capacidade de armazenar e processar dados. Em paralelo, os clientes estão ajustando o tamanho de seus data warehouses com base em suas implantações do Hadoop. Bancos de dados NoSQL são frequentemente escolhidos como back-end para aplicativos no lugar de bancos de dados relacionais, devido aos seus modelos de dados flexíveis, à sua baixa latência e ao seu design voltado para aplicativos. Além disso, as fontes de dados na nuvem também estão sempre presentes, visto que os sistemas CRM e ERP na nuvem tornaram-se a primeira opção para gerenciar processos de negócios, e o modelo de consumo pré-pago está se tornando popular para armazenamento na nuvem e processamento de dados. Com back-ends tão diversos e flexíveis, os usuários precisam de uma solução de front-end como o Tableau para se conectarem com flexibilidade a diferentes plataformas de Big Data, a fontes de dados na nuvem e a bancos de dados relacionais para terem a agilidade que desejam ao analisar dados.

Quer saber mais? Baixe o restante do whitepaper!

Continuar lendo...

Você também pode gostar de...