La visión de Tableau sobre los big data


Resumen | Lo que aprenderá: 

Tableau emprendió una misión para ayudar a los usuarios a ver y comprender sus datos. Creemos fervientemente que la democratización de los datos conducirá al éxito de esta misión: “las personas que conocen los datos deberían ser las que hagan preguntas acerca de ellos”. Los trabajadores del conocimiento deberían poder acceder fácilmente a sus datos dondequiera que se encuentren. También deberían tener la capacidad de analizar y descubrir información acerca de sus datos sin necesitar asistencia de la escasa élite (los científicos de datos y los desarrolladores de TI).

La visualización de los datos es importante, independientemente de la cantidad de estos, porque los traduce en información y acción. El enfoque para la visualización de los big data tiene una importancia especial porque el costo de almacenamiento, preparación y consulta de estos datos es mucho más alto. En consecuencia, las organizaciones deben usar fuentes de datos con una buena arquitectura y aplicar de manera rigurosa las prácticas recomendadas para permitir que los trabajadores del conocimiento consulten los big data directamente. En los últimos años, se innovó mucho en materia de big data, por lo que existen muchas opciones con distintas ventajas. Tableau tiene la intención de admitir todas las plataformas de big data que sean pertinentes para sus usuarios y ayudarlos a mantener conversaciones con sus datos en tiempo real.

También le ofrecemos las primeras páginas del informe para que las lea. Descargue el PDF de la derecha para leer el resto.


La estrategia de Tableau para los big data

Tableau emprendió una misión para ayudar a los usuarios a ver y comprender sus datos. Creemos fervientemente que la democratización de los datos conducirá al éxito de esta misión: “las personas que conocen los datos deberían ser las que hagan preguntas acerca de ellos”. Los trabajadores del conocimiento deberían poder acceder fácilmente a sus datos dondequiera que se encuentren. También deberían tener la capacidad de analizar y descubrir información acerca de sus datos sin necesitar asistencia de la escasa élite (los científicos de datos y los desarrolladores de TI).

La visualización de los datos es importante, independientemente de la cantidad de estos, porque los traduce en información y acción. El enfoque para la visualización de los big data tiene una importancia especial porque el costo de almacenamiento, preparación y consulta de estos datos es mucho más alto. En consecuencia, las organizaciones deben usar fuentes de datos con una buena arquitectura y aplicar de manera rigurosa las prácticas recomendadas para permitir que los trabajadores del conocimiento consulten los big data directamente. En los últimos años, se innovó mucho en materia de big data, por lo que existen muchas opciones con distintas ventajas. Tableau tiene la intención de admitir todas las plataformas de big data que sean pertinentes para sus usuarios y ayudarlos a mantener conversaciones con sus datos en tiempo real.

Para hacer realidad esta visión sobre los big data, Tableau se concentra en seis pilares:

  1. Acceso generalizado a las plataformas de big data: Parte de nuestra visión consiste en permitir el análisis de los big data dondequiera que estén. Hoy en día, Tableau admite más de 40 fuentes de datos diferentes y acepta muchas otras, mediante sus opciones de extensibilidad. A medida que surjan nuevas fuentes de datos y estas se vuelvan valiosas para nuestros usuarios, continuaremos incorporándolas en nuestros productos para reducir los problemas de acceso a los datos. Entre nuestros conectores reconocidos para el ecosistema de big data se incluyen:
    • Hadoop: Cloudera Impala y Hive; Hortonworks Hive; MapR Hive; Amazon EMR con Impala y
    • Hive; Pivotal HAWQ; IBM BigInsights.
    • NoSQL: MarkLogic, Datastax.
    • Spark: Apache Spark SQL.
    • Nube: Amazon Redshift, Google BigQuery.
    • Datos operativos: Splunk.
    • Bases de datos de análisis rápidas: Actian Vectorwise y ParAccel; Teradata Aster; HP Vertica; SAP Hana; SAP Sybase; Pivotal Greenplum; EXASOL EXASolution.
  2. Visualización de autoservicio de big data para usuarios profesionales: Los usuarios profesionales pueden visualizar sus datos con operaciones de arrastrar y soltar, sin necesidad de escribir códigos de SQL o Java ni trabajos MapReduce complejos. Tableau simplifica el análisis de datos y permite a los usuarios descubrir información visual acerca de ellos más rápido que nunca.
  3. Arquitectura de datos híbrida para la optimización del rendimiento de las consultas: Tableau puede conectarse en tiempo real a fuentes de datos o llevar los datos a la memoria. La conectividad en tiempo real funciona de maravilla para la conexión a grandes conjuntos de datos y rápidos motores de consulta interactiva. No obstante, también podemos incrementar y acelerar las fuentes de datos más lentas creando una extracción de los datos y llevándola a nuestro motor de datos en memoria.
  4. Combinación de datos para el análisis de distintas fuentes de datos: Los datos distribuidos suelen ser un desafío más grande que los big data. No es común que un analista cuente con datos bien empaquetados en un único lugar. Por el contrario, los datos normalmente están distribuidos en tecnologías y plataformas dispares. Tableau permite a los usuarios trascender las fuentes de datos mediante la combinación de big data con otras fuentes de datos (p. ej., archivos de Excel, Salesforce, MySQL), lo que posibilita que las organizaciones conserven sus recursos de datos donde estos residan.
  5. Rendimiento general de las consultas a la plataforma: A medida que los volúmenes de datos crecen, Tableau continúa invirtiendo en mejoras de rendimiento clave, que favorecen las conversaciones con los datos en tiempo real. Recientemente, se incluyeron funcionalidades como consultas paralelas, fusión de consultas y almacenamiento en caché externo de consultas. Ahora, Tableau también saca partido de la vectorización de los procesadores que la admiten.
  6. Interfaz visual eficaz y homogénea para los datos: Tableau cuenta con herramientas de análisis que le permiten filtrar datos, hacer pronósticos y realizar análisis de línea de tendencia con acciones simples. Además, interpreta las acciones del usuario y selecciona la mejor manera de representar los datos de acuerdo a las prácticas recomendadas de visualización. Cuando uno se conecta a los datos, Tableau proporciona una interfaz única para la visualización de estos, que es consistente para todas las fuentes de datos.

Nuestra visión se adapta bien al modo en que evoluciona el panorama general de los datos. En la actualidad, lo que sucede normalmente es que muchos clientes hacen frente a un conjunto heterogéneo de tecnologías de big data. Tecnologías como Hadoop y Spark se convirtieron en parte de la arquitectura de datos, junto con los almacenes de datos, debido a su capacidad de almacenar y procesar datos. Al mismo tiempo, los clientes corrigen el tamaño de sus almacenes de datos para ajustarlos a sus implementaciones de Hadoop. Frecuentemente, se prefieren las bases de datos NoSQL antes que las bases de datos relacionales para el back-end de las aplicaciones debido a sus modelos de datos flexibles, su baja latencia y su diseño específico para las aplicaciones. Por último, las fuentes de datos en la nube son ubicuas, ya que los sistemas ERP y CRM en la nube se convirtieron en las opciones preferidas para la administración de procesos de negocios, y el modelo de consumo de “pago por uso” cada vez resulta más popular para el almacenamiento en la nube y el procesamiento de datos. Con back-ends tan diversos y flexibles, el usuario necesita una herramienta de front-end como Tableau para obtener la flexibilidad necesaria para conectarse a diferentes plataformas de big data, fuentes de datos en la nube y bases de datos relacionales, y disponer así de las capacidades necesarias para analizar sus datos.

¿Desea seguir leyendo? Descargue el resto del informe.

Continuar leyendo...

También podría interesarle...