Innovación tras innovación

En 2003, Tableau surgió en la Stanford University con VizQL™, una tecnología que cambió por completo la manera de trabajar con datos al permitir funciones “arrastrar y soltar” simples para la creación de visualizaciones sofisticadas. La innovación fundamental es un lenguaje de consulta patentado que traduce sus acciones a una consulta de base de datos y que luego expresa la respuesta de manera gráfica. La siguiente innovación es la capacidad de realizar un análisis ad hoc de millones de filas de datos en segundos gracias al motor de datos de Tableau. El motor de datos es una base de datos de análisis de alto rendimiento en memoria en su PC. Tiene los beneficios de la velocidad de las soluciones en memoria tradicionales sin las limitaciones de que sus datos deben caber en la memoria. Y siguiendo con la tradición que Tableau tiene de crear herramientas poderosas accesibles a todos, no se requiere cifrado personalizado para utilizar el motor de datos.

VizQL™

Visual por naturaleza, y por ello más rápido.

En el núcleo de Tableau se encuentra una tecnología patentada con la cual la visualización interactiva de datos se convierte en una parte esencial de la comprensión de datos. Una herramienta de análisis tradicional requiere que analice datos en filas y columnas, que elija un subconjunto de datos a presentar, que organice esos datos en una tabla y luego, que cree un gráfico de la misma. VizQL evita todos esos pasos y crea una representación visual de sus datos al instante, brindándole comentarios visuales mientras realiza el análisis. Como resultado, logra una comprensión mucho más profunda de sus datos y puede trabajar mucho más rápido que con los métodos convencionales, a una velocidad hasta 100 veces mayor.
VizQL permite un amplio rango de visualización

Un nuevo lenguaje para datos implica que puede incluir mucho más contenido en sus relatos.

Esta arquitectura básicamente nueva hace por las interacciones de datos en formato visual lo que SQL hacía por ellas en formato textual. Las instrucciones de VizQL describen una clase infinita de sofisticadas visualizaciones multidimensionales. Con VizQL, los usuarios cuentan con una herramienta de interfaz de análisis y visualización de bases de datos única para producir una amplia variedad de resúmenes gráficos. Tableau puede crear una variedad increíblemente amplia de visualizaciones, desde gráficos de barras y líneas hasta mapas y sofisticadas vistas vinculadas. Esta flexibilidad le permite comprender los datos de una manera totalmente nueva. Le permite hallar información que se perdería si tuviera que comprimir sus datos en plantillas de gráficos rígidas.

Admite patrones naturales de pensamiento.

El pensamiento es por naturaleza un patrón de cuestionamiento y respuesta que progresa e incluye nueva información de manera incremental. En pocas ocasiones se sabe con exactitud la dirección que se toma al iniciar un análisis. Sin embargo, eso es lo que exigen las herramientas de inteligencia de negocios tradicionales. Existe una alternativa: VizQL le permite explorar sus datos visualmente y hallar la mejor representación para ellos. Se aprende a medida que se avanza, se agregan más datos si es necesario y finalmente se obtienen conocimientos más profundos. Denominamos a esto “ciclo del análisis visual”. Una vez que completa este ciclo, puede comunicar una historia mucho mejor acerca de sus datos.

No existe en ninguna otra parte del mundo.

Gracias a VizQL, el análisis y la visualización rápidos son una realidad. Los usuarios con poca capacitación o sin ella pueden ver y comprender datos con mayor rapidez que nunca y de maneras nunca vistas. Y esa es la mayor diferencia de todas.

El motor de datos

Diseñado para superar las limitaciones

El motor de datos es una innovadora base de datos de análisis diseñada para superar las limitaciones de las bases y los silos de datos existentes, y para respaldar verdaderamente el proceso de análisis visual. Está diseñado para reflejar las capacidades del hardware más modernas y la jerarquía de memoria completa del caché de discos al caché L1. El motor de datos de Tableau hace que las grandes cantidades de datos y el análisis rápido se acerquen.
El motor de datos: análisis de datos inmensos

La evolución de los datos en grandes cantidades

Las bases de datos han evolucionado sustancialmente durante los últimos años. Las bases de datos heredadas se centran en los datos alojados en discos y los cómputos previos. Aunque eso hacía posible una potencia de cómputo mayor que la de antes, tenía la desventaja de ser lenta, lo que exigió que los usuarios supieran las preguntas que desearían responder (su carga de trabajo de consulta) antes de crear la base de datos. Las bases de datos más recientes han hecho posibles beneficios de rendimiento al emplear simplemente los niveles superiores de la jerarquía de memoria demandar que todos los datos se alojen en la memoria. Estas soluciones “en memoria” hicieron mucho más rápido el cómputo, aunque a expensas de subordinar el tamaño de los datos al tamaño de memoria disponible.

Objetivos del motor de datos de Tableau

Diseñamos el motor de datos para:
  1. Utilizar por completo hardware de la generación actual para lograr una respuesta de consultas instantánea en cientos de millones de filas de datos en hardware comercial, como las computadoras portátiles corporativas
  2. Respaldar consultas ad hoc verdaderas a través de un rendimiento de consulta predecible y uniforme para todas las consultas, y sin exigencia de cargas de trabajo de consulta o cómputo previo de agregados o resúmenes
  3. Obtener una integración perfecta con almacenes de datos corporativos e infraestructuras existentes
  4. No lidiar con la limitación del requisito de cargar un conjunto de datos completo de modo que quede alojado en la memoria para alcanzar sus objetivos de rendimiento
  5. Proporcionar cargas y conexiones con fuentes de datos que sean muy rápidas.

Diseño que tiene en cuenta la arquitectura

La estructura del motor de datos central es una representación basada en columnas que emplea compresión y admite la ejecución de consultas sin descompresión. Aprovechando enfoques novedosos de gráficos por computador, los algoritmos fueron diseñados cuidadosamente para permitir la utilización total de procesadores modernos que hacen un uso casi óptimo de los cachés L1 y L2, resultados intermedios mínimos y técnicas innovadoras para administrar la transmisión de datos de los discos a fin de evitar la limitación común del requisito de cargar por completo un conjunto de datos en la memoria para que la ejecución del análisis pueda ser alojada.

Del motor de datos a la conexión en tiempo real, y de vuelta

El motor de datos está diseñado para integrarse de manera directa con la tecnología de “conexión en tiempo real” existente de Tableau, lo que permite a los usuarios realizar alternaciones con un clic entre una conexión directa a la base de datos corporativa (emitiendo consultas de SQL altamente optimizadas y específicas de plataformas) y la consulta de un extracto de dichos datos cargados en el motor de datos (y de vuelta) con conciliación detallada de semántica de cálculos e intercalación. Esta integración permite a las empresas realizar análisis de muestras de datos (GB) y redirigir esto hacia un almacén paralelo enorme como Teradata para ejecutar los análisis (o los registros) finales en petabytes.

Consultas ad hoc verdaderas

El motor de datos fue diseñado con un lenguaje de consulta y un optimizador de consultas pensados para admitir las consultas típicas del análisis de negocios sobre la marcha. Al trabajar con datos a la velocidad del pensamiento, es común la necesidad de ejecutar consultas complejas, como las que involucran filtros multidimensionales muy grandes o simultaneidad. Las bases de datos existentes generalmente tienen un rendimiento deficiente en estos tipos de consultas, mientras que el motor de datos las procesa al instante.

Modelo de datos flexible

Una de las diferencias claves del motor de datos en comparación con otras soluciones en memoria es que podemos trabajar con los datos de manera directa tal como están representados en la base de datos del disco. Por lo tanto, no se deben realizar tareas de modelado ni de cifrado para utilizar el motor de datos. Uno de los tan poderosos aspectos del motor de datos es que puede definir, al igual que con cualquier otra base de datos relacional, nuevas columnas calculadas o bien concebir un modelado de datos ad hoc en cualquier momento.

Carga de instancias y tiempo de conexión

Lo que hace único al motor de datos es que una vez que sus datos están cargados en el motor de datos, su inicio es muy rápido. Solo hace falta que realicemos una lectura de los datos que están en contacto con nuestras consultas. Es posible que tenga en la base de datos muchísimos datos que no tengan relevancia para un análisis en particular; nunca deberá esperar a que el motor de datos los lea.