Avances de Tableau 9.0: Manténgase en el flujo del análisis con la preparación automática de datos

El análisis no es solo para datos de gran belleza. Tableau 9.0, actualmente en su versión beta, automatiza la limpieza de los datos desorganizados, en especial de los que provienen de hojas de cálculo de Excel. Esto incluye la identificación automática de la estructura de un archivo Excel realizada por el Intérprete de datos de Tableau, las nuevas herramientas que permiten dinamizar y dividir los datos, y un nuevo diseño que permite trabajar con metadatos. Junto con el Modelado automático de datos, que se lanzó en la versión 8.2, estas nuevas características lo ayudan a preparar rápidamente sus datos para el análisis.

El primer paso para utilizar Tableau, antes de que pueda responder rápidamente a preguntas o utilizar todo el poder del análisis, y antes de que pueda compartir sus valiosos descubrimientos con usuarios web o móviles, consiste en conectarse a los datos.

Como muchos de ustedes saben, el análisis no es solo para los datos de gran belleza. Muchas personas utilizan con frecuencia herramientas y scripts especializados para preparar sus datos para Tableau o dedican tiempo a escribir cálculos complejos para corregir los problemas en los datos.

Tableau 9.0 automatiza considerablemente este monótono trabajo de limpiar los datos desorganizados, en especial los que provienen de las hojas de cálculo de Excel. Las mejoras incluyen el Intérprete de datos de Tableau, que identifica automáticamente la estructura de un archivo Excel, las nuevas herramientas que permiten dinamizar y dividir los datos, y un nuevo diseño que permite trabajar con metadatos. Junto con el Modelado automático de datos, que se lanzó en la versión 8.2, estas nuevas características lo ayudan a preparar rápidamente sus datos para el análisis.

La filosofía de Tableau respecto a la preparación de datos es permitirle a cualquiera, y en cualquier momento, realizar cambios fundamentales en su conexión de datos. Esto significa que las funcionalidades deben contar con cuatro atributos clave para proporcionarle este poder:

  • Inteligencia: se deben aplicar automáticamente y deben tener un entendimiento profundo de los datos.
  • Velocidad: deben funcionar casi en tiempo real, incluso con macrodatos.
  • Repetibilidad: deben permitir cambios en los datos subyacentes, como valores, filas y columnas nuevos.
  • Flexibilidad: deben permitirle realizar cambios importantes en cualquier momento, conservando al mismo tiempo su trabajo.

Como parte de Tableau 9.0, planeamos lanzar un gran número de funcionalidades nuevas que harán que esto sea posible. Veamos todo esto con más detalle:

Intérprete de datos de Tableau
¿Tiene archivos Excel que se parezcan a este?

Tableau detecta automáticamente la ubicación (los valores de datos comienzan en la celda B8) y la estructura de los datos (p. ej., hay encabezados compuestos que aparecen a lo largo de la hoja) para convertirlos en datos listos para el análisis.

Dinamización
Muchos archivos de texto y Excel tienen nombres de columnas que son en realidad valores de datos útiles. Por ejemplo, estos datos tienen años y meses como nombres de campos.

Para lograr una mejor experiencia de análisis, estos datos deberían tener una columna con el nombre "Fecha" y otra con el valor de datos, en vez de docenas de columnas de fechas. En otras palabras, debemos dinamizar parte del conjunto de datos. Simplemente seleccione las columnas de interés y elija la opción "Tabla dinámica" para obtener lo siguiente:

División
Hay muchas columnas que contienen información compuesta, como números telefónicos (código de área), direcciones de correo electrónico, direcciones URL y muchas otras construcciones que pueden ser únicas para sus datos. Con la opción "División", Tableau tomará automáticamente una muestra de los datos, detectará los diferentes delimitadores y creará nuevas columnas para usted. Hay una columna que combina código postal y ubicación. Un valor de datos tiene este aspecto: 90001 (33.973271508000494, -118.24896959899968). Piense en los extravagantes cálculos de cadena que debería escribir para analizar las tres partes.

Regex (la capacidad de utilizar expresiones habituales) es una mejora y Tableau también cuenta con ella ahora. Sin embargo, la escritura de regex aquí es todavía algo inaccesible para muchos. En su lugar, haga clic con el botón secundario, elija "División" y obtendrá lo siguiente:

Sin mensajes ni opciones, solo tres columnas bien organizadas. Si la división automática no puede encontrarle una estructura a su campo, le solicitará que proporcione un delimitador (generalmente, una coma, un espacio o algún otro carácter) y siempre podrá cambiar el cálculo resultante con una simple función SPLIT(). Esas son las tres maneras nuevas para dividir fácilmente una columna en solo las partes que necesita.

Cuadrícula de metadatos
Cuando prepara los datos para el análisis, en algunas ocasiones, una lista de campos es más útil que una vista previa de los datos, por lo que agregamos una vista de "Metadatos" de su conexión.

Esta vista permite ver más información acerca de los campos de un solo vistazo, cambiarles el nombre rápidamente y realizar operaciones masivas en una selección de campos. ¿Desea ocultar un conjunto de campos? Es muy sencillo. Selecciónelos y elija "Ocultar".

Lo mejor de todas estas características es que no necesitan aplicarse en un orden especial. De hecho, en cualquier momento de su análisis, puede hacer clic en la nueva pestaña "Datos" y realizar cambios en su conexión. Agregue tablas, modifique uniones, cambie los nombres de los campos, realice cualquiera de estas nuevas operaciones, etc. Vuelva a su análisis y vea el impacto de sus cambios inmediatamente. Esta capacidad de mantenerse en el flujo del análisis no tiene precedentes.

Por supuesto, toda esta preparación de datos es el paso preliminar de la parte realmente divertida: generar análisis visuales bellos y útiles. Tal vez sea la única persona que sepa qué se hizo para limpiar sus datos, pero cualquiera que interactúe con su visualización final podrá disfrutar del resultado.