Gracias al ciclo de lanzamiento acelerado de Tableau, usted obtiene nuevas funcionalidades interesantes con más rapidez. Sin embargo, algunas de las funcionalidades más antiguas y básicas pueden caer en el olvido. La demanda de las funcionalidades estadísticas es más alta que nunca, pero Tableau es más conocido por su facilidad de uso que por su rigor analítico. Las herramientas estadísticas generan imágenes a partir de ecuaciones y cálculos complejos. Por el contrario, Tableau hace muchos de esos cálculos con una acción de arrastrar y soltar.

En esta publicación evaluamos algunas funcionalidades sencillas pero eficaces para el análisis estadístico. Además, ofrecemos recursos adicionales para que pueda sacar el máximo partido de sus datos con el análisis correcto.

Histogramas: más que un gráfico de barras

Los histogramas son herramientas eficaces para comprender grandes conjuntos de datos. Muestran la frecuencia de los datos divididos en agrupaciones de igual tamaño. Al trazar estos datos, vemos si tienen una distribución normal o desviada.

En Tableau, los histogramas se pueden crear con solo dos clics. No muchos usuarios saben que si hacen clic con el botón secundario en una medida y navegan hasta el menú Crear, pueden generar agrupaciones, parámetros, cálculos y grupos. Tableau incluso sugiere un tamaño para su agrupación.

Un ejemplo habitual de un histograma es el de la distribución de las calificaciones del examen estandarizado SAT. Las calificaciones se dividen en intervalos de 50 o 100 puntos. Las barras representan el número de estudiantes que obtuvieron una calificación correspondiente a esa agrupación. Esto reconforta a los estudiantes, que saben que una calificación de 1600 es excepcional y que la mayoría de las calificaciones son intermedias.

Valores residuales: ¿qué precisión tiene la línea de tendencia en realidad?

Un valor residual, también conocido como error, es la diferencia entre el valor observado, o real, y el valor predicho. La creación de un diagrama de valores residuales le permite determinar de manera visual la precisión de un modelo de regresión. Por supuesto, también puede evaluar los valores de R cuadrado y de P en Tableau.

En Windows, Tableau permite exportar los valores residuales de las vistas con una línea de tendencia. Desde el menú de la hoja de trabajo, navegue hasta Exportar, Datos y seleccione su archivo de datos. Los valores residuales se guardarán en un archivo de Access. Puede optar por conectarse directamente a esta nueva fuente de datos que contiene la dimensión del eje x (Order Date [Fecha de pedido] en este ejemplo) y las medidas necesarias para las predicciones y los valores residuales. Arrastre los valores residuales hasta Filas y las predicciones hasta Columnas. Después, arrastre su dimensión hasta Detalle. Cuanto más esparcidos estén los puntos en el diagrama de dispersión, más preciso será el modelo.

Desviación estándar: ¿qué dispersión tienen mis datos?

La desviación estándar es una ecuación. Probablemente, la aprendió en la escuela secundaria, pero no ha vuelto a pensar en ella desde entonces. La desviación estándar mide cuánto se alejan los datos de la media. Existen dos métodos para calcular ese valor: uno para la población, y otro para una muestra. El procedimiento es muy sencillo. Si tiene un conjunto de datos completo, use la ecuación para la población. Si tiene una muestra de un conjunto de datos más grande, use la ecuación para muestras.

Para encontrar la desviación estándar en Tableau, solo hay que cambiar la agregación de una medida. La desviación estándar poblacional y la muestral están incorporadas como opciones de agregación. En el ejemplo que aparece a continuación, la desviación estándar proporciona un contexto para la media. Las copiadoras tienen un alto valor promedio de ventas. Pero también tienen una alta desviación estándar. En el gráfico, podemos ver que se vendió un artículo muy costoso que eleva el valor de la media.

Cálculos de tablas rápidos: promedio móvil y percentil

Los cálculos de tablas son una funcionalidad muy popular de Tableau. Sin embargo, algunos de esos cálculos no son tan apreciados. En particular, ese es el caso del promedio móvil y del percentil.

El promedio móvil permite excluir parte del ruido de los datos y visualizar tendencias. En Tableau, el cálculo del promedio móvil es personalizable. Puede elegir el número de puntos y las dimensiones que desea usar para el cálculo. También puede agregar otro cálculo de tabla al promedio móvil (por ejemplo, la diferencia de porcentaje desde cierto valor).

La palabra “percentil” puede traerle recuerdos de cuando su pediatra le dijo que se encontraba en el percentil 90 de altura de su grupo etario. Pero puede ser un elemento útil para comparar marcas (o agregaciones) con la distribución general. No se limite a observar los números (por ejemplo, de Sales [Ventas]). El cálculo del percentil clasifica la ubicación de las marcas en la distribución.

Cálculos de tablas no tan rápidos: cálculos de ventana y de referencia

Al principio, las funciones del tipo LOOKUP(), PREVIOUS_VALUE() y FIRST() pueden ser intimidatorias. Probablemente, las vio en un cálculo que copió de alguna publicación del blog de Tableau o al usar un cálculo de tabla rápido. LOOKUP() es la base de muchos cálculos, como la diferencia de porcentaje.

La función le permite hacer referencia a otros valores de la partición con la compensación que especifique (o incluir dinamismo con un parámetro). La mayoría de los cálculos directos del cambio porcentual pueden hacerse con los cálculos de tablas rápidos. Sin embargo, LOOKUP() es muy útil para comprender cómo trabajan las funciones subyacentes. Después, puede incluirlas en cálculos más complejos, como las declaraciones lógicas y los cálculos de fechas.

Los cálculos de ventana son magníficos para resumir los datos de una vista. Permiten añadir una agregación a una medida ya agregada. Por ejemplo, WINDOW_AVG(SUM([Sales])) dará como resultado la media de cada suma de ventas en la vista. Ese es el mismo valor que se obtiene cuando se agrega una línea de promedio. Los cálculos de ventana son ideales para los casos en que se debe hacer referencia a un valor que resume el conjunto de datos más grande. En el ejemplo que aparece a continuación, el valor de Z se calcula con WINDOW_AVG y WINDOW_STDEV. La expresión calcula la distancia en desviaciones estándar (de los datos en la ventana) entre una observación y la media.

Adicional: integración de R y Python

¿Desea llevar su análisis estadístico a otro nivel? Conéctese a un servidor de R o instale TabPy. Así, podrá escribir scripts en campos calculados de R o Python. Para obtener más información sobre estas funcionalidades, consulte nuestro informe Análisis avanzado con Tableau.

¿Está listo para hacer análisis más avanzados?

Creemos que, a fin de ayudar a ver y comprender los datos, debemos ofrecer funcionalidades eficaces para los usuarios de todos los niveles. Desde sencillas métricas esenciales hasta técnicas de análisis avanzado, Tableau proporciona un flexible front-end para la exploración de datos con la profundidad analítica necesaria para el científico. Mediante el uso de cálculos sofisticados, la integración de R y Python, el rápido análisis de cohortes y las funcionalidades predictivas, los científicos de datos pueden hacer análisis cuantitativos complejos en Tableau. También pueden compartir los resultados visuales para facilitar la comprensión y promover la colaboración a partir de los datos.

Únase a la conversación con #HardcoreAnalytics y eche un vistazo a estos recursos para profundizar aún más:

También podría interesarle...

Agregar nuevo comentario

Suscribirse a nuestro blog