Cómo consolidar la confianza en los datos con el servidor de datos de Tableau

¿No sabe cómo comenzar a usar Tableau Server? Lorena Vasquez, Zen Master de Tableau, analiza cómo consolidar la confianza en los datos con Tableau Server.

Hoy invitamos a Lorena Vazquez, ingeniera sénior de software en Cboe Global Markets, a escribir esta publicación de blog. Lorena es parte del equipo de inteligencia de negocios e ingeniería para la generación de informes. Además, es administradora de Tableau Server.

Administrador: “Alguien de finanzas me envió por correo electrónico estos resultados de los ingresos, pero no coinciden con los resultados que usted presentó en la revisión empresarial trimestral. ¿De dónde extrajo los resultados que presentó? ¿Por qué son diferentes?”

Analista: “Obtuve los resultados de una hoja de cálculo creada a partir de un informe desarrollado por el departamento de TI. No estoy al tanto del origen de los resultados enviados por el departamento de finanzas. Sin embargo, los resultados que presenté son correctos”.

Administrador: “Debemos descubrir qué pasó”.

Todos, alguna vez, tuvimos esta conversación. Así sea como administrador, analista o TI. ¿Cómo podemos generar una confianza en los datos compartida entre todos los departamentos y las funciones ? En mi caso, la solución fue el servidor de datos de Tableau.

Ahora bien, ¿qué es el servidor de datos? El servidor de datos es un componente de Tableau Server que permite publicar, compartir y actualizar las fuentes de datos en un sitio de Tableau Server. En mi experiencia, mediante el uso del servidor de datos de Tableau es posible generar confianza en los datos y mucho más.

  1. El servidor de datos de Tableau proporciona fuentes de datos publicadas y certificadas. Esto elimina el riesgo de que los datos clave, como la información acerca de los ingresos, sean ambiguos.
  2. Además, las fuentes de datos se pueden actualizar según un programa. Ya no es necesario preocuparse por actualizar manualmente las fuentes de datos o publicarlas nuevamente después de una actualización. Siempre tendrá disponible la información más reciente. Quédese tranquilo. Si ocurre un error durante un proceso relacionado con las fuentes de datos, recibirá una notificación.
  3. Lo que es más importante, el servidor de datos de Tableau ofrece un conjunto de dimensiones, medidas y cálculos definidos, documentados y reutilizables para futuros análisis y dashboards.
  4. A mi modo de ver, el servidor de datos de Tableau tiene un beneficio adicional: reduce el impacto de los sistemas de base de datos de producción. Las extracciones de datos reducen las consultas en tiempo real a los sistemas de base de datos de producción. Esto implica una mayor tranquilidad para el departamento de TI.

¿Por dónde comencé?

En primer lugar, comencé con una fuente de datos. Si bien es posible programar una actualización de la fuente de datos para agregar nuevos datos, el servidor de datos también es útil para las fuentes de datos estáticas. Un ejemplo de los casos de uso de los datos estáticos son los conjuntos de datos históricos. Estos nunca se modifican o existen independientemente del dominio de la base de datos. Las fuentes de datos estáticas son las más simples, ya que nos permiten generar una extracción de Tableau y publicarla directamente en Tableau Server.

Para actualizar las fuentes de datos, debíamos asegurarnos de que todo estuviera en su lugar antes de publicarlas en Tableau Server. Cuando recién comenzamos, nos encontramos con algunos problemas que voy a mencionar más adelante. Sin embargo, esto nos permitió crear un proceso de desarrollo para las nuevas fuentes de datos.

Sin importar qué fuente de datos se va a utilizar, es necesario asegurarse de que Tableau Server tenga acceso a esa fuente. Si es un servidor de base de datos, verifique que Tableau Server se pueda conectar a la base de datos. Revise la dirección IP y el puerto. Como yo misma era administradora de Tableau Server, pude comprobar que la conectividad funcionaba. Luego, me puse en contacto con el equipo de administración de bases de datos a fin de garantizar que tenía la autenticación correcta para Tableau. El primer problema al que nos enfrentamos estaba relacionado con la conectividad a una fuente de datos. Publicamos la fuente de datos y programamos una actualización. Durante este proceso, se produjo un error de actualización, ya que el servidor no pudo establecer la conexión a la fuente de datos. Para resolver este inconveniente, nos pusimos en contacto con el equipo de administradores de bases de datos. Ellos confirmaron que el servidor de base de datos estaba rechazando la solicitud de conexión. Se habilitó el acceso de Tableau Server a la base de datos y, gracias a esto, se mejoró el flujo de trabajo.

A continuación, se debe comprobar que los controladores de bases de datos estén instalados en Tableau Server. No tiene que preocuparse de mantener diferentes versiones de los controladores de bases de datos, ya que el servidor solo cuenta con uno. Los días en los que el equipo de soporte debía instalar controladores de bases de datos en el equipo de cada usuario para permitir el acceso a las bases de datos son cosa del pasado. Una vez que la fuente de datos está publicada, tan solo indíqueles a los usuarios cuál es la fuente de datos a la que se deben conectar y ellos podrán hacerlo a través de Tableau Server. Como administradora de Tableau Server, tengo control sobre las fuentes de datos y los controladores que se utilizan. Esto me permite comprobar que las versiones sean las correctas y que sean compatibles con Tableau Server. Asegúrese de que los controladores adecuados estén instalados en los equipos de los usuarios de Tableau Desktop. Para hacerlo, nosotros mantenemos una lista de los controladores de bases de datos que usamos y la compartimos con el equipo de soporte técnico del departamento de TI.

Una vez que se estableció la conectividad con la base de datos, la red o el archivo compartido, puede publicar la fuente de datos en Tableau Server. Puede parecer mucho trabajo. Sin embargo, después de configurar cada una de las fuentes de datos, descubrirá que contar con fuentes de datos certificadas y actualizadas es extremadamente valioso.

Aplicación en el mundo real

Una de las mayores preocupaciones, incluso para mí, de que todos los miembros de la organización tengan acceso a los datos, es que surja la "TI indirecta". Cada uno tiene su propia copia de los datos o usa diferente terminología para las mismas dimensiones o medidas. De repente, toda la situación se transforma en una pesadilla de la gobernanza de datos. El servidor de datos de Tableau soluciona todos estos problemas y ofrece tranquilidad. Al menos en mi experiencia.
Analicemos cómo el servidor de datos de Tableau ofrece gobernanza de datos, incluso para la calidad de los datos.

Gobernanza de datos

Volvamos a la conversación desde el principio. ¿Cómo el servidor de datos de Tableau puede modificar la conversación entre el administrador y el analista, ahora que saben que es posible tener conjuntos de datos actualizados y certificados?

Analista: “Trabajé con el equipo para conseguir que los datos estén disponibles en Tableau Server. Ya no hace falta preocuparse acerca de los datos obsoletos. Estos se actualizan cada día. Incluso algo mejor, el departamento de finanzas ya no usa las hojas de cálculo manuales. Ahora, todos obtenemos la información de la misma fuente”.

Administrador: “Entonces, ¿esto quiere decir que ya no obtendremos resultados diferentes? Eso es fantástico”.

Publicar las fuentes de datos en Tableau Server proporciona información coherente a todos los usuarios que acceden a los conjuntos de datos. Además, actualiza, define y describe las dimensiones y las medidas, y las pone a disposición de todos. Tableau Server incluso permite identificar fuentes de datos como certificadas. Cuando no se llevan a cabo estas tareas, se generan los problemas con las fuentes de datos publicadas. Si publica una fuente de datos sin una descripción, usa nombres al azar o absurdos para las medidas y las dimensiones o no cuenta con un proceso establecido para el flujo de trabajo de datos, es posible que se genere confusión y desconfianza en los datos. En resumen, la pesadilla de todo administrador de datos. Una pesadilla que me tocó experimentar de primera mano. Incluimos fuentes de datos publicadas sin ninguna descripción. Esto generó mucha confusión entre los usuarios finales.

¿Cómo lo solucionamos? Diseñamos un flujo de trabajo para crear fuentes de datos en Tableau Server. Este puede ser tan detallado como lo desee. Sin embargo, en mi experiencia, al menos debe cumplir con los siguientes requisitos:

  1. Se deben definir las dimensiones y las medidas en el lenguaje de negocios de la empresa.
  2. Se deben determinar nombres adecuados para los cálculos e incluir todos los comentarios necesarios. No es recomendable contar con un cálculo denominado “total” y otro “total del total”.
  3. Las dimensiones deben incluir una descripción, si el nombre no es suficientemente explicativo. Es posible integrar la fuente de datos de una aplicación anterior, como un formulario de un sitio web o de una solicitud.
  4. Una vez que se hayan completado estos pasos, se deben certificar las fuentes de datos. Esto permitirá que los usuarios puedan identificar qué datos son confiables.

Debe trabajar con el equipo y el centro de excelencia para definir qué significa este flujo de trabajo para el grupo. Lleva algo de tiempo integrarlo, pero resulta extremadamente útil para comprender completamente los datos en Tableau Server.

Calidad de los datos

La calidad de los datos forma parte de la gobernanza de datos. ¿Cómo se puede garantizar que los datos son correctos? En la conversación, el analista mencionó que ahora que los datos estaban disponibles en Tableau Server, estos se iban a actualizar cada día. El servidor de datos de Tableau permite programar las extracciones para que se completen según diferentes frecuencias, incluso cada hora.

Una desventaja potencial de programar las extracciones de las fuentes de datos son los datos faltantes. Esto ocurre cuando los datos aún no están disponibles en el momento en el que se ejecuta la extracción. Podemos llevar la validación de la calidad de los datos al siguiente nivel. Para hacerlo, es necesario crear un dashboard que realice consultas a la fuente de datos publicada y la fuente de datos original, a fin de comparar la cantidad total de registros. Además, con las alertas basadas en datos es posible recibir notificaciones si la fuente de datos no está sincronizada. Esta es una funcionalidad que uso cada día en las fuentes de datos esenciales.

Otras alternativas son la API de REST de Tableau Server y la utilidad de línea de comandos de extracción de datos de Tableau. Estas permiten que los desarrolladores puedan crear una tarea para actualizar automáticamente los datos en Tableau Server cuando se agregan datos a la fuente de datos original. En lugar de que Tableau Server obtenga los datos de la base de datos original según el programa, actualizar los datos de Tableau Server a través de esta tarea (externa al programa de Tableau Server) depende de si los datos están disponibles en la fuente de datos original antes de ejecutar el trabajo de extracción. Este enfoque funciona únicamente si tiene disponible un programa de planeamiento. Trabaje en conjunto con el equipo de desarrollo o de datos responsable de cargar los datos en la base de datos para evaluar cómo incluir esta tarea.

Apoyo

Una vez que se establecen las fuentes de datos publicadas y los procesos, es necesario compartirlos. De lo contrario, todo el esfuerzo ha sido en vano. El siguiente paso consiste en fomentar el uso de Tableau Server y las fuentes de datos publicadas en el servidor de datos. Una excelente idea es compartir las nuevas fuentes de datos en un boletín cada mes. Además, se pueden organizar sesiones de capacitación para revisar las nuevas fuentes de datos. Se puede incluir un video de procedimiento acerca de cómo usar las nuevas fuentes de datos, como un recurso muy útil. Todo depende de qué funciona en su organización. Lo más importante es que los usuarios proporcionen sus comentarios. Asegúrese de que los usuarios comprendan las dimensiones, las medidas y los casos de uso para esas fuentes de datos. Cuanto más involucre a los usuarios, más usarán Tableau Server.

Vaya más allá de los límites

Ahora que ya está más familiarizado con el servidor de datos, le recomiendo que se ponga en contacto con el centro de excelencia, el grupo de usuarios de Tableau interno o los embajadores de Tableau para obtener más información acerca de cómo sacar el máximo provecho del servidor de datos de Tableau. Evalúe los procesos actuales de su empresa y cómo los puede mejorar con el servidor de datos. Todos queremos obtener datos relevantes y valiosos. Para lograrlo, debemos asegurarnos de contar con una única fuente de veracidad.

Aprenda más en esta presentación de Slideshare acerca del servidor de datos de Tableau.