Esta es la última publicación de una serie de tres publicaciones acerca de las extracciones de datos de Tableau (TDE). En la primera publicación, analizamos cómo Tableau crea y usa las extracciones de datos. En la segunda, vimos por qué es conveniente usar TDE y algunas aplicaciones específicas de muestra. En esta última publicación, consideraremos consejos, técnicas y prácticas recomendadas.

¡Extracciones de datos!

Algunos conceptos generales para tener en cuenta:

  • Si oculta campos en Tableau después de crear una extracción y antes de hacer una actualización completa o incremental, los campos seguirán estando ocultos, pero no se eliminarán de la extracción. Los campos ocultos pueden mostrarse en cualquier momento.
  • Tableau Desktop usa la ubicación designada por la variable de entorno %TEMP% del sistema para todos los archivos temporales que se usan en el proceso de creación de extracciones. Tableau Server usa la carpeta :\ProgramData\Tableau\Tableau Server\data\tabsvc\temp.
  • Las extracciones de datos de Tableau intentan mantener la distinción de mayúsculas y minúsculas de la fuente de datos. Por ejemplo, las comparaciones de cadenas, por definición, no distinguen entre mayúsculas y minúsculas en SQL Server, pero lo hacen en Oracle. Las extracciones basadas en esas fuentes de datos tendrán la misma capacidad o incapacidad de distinguir mayúsculas y minúsculas en las comparaciones de cadenas.
  • Un usuario con permiso para programar una actualización de extracción puede cambiar el tipo de actualización de incremental a completa. Para evitar que los usuarios programen actualizaciones de extracciones completas en horario laboral, asegúrese de configurar sus programaciones adecuadamente.
  • Una extracción de Tableau escrita en un área contigua de espacio libre rendirá mejor que una escrita en fragmentos en distintas partes del disco duro. Defragmentar regularmente un disco duro de Tableau Server o usar unidades SSD son dos maneras de garantizar que los archivos de extracciones posean tanta continuidad como sea posible.
  • A partir de la versión 8.1, la API del motor de datos de Tableau se puede usar para crear tanto extracciones completas como incrementales.
  • En un entorno de Tableau Server, es importante asegurarse de que el componente de segundo plano tenga suficiente espacio en disco para almacenar las extracciones de Tableau existentes, así como para actualizarlas y crear nuevas. Una buena regla general es que el tamaño del disco disponible para el componente de segundo plano debe ser entre dos y tres veces superior al tamaño de las extracciones que se espera almacenar en él.
  • Tabcmd (una utilidad de línea de comando) se puede usar para actualizar extracciones, así como para publicar TDE en Tableau Server.

Consejos para actualizaciones incrementales

  • Las extracciones incrementales solo recuperan registros nuevos de la fuente de datos, lo que reduce la cantidad de tiempo requerido para crear una extracción actualizada. Si no hay registros nuevos para agregar durante una extracción incremental, la mayoría de los procesos asociados con la realización de una extracción incremental aún se ejecutan. Las extracciones incrementales rinden menos con el correr del tiempo. Esto sucede porque, por definición, las extracciones incrementales solo crecen en tamaño, y, como resultado, las cantidades de áreas de memoria y datos a los que se debe acceder para satisfacer las solicitudes también crecen. Además, los archivos grandes tienen más probabilidades de ser fragmentados en un disco que los archivos pequeños.
  • Cuando se hacen extracciones incrementales, los registros no se reemplazan. Por lo tanto, usar una columna de fecha, como “Última actualización”, para realizar una actualización incremental podría generar filas duplicadas en la extracción.
  • Cuando se hace una actualización incremental basada en una fuente de datos de Excel, solo las columnas de fecha están disponibles para definir filas nuevas. Esto se debe a que Excel no está fuertemente tipado, y Tableau no sabe con seguridad si una columna que contiene números, contiene solo enteros.
  • Las actualizaciones incrementales no se pueden realizar después de adjuntar un archivo adicional a una fuente de datos basada en archivos porque, en esa instancia, la extracción tiene múltiples fuentes.
  • Cuando se publica una extracción que no se actualizará o no debe actualizarse, conéctese directamente al archivo de extracción como fuente de datos antes de hacer la publicación.

Consejos para extracciones agregadas

  • Sea cuidadoso con las agregaciones como CNTD u otras agregaciones no aditivas. Para que Tableau pueda recalcular un conteo definido, este debe incluir todos los miembros únicos del campo base en la extracción. Por ejemplo, si una extracción agregada incluye CNTD(ID del cliente), la cláusula “agrupar por” de la consulta SQL usada para recuperar datos de la fuente subyacente incluiría ID del cliente.
  • Sea cuidadoso con los cálculos de nivel de filas que involucren parámetros. Como el valor de los parámetros puede cambiar, Tableau incluye todos los campos usados en cálculos de nivel de filas en el nivel de detalle de la extracción.
  • “Número de registros” es especial en extracciones agregadas. Su agregación predeterminada es SUMA. Si usa Número de registros después de crear una extracción agregada, se mostrará el número de registros de la fuente de datos subyacente, es decir, el número de registros original. Esto resulta muy útil para muchos tipos de cálculos secundarios que pueden depender del conocimiento de las filas originales de la fuente subyacente. Para saber cuántas filas hay en la extracción, simplemente cambie la agregación predeterminada a CONTEO.

Consideraciones de fuentes de datos

  • Cuando extraiga datos de SAP BW, tenga en cuenta que existen algunas limitaciones.
  • Cuando crea una extracción inicial de una fuente de datos de Salesforce.com, Tableau recupera todos los objetos, y la creación de la extracción puede llevar mucho tiempo, varias horas en algunos casos. Deje que la extracción inicial se complete y use actualizaciones incrementales para mantener los datos al día.


En resumen, asegúrese de tener en cuenta estas prácticas recomendadas:

  • Use actualizaciones completas siempre que sea posible.
  • Las extracciones actualizadas incrementalmente deben actualizarse completamente de manera regular (p. ej.: todos los fines de semana o cada mes) para maximizar el rendimiento.
  • Publique extracciones en Data Server para contribuir a evitar extracciones redundantes en el entorno de Tableau Server.
  • Oculte las columnas sin usar antes de crear una extracción para acelerar la creación de la extracción y preservar espacio de almacenamiento.
  • Asegúrese de contar con suficiente espacio libre contiguo en el disco para la extracción más grande que deba hacer, a fin de optimizar el rendimiento de las extracciones. Una forma de lograrlo es usar unidades SSD, ya que no se fragmentan (una función del modo en que se recuperan los datos de una SSD, no de dónde se almacenan).

Esperamos que estas publicaciones lo hayan ayudado a comprender mejor las TDE y, como resultado, a usarlas de manera más eficaz. Muchas gracias a Marc Rueter, Russell Christopher y David Spezia de Tableau por sus valiosas contribuciones a esta serie de publicaciones.

¡Felices visualizaciones!

También podría interesarle...

Comentarios

Cuantos millones de registros soporta tableau ?

Buenos días

Quisiera saber si existe la forma para resolver lo siguiente:

Tengo mi conexión de tableau a un servidor de oracle sobre una tabla de dicho servidor, esa tabla se actualiza todos los días con registros nuevos, tengo el problema que esos registros no se reflejan en mi reporte en tableau si yo no actualizo primero la conexión de datos del archivo y vuelvo a publicar todo, existe alguna forma para que mis datos se actualicen automáticamente en el servidor sin que tenga que estar actualizando la conexión y volviendo a publicar?

Muchas gracias por su atención, Quedo atento a sus comentarios,

Saludos


Agregar nuevo comentario