Taller práctico de Tableau para la iniciativa #yosigopublicando

Los materiales usados en el taller están accesibles aquí

Tableau, para los que no lo conozcan, es un software específicamente construido para facilitar el diseño y publicación de visualizaciones de datos, que llevo usando desde hace ya unos añitos (aunque no tanto como me gustaría). Si eres académico te interesa especialmente porque Tableau te permite usarlo de manera gratuita. Esta entrada es un resumen y recopilación del taller práctico de visualización de datos con Tableau que impartí el pasado 20 de mayo, dentro de la iniciativa #yosigopublicando de la Universidad de Granada.

¿Qué es Tableau?

Tableau, como decimos, es un software, basado en las tablas dinámicas de Excel, que está preparado para analizar y visualizar grandes cantidades de datos. Y es que los seres humanos no estamos hechos para leer tablas, nos cuesta leer números, son conceptos abstractos que necesitan de cierta descodificación y, por tanto, es un proceso mentalmente costoso. Como animales visuales, preferimos las imágenes para procesar información, nos resulta intuitivamente más sencillo. Sin embargo, las visualizaciones de datos no son el final del camino, cuando decidimos mostrar la información recopilada en una imagen, sino que también son un camino de exploración de datos, un medio para conseguir insights, visiones, intuiciones, revelaciones, percepciones, de la información contenida en los datos para transformarla en conocimiento. Por tanto, las visualizaciones de datos son una herramienta de exposición, pero también de exploración.

Para hacerse una idea de su potencial, basta con descargarlo y empezar a usarlo con una base de datos sencilla, preferiblemente en formato Excel. A partir de este ejemplo, se pueden construir, mediante unos pocos clics y como puede verse en el vídeo, mapas, tablas, gráficos de barras y líneas (los más usuales) y personalizarlos completamente mediante colores y tamaños para empezar a conseguir esos insights de manea rápida y fácil.

Una de las fortalezas de Tableau es que permite conectar los datos a la herramienta desde múltiples fuentes, ya sean locales (en forma de archivos de varios formatos, como xls o csv) o desde servidores web, propios o ajenos, pues permite, a través de aplicaciones directas, conectar con bases de datos directamente, como este ejemplo en data.world, cuyo conector web permite una actualización directa y automática de los datos.

El espacio de trabajo de Tableau es sencillo y a la vez complejo. Para los menos iniciados en el fabuloso mundo de las #dataviz, con un par de clics tenemos suficiente para conseguir una visualización de datos simple pero efectiva. Para ello hay tres columnas principales, como puede verse en la imagen.

Una primera columna con las variables y posibles análisis que podemos realizar sobre ellas. Una segunda la mayoría de opciones disponibles para personalizar el gráfico a gusto del diseñador. Y una tercera donde está la propia visualización de datos con su aspecto final, con las variables que hemos escogido visualizar.

Se distinguen dos tipos de variables: las dimensiones y las medidas. Puede parecer que las medidas son las variables cuantitativas (numéricas, cuantificaciones, aquello medible mediante números) y las dimensiones son las que conocemos como variables cualitativas, categóricas, cuyo número, más que medida cuantitativa, implica orden o categoría (nominales y ordinales). Pero en realidad, un dato puede ser cualquiera de las dos cosas. Podemos pasar a dimensión cualquier variable de medida y al revés. Una forma de verlo es pensar que las dimensiones son las variables independientes y las medidas, las dependientes.

Por otro lado, tenemos tres tipos diferentes de visualizaciones: las hojas, que serían visualizaciones únicas; los escritorios o «dashboards», que serían combinaciones de diferentes visualizaciones de datos, conectadas o no entre sí; y las historias, que se construyen mediante combinaciones de escritorios y visualizaciones para contar una historia a partir de los datos y las visualizaciones que hemos diseñado, y a las que podemos añadir más elementos de diseño para su publicación web.

Jugando con las variables, en función del tipo de cada una (se pueden definir el tipo como número, entero o decimal, cadena o texto, y fecha; en cualquiera de estos casos se puede definir también como variable con función geográfica, ya sean latitud, longitud, provincia, país…), colocándolas en el apartado de filas y columnas (eje X y eje Y) podemos ir creando diferentes tipos de visualizaciones básicas. De hecho, Tableau reconoce y aconseja qué tipo de visualización es la más aconsejable para ello. Por ejemplo, si detecta que lo primero que introducimos son variables geográficas, automáticamente comenzará un mapa. A partir de ellos, podemos elegir entre hacer tablas simples, de resaltado o mapas de calor, mapas normales o de coropletas, gráficos de sectores (cuidado con ellos, usar sólo si es imprescindible, o sea, nunca), de barras, horizontales, apiladas o paralelas, treemaps, de puntos, de líneas (simples o dobles), de áreas, dobles (dos tipos de gráfico, por ejemplo, líneas y barras, a la vez), de dispersión, histograma, de bigotes y cajas, de Gantt, de balas, de burbujas agrupadas…

En cada uno de ellos, es posible configurar y personalizar cada detalle de la visualización: desde el color a los detalles mostrados, así como las etiquetas (formateables también según sean de moneda, unidades, etc.), títulos, ejes y, especialmente, la descripción emergente que aparece cuando señalamos un punto o área concreta con el ratón. Es destacable la diversidad de colores, paletas y gradaciones de colores disponibles, configuradas para su uso directo, pero también la posibilidad de definir las nuestras propias, que se aplican a todo el dataset y las variables que estemos usando.

En un próximo post desglosaré algunas de las principales fortalezas de Tableau, como:

  • La posibilidad de crear nuevas variables como campos calculados.
  • Realizar análisis complejos como la detección de clústeres.
  • Las distintas formas de establecer granularidad en variables espaciales y temporales definiendo jerarquías
  • La importancia de los filtros, no sólo para visualizar datos, sino para conectar distintas visualizaciones en las que la selección de un valor en una de ellas provoca una selección en todo el resto de visualizaciones.
  • El uso de páginas para establecer, por ejemplo, secuencialidad.
  • Las uniones y relaciones que podemos establecer entre diferentes bases de datos, para fusionarlas o solo conectarlas.
  • La herramienta específica que han creado para la limpieza y preprocesado de datos, denominada Tableau Prep.
  • El uso de acciones para ganar aún más interactividad en las visualizaciones que diseñemos.

Así que si te ha gustado este post, ¡permanece atento o suscríbete para no perderte la segunda parte!

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.