La necesidad de utilizar recursos gráficos para visualizar datos surge casi naturalmente como forma de agrupar y destacar ciertos aspectos de una información que se quiere compartir. Es en este punto cuando, fruto de un atisbo de creatividad, surge un lenguaje que mezcla abstracciones y conceptos a través de elementos visuales para hace emerger los detalles intrínsecos de la información.

Con el lenguaje aprendemos a leer y escribir como habilidades separadas pero relacionadas. De manera similar, con el lenguaje visual necesitamos aprender a entender (leer) y crear (escribir) como habilidades distintas pero relacionadas. Hay muchos libros, cursos y otros recursos que enseñan cómo desarrollar visualizaciones de datos; pero pocos que enseñan cómo leerlos y entenderlos. En este recorrido vamos a tratar de explicar el impacto contemporáneo de las visualizaciones, entendidas como composiciones artísticas, así como su utilidad y beneficios.

Frédérik Ruys, diseñó la siguiente matriz que permite decidir qué gráfico usar según la pregunta de las 5W que estés respondiendo: quién, qué, cuándo, dónde y por qué.

Partiendo de que “la forma precede a la funcionalidad”, el mejor método para visualizar se define según el tipo de preguntas que le estés haciendo a tu dataset. Fuente: Frédérik Ruys

A continuación, vamos a aplicar este mismo esquema narrativo pero tomando como referencia la teoría de la visualización de datos en sí misma y su estado del arte.

What? Qué es la visualización de datos

La visualización de datos es la exploración visual y la representación gráfica de datos de cualquier tamaño, tipo (estructurado y no estructurado) u origen. Las visualizaciones ayudan a las personas a ver cosas que antes no eran obvias. Incluso cuando los volúmenes de datos son muy grandes, los patrones se pueden detectar rápida y fácilmente, esto se conoce como visualización exploratoria. Adicionalmente, las visualizaciones transmiten información de manera universal y hacen que compartir ideas con otros sea sencillo, abarcando lo que se conoce como visualización explicativa.

El análisis exploratorio es lo que haces para familiarizarte con los datos. Puede comenzar con una hipótesis, una pregunta o, simplemente, profundizar en los datos para determinar qué podría ser interesante al respecto.

El análisis explicativo es lo que sucede cuando se tiene algo específico que desea mostrar a una audiencia; esto es,. cuando ya ha pasado por el análisis exploratorio y de esto se ha determinado que hay algo específico que desea comunicar a una audiencia determinada. En otras palabras, cuando quieres contar una historia con datos.

Teniendo en cuenta esta distinción, la imagen visual que se podría usar para los pasos exploratorios y explicativos del proceso analítico podría diferir. Tenga en cuenta cómo, cuando nos centramos en un aspecto o historia, en realidad es más difícil ver a los demás. Esa es una de las razones por las que es importante realizar un análisis exploratorio antes de llegar a la fase explicativa, para que pueda confiar en que está enfocando a su audiencia en los objetivos correctos.

Aunque las visualizaciones exploratorias y explicativas tienen objetivos ligeramente diferentes (descubrir patrones ocultos vs. comunicar ideas y mensajes en los datos), las buenas visualizaciones exploratorias explican lo que está sucediendo y las buenas visualizaciones explicativas permiten a las personas explorar las ideas.

Visualización exploratoria Vs. Visualización explicativa en #Dataviz Clic para tuitear

Why or for What? Por qué utilizarla a menudo

Pregúntate: ¿Qué quieres representar o visualizar? Podrían ser metas operacionales, ingresos, inventario, productividad, etc., pero tal vez es lo que no se está midiendo o visualizando actualmente porque simplemente a nadie se le ocurrió o porque era demasiado difícil. Otro enfoque podría ser: ¿Qué tiene de malo su actual método de presentación/visualización de información? Si hay algo que no gusta del método actual de visualización, entonces se puede concebir una alternativa: ¿Cómo se podría hacer correctamente? Y diseñar un método alternativo para hacerlo.

El objetivo de la visualización logra magnificar aspectos de la información escogida, de modo que siempre debe ser precisa y fiel a la realidad, así como dotada del contexto necesario para que logremos que lo importante se vea y destaque rápidamente.

Un informe visual bien diseñado resalta el mensaje detrás de los datos e impulsa instantáneamente a los usuarios a debatir, decidir y actuar. Ese es el verdadero poder de la visualización de datos: pasar de ver a actuar en segundos. También brinda a las personas la oportunidad de analizar y examinar grandes conjuntos de datos, que de otro modo serían difíciles de comprender.

Who? Qué roles están implicados

Profesionalmente, alrededor de las visualizaciones, se establecen varios roles o perfiles; el primero de ellos sería el diseñador de información o Data-Designer, que aborda diferentes desafíos de comunicación. Si bien el producto final de un diseñador de información debe ser atractivo y llamativo, su verdadero trabajo es conectarse intelectualmente con la emoción. Eso significa que un diseñador de información otorgará una mayor prioridad a la precisión y facilidad de consumo de datos dentro de un contexto visual estéticamente agradable. Sin embargo, los gráficos atractivos siguen siendo una parte clave de su responsabilidad. Los diseñadores de información no abandonan la idea de tener un producto final visualmente atractivo, simplemente se aseguran de que sus decisiones de presentación refuercen los datos en lugar de difuminarlos.

Un segundo rol sería el del científico de datos, un especialista que aplica su experiencia en matemáticas y estadística para crear modelos de aprendizaje automático con el fin de hacer predicciones y responder preguntas empresariales clave. Un Data-Scientist aún necesita poder limpiar, analizar y visualizar datos, al igual que un Data-Designer; sin embargo, un científico de datos tendrá más profundidad y experiencia en estas habilidades, y también podrá entrenar y optimizar modelos de aprendizaje automático.

La audiencia objetivo es, probablemente, la consideración más importante a la hora de diseñar y diseñar una visualización. Conocerla o entrevistarla es necesario para obtener la capacidad de comprender los datos de forma fácil y eficaz, logrando generar un canal de comunicación efectivo de una manera rápida y exhaustiva. Este sería el rol de Reader o consumidor de la información.

#DataDesigner #DataScientist #Reader los roles implicados en la visualización de datos #Dataviz Clic para tuitear

La tendencia actual pone de manifiesto que el mundo de la ciencia de datos está en crecimiento en los últimos años, aglutinando y especializando los distintos roles y perfiles. Lo que era un paso más en el big data, la analítica avanzada, ha pasado a ser clave en proyectos basados en datos y está generando la especialización del rol de científico de datos, diferentes especializaciones que erróneamente se dirigen todas al mismo concepto: científico de datos.

When? Cómo visualizar y analizar los datos para que pueda extraer ideas e información procesable

Una vez que se tenga en mente un propósito para la visualización, es el momento de pensar en qué tipos de análisis ayudarán a lograr ese propósito. Una de las dificultades que ralentiza el análisis es comprender qué tipos de gráficos usar y por qué. Esto se debe a que la elección de la ayuda visual incorrecta o simplemente el incumplimiento del tipo más común de visualización de datos, puede causar confusión con el espectador o llevar a una interpretación errónea de los datos.

Existen dos grandes grupos de visualizaciones de datos: las visualizaciones (gráficos, Tablas, Mapas,…) y las infografías. En esta dirección un cuadro de mando suele ser un agrupamiento de varias visualizaciones sencillas.

Una visualización de datos a menudo presenta un conjunto de datos con una edición mínima y su objetivo es hacer que los datos sean más accesibles de lo que son en su forma original. Algunas visualizaciones de datos también permiten explorar los datos en los que se basan.

Ejemplo de visualización de datos en un Dashboard

Una infografía es una colección de visualizaciones alrededor de un tema. La infografía está diseñada para contar una historia en particular a una audiencia específica. Puede incluir imágenes o información y tiene un elevado grado de diseño.

Ejemplo de infografía. Fuente: Ink Factory

En el libro Designing Data Visualizations, Noah Iliinsky y Julie Steele usan los siguientes tres criterios para determinar si se debe llamar a un gráfico una visualización de datos o una infografía:

  • Método de generación: se refiere a lo que entra en la creación del gráfico en sí. Si se crean muchas ilustraciones originales para explicar los datos, por ejemplo, es probable que sea una infografía. A menudo las infografías son bellas y elaboradas imágenes creadas para explicar la información.
  • Cantidad de datos representados: por lo general, las visualizaciones de datos tienen más y diferentes tipos de datos que la infografía. Además, los datos en las visualizaciones de datos cambian frecuentemente para indicar cambios en el estado. Además, es menos probable que una infografía incluya números interactivos.
  • Grado de tratamiento estético aplicado: este criterio se refiere a la ingeniosidad del gráfico. Si se ha dedicado mucho trabajo de diseño a mostrar información, es probable que el gráfico sea una infografía.

Adicionalmente, existe otro criterio para determinar la diferencia entre una visualización de datos y una infografía: si el gráfico es interactivo o estático. Un gráfico interactivo cuenta una historia diferente cada vez que se insertan datos nuevos. Una visualización interactiva lo ayuda a determinar qué dicen los datos. Una visualización estática representa una historia de datos que desea explicar a otros.

Where? Dónde puedo crear visualizaciones

Más que nunca, los directores ejecutivos y gerentes reconocen que la toma de decisiones basada en los datos es esencial y que una mentalidad «orientada a los datos» puede ser una ventaja competitiva.

Esa omnipresencia de datos empuja a los gerentes a equipar su negocio con herramientas de autoservicio que actúan como plataformas de distribución, desde el espectro opensource (D3, ECharts, RAWGraphs, etc.) hasta el ámbito comercial (Tableau, MicroStrategy, Microsoft Power BI, etc). Estas herramientas de visualización, permiten a los empleados extraer información relevante e importante de la inmensa colección de su empresa, así como realizar análisis sofisticados y obtener conocimiento, incluso sin una sólida formación técnica.

Todas estas herramientas tienen enormes ventajas y facilitan en gran medida ambas perspectivas de la visualización de datos; en general, se podrían clasificar como herramientas automáticas que aglutinan de forma no técnica las labores de ingesta, consulta y manipulación de datos y las herramientas más manuales orientadas a la profundización y diseño de visualización. Otros factores determinantes para escoger una u otra podrían ser su soporte puede ser local, on-premise, como SaaS… o su sistema de licencia.

La efectividad e impacto de la analítica depende de las habilidades de visualización de dos tipos: la capacidad de crear efectos visuales y la capacidad de comprender imágenes. El valor real de la visualización no proviene de la creación de efectos visuales, sino de la comprensión de lo que se pretende transmitir. Hacer la información comprensible depende de las habilidades de quienes diseñan visualizaciones, pero el valor y el impacto se derivan de quienes las leen, interpretan y utilizan para impulsar la conversación, la colaboración y la innovación. Le incumbe al lector acercarse a las visualizaciones sistemáticamente, verlas críticamente y buscar el significado real derivado de los datos para aprender a leer el lenguaje visual.

Imagen: unsplash | stephen dawson

Author