«La visualización es crítica para el análisis de datos. Aporta una primera línea de ataque, revelando estructuras intrincadas en datos que no pueden ser absorbidas de otro modo. Descubrimos efectos inimaginables y cuestionamos aquellos que han sido imaginados.” (William S. Cleveland)[1]
Como afirma Cleveland, la importancia del cuidado y atención a la hora de visualizar datos es de extrema relevancia para lograr una buena análisis. Hoy nuestra entrada enseña como la elección de los colores es importante a la hora de visualizar datos.
Los colores son una de las herramientas visuales que más empleamos cuando estamos construyendo una visualización pero muchas veces no somos conscientes de ello. Las variaciones – arco iris – de los colores en el mapa son muy populares y pueden ser a la vez problemáticas y engañosas se no sabemos cómo utilizarlas de manera a facilitar la lectura de los datos.
El mapa del arco iris se basa en los colores del espectro de luz, sin embargo muchas son las veces que lo usamos en el orden equivocado. ¿Sabes nombrar los colores del arco iris en el orden? Eso es parte del problema. Aunque utilices constantemente, somos pocos lo que saben la secuencia correcta. Os pongo una imagen de wikipedia para refrescar la memoria.
Ahora, echa un vistazo a este mapa de un documento sobre los recursos hídricos publicado en la revista «American Water Resources Association»[2]. El mapa describe la cantidad de evaporación (perdida de agua de lluvia a través de la evaporación) por condado para los 48 estados del EEUU.
Como podes ver el mapa se divide prácticamente en dos partes. La región occidental más colorida – verdes, amarillos y naranjas – y la parte oriental en tonos de azul. Sin leer la leyenda pensamos que de cierta forma la parte oriental debe ser más homogénea. Sin embargo, se damos un zoom en la leyenda y verificamos los valores vamos ver que los valores cambian pero los colores no los acompañan.
De esta manera hay dos problemas: cambios bruscos de luminancia[3] y cambios entre diferentes tonalidades.
Luminancia:
Probamos cambiar un poco la leyenda, quitando las distintas tonalidades y aplicando diferentes valores de luminancia.
El color de 0,3 a 0,39 es más oscuro que los colores vecinos, la luminancia de 0,5 hasta 0,59, desde 0,6 hasta 0,69, y 0,7 a 0,79 es prácticamente la misma, y luego hay un gran salto de 0,8 a 0,89. El tamaño de paso en función de los datos no es diferente, es simplemente un artefacto de la combinación de colores.
Tonalidad:
Ahora vamos analizar los cambios de tonalidad. Empezamos por enumerar cada tonalidad y comparar las relaciones entre ella y el valor expreso en la leyenda.
- Blanco (,0-0,09). Una elección realmente extraña lo comenzar con el color «blanco», ya que el de fondo de la mapa también es eso color, y generalmente los «no-colores«, como el blanco, negro, y gris, se deben utilizar para los valores especiales como los datos que faltan, etc.
- Rosa (0,1 a 0,19 y la desde 0,2 hasta 0,29). Estos de dos por si solos estarían bien.
- Morado (desde 0,3 hasta 0,39). Color diferente y también mucho más oscuro.
- Azul (0,4 a 0,49 y 0,5 a 0,59). Color diferente otra vez, y la escala de colores está en la dirección opuesta de los colores de rosa – el color más brillante ahora representa el valor más alto.
- Verde (0,6 a 0,69 y 0,7 a 0,79). Color diferente otra vez, y los dos son muy parecidos.
- Amarillo Verdoso (0,8 a 0,89). Otro cambio de tonalidad y también un salto dramático en luminancia, sin ninguna razón discernible.
- Amarillo (0.9 a 0.99). Tonalidad número siete y todavía nosotros no hemos terminado.
- Naranja a Marrón (1,0 – adelante). Voy a analizar estos dos colores juntos aunque puede que muchos de vosotros los consideren como colores distintos – el marrón acaba siendo en realidad muy oscuro, un naranja desaturado, pero todavía tiene eso en su nombre).
El mapa utiliza ocho tonalidades distintas, saltos repentinos en la luminancia, y la luminancia no tiene ni siquiera cambios en una dirección consistente.
Existen algunas razones que justifican la utilización de más de una tonalidad. En los casos en que existan rangos de valores que son significativos e importantes – con el objetivo de diferenciarlos mejor (lo que no corresponde a la realidad del mapa de «Evapotranspitation Map«). O cuando queremos visualizar datos – por encima de x y debajo de y. Como es el caso del mapa del IECA – Empleo derivado del turismo en Andalucía.
¿Arco Iris?
Teniendo en cuenta esos problemas – la gran cuestión es – ¿Por qué utilizar o mapa con los colores arco iris? Porque son atractivos. Utilizar una única tonalidad para visualizar los datos en el mapa puede ser muy eficaz pero no tan interesante visualmente. Es más, cuando estás mirando el mapa para leer los valores, la rampa lisa es peor porque ya no puedes buscar un color determinado. Sin embargo, el coste es que se crea un montón de artefactos en el mapa.
Una de las posibles soluciones es utilizar una escala de luminancia de manera que consiga alcanzar un adecuado para ser atractivo sin dañar la lectura de los datos. ColorBrewer tiene un poco esa ambición, con pelo menos dos colores.
Alternativas
El ColorBrewer es una buena herramienta de ayuda para la elección de los colores pero requiere un cierto cuidado a la hora de utilizarlo. ColorBrewer está disponible en muchos paquetes de visualización (D3, etc) aunque la gran mayoría de sus categorías son variables.
Existe también el Kuler de Adobe, que permite diseñar paletas de colores, pero que requiere un poco de conocimiento también. En él puedes encontrar muchas combinaciones de colores atractivos para explorar sin embargo hay que tener cierto cuidado porque no es una herramienta diseñada para visualización de datos.
Cuando un mapa tiene valores constantes, una rampa con un solo color es siempre una elección segura. Puede no parecer emocionante, pero al menos tiene la buena lectura de los datos. Utilizar algo más allá de un solo tono precisa ser realmente justificado. La inteligibilidad de los datos es, sin duda, más relevante que su aspecto atractivo o no atractivo.
A pesar de su importancia para la percepción y la visualización, los colores siguen siendo un tema muy poco entendido. Las personas parecen estar contentas con los colores predeterminados o con una selección arbitraria y atractiva. Pero una mala elección de los colores puede acabar interfiriendo negativamente en la visualización y todo el trabajo anterior (de tratamiento de datos) acaba perdiendo su valor.
Bibliografía
Cleveland, W. S. (1993). Visualizing data. Murray Hill, N.J: At&T Bell Laboratories.
http://cliffmass.blogspot.com.br/2013/06/evaporation-versus-precipitation-which.html
http://artefigura.blogspot.com.br
[1] Cleveland, W. S. (1993). Visualizing data. Murray Hill, N.J: At&T Bell Laboratories.
[3] La combinación de variación suave y con cambios bruscos de luminancia hace que parezca como si no hubiera regiones claramente definidos en el mapa. Una versión de la leyenda que sólo muestra luminancia, sin tonalidad, hace esto un poco más claro.