Mentiras arriesgadas con la visualización de datos

Vamos a trabajar el aspecto de la visualización del dato, un aspecto fundamental para alguien que trabaja en áreas del Business Intelligence y sobre todo en la parte de Data Visualization (o visualización del dato). Claro que hoy en día, son muchos los profesionales que "pintan" un gráfico muy rápidamente en cualquier medio. Periódico, ppt, empresa, estudiantes, etc.

¿Buscas clases de programación?

Siempre que pienso en "mentir" hay un recuerdo que asalta en mi mente, una película que he visto un par de veces es "Mentiras arriesgadas" (1994, James Cameron). De risa, recomendable a mi parecer.

Hoy vamos a hablar de mentiras arriesgadas que restan credibilidad a todo profesional que trabaje con el dato y desdice del trabajo realizado por usar mal los gráficos o la visualización del dato. Y hay uno que se lleva el "premio goya" al mejor actor... el gráfico de quesitos.

Gráfico circular

Si, además, hoy es un día de confesiones, os diré que estoy enamorada, profeso un amor por el gráfico de quesitos, ese nombre, ese saber estar, ese sabor... También recibe el de pastel o de tarta (bueno y circular, sectores, pero eso es más técnico), nos quedaremos con el de pastel o tarta. ¿A quién no le gusta el dulce? Será por eso que se usará tanto, porque es fácil de comprender, sencillo... bueno y fácil de mentir con él.

Una cuestión es que si tú eres un profesional del dato, no es lo mismo que una persona que no se dedica a ello, pero que ocurre con un periodista, ¿cómo es un profesional de la "letra" se le puede permitir que ponga un artículo y confunda millones con miles? ¿O que por hacer un artículo más sensacionalista ponga miles en lugar de centenares? ¿Desconocimiento o falta de ética? Nunca lo sabremos... pero si puedes, usa el gráfico adecuado para cada dato. Aunque esto lo abordaremos otro día.

La estadística, que es nuestra gran amiga, nos dice que para variables cualitativas de tipo dicotómico o binario es para lo que está más recomendado el gráfico de quesitos. Claro dicotómico, son solo dos categorías, pero veamos qué ocurre cuando ponemos muchas categorías en un gráfico de tarta:

¿Sencillo y bien interpretable, verdad? Bueno, pues si no lo interpretas bien, es normal. Recuerda, no es que se te den mal las mates es que no te lo han puesto fácil de entender.

Vamos a comparar "solo" 5 categorías, ¿cuál es el producto que representa un 25%?, ¿dudas?

La alineación de la sección en el diagrama A nos facilita la identificación rápida de su magnitud. Sin embargo, en el gráfico B, se presenta un desafío al intentar visualizar con precisión la fracción correspondiente al producto E.

Es difícil, lo sé, pero como estoy enamorada, y ya sabéis que a veces hacemos cosas absurdas, me he encabezonado con que sea este gráfico, por lo que puedo añadir porcentajes, leyenda, una tabla... y no pongo un monigote bonito en forma de gato para distraer porque sería muy "cantoso" que lo hago para distraer la atención y no facilitar el dato.

Podríamos resolver este sumando porcentajes a cada sección y agregando los nombres para evitar consultar la leyenda constantemente. Sin embargo, esto genera una información similar a la de una tabla, pero de forma caótica y poco eficiente, ya que requeriría enfocarse en cada sección del diagrama y luego buscar en la leyenda.

Diagrama de barras

O también podríamos usar el gráfico que según la estadística está pensado para varias categorías, el diagrama de barras, lo sé no suena tan bonito y apetecible, es más sencillo y quizás por eso, porque facilita la información de forma humana, apenas se usa. Si además a este gráfico lo ordenamos, ya es un manjar de elegancia y sencillez del dato listo para su consumo y disfrute, veamos:

Hay una definición que leí una vez y que coincido totalmente, no conozco personalmente a Naomi Robbins, aunque ya siento que me he vuelto a enamorar (sí, me enamoro fácilmente), según ella: << Para nuestros fines, un gráfico es considerado más efectivo que otro si su información cuantitativa puede ser decodificada con mayor rapidez o con mayor facilidad por la mayoría de los observadores“ (Naomi Robbins, Communicating Data Clearly, Strata Conference,2011, p. 3).

Hay muchos profesionales (en grande) que han explicado matemáticamente y han abordado la limitación y posibles engaños asociados con este tipo de gráfico son:

  • Edward R. Tufte: Es un reconocido estadístico y profesor emérito de estadísticas, gráficos y visualización de información. En su libro "The Visual Display of Quantitative Information", Tufte critica el uso de gráficos de quesitos, argumentando que pueden ser menos efectivos para comunicar información que otras formas de visualización.
  • Stephen Few: Experto en diseño de dashboards y visualización de datos, Few ha cuestionado la eficacia del gráfico de quesitos en varias de sus obras, incluyendo "Show Me the Numbers" y "Now You See It". Argumenta que otros tipos de gráficos, como los de barras o los de líneas, son a menudo más claros y precisos.
  • William S. Cleveland: Un estadístico y profesor de la Universidad Purdue. En su libro "The Elements of Graphing Data", Cleveland destaca las limitaciones de los gráficos de quesitos y sugiere alternativas más efectivas.
  • Y muchos más profesionales... (espero contar contigo a partir de ahora).

Que no te cuenten películas, ni mentiras (sean o no arriesgadas), mi consejo es ser lo más profesional y ético si eres el que genera el dato y el gráfico asociado, sea cual sea tu rama (incluso si eres político) y si eres el consumidor del dato, que seas crítico cuando te dan un dato, para que "no te la den con queso".

Utiliza nuestro Buscador Inteligente
© 2007 - 2024 Tus clases particulares Mapa web: Profesores particulares| Academias y centros