¿Qué son y cómo hacer un cálculo de los cuartiles?

La estadística es una rama de las matemáticas que nos permite analizar, interpretar y comprender datos para obtener información significativa sobre diferentes fenómenos. En este artículo, exploraré qué son los cuartiles y cómo calcularlos, proporcionando ejemplos para una mejor comprensión.

¿Buscas clases de estadística online?

Entre las herramientas fundamentales que ofrece la estadística se encuentran los cuartiles, que nos permiten dividir y entender datos en diferentes segmentos. Los cuartiles suelen representarte gráficamente en una caja de bigotes o en una tabla. Por ejemplo, a continuación ves una tabla que hace parte de los datos de un banco, y donde se analizan los datos de los clientes, en la primera columna ves que el 25 % de los clientes tienen 41 años, que el 50% tienen hasta 46 años y que el 75% de los clientes tiene hasta 52 años.

¿Qué son los cuartiles?

Como su nombre lo indica, viene de cuatro, por lo que los cuartiles son valores que dividen un conjunto de datos en cuatro partes iguales, cada una representando el 25% de las observaciones. Son útiles para identificar la dispersión de los datos y para analizar su distribución. En un conjunto ordenado de datos, los cuartiles se denotan como Q1, Q2, y Q3.

Cálculo de cuartiles:

  • Primer Cuartil (Q1): El primer cuartil, Q1, se define como el valor que separa el 25% inferior de los datos. Para calcularlo, es necesario ordenar los datos de manera ascendente y encontrar el valor que se encuentra en la posición 25% del conjunto.

Ejemplo: Consideremos el siguiente conjunto de datos ordenado: 10, 15, 20, 25, 30, 35, 40, 45, 50. Para encontrar Q1, debemos ubicar el valor que se encuentra en la posición (9+1) * 0.25 = 2.5, que está entre los valores 15 y 20. Luego, tomamos el promedio de estos dos valores: (15 + 20) / 2 = 17.5. Por lo tanto, Q1 = 17.5.

  • Segundo Cuartil (Q2): El segundo cuartil, Q2, también es conocido como la mediana(el dato central de un grupo de datos, ordenados de manera ascendente). Divide los datos en dos partes iguales, es decir, el 50% de los valores se encuentran por encima y el 50% por debajo de Q2.

Ejemplo: Utilizando el mismo conjunto de datos ordenado 10, 15, 20, 25, 30, 35, 40, 45, 50., podemos ver que el valor que se encuentra en la posición (9+1) * 0.50 = 5 es 30. Por lo tanto, Q2 = 30.

  • Tercer Cuartil (Q3): El tercer cuartil, Q3, divide el 75% inferior de los datos.Al igual que en los casos anteriores, ordenamos los datos 10, 15, 20, 25, 30, 35, 40, 45, 50 y encontramos el valor que está en la posición (9+1) * 0.75 = 7.5, que se encuentra entre los valores 40 y 45. Tomamos el promedio: (40 + 45) / 2 = 42.5. Entonces, Q3 = 42.5.

¿Cómo se representan los cuartiles?

La manera usual de representar los cuartiles en estadística es a través de un gráfico de caja y bigotes, también conocido como diagrama de caja o boxplot. Este tipo de representación gráfica ofrece una visualización clara y concisa de la distribución de un conjunto de datos y permite identificar de manera rápida y sencilla la ubicación y dispersión de los cuartiles.

El gráfico de caja y bigotes consta de una caja que representa el rango intercuartílico (IQR), es decir, el rango que abarca desde el primer cuartil (Q1) hasta el tercer cuartil (Q3). El extremo inferior de la caja marca el valor de Q1, mientras que el extremo superior marca el valor de Q3. La línea en medio de la caja representa la mediana (Q2).

Además, se dibujan dos líneas verticales llamadas bigotes, que se extienden desde los extremos de la caja hasta los valores más extremos dentro de ciertos límites. Estos límites son generalmente 1.5 veces el IQR. Cualquier valor que se encuentre más allá de estos límites se considera un valor atípico y se muestra como un punto fuera de los bigotes.

Por ejemplo, a continuación te muestro de unos datos que analice usando un boxplot. Aquí son los datos de unos clientes de un banco. En el eje de abajo, se ve el tipo de tarjeta que tiene el cliente y en el eje lateral se ve el ingreso de los clientes. Cómo ves los datos son más dispersos en los clientes que tienen tarjetas platinum, que en las otras tarjetas, además se ven tres puntos atípicos.

El gráfico de caja y bigotes es una herramienta poderosa para detectar valores atípicos y visualizar la dispersión de los datos en un conjunto, por lo que los ingenieros de datos lo suelen usar para analizar los datos, porque proporciona información valiosa. Es ampliamente utilizado en análisis estadísticos, comparaciones entre diferentes grupos de datos y para tener una comprensión rápida de la distribución de los cuartiles en un conjunto de datos.

Espero que este artículo te haya proporcionado una comprensión sólida de los cuartiles y cómo aplicarlos en diversos escenarios. Si tienes alguna pregunta o necesitas más ejemplos, ¡no dudes contactarme!

Utiliza nuestro Buscador Inteligente
© 2007 - 2024 Tus clases particulares Mapa web: Profesores particulares| Academias y centros