Lección 7Diagramas de caja y rango intercuartil

Objetivo de aprendizaje

Exploremos cómo los diagramas de caja nos pueden ayudar a resumir las distribuciones.

Metas de aprendizaje

  • Puedo utilizar el IQR para describir la dispersión de los datos.

  • Sé qué información se muestra en un diagrama de caja y cómo se construye.

Términos de la lección

  • cuartil
  • diagrama de caja
  • mediana
  • rango
  • rango intercuartil (IQR)

Calentamiento: Observa y pregúntate: dos fiestas

Problema 1

Estos son dos diagramas de puntos que incluyen la media marcada con un triángulo. Cada uno muestra las edades de los asistentes a una fiesta.

¿Qué observas y qué te preguntas sobre las distribuciones mostradas en los dos diagramas de puntos?

Actividad 1: El resumen de cinco números

Problema 1

Estas son las edades de las personas en una fiesta, ordenadas en una lista de menor a mayor.

  1. Encuentra la mediana del conjunto de datos y etiquétala como “percentil 50”. Esto divide los datos en una mitad superior y una mitad inferior.

    • 7 8 9 10 10 11 12 15 16 20 20 22 23 24 28 30 33 35 38 42

  2. Encuentra el valor del medio de la mitad inferior de los datos, sin incluir la mediana. Etiqueta este valor como “percentil 25”.

  3. Encuentra el valor del medio de la mitad superior de los datos, sin incluir la mediana. Etiqueta este valor como “percentil 75”.

  4. Has dividido el conjunto de datos en cuatro partes. Cada uno de los tres valores que dividen los datos se llama un cuartil.

    • Llamamos al percentil 25 el primer cuartil. Escribe “Q1” al lado de ese número.

    • La mediana puede llamarse el segundo cuartil. Escribe “Q2” al lado de ese número.

    • Llamamos al percentil 75 el tercer cuartil. Escribe “Q3” al lado de ese número.

  5. Etiqueta el menor valor del conjunto como “mínimo” y el mayor valor como “máximo”.

Problema 2

Los valores que identificaste son el resumen de cinco números del conjunto de datos. Anótalos aquí.

Mínimo:   

Q1:    años

Q2: años

Q3: años   

Máximo: años

Problema 3

La mediana de este conjunto de datos es 20. Esto nos dice que la mitad de las personas que asistieron a la fiesta tenían 20 años o menos y la otra mitad tenían 20 años o más. ¿Qué nos dice cada uno de estos otros valores sobre las edades de las personas que asistieron a la fiesta?

  1. el tercer cuartil

  2. el mínimo

  3. el máximo

¿Estás listo para más?

Problema 1

Hubo otra fiesta a la que asistieron 21 personas. Estos cinco números resumen sus edades.

mínimo:   5       Q1:   6       Q2:   27       Q3:   32       máximo:   60  

  1. ¿Crees que esta fiesta tiene más o menos niños que la otra fiesta? Explica tu razonamiento.

  2. En esta fiesta, ¿hay más niños o más adultos? Explica tu razonamiento.

Actividad 2: Diagrama de caja humano

Problema 1

Tu profesor te dará los datos sobre las longitudes de los nombres de los estudiantes en tu clase. Escribe un resumen de cinco números, hallando el mínimo, el Q1, el Q2, el Q3 y el máximo del conjunto de datos.

Haz una pausa para esperar instrucciones adicionales de tu profesor.

Actividad 3: Estudiemos los parpadeos

Veinte personas participaron en un estudio sobre los parpadeos. Se registró el número de veces que cada persona parpadeó mientras veía un video durante un minuto. Estos son los valores de los datos, en orden de menor a mayor.

  • 3

  • 6

  • 8

  • 11

  • 11

  • 13

  • 14

  • 14

  • 14

  • 14

  • 16

  • 18

  • 20

  • 20

  • 20

  • 22

  • 24

  • 32

  • 36

  • 51

Problema 1

  1. Utiliza la cuadrícula y el eje para hacer un diagrama de puntos de este conjunto de datos.

  2. Halla la mediana (Q2) y marca su ubicación en el diagrama de puntos.

  3. Halla el primer cuartil (Q1) y el tercer cuartil (Q3). Marca sus ubicaciones en el diagrama de puntos.

  4. ¿Cuáles son los valores mínimo y máximo?

Problema 2

Un diagrama de caja puede ser utilizado para representar gráficamente el resumen de cinco números. Dibujemos un diagrama de caja para los datos del número de parpadeos. En la cuadrícula, sobre el diagrama de puntos:

  1. Dibuja una caja que se extienda desde el primer cuartil (Q1) hasta el tercer cuartil (Q3). Etiqueta los cuartiles.

  2. En la mediana (Q2), dibuja una recta vertical desde la parte superior de la caja hasta la parte inferior de la caja. Etiqueta la mediana.

  3. Desde el lado izquierdo de la caja (Q1), dibuja una recta horizontal (un bigote) que se extienda hasta el valor mínimo del conjunto de datos. En el lado derecho de la caja (Q3), dibuja una recta similar que se extienda hasta el valor máximo del conjunto de datos.

Problema 3

Has creado un diagrama de caja para representar los datos del número de parpadeos. ¿Qué fracción de los datos está representada por cada uno de estos elementos del diagrama de caja?

  1. El bigote izquierdo

  2. La caja

  3. El bigote derecho

¿Estás listo para más?

Problema 1

Supongamos que hubo algunos errores en el conjunto de datos: el valor más pequeño debió haber sido 6 en lugar de 3 y el valor más grande debió haber sido 41 en lugar de 51. Decide si alguna de las partes del resumen de cinco números cambiaría. Si así lo crees, describe cómo cambiaría. Si no, explica cómo lo sabes.

Resumen de la lección

Antes aprendimos que la media es una medida del centro de una distribución y la MAD es una medida de la variabilidad (o dispersión) que va con la media. También hay una medida de dispersión asociada a la mediana: se llama rango intercuartil (IQR).

Para hallar el IQR, debemos dividir el conjunto de datos en cuartos. Cada uno de los tres valores que separan los datos en cuartos se llama cuartil.

  • La mediana, o segundo cuartil (Q2), separa los datos en dos mitades.

  • El primer cuartil (Q1) es el valor del medio de la mitad inferior de los datos.

  • El tercer cuartil (Q3) es el valor del medio de la mitad superior de los datos.

Por ejemplo, este es un conjunto de datos con 11 valores:

Q1

Q2

Q3

  • La mediana es 33.

  • El primer cuartil es 20. Es la mediana de los números menores que 33.

  • El tercer cuartil es 40. Es la mediana de los números mayores que 33.

La diferencia entre los valores máximo y mínimo de un conjunto de datos es el rango. La diferencia entre Q3 y Q1 es el rango intercuartil (IQR). Como la distancia entre Q1 y Q3 incluye a los dos cuartos que están en medio de la distribución, los valores que están entre esos dos cuartiles a veces se llaman la mitad central de los datos.

Cuanto más grande es el IQR, más dispersa es la mitad central de los datos. Cuanto más pequeño es el IQR, más cercanos son los datos de la mitad central. Por eso podemos usar el IQR como una medida de dispersión.

Se puede usar un resumen de cinco números para resumir una distribución. Este incluye el mínimo, el primer cuartil, la mediana, el tercer cuartil y el máximo del conjunto de datos. Para el ejemplo anterior, el resumen de cinco números es 12, 20, 33, 40 y 49. Estos números están marcados con diamantes en este diagrama de puntos.

Distintos conjuntos de datos pueden tener el mismo resumen de cinco números. Por ejemplo, este es otro conjunto de datos con el mismo mínimo, máximo y cuartiles que el ejemplo anterior.

Un diagrama de caja representa el resumen de cinco puntos de un conjunto de datos.

Este nos muestra el primer cuartil (Q1) y el tercer cuartil (Q3) como los lados izquierdo y derecho de un rectángulo o una caja. La mediana (Q2) se muestra como un segmento vertical dentro de la caja. En el lado izquierdo, se extiende un segmento de recta horizontal (un “bigote”) desde Q1 hasta el valor mínimo. En el lado derecho, se extiende un bigote desde Q3 hasta el valor máximo.

El rectángulo que está en el medio representa la mitad central de los datos. Su ancho es el IQR. Los bigotes representan el cuarto inferior y el cuarto superior del conjunto de datos.

Los diagramas de caja de estos conjuntos de datos se muestran encima de los diagramas de puntos correspondientes.

A partir de los diagramas de caja, podemos decir que, en general, los pugs del grupo son más livianos que los beagles: la mediana de los pesos de los pugs es 7 kilogramos y la mediana de los pesos de los beagles es 10 kilogramos. Como los dos diagramas de caja tienen la misma escala y los rectángulos tienen anchos similares, también podemos decir que los IQR de ambas razas son muy similares. Esto parece indicar que la variabilidad en los pesos de los beagles es muy similar a la variabilidad en los pesos de los pugs.