Lección 18Utilicemos datos para resolver problemas

Comparemos conjuntos de datos utilizando representaciones visuales.

Metas de aprendizaje:

  • Puedo decidir si la media y la MAD, o la mediana y el IQR serían más apropiadas para describir el centro y la dispersión de un conjunto de datos.
  • Puedo dibujar una representación gráfica apropiada para un conjunto de datos.
  • Puedo explicar lo que nos dicen la media y la MAD o la media y el promedio en el contexto de una situación, y usarlos para responder preguntas.

18.1 Osos salvajes

En un estudio sobre osos salvajes, los investigadores midieron la longitud y el ancho, en pulgadas, de las cabezas de 143 osos salvajes. Las edades de los osos van desde recién nacidos (0 años) hasta 15 años. Los diagramas de caja sintetizan los datos del estudio.

Two sets of box plots for "head length in inches" and "head width in inches". The numbers 2 through 20, in increments of 2, are indicated and there are tick marks midway between each indicated number.  For "head length in inches" the top box plot is labeled "male bears" and the five-number summary are as follows: Minimum value, 9. Maximum value, 19. Q1, 12 point 5. Q2, 13 point 5. Q3, 15 point 5. The bottom box plot is labeled "female bears" and the five-number summary are as follows: Minimum value, 10. Maximum value, 15 point 5. Q1, 12. Q2, 12 point 5. Q3, 13 point 5. For "head width in inches" the top box plot is labeled "male bears" and the five-number summary are as follows: Minimum value, 4. Maximum value, 10. Q1, 5 point 5. Q2, 6 point 5. Q3, 8. The bottom box plot is labeled "female bears" and the five-number summary are as follows: Minimum value, 4 point 5. Maximum value, 7 point 5. Q1, 5. Q2, 6. Q3, 7 point 5.
  1. Escriban cuatro preguntas estadísticas que se puedan responder utilizando los diagramas de caja: dos preguntas sobre la longitud de la cabeza y dos preguntas sobre el ancho de la cabeza.
  2. Intercambia las preguntas con tu compañero.
    1. Decide si cada pregunta es una pregunta estadística.
    2. Utiliza los diagramas de caja para responder cada pregunta.

18.2 Tareas de matemáticas (Parte 1)

Durante un periodo de dos semanas, Mai anotó el número de ejercicios que tenían sus tareas de matemáticas cada día.

2 15 20 0 5 25 1 0 10 12
  1. Calcula los siguientes valores. Muestra tu razonamiento.

    1. La media del número de ejercicios de matemáticas en las tareas. 
    2. La desviación media absoluta (MAD).
  2. Interpreta la media y la MAD. ¿Qué te dicen sobre el número de ejercicios que Mai tuvo durante esas dos semanas?
  3. Halla o calcula los siguientes valores y muestra tu razonamiento.

    1. La mediana, los quartiles, el máximo y el mínimo de los mismos datos sobre los ejercicios en las tareas de matemáticas de Mai.
    2. El rango intercuartil (IQR).
  4. ¿Qué par de medidas de centro y variabilidad (media y MAD o mediana e IQR) crees que resumen mejor la distribución de las tareas de Mai? Explica tu razonamiento.

Puedes utilizar el applet que está abajo como ayuda si así lo decides. Ingresa los valores necesarios para calcular el IQR y la media cuando se requiera.

18.3 Tareas de matemáticas (Parte 2)

Jada quería saber si un diagrama de puntos, un histograma o un diagrama de caja sintetizaría mejor el centro, la variabilidad y otros aspectos del número de ejercicios en sus tareas.

2 15 20 0 5 25 1 0 10 12
  1. Utiliza el eje para hacer un diagrama de puntos que represente los datos. Marca la posición de la media, que calculaste antes, en el diagrama de puntos utilizando un triángulo ( \Delta ). Traza un segmento de recta horizontal desde el triángulo hacia los lados izquierdo y derecho para representar la MAD.

    Missing image 6.8.E1.Image.03a.blank
  2. Utiliza la cuadrícula y el resumen de cinco números de la actividad anterior para dibujar un diagrama de caja que represente los datos de las tareas de Jada.

    Missing image 6.8.E1.Image.03b.blank
  3. Trabaja con tu grupo para dibujar tres histogramas que representen los datos de las tareas de Jada. El ancho de las barras de cada histograma debe representar un número distinto de ejercicios en las tareas, como se especifica.

    1. Una barra representa 10 ejercicios.
    2. Una barra representa 5 ejercicios.
    3. Una barra representa 2 ejercicios.
  4. ¿Cuál de las cinco representaciones debería utilizar Jada para resumir sus datos? ¿Debería utilizar un diagrama de puntos, un diagrama de caja o uno de los histogramas? Explica tu razonamiento.

Puedes utilizar el applet para hacer cada tipo de gráfica si así lo decides.

18.4 ¿Sobrevivirán las percas amarillas?

Los científicos que estudian las percas amarillas (que son una especie de peces), creen que la longitud de estos peces está relacionada con su edad. Esto significa que entre más largo sea el pez, más viejo es. Las percas amarillas adultas varían en tamaño, pero usualmente están entre 10 y 25 centímetros.

Los científicos del Instituto de aguas de los Grandes Lagos recogieron, midieron y liberaron algunas percas amarillas de varios lugares en el Lago Michigan. El siguiente resumen se basa en una muestra de percas amarillas de uno de estos lugares.

longitud de los peces en centímetros número de peces
0 a menos de 5 5
5 a menos de 10 7
10 a menos de 15 14
15 a menos de 20 20
20 a menos de 25 24
25 a menos de 30 30
  1. Utiliza los datos para hacer un histograma que muestre las longitudes de las percas amarillas recogidas. Cada barra debe contener las longitudes que se muestran en cada fila de la tabla.

    A blank grid. The horizontal axis is labeled “fish length in centimeters” and the numbers 0 through 30, in increments of 5, are indicated. The vertical axis has the numbers 0 through 40, in increments of 5, indicated. There are 4 evenly spaced horizontal gridlines between each indicated number.
  2. ¿Cuántos peces se midieron? ¿Cómo lo sabes?
  3. Utiliza el histograma para responder las siguientes preguntas.

    1. ¿Cómo describirías la forma de la distribución?
    2. Estima la mediana de las longitudes de esta muestra. Describe cómo hiciste esta estimación.
    3. Predice si la media de las longitudes de esta muestra es mayor que, menor que o casi igual a la mediana de las longitudes de los peces de esta muestra. Explica tu predicción.
    4. ¿Utilizarías la media o la mediana para describir una longitud normal de los peces que se están estudiando? Explica tu razonamiento.
  4. Con base en el trabajo que has hecho hasta el momento:

    1. ¿Describirías una edad normal para las percas amarillas de esta muestra como, "joven", "adulto" o "viejo"? Explica tu razonamiento.
    2. Algunos investigadores están preocupados por la supervivencia de las percas amarillas. ¿Crees que las longitudes (o las edades) de los peces de esta muestra son preocupantes? Explica tu razonamiento.

Resumen de la lección 18

El diagrama de puntos muestra la distribución de los pesos de 30 galletas en gramos.

A box plot and a histogram for "cookie weights in grams". The numbers 8 through 34, in increments of two, are indicated. The box plot is above the dot plot.  The five-number summary for the box plot is as follows: Minimum value, 9. Maximum value, 34. Q1, 16. Q2, 20.5. Q3, 26. For the dot plot a triangle is indicated at 21 grams. A horizontal line is drawn below the triangle and begins at 15.4 and ends at 26.6. The data for the dot plot are as follows: 9 grams, 1 dot. 10 grams, 1 dot. 11 grams, 2 dots. 12 grams, 1 dot. 14 grams, 1 dot. 16 grams, 2 dots. 17 grams, 1 dot. 18 grams, 2 dots. 19 grams, 1 dot. 20 grams, 3 dots. 21 grams, 1 dot. 22 grams, 3 dots. 23 grams, 1 dot. 24 grams, 2 dots. 26 grams, 2 dots. 28 grams, 1 dot. 30 grams, 1 dot. 32 grams, 2 dots. 33 grams, 1 dot. 34 grams, 1 dot.

La media de los pesos de las galletas, marcada con el triángulo, es de 21 gramos. Esto nos dice que si los pesos de todas las galletas fueran redistribuidos de tal forma que todas pesaran lo mismo, cada galleta pesaría 21 gramos. La MAD es 5.6 gramos, lo que sugiere que una galleta por lo general pesa entre 15.4 y 26.6 gramos.

El diagrama de caja para el mismo conjunto de datos se muestra sobre el diagrama de puntos. La mediana muestra que la mitad de los pesos son mayores o iguales a 20.5 gramos y la mitad son menores o iguales a 20.5 gramos. La caja muestra que el IQR es 10 y que la mitad central de las galletas pesa entre 16 y 26 gramos.

En este caso, la mediana de los pesos está muy cerca de la media de los pesos y el IQR es más o menos el doble de la MAD. Esto nos dice que las dos parejas de medidas de centro y dispersión son muy similares.

Ahora veamos otro ejemplo de 30 galletas distintas.

A box plot and a dot plot for "cookie weights in grams". The numbers 8 through 34, in increments of two, are indicated. For the box plot: The minimum value is 9 and the maximum value is 26. Q1 has a value of 20, Q2 has a value of 23, and Q3 has a vlaue of 24. For the dot plot: A triangle is indicated at 21 grams. A line indicates the distance from 17.6 to 24.4 grams. The data is as follows: 9 grams, 1 dot. 10 grams, 1 dot. 13 grams, 1 dot. 14 grams, 1 dot. 16 grams, 1 dot. 17 grams, 1 dot. 19 grams, 1 dot. 20 grams, 2 dots. 21 grams, 2 dots. 22 grams, 3 dots. 23 grams, 6 dots. 24 grams, 5 dots. 25 grams, 4 dots. 26 grams, 1 dot.

Aquí la mediana es 21 gramos y la MAD es 3.4 gramos. Esto sugiere que una galleta pesa por lo general entre 17.6 y 24.4 gramos. La mediana del peso de las galletas es 23 gramos y el diagrama de caja muestra que la mitad central de los datos está entre 20 y 24 gramos. Estas dos parejas de medidas nos dan dos perspectivas muy distintas de la variabilidad de los pesos de las galletas.

La mediana (23 gramos) está más cerca del medio de la agrupación grande de valores. Si ignoráramos las galletas más pequeñas, la mediana y el IQR darían una perspectiva más precisa de cuánto pesa generalmente una galleta.

Cuando una distribución no es simétrica, la mediana y el IQR son por lo general una mejor medida de centro y dispersión que la media y la MAD. Sin embargo, la decisión de qué pareja de medidas utilizar depende de qué queremos saber sobre el grupo que estamos investigando.

Problemas de práctica de la lección 18

  1. Veinte estudiantes cronometraron cuánto tardó cada uno en resolver un acertijo. Este es un diagrama de puntos de sus tiempos de solución.

    1. Predice qué medida de centro (la media o la mediana) va a ser mayor.
      Explica tu razonamiento.
    Dot plot for “puzzle-solving time in minutes.” The numbers 0 through 14, in increments of 2, are indicated. The data are as follows:  2 minutes, 1 dot; 6 mintues, 1 dot; 7 minutes, 2 dots; 8 minutes, 3 dots; 9 minutes, 7 dots; 10 minutes; 2 dots; 11 minutes; 3 dots; 12 minutes; 1 dot.
    1. Calcula la media y la mediana. ¿Tu predicción fue correcta?
    2. ¿Qué par de medidas de centro y variabilidad (media y MAD, o mediana e IQR) escogerías para describir la distribución de los tiempos de solución? Explica tu razonamiento.
  2. Una biblioteca pública presentó una película durante un festival de niños. Jada registró las edades de 100 niños que vieron la película. Este es un histograma de sus datos.

    Responde cada pregunta. Explica tu razonamiento para cada respuesta.

    1. ¿El histograma se puede usar para estimar la media de las edades de los espectadores?
    A histogram: The horizontal axis is labeled "age in years" and the numbers 1 through 10 are indicated. On the vertical axis the numbers 0 through 50, in increments of 10, are indicated. The data represented by the bars are as follows:   Age from 1 up to 3, 10. Age from 3 up to 5, 25. Age from 5 up to 7, 50. Age from 7 up to 9, 15.
    1. ¿El histograma se puede usar para estimar la mediana de las edades de los espectadores?  
    2. ¿El histograma se puede usar para encontrar la mediana exacta de las edades de los espectadores?  
    3. ¿Es posible saber a partir del histograma si había por lo menos un niño de 3 años que vio la película?  
  3. En un juego, a los jugadores se les muestra una fotografía que tiene 14 mariposas escondidas en ella. Se les dan 3 minutos para encontrar tantas mariposas escondidas como puedan.

    Veinte estudiantes de cuarto grado y veinte estudiantes de sexto grado jugaron este juego. Los diagramas de puntos representan los números de mariposas que encontraron ambos grupos.

    Escribe algunas frases en donde se comparen los números de mariposas escondidas que fueron encontradas por estos dos grupos de estudiantes.

  4. En una ronda de mini golf, Elena registra el número de golpes que toma meter la bola en el hoyo en cada green. Halla el rango, la mediana y el rango intercuartil del número de golpes necesarios en cada green.

    2 3 1 4 5 2 3 4 3