Lección 18Comparemos poblaciones usando muestras

Comparemos poblaciones diferentes usando muestras.

Metas de aprendizaje:

  • Puedo calcular la diferencia entre dos medianas como un múltiplo del rango intercuartil.
  • Puedo determinar si hay una diferencia significativa entre dos poblaciones, con base en una muestra de cada población.

18.1 ¿Misma media? ¿Misma MAD?

Sin calcular, di si cada pareja de conjuntos de datos tienen la misma media y si tienen la misma desviación media absoluta.

conjunto A 1 3 3 5 6 8 10 14
conjunto B 21 23 23 25 26 28 30 34
conjunto X 1 2 3 4 5
conjunto Y 1 2 3 4 5 6
conjunto P 47 53 58 62
conjunto Q 37 43 68 72

18.2 Con una carga pesada

Consideren la pregunta: "¿Las mochilas de los estudiantes de décimo grado generalmente pesan más que las mochilas de los estudiantes de séptimo grado?".

Estos son diagramas de puntos de los pesos de las mochilas de una muestra aleatoria de estudiantes de estos dos grados:

Two dot plots for “backpack weight in pounds” are labeled "grade 7" and "grade 10," and the numbers 1 through 22 are indicated. The data are as follows:  Grade 7: 2 pounds, 1 dot. 3 pounds, 2 dots. 4 pounds, 3 dots. 5 pounds, 2 dots. 6 pounds, 1 dot. 7 pounds, 2 dots. 9 pounds, 1 dot. 11 pounds, 1 dot. 12 pounds, 1 dot. 13 pounds, 1 dot.  Grade 10: 10 pounds, 1 dot. 11 pounds, 2 dots. 12 pounds, 1 dot. 13 pounds, 2 dots. 14 pounds, 2 dots. 15 pounds, 2 dots. 16 pounds, 1 dot. 18 pounds, 2 dots. 20 pounds, 1 dot. 22 pounds, 1 dot.
  1. ¿Alguna mochila de séptimo grado en la muestra pesa más que una mochila de décimo grado?  
  2. El peso medio de esta muestra de mochilas de séptimo grado es 6.3 libras. ¿Crees que el peso medio de las mochilas de todos los estudiantes de séptimo grado es exactamente 6.3 libras?

  3. El peso medio de esta muestra de mochilas de décimo grado es 14.8 libras. ¿Crees que hay una diferencia significativa entre el peso de las mochilas de los estudiantes de séptimo y décimo grado? Explica o muestra tu razonamiento.

18.3 ¿Ellos cargan más?

Estas son 10 muestras aleatorias más de pesos de mochilas de estudiantes de séptimo grado.

Ten dot plots titled "sample one through sample ten," each with the numbers 0 through 18 indicated. the data are as follows:  Sample 1: 1 pound, 3 dots. 2 pounds, 1 dot. 4 pounds, 3 dots. 5 pounds, 1 dot. 6 pounds, 1 dot. 7 pounds, 1 dot. 10 pounds, 4 dots.  12 pounds, 1 dot.  Sample 2: 4 pounds, 1 dot. 5 pounds, 1 dot. 6 pounds, 1 dot. 7 pounds, 1 dot. 8 pounds, 2 dots. 9 pounds, 3 dots. 10 pounds, 1 dot. 12 pounds, 4 dots. 15 pounds, 1 dot.  Sample 3: 1 pound, 1 dot. 2 pounds, 1 dot. 3 pounds, 3 dots. 4 pounds, 1 dot. 5 pounds, 1 dot. 6 pounds, 3 dots. 7 pounds, 1 dot. 8 pounds, 1 dot. 9 pounds, 1 dot. 10 pounds, 2 dots.  Sample 4: 1 pound, 1 dot. 4 pounds, 2 dots. 5 pounds, 2 dots. 6 pounds, 1 dot. 7 pounds, 2 dots. 8 pounds, 2 dots. 10 pounds, 3 dots. 12 pounds, 1 dot. 13 pounds, 1 dot.  Sample 5: 3 pounds, 2 dots. 4 pounds, 3 dots. 5 pounds, 1 dot. 8 pounds, 3 dots. 9 pounds, 2 dots. 10 pounds, 2 dots. 11 pounds, 1 dot. 12 pounds, 1 dot.  Sample 6: 1 pound, 1 dot. 2 pounds, 2 dots. 4 pounds, 1 dot. 5 pounds, 3 dots. 8 pounds, 2 dots. 9 pounds, 3 dots. 10 pounds, 1 dot. 11 pounds, 1 dot. 12 pounds, 1 dot.  Sample 7: 1 pound, 1 dot. 2 pounds, 3 dots. 3 pounds, 1 dot. 4 pounds, 2 dots. 5 pounds, 1 dot. 6 pounds, 1 dot. 7 pounds, 1 dot. 8 pounds, 3 dots. 9 pounds, 2 dots.  Sample 8: 0 pounds, 1 dot. 1 pound, 1 dot. 2 pounds, 1 dot. 4 pounds, 4 dots. 5 pounds, 2 dots. 6 pounds, 1 dot. 8 pounds, 4 dots. 9 pounds, 2 dots.  Sample 9: 0 pounds, 1 dot. 1 pound, 1 dot. 5 pounds, 3 dots. 6 pounds, 1 dot. 7 pounds, 4 dots. 8 pounds, 3 dots. 9 pounds, 1 dot. 12 pounds, 1 dot.  Sample 10: 0 pounds, 3 dots. 1 pound, 1 dot. 4 pounds, 2 dots. 6 pounds, 2 dots. 7 pounds, 1 dot. 9 pounds, 2 dots. 10 pounds, 1 dot. 11 pounds, 2 dots. 18 pounds, 1 dot.
muestra número media de los pesos (libras)
1 5.8
2 9.2
3 5.5
4 7.3
5 7.2
6 6.6
7 5.2
8 5.2
9 6.3
10 6.4
    1. ¿Cuál media de los pesos es la más grande, entre todas las muestras?
    2. ¿Cuál media de los pesos es la más pequeña, entre todas las muestras?
    3. ¿Cuál es la diferencia entre las medias de estas dos muestras?
  1. Todas las muestras tienen desviación media absoluta de aproximadamente 2.8 libras. Expresen la diferencia entre las medias de estas dos muestras como un múltiplo de la MAD.
  2. ¿Estas muestras son muy diferentes? Expliquen o muestren su razonamiento.

Recuerden que nuestra muestra de las mochilas de los estudiantes de décimo grado tuvo un peso medio de 14.8 libras. La MAD para esta muestra es 2.7 libras. Su profesor les va a asignar una de la muestras de las mochilas de los estudiantes de séptimo grado para que trabajen.

    1. ¿Cuál es la diferencia entre las medias de las muestras de las mochilas de los estudiantes de décimo grado y las mochilas de los estudiantes de séptimo grado?
    2. Expresen la diferencia entre las medias de estas dos muestras como un múltiplo de la MAD más grande.
  1. ¿Piensan que hay una diferencia significativa entre los pesos de las mochilas de todos los estudiantes de séptimo grado y las mochilas de los estudiantes de décimo grado? Expliquen o muestren su razonamiento.

18.4 Acero de regiones diferentes

Cuando los antropólogos encuentran artefactos de acero, pueden evaluar la cantidad de carbono en el acero para aprender sobre la gente que fabricó los artefactos. Estos son algunos diagramas de cajas que muestran el porcentaje de carbono en muestras de acero que se encontraron en dos regiones diferentes:

  1. Determinen si alguna pieza de acero encontrada en la región 1 tuvo:

    1. más carbono que alguna pieza de acero encontrada en la región 2
    2. menos carbono que alguna pieza de acero encontrada en la región 2
  2. ¿Piensan que hay una diferencia significativa entre los artefactos de acero encontrados en las regiones 1 y 2?
  3. ¿Cuál muestra tiene una distribución que no es aproximadamente simétrica?
mediana de la muestra (%) IQR
(%)
región 1 0.64 0.05
región 2 0.47 0.03
  1. ¿De cuánto es la diferencia entre las medianas de las muestras de estas dos regiones?
  2. Expresen la diferencia entre las medianas de estas dos muestras como un múltiplo del rango intercuartil más grande.
  1. Los antropólogos que hicieron el estudio concluyeron que había una diferencia significativa entre el acero de estas dos regiones. ¿Están de acuerdo? Expliquen o muestren su razonamiento.

Resumen de la lección 18

Algunas veces queremos comparar dos poblaciones diferentes. Por ejemplo, ¿hay una diferencia significativa entre los pesos de los pugs y los beagles? Estos son los histogramas de los pesos de una muestra de perros de cada una de estas razas:

A histogram for two different populations: On the horizontal axis, the numbers 6 through 11, in increments of zero point 5, are indicated. The label “pug weights in kilograms” is indicated for the numbers 6 through 8 and “beagle weights in kilograms” is indicated for the numbers 9 through 11. On the vertical axis, the numbers 0 through 8 are indicated. The data represented by the bars are as follows:   Pug weights in kilograms: Weight from 6 up to 6 point 5, 5. Weight from 6 point 5 up to 7, 5. Weight from 7 up to 7 point 5, 7. Weight from 7 point 5 up to 8, 3. A triangle is located at 6 point 9 kilograms.  Beagle weights in kilograms: Weight from 9 up to 9 point 5, 3. Weight from 9 point 5 up to 10, 3. Weight from 10 up to 10 point 5, 8. Weight from 10 point 5 up to 11, 6. A triangle is located at 10 point 1.

Los triángulos rojos indican el peso medio de cada muestra, 6.9 kg para los pugs y 10.1 kg para los beagles. Las líneas rojas indican los pesos que están a 1 MAD de la media. Podemos pensar en estos como pesos "típicos" de la raza. Estos pesos típicos no se superponen. De hecho, la distancia entre las medias es 10.1-6.9 o 3.2 kg, ¡más de 6 veces la MAD más grande! Así que podemos decir que hay una diferencia significativa entre los pesos de los pugs y los beagles.

¿Hay una diferencia significativa entre los pesos de los pugs machos y los pugs hembras? Estos son diagramas de cajas que muestran los pesos de una muestra de pugs machos y pugs hembras:

Two box plots labeled “male pug weights in kilograms” and “female pug weights in kilograms” are indicated. The numbers 4 through 8 point 5, in increments of zero point 5, are indicated. The five-number summary for the box plots are as follows:   Male pug weights in kilograms: Minimum value, 6 point 4. Maximum value, 8 point 3. Q1, 7 point 2. Q2, 7 point 6. Q3, 7 point 9.  Female pug weights in kilograms: Minimum value, 6 point 2. Maximum value, 8. Q1, 6 point 4. Q2, 6 point 9. Q3, 7 point 3.

Podemos ver que las medianas son diferentes, pero los pesos entre el primer y tercer cuartil se superponen. Basados en estas muestras, diríamos que no hay una diferencia significativa entre los pesos de los pugs machos y los pugs hembras.

En general, si las medidas de centro de dos muestras están al menos a dos medidas de variabilidad, decimos que la diferencia entre las medidas de centro es significativa. Visualmente, esto quiere decir que los rangos de los valores típicos no se superponen. Si están más cerca, entonces no consideramos que la diferencia sea significativa.

Problemas de práctica de la lección 18

  1. Lin quiere saber si los estudiantes de escuela primaria generalmente pasan más tiempo jugando al aire libre que los estudiantes de escuela secundaria. Ella selecciona una muestra aleatoria de tamaño 20 de cada población de estudiantes y les pregunta cuántas horas jugaron al aire libre la semana pasada. Supón que la MAD de cada una de sus muestras es alrededor de 3 horas.

    Selecciona todas las parejas de medias de muestras de las que Lin podría concluir que hay una diferencia significativa entre las dos poblaciones.

    1. escuela primaria: 12 horas, escuela secundaria: 10 horas

    2. escuela primaria: 14 horas, escuela secundaria: 9 horas

    3. escuela primaria: 13 horas, escuela secundaria: 6 horas

    4. escuela primaria: 13 horas, escuela secundaria: 10 horas

    5. escuela primaria: 7 horas, escuela secundaria: 15 horas

  2. Estos dos diagramas de cajas muestran las distancias de un salto de longitud sin impulso, en pulgadas, de una muestra aleatoria de personas de 10 años de edad y de una muestra aleatoria de personas de 15 años de edad.

    ¿Hay una diferencia significativa entre las medianas de las distancias de las dos poblaciones? Explica cómo lo sabes.

  3. La mediana de los ingresos de una muestra de personas de Chicago es alrededor de $60,000 y la mediana de los ingresos de una muestra de personas de Kansas City es alrededor de $46,000, pero unos investigadores han determinado que no hay una diferencia significativa entre las medianas. Explica por qué los investigadores pueden tener razón.

  4. Un agricultor cultiva 5,000 calabazas por año. Las calabazas se venden según su peso, así que el agricultor quiere estimar la media del peso de las calabazas que cultivó este año. Él selecciona aleatoriamente 8 calabazas y las pesa. Estos son los pesos (en libras) de estas calabazas:

    peso (libras) 2.9 6.8 7.3 7.7 8.9 10.6 12.3 15.3
    1. Estima la media del peso el peso medio de las calabazas que cultivó el agricultor.

      Este diagrama de puntos muestra el peso medio de 100 muestras de ocho calabazas, similares a la de arriba.

    2. ¿Cuánto parece ser el peso medio de las 5,000 calabazas?

    3. ¿Qué sugiere el diagrama de puntos de las medias de las muestras sobre qué tan acertada puede ser una estimación basada en una sola muestra de 8 calabazas?

    4. ¿Qué piensas que podría hacer le agricultor para obtener una estimación más acertada de la media de la población?