Unidad 8 Data Sets and Distributions (Materiales para la familia)

Sección B Media y MAD

Esta semana, nuestros estudiantes van a aprender a calcular e interpretar la media, o promedio, de un conjunto de datos. Podemos pensar en la media de un conjunto de datos como una porción equitativa (o porción justa), es decir, lo que sucedería si los números en los datos estuvieran distribuidos de manera equitativa. Supongamos que una mujer corrió 3, 4, 3, 1 y 5 millas en el transcurso de cinco días. Si el número total de millas que corrió (16 millas) se distribuyera equitativamente a lo largo de esos cinco días, la distancia recorrida por cada día (3.2 millas) sería la media. Para calcular la media, podemos sumar los valores y luego dividir la suma entre el número de valores que haya.

Si pensamos en los puntos de datos como pesos sobre la recta numérica, la media también puede interpretarse como el punto de equilibrio de los datos. En esta figura, los puntos muestran los tiempos de viaje (en minutos) de Lin y Andre. Los triángulos muestran la media de tiempo de viaje en cada caso. Observen que los valores están “equilibrados” a cada lado de cada triángulo.

Nuestros estudiantes aprenderán también a hallar e interpretar la desviación media absoluta (o la MAD) de los datos. La MAD nos indica la distancia, en promedio, de los puntos de los datos hasta la media. Cuando los puntos de los datos están cerca de la media, las distancias entre ellos y la media son pequeñas, por lo tanto, la distancia promedio (la MAD) también será pequeña. Cuando los puntos de los datos están más dispersos, la MAD será más grande.

Los valores de media y de MAD nos ayudan a resumir (o sintetizar) los datos. La media es una forma de describir el centro del conjunto de datos. La MAD es una forma de describir qué tan dispersos están los datos.

Esta es una tarea para que trabajen en familia:

  1. Usen los diagramas de puntos de Lin y de Andre para verificar que en ambos casos la media de los tiempos de viaje es 14 minutos.

  2. Andre argumenta que la media de sus datos debería ser 13 minutos, pues hay dos números a la izquierda del 13 y dos números a la derecha. Expliquen por qué 13 no puede ser la media.

  3. ¿Cuál conjunto de datos tiene una MAD (desviación media absoluta) más grande: el de Lin o el de Andre? Expliquen cómo lo saben.

Solución:

  1. Para los datos de Lin, la media es , que es igual a 14. Para los datos de Andre, la media es , que también es igual a 14.

  2. Las explicaciones pueden variar. Ejemplos de explicaciones:

    • La media no puede ser 13 minutos porque 13 no representa una porción equitativa.

    • La media no puede ser 13 minutos porque los datos no estarían en equilibrio. Los dos valores a la derecha de 13 (16 y 17) están mucho más lejos que los dos valores de la izquierda (12 y 12).

  3. Los datos de Lin tienen una MAD más alta. Las explicaciones pueden variar. Ejemplos de explicaciones:

    • En los datos de Lin, los puntos están a 6, 3, 3, 4 y 8 unidades de la media, que es 14. En los datos de Andre, los puntos están a 2, 2, 1, 2 y 3 unidades de la media, que también es 14. La distancia promedio en los datos de Lin será mayor, pues esas distancias son mayores.

    • La MAD de los datos de Lin es 4.8 minutos y la MAD de los datos de Andre es 2 minutos.

    • Comparados con los puntos de los datos de Andre, los de Lin están más lejos de la media.

Sección C Muestreo

Esta semana nuestros estudiantes van a trabajar con datos. A veces queremos obtener información sobre cierto grupo, pero el grupo es tan grande que resulta imposible preguntarle a cada persona del grupo. Puede ser útil recolectar datos a partir de una muestra (una parte del grupo) de la población (el grupo completo). Es importante que la muestra se parezca a la población.

  • Por ejemplo, este es un diagrama de puntos que describe una población: la altura de 49 plantas en un sembrado de coles.

  • La siguiente muestra es representativa de la población porque, a pesar de incluir solo una parte de los datos, esta parte se parece a los datos de toda la población en su forma, su centro y su dispersión.

  • La siguiente muestra, en cambio, no es representativa de la población. Tiene demasiadas alturas de plantas en el medio y no tiene suficientes de las muy bajas ni de las muy altas.

Una muestra seleccionada de forma aleatoria tiene más posibilidades de ser representativa de una población que una muestra seleccionada de alguna otra manera.

Esta es una tarea para que trabajen en familia:

Un consejo municipal necesita saber cuántos edificios de la ciudad tienen pintura a base de plomo, pero no tienen suficiente tiempo para examinar los 100,000 edificios de la ciudad. Quieren examinar una muestra de edificios que sea representativa de la población.

  1. ¿Cuál sería una mala forma de elegir una muestra de los edificios?

  2. ¿Cuál sería una buena forma de elegir una muestra de los edificios?

Solución:

  1. Hay varias respuestas posibles.

    • Examinar edificios del mismo tipo (como los colegios o las estaciones de gasolina) no resultaría en una muestra representativa de todos los edificios de la ciudad.

    • Examinar edificios ubicados en una misma zona (como los edificios situados cerca de la alcaldía) también sería una mala forma de seleccionar una muestra.

    • Examinar todos los edificios nuevos sesgaría la muestra hacia edificios que no tienen pintura a base de plomo.

    • Examinar un número pequeño de edificios, como 5 o 10, también haría que fuera difícil usar la muestra para hacer predicciones sobre toda la población.

  2. Para seleccionar una muestra de forma aleatoria, podrían escribir las direcciones de los 100,000 edificios en una computadora y hacer que la computadora seleccionara 50 direcciones de la lista de manera aleatoria. Otra opción sería sacar trozos de papel de una bolsa (pero con tantos edificios en la ciudad, este método sería difícil).

Sección D Probabilidades de eventos de un solo paso

Esta semana nuestros estudiantes van a trabajar con el concepto de probabilidad. Una probabilidad es un número que representa qué tan posible es que algo pase. Por ejemplo, piensen en el lanzamiento de una moneda.

  • La probabilidad de que la moneda caiga en alguna parte es 1. Eso es seguro.

  • La probabilidad de que la moneda caiga mostrando cara es , es decir, 0.5.

  • La probabilidad de que la moneda se convierta en una botella de salsa de tomate es 0. Eso es imposible.

A veces podemos encontrar una probabilidad de manera exacta. Por ejemplo, si seleccionamos una fecha al azar, la probabilidad de que sea un día de fin de semana es porque 2 de cada 7 días caen en fin de semana. En otras ocasiones, podemos estimar una probabilidad basándonos en lo que hemos observado en el pasado.

Esta es una tarea para que trabajen en familia:

En una competencia de pesca, los concursantes escriben el tipo de cada pez que pescan. Estos son los resultados:

  • Concursante 1: lubina, bagre, bagre, lubina, lubina, lubina

  • Concursante 2: bagre, bagre, lubina, lubina, lubina, lubina, bagre, bagre, lubina, bagre

  • Concursante 3: lubina, lubina, lubina, bagre, lubina, lubina, bagre, lubina, bagre

  1. Estimen la probabilidad de que el siguiente pez que atrapen sea una lubina.

  2. Otro concursante pescó 5 peces. Predigan cuántos de esos peces son lubinas.

  3. Antes de la competencia, el lago tenía el mismo número de lubinas que de bagres. Describan posibles razones por las cuales los resultados no muestran una probabilidad de para pescar una lubina.

Solución:

  1. Aproximadamente , o 0.6, porque de los 25 peces que ya fueron atrapados, 15 eran lubinas.

  2. Aproximadamente 3 lubinas, porque . También sería razonable si pescaran 2 o 4 lubinas, entre sus 5 peces.

  3. Hay varias respuestas posibles. Por ejemplo:

    • Quizás los señuelos o las carnadas que estaban usando eran mejores para atrapar lubinas.

    • Con resultados provenientes de solo 25 peces atrapados, podemos esperar que los resultados varíen un poco con respecto a la probabilidad exacta.