Lección 4Ajustemos una recta a los datos

Analicemos diagramas de dispersión como un todo.

Metas de aprendizaje:

  • Puedo reconocer los datos atípicos en un diagrama de dispersión.
  • Puedo usar un modelo para predecir los valores de los datos.

4.1 Predecir esto

Este es un diagrama de dispersión que muestra los pesos y eficiencias de combustible de 20 tipos de automóviles diferentes.

Si un automóvil pesa 1,750 kg, ¿esperarían que su eficiencia de combustible estuviera más cerca de 22 mpg o de 28 mpg? Expliquen su razonamiento.

A scatterplot with 20 data points. The horizontal axis is labeled “weight, in kilograms” and the numbers 1,000 through 2,500, in increments of 250, are indicated. The vertical axis is labeled “fuel efficiency, in miles per gallon” and the numbers 14 through 32, in increments of 2, are indicated. The graph shows the trend of the 20 data points moving linearly downward and to the right. The approximate coordinates of 11 selected data points are as follows:  1,130 comma 28. 1,240 comma 30. 1,400 comma 25. 1,490 comma 23. 1,550 comma 25. 1,590 comma 26. 1,650 comma 19. 1,740 comma 21. 1,775 comma 20. 1,950 comma 19. 2,200 comma 16.

4.2 Brillo resplandeciente

Los pesos y precios de 20 diamantes diferentes se muestran en la tabla y en el diagrama de dispersión.

peso (quilates) precio real (dólares) precio que se predice (dólares)
1 3,772 4,429
1 4,221 4,429
1 4,032 4,429
1 5,385 4,429
1.05 3,942 4,705
1.05 4,480 4,705
1.06 4,511 4,760
1.2 5,544 5,533
1.3 6,131 6,085
1.32 5,872 6,195
1.41 7,122 6,692
1.5 7,474 7,189
1.5 5,904 7,189
1.59 8,706 7,686
1.61 8,252 7,796
1.73 9,530 8,459
1.77 9,374 8,679
1.85 8,169 9,121
1.9 9,541 9,397
2.04 9,125 10,170

El diagrama de dispersión muestra los precios y pesos de los 20 diamantes junto con la gráfica de  y = 5,\!520x- 1,\!091 .

 

La función descrita por la ecuación  y = 5,\!520x- 1,\!091 es un modelo de la relación entre el peso de un diamante y su precio.

Este modelo predice el precio de un diamante a partir de su peso. Estos valores que se predicen se muestran en la tercera columna de la tabla.

  1. Dos diamantes que pesan 1.5 quilates tienen precios diferentes. ¿Cuáles son sus precios? ¿Cómo puedes ver esto en la tabla? ¿Cómo puedes ver esto en el diagrama?
  2. El modelo predice que cuando el peso es 1.5 quilates, el precio será $7,189. ¿Cómo puedes ver esto en la gráfica? ¿Cómo puedes ver esto usando la ecuación?
  3. Uno de los diamantes pesa 1.9 quilates. ¿Qué precio predice el modelo para este diamante? ¿Compara la predicción con el precio real?
  4. Encuentra un diamante para el que el modelo haga una muy buena predicción del precio real. ¿Cómo puedes ver esto en la tabla?, ¿en la gráfica?
  5. Encuentra un diamante para el que la predicción del modelo no esté muy cerca del precio real. ¿Cómo puedes ver esto en la tabla?, ¿en la gráfica?

4.3 La agonía de los pies

El diagrama de dispersión muestra el ancho y el largo de 20 pies izquierdos diferentes. Usa la flecha doble para ver u ocultar la lista de expresiones.

 
  1. Estima el ancho del pie más largo y del más corto.

  2. Estima el largo del pie más ancho y del más angosto.

  3. Haz clic en el círculo gris al lado de las palabras "La recta" en la lista de expresiones.

    An icon labeled the gray circle.
    Debe aparecer la gráfica de un modelo lineal. Encuentra el punto de dato que parezca extraño al compararlo con el modelo. ¿Qué largo y qué ancho representa ese punto?

Resumen de la lección 4

Algunas veces, podemos usar una función lineal como un modelo de la relación entre dos variables. Por ejemplo, este es un diagrama de dispersión que muestra las alturas y los pesos de 25 perros junto con la gráfica de una función lineal que es un modelo de la relación entre la altura de un perro y su peso.

Podemos ver que el modelo hace un buen trabajo al predecir el peso dada la altura de algunos perros. Estos corresponden a los puntos que están en la recta o cerca de la recta. El modelo no hace un buen trabajo prediciendo los pesos dadas las alturas de los perros cuyos puntos están lejos de la recta.

Por ejemplo, hay un perro que mide aproximadamente 20 pulgadas y pesa un poco más de 16 libras. El modelo predice que el peso debería ser 48 libras. Decimos que el modelo sobrestima el peso de este perro. También hay un perro que mide 27 pulgadas y pesa aproximadamente 110 libras. El modelo predice que el peso debería ser 48 libras. Decimos que el modelo subestima el peso de este perro.

Algunas veces un punto de dato está lejos de los otros puntos o no encaja con una tendencia que se aplica para todos los otros puntos. A estos los llamamos datos atípicos.

Términos del glosario

dato atípico

Un dato atípico es un dato que está lejos de los demás datos en un conjunto de datos.

Este es un diagrama de dispersión que muestra largos y anchos de 20 pies izquierdos distintos. El pie con 24.2 cm de largo y 7.4 cm de ancho es un dato atípico.

Problemas de práctica de la lección 4

  1. El diagrama de dispersión muestra el número de hits y home runs de 20 jugadores de béisbol que tuvieron por lo menos 10 hits la temporada pasada. La tabla muestra los valores de 15 de esos jugadores.

    Esta es la gráfica del modelo  y = 0.15x - 1.5 , junto con un diagrama de dispersión.

    Usa la gráfica y la tabla para responder estas preguntas.

    1. El jugador A tuvo 154 hits en 2015. ¿Cuántos home runs hizo? ¿Cuántos se había predicho que haría?
    2. El jugador B fue el jugador que más superó la predicción. ¿Cuántos hits tuvo el jugador B la temporada pasada?
    3. ¿Qué esperarías ver en la gráfica para un jugador que bateó muchos menos home runs de los que predice el modelo?
    hits home runs home runs predichos
    12 2 0.3
    22 1 1.8
    154 26 21.6
    145 11 20.3
    110 16 15
    57 3 7.1
    149 17 20.9
    29 2 2.9
    13 1 0.5
    18 1 1.2
    86 15 11.4
    163 31 23
    115 13 15.8
    57 16 7.1
    96 10 12.9
  2. Este es un diagrama de dispersión que compara puntos por partido con intentos tiros libres por partido de los jugadores de baloncesto en un torneo. Esta es la gráfica del modelo  y = 4.413x + 0.377 , junto con el diagrama de dispersión. En este caso,  x representa los intentos de tiro libre por partido y y representa los puntos por partido.

    1. Marca alguno de los datos que parezca ser un dato atípico.
    2. ¿Qué quiere decir que un punto esté muy por encima de la recta en esta situación?
    3. Basado en el modelo, ¿cuántos puntos por partido esperarías que un jugador con 4.5 intentos de tiro libre por partido tuviera? Redondea tu respuesta a la décima más cercana.
    4. Uno de los jugadores anotó 13.7 puntos por partido y tuvo 4.1 intentos de tiro libre por partido. ¿Cómo se compara esto con lo que el modelo predice para este jugador?