Diagrama de dispersión y recta de mínimos cuadrados
La representación gráfica, denominada diagrama de dispersión o nube de puntos, se hace utilizando un sistema de ejes de coordenadas de dos dimensiones representando cada dato en un punto de coordenadas .
Ejemplo
En el conjunto de datos faithful, emparejamos el par de valores de eruption y duration en la misma observación como coordenadas (x, y). Entonces representaremos los puntos en el plano Cartesiano.
library(MASS)
duration <- faithful$eruptions
waiting <- faithful$waiting
head(cbind(duration, waiting))
## duration waiting
## [1,] 3.600 79
## [2,] 1.800 54
## [3,] 3.333 74
## [4,] 2.283 62
## [5,] 4.533 85
## [6,] 2.883 55
Problema
Encuentra el diagrama de dispersión de la distribución bidimensional de frecuencias de las variables eruption y waiting. Determinar la recta de mínimos cuadrados.
Solución
Aplicaremos la función plot() para computar el diagrama de dispersión de eruption y waiting.
duration <- faithful$eruptions
waiting <- faithful$waiting
plot(x = duration, y = waiting,
xlab = "Duración erupciones",
ylab = "Tiempo de espera")
Respuesta
A continuación para encontrar la recta de mínimos cuadradaos para generar un modelo de regresión lineal de las dos variables podemos utilizar la función lm() y posterioremente añadirlo al diagrama de dispersión mediante la función abline().
abline(lm(waiting ~ duration))