Diagrama de dispersión y recta de mínimos cuadrados

La representación gráfica, denominada diagrama de dispersión o nube de puntos, se hace utilizando un sistema de ejes de coordenadas de dos dimensiones representando cada dato en un punto de coordenadas .

Ejemplo

En el conjunto de datos faithful, emparejamos el par de valores de eruption y duration en la misma observación como coordenadas (x, y). Entonces representaremos los puntos en el plano Cartesiano.

library(MASS)
duration <- faithful$eruptions
waiting <- faithful$waiting
head(cbind(duration, waiting))
##      duration waiting
## [1,]    3.600      79
## [2,]    1.800      54
## [3,]    3.333      74
## [4,]    2.283      62
## [5,]    4.533      85
## [6,]    2.883      55

Problema

Encuentra el diagrama de dispersión de la distribución bidimensional de frecuencias de las variables eruption y waiting. Determinar la recta de mínimos cuadrados.

Solución

Aplicaremos la función plot() para computar el diagrama de dispersión de eruption y waiting.

duration <- faithful$eruptions
waiting <- faithful$waiting
plot(x = duration, y = waiting,
     xlab = "Duración erupciones",
     ylab = "Tiempo de espera")

Respuesta

plot of chunk scatterplot

A continuación para encontrar la recta de mínimos cuadradaos para generar un modelo de regresión lineal de las dos variables podemos utilizar la función lm() y posterioremente añadirlo al diagrama de dispersión mediante la función abline().

plot of chunk linealmodelregression

abline(lm(waiting ~ duration))