Polígono de frecuencias acumuladas

Un polígon de frecuencias absolutas acumuladas de un dato cuantitativo és una curva que representa la distribución de frecuencias absolutas acumuladas.

Ejemplo

En el conjunto de datos faithful, un punto en el polígono de frecuencias acumuladas de la variable eruption representa el número total de erupciones cuyas duraciones son menor que o igual a un rango dado.

Problema

Encontrar el polígono de frecuencias acumuladas en faithful.

Solución

En primer lugar tenemos que encontrar la distribucioón de frecuencias absolutas.

duration <- faithful$eruptions
breaks <- seq(1.5, 5.5, by=0.5)
duration.cut <- cut(duration, breaks, right = FALSE)
duration.freq <- table(duration.cut)

Entonces podemos utilitzar la función cumsum() para computar la distribución de frecuencias absolutas acumuladas.

duration.cumfreq <- c(0,cumsum(duration.freq))

Obsérvese en el paso anterior que hemos computado la distribución de frecuencias acumuladas creando un vector que contiene como primer elemento el 0.

A continuación vamos a graficar el polígono:

plot(breaks, duration.cumfreq,
     main="Erupciones géiser Faithful",
     xlab = "Duración en minutos",
     ylab = "Erupciones acumuladas")
lines(breaks, duration.cumfreq)

plot of chunk ncumulativegraph