Distribución de frecuencias relativas acumuladas

LLamaremos frecuencia relativa acumulada hasta la modalidad (valor o intervalo ) al cociente , o lo que es lo mismo, a

siendo .

Ejemplo

En el conjunto de datas faithful, la distribución de frecuentcias relativas acumuladas de la variable eruption representa la proporción de frecuencias de las erupciones cuyas duraciones son menor que o igual a un conjunto de niveles dado.

Problema

Encontrar la distribución de frecuencias acumuladas de las erupciones en faithful.

Solución

En primer lugar encontramos la distribución de frecuencias absolutas.

duration <- faithful$eruptions
breaks <- seq(1.5, 5.5, by=0.5)
duration.cut <- cut(duration,  breaks, by=0.5, right = FALSE)
duration.freq <- table(duration.cut)

A continuación aplicamos la función cumsum() para computar la distribución de frecuencias absolutas acumuladas.

duration.cumfreq = cumsum(duration.freq)

Por último, encontramos en tamaño de la muestra de faithful con la función nrow(), y dividimos la distribución de frecuencias absolutas por . Así pues, la distribución de frecuencias relativas acumuladas es:

duration.cumrelfreq = duration.cumfreq / nrow(faithful)

Respuesta

La distribución de frecuencias relativas acumuladas de la variable eruption es:

cbind(duration.cumfreq,duration.cumrelfreq)
##         duration.cumfreq duration.cumrelfreq
## [1.5,2)               51           0.1875000
## [2,2.5)               92           0.3382353
## [2.5,3)               97           0.3566176
## [3,3.5)              104           0.3823529
## [3.5,4)              134           0.4926471
## [4,4.5)              207           0.7610294
## [4.5,5)              268           0.9852941
## [5,5.5)              272           1.0000000