Distribución de frecuencias absolutas

Llamamos frecuencia absoluta del valor (modalidad o intervalo ) al número de datos que presentan el valor (modalidad o intervalo ). Si existen modalidades posibles, se verificará

siendo la frecuencia total al número de datos.

Ejemplo

En el conjunto de datos faitful, la frecuencia absoluta de la variable eruption es el resumen de las erupciones.

Problema

Encuentra la distribución de frecuencias de las duraciones en las erupciones en el conjunto de datos faithful.

Solución

La solución consiste de los siguientes pasos:

  • Encontramos el rango de duración en las erupciones con la función range(). Esto nos mostrará el dato mayor que és 5.1 y el dato menor que és 1.6.
library(MASS)
duration <- faithful$eruptions
range(duration)
## [1] 1.6 5.1
  • Determinaremos el número de intervalos a considerar. Si el primer intervalo tiene que contener 1.6 y el último a 5.1 redondeando tendremos el intervalo [1.5, 5.5]. Si consideramos como amplitud constante del intervalo 0.5, tendremos la siguiente secuencia {1.5, 2.0, 2.5,...}.
breaks <- seq(1.5, 5.5, by=0.5)
breaks
## [1] 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5
  • Distribuimos los valores de la variable duration por intervalos con la función cut(). Como los intervalos son cerrados por la izquierda y abiertos por la derecha, pasamos FALSE al argumento right.
duration.cut <- cut(duration, breaks, right = FALSE)
  • Computamos la frecuencia absoluta de los datos agrupados con la función table().
duration.freq <- table(duration.cut)

Respuesta

La distribución absoluta de los datos agrupados en intervalos es la siguiente:

cbind(duration.freq)
##         duration.freq
## [1.5,2)            51
## [2,2.5)            41
## [2.5,3)             5
## [3,3.5)             7
## [3.5,4)            30
## [4,4.5)            73
## [4.5,5)            61
## [5,5.5)             4

A continuación podemos visualizar un video que explica el contenido de esta sección: