Calculando los requerimientos de memoria
Debido a que R almacena todos sus objetos en la memoria física, es importante conocer cuanta memoria está siendo usada por estos objetos en tu espacio de trabajo. Una situación importante en la que es importante conocer la cantidad de memoria necesaria es cuando leemos un conjunto de datos en R.
Por ejemplo, supongamos que tenemos un data frame con 1.500.000 de filas y 120 columnas, las cuales todas son numéricas. Bien, la mayoría de computadores de hoy en dia usan 64 bits de memoria para numeros en punto flotante doble precision. Conociendo esta información podemos hacer los siguientes cálculos:
1.500.000 120 8 bytes/numeric = 1.440.000 bytes = 1.440.000 / 2^20^ byte/MB = 1.373,29 MB = 1.34 GB
Por lo tanto el conjunto de datos requiere 1.34 GB de memoria. La mayoría de ordenadores de hoy en día tienen esta RAM. Sin embargo, tenemos que tener en cuenta:
- otros programas que se esten ejecutando en nuestro sistema
- otros objetos R que están utilizando memoria en nuestro espacio de trabajo
Importar un conjunto de datos cuando no poseemos suficiente memoria es un modo muy fácil de bloquear nuestro sistema (o al menos nuestra sesión en R). Esto es una situación que debemos evitar y que requiere que finalicemos el proceso R, en el mejor de los escenarios, o reiniciar nuestra computadora, en el peor de los casos. Por lo tanto, recomiendo encarecidamente que se tengan en cuenta los requerimientos de memoria antes de leer un conjunto de datos.