Leyendo archivos con read.table()

La función read.table() es de las más utilizadas para la lectura de datos. Se recomienda encarecidamente la lectura del archivo de ayuda para read.table() (ejecutar ?read.table en R).

A continuación se muestran los argumentos de la función:

  • file, el nombre del archivo o conexión
  • header, de tipo lógico indicando si el archivo contiene una línia de cabecera
  • sep, una cadena indicando como están separadas las columnas
  • colClasses, un vector de carácteres indicando la clase de cada columna en el conjunto de datos
  • nrows, el número de filas en el conjunto de datos. Por defecto read.table) lee el archivo entero
  • comment.char, una cadena indicanto el tipo de character utilizado en los comentarios. Por defecto es "#". Se recomienda que si no existen líneas comentadas, pasar como argumento la cadena vacía ("").
  • skip, el número de líneas para salter desde el principio
  • stringAsFactors, para codificar las variables de tipo carácter como factores

Para conjunto de un tamaño pequeño o moderado, podemos utilizar la función read.table() sin especificar ningún argumento.

data 

En este caso, R automáticamente realizará lo siguiente:

  • saltará las líneas que empiezen con #
  • calculará cuántas línias tiene el archivo (y cuánta memoria necesita)
  • calculará que tipo de variable almacena cada columna

Es importante mencionar que si pasamos los argumentos anteriormente mencionados a la función read.table haremos que trabaje más eficazmente y mucho más rápido.

La función read.csv() es idéntica a la función que hemos visto anteriormente excepto en algunos argumentos por defecto (ej. como el argumento sep)