Importar Datos en R

Para importar datos en R, obviamente necesitamos disponer de datos. Estos datos pueden estar guardados en un archivo en nuestro computador en Excel, SPSS, u otro tipo de archivo. En este escenario, en el que nuestros datos están guardados localmente, podemos siempre que queramos editarlos cuando deseemos, añadir más datos o modificarlos, preservando las fórmulas que hemos usado para calcular los resultados, etc.

Sin embargo, los datos también podemos encontrarlos en Internet o podemos obtenerlos de otras fuentes.

En es capítulo veremos las diferentes formas de importar datos en R desde diferentes archivos y fuentes.

Comprobación de Nuestros Datos

Antes de conocer como importar nuestros datos en R, es importante comprobar la siguiente lista de verificación:

  • Si trabajamos con hojas de cálculo, la primera fila normalmente está reservada para la cabecera, mientras que la primera columna es usada para identificar la observación.
  • Debemos de evitar nombres, valores o campos con espacios en blanco, de lo contrario cada palabra será interpretada como una variable, resultando en errores relacionados con el número de elementos por fila en nuestro conjunto de datos.
  • Si deseamos concatenar palabras, aconsejamos insertar un guión (-) entre las palabras en lugar de un espacio en blanco.
  • Escoger nombres cortos en lugar de largos.
  • Evitar usar los siguientes símbolos en los nombres: ?, $, %, ^, &, *, (, ), -, #, ?, ,, <, >, /, |, \, [, ], { y }.
  • Borrar cualquier comentario que hayamos insertado en nuestro archivo Excel para evitar columnas extra, de lo contrario valores NA serán introducidos en nuestro archivo.
  • Comprobar que cualquier valor desconocido en nuestros datos es indicado como NA.

Preparación del Espacio de Trabajo

Antes de importar datos en R es necesario además preparar nuestro entorno de trabajo en RStudio. Podríamos encontrarnos con un entorno que se encuentra atiborrado con datos y valores, que podemos borrar con la siguiente línea de código:

rm(list = ls())

La función rm() nos permite borrar todos los objetos de un entorno específico. En el ejemplo, pasamos como argumento la función ls(). Esta función devuelve un vector de tipo character que nos proporciona los nombres de los objetos en el entorno especificado.

A continuación, es importante conocer en que directorio de trabajo nos encontramos, que podemos comprobar mediante:

getwd()

Por último, si en el paso anterior confirmamos que nuestros datos no se encuentran en el directorio devuelto por la función getwd(), debemos cambiar la ruta al directorio donde se encuentran nuestro conjunto de datos por medio de:

setwd("<localización de nuestro dataset>")

results matching ""

    No results matching ""