Estructuras de Datos
Este capítulo resume las estructuras de datos más importantes en R. Las colecciones o conjunto de datos en R se organizan por su dimensión (1º, 2º, o varias dimensiones) y si son homogéneas (todos los objetos deben ser del mismo tipo) o heterogéneas ( el contenido puede ser de diferentes tipos). A continuación mostramos los cinco tipos de datos más usados en el análisis de datos:
Homogénea | Heterogénea | |
---|---|---|
1 | Vector atómico | Lista |
2 | Matriz | Data frame |
n | Array |
Tabla 1 Estructuras de datos
Además, analizaremos la sintaxis de R para acceder a las estructuras de datos. Como veremos podemos seleccionar un único elemento o varios elementos, mediante el uso de la notación de índices que proporciona R. Asimismo aprenderemos a elegir elementos por localización dentro de una estructura o por nombre.
La Tabla 2 resume los operadores que aporta R para el acceso a objetos en estructuras de datos.
Sintaxis | Objetos | Descripción |
---|---|---|
x[i] |
Vectores, Listas | Selecciona elementos del objeto x, descritos en i. i puede ser un vector de tipo integer, chararacter (de nombres de los objetos) o lógico. Cuando es usado con listas, devuelve una lista. Cuando es usado en vectores devuelve un vector. |
x[[i]] |
Listas | Devuelve un único elemento de x que se encuentra en la posición i. i puede ser un vector de tipo integer o character de longitud 1. |
x$n |
Listas, Dataframes | Devuelve un objeto con nombre n del objeto x. |
[i, j ] |
Matrices | Devuelve el objeto de la fila i y columna j. i y j pueden ser un vector de tipo integer o chararacter (de nombres de los objetos) |
Tabla 2 Notación para acceder estructuras de datos
Objetivos
Después de leer este capítulo, deberíamos:
- Conocer las principales estructuras de datos que proporciona R.
- Ser capaces de crear las distintas colecciones en R.
- Saber manipular las diferentes conjuntos de datos que aporta R.