Introducción
Data.table es un paquete que amplía la funcionalidad de los marcos de datos desde la base R, particularmente mejorando su rendimiento y sintaxis. Consulte el área de documentos del paquete en Introducción a data.table para obtener más información.
Sintaxis
-
DT[i, j, by]
# DT [donde, seleccione | actualizar | hacer, por] -
DT[...][...]
# encadenamiento -
################# Shortcuts, special functions and special symbols inside DT[...]
- . ()
# en varios argumentos, reemplaza lista () - J ()
# en i, reemplaza lista () - : =
# en j, una función utilizada para agregar o modificar columnas - .NORTE
# en i, el número total de filas
# en j, el número de filas en un grupo - .YO
# en j, el vector de los números de fila en la tabla (filtrado por i) - .DAKOTA DEL SUR
# en j, el subconjunto actual de los datos
# seleccionado por el argumento .SDcols - .GRP
# en j, el índice actual del subconjunto de los datos - .POR
# en j, la lista de por valores para el subconjunto actual de datos - V1, V2, ...
# nombres predeterminados para columnas sin nombre creadas en j -
################# Joins inside DT[...]
- DT1 [DT2, on, j]
# unir dos mesas - yo.*
# prefijo especial en las columnas de DT2 después de la unión - por = .EACHI
# opción especial disponible solo con una combinación - DT1 [! DT2, on, j]
# anti-join dos mesas - DT1 [DT2, on, roll, j]
# unir dos tablas, rodando en la última columna en on = -
################# Reshaping, stacking and splitting
- derretir (DT, id.vars, measure.vars)
# transformar a formato largo
# para columnas múltiples, use measure.vars = patterns (...) - dcast (DT, formula)
# transformar a formato ancho - rbind (DT1, DT2, ...)
# pila enumeró data.tables - rbindlist (DT_list, idcol)
# apilar una lista de data.tables - dividir (DT, por)
# divide una tabla de datos en una lista -
################# Some other functions specialized for data.tables
- foverlaps
# superposición une - unir
# Otra forma de unir dos mesas. - conjunto
# Otra forma de agregar o modificar columnas. - fintersect, fsetdiff, funion, fsetequal, unique, duplicated, anyDuplicated
# operaciones de set-theory con filas como elementos - únicoN
# el número de filas distintas - rowidv (DT, cols)
# ID de fila (1 a .N) dentro de cada grupo determinado por cols - rleidv (DT, cols)
# ID de grupo (1 a .GRP) dentro de cada grupo determinado por ejecuciones de cols - shift (DT, n, type = c ("lag", "lead"))
# aplicar un operador de turno a cada columna - setorder, setcolorder, setnames, setkey, setindex, setattr
# modificar atributos y ordenar por referencia
Observaciones
Instalación y soporte
Para instalar el paquete data.table:
# install from CRAN
install.packages("data.table")
# or install development version
install.packages("data.table", type = "source", repos = "http://Rdatatable.github.io/data.table")
# and to revert from devel to CRAN, the current version must first be removed
remove.packages("data.table")
install.packages("data.table")
El sitio oficial del paquete tiene páginas wiki que proporcionan ayuda para comenzar, y listas de presentaciones y artículos de toda la web. Antes de hacer una pregunta, aquí en StackOverflow o en cualquier otro lugar, lea la página de soporte .
Cargando el paquete
Muchas de las funciones en los ejemplos anteriores existen en el espacio de nombres data.table. Para usarlos, primero deberá agregar una línea como library(data.table)
o usar su ruta completa, como data.table::fread
lugar de simplemente fread
. Para obtener ayuda sobre funciones individuales, la sintaxis es help("fread")
o ?fread
. Nuevamente, si el paquete no está cargado, use el nombre completo como ?data.table::fread
.
tabla de datos Ejemplos relacionados