Looking for r Answers? Try Ask4KnowledgeBase
Looking for r Keywords? Try Ask4Keywords

R Languagetabla de datos


Introducción

Data.table es un paquete que amplía la funcionalidad de los marcos de datos desde la base R, particularmente mejorando su rendimiento y sintaxis. Consulte el área de documentos del paquete en Introducción a data.table para obtener más información.

Sintaxis

  • DT[i, j, by]
    # DT [donde, seleccione | actualizar | hacer, por]
  • DT[...][...]
    # encadenamiento
  • ################# Shortcuts, special functions and special symbols inside DT[...]
  • . ()
    # en varios argumentos, reemplaza lista ()
  • J ()
    # en i, reemplaza lista ()
  • : =
    # en j, una función utilizada para agregar o modificar columnas
  • .NORTE
    # en i, el número total de filas
    # en j, el número de filas en un grupo
  • .YO
    # en j, el vector de los números de fila en la tabla (filtrado por i)
  • .DAKOTA DEL SUR
    # en j, el subconjunto actual de los datos
    # seleccionado por el argumento .SDcols
  • .GRP
    # en j, el índice actual del subconjunto de los datos
  • .POR
    # en j, la lista de por valores para el subconjunto actual de datos
  • V1, V2, ...
    # nombres predeterminados para columnas sin nombre creadas en j
  • ################# Joins inside DT[...]
  • DT1 [DT2, on, j]
    # unir dos mesas
  • yo.*
    # prefijo especial en las columnas de DT2 después de la unión
  • por = .EACHI
    # opción especial disponible solo con una combinación
  • DT1 [! DT2, on, j]
    # anti-join dos mesas
  • DT1 [DT2, on, roll, j]
    # unir dos tablas, rodando en la última columna en on =
  • ################# Reshaping, stacking and splitting
  • derretir (DT, id.vars, measure.vars)
    # transformar a formato largo
    # para columnas múltiples, use measure.vars = patterns (...)
  • dcast (DT, formula)
    # transformar a formato ancho
  • rbind (DT1, DT2, ...)
    # pila enumeró data.tables
  • rbindlist (DT_list, idcol)
    # apilar una lista de data.tables
  • dividir (DT, por)
    # divide una tabla de datos en una lista
  • ################# Some other functions specialized for data.tables
  • foverlaps
    # superposición une
  • unir
    # Otra forma de unir dos mesas.
  • conjunto
    # Otra forma de agregar o modificar columnas.
  • fintersect, fsetdiff, funion, fsetequal, unique, duplicated, anyDuplicated
    # operaciones de set-theory con filas como elementos
  • únicoN
    # el número de filas distintas
  • rowidv (DT, cols)
    # ID de fila (1 a .N) dentro de cada grupo determinado por cols
  • rleidv (DT, cols)
    # ID de grupo (1 a .GRP) dentro de cada grupo determinado por ejecuciones de cols
  • shift (DT, n, type = c ("lag", "lead"))
    # aplicar un operador de turno a cada columna
  • setorder, setcolorder, setnames, setkey, setindex, setattr
    # modificar atributos y ordenar por referencia

Observaciones

Instalación y soporte

Para instalar el paquete data.table:

# install from CRAN
install.packages("data.table")       

# or install development version 
install.packages("data.table", type = "source", repos = "http://Rdatatable.github.io/data.table")

# and to revert from devel to CRAN, the current version must first be removed
remove.packages("data.table")
install.packages("data.table")

El sitio oficial del paquete tiene páginas wiki que proporcionan ayuda para comenzar, y listas de presentaciones y artículos de toda la web. Antes de hacer una pregunta, aquí en StackOverflow o en cualquier otro lugar, lea la página de soporte .

Cargando el paquete

Muchas de las funciones en los ejemplos anteriores existen en el espacio de nombres data.table. Para usarlos, primero deberá agregar una línea como library(data.table) o usar su ruta completa, como data.table::fread lugar de simplemente fread . Para obtener ayuda sobre funciones individuales, la sintaxis es help("fread") o ?fread . Nuevamente, si el paquete no está cargado, use el nombre completo como ?data.table::fread .

tabla de datos Ejemplos relacionados