R Languagedata.table


Introduction

Data.table est un package qui étend les fonctionnalités des trames de données à partir de la base R, améliorant en particulier leurs performances et leur syntaxe. Reportez-vous à la section Docs du package à la rubrique Mise en route avec data.table pour plus de détails.

Syntaxe

  • DT[i, j, by]
    # DT [où, sélectionnez | mettre à jour | faire, par]
  • DT[...][...]
    # chaînage
  • ################# Shortcuts, special functions and special symbols inside DT[...]
  • . ()
    # dans plusieurs arguments, remplace la liste ()
  • J ()
    # en i, remplace la liste ()
  • : =
    # en j, une fonction utilisée pour ajouter ou modifier des colonnes
  • .N
    # dans i, le nombre total de lignes
    # en j, le nombre de lignes d'un groupe
  • .JE
    # en j, le vecteur des numéros de ligne dans le tableau (filtré par i)
  • .DAKOTA DU SUD
    # en j, le sous-ensemble actuel des données
    # sélectionné par l'argument .SDcols
  • .GRP
    # en j, l'index actuel du sous-ensemble des données
  • .PAR
    # en j, la liste des valeurs pour le sous-ensemble de données en cours
  • V1, V2, ...
    # noms par défaut pour les colonnes sans nom créées en j
  • ################# Joins inside DT[...]
  • DT1 [DT2, on, j]
    # joindre deux tables
  • je.*
    # préfixe spécial sur les colonnes de DT2 après la jointure
  • par = .EACHI
    # option spéciale disponible uniquement avec une jointure
  • DT1 [! DT2, on, j]
    # anti-joint deux tables
  • DT1 [DT2, on, roll, j]
    # joindre deux tables, en roulant sur la dernière colonne de on =
  • ################# Reshaping, stacking and splitting
  • faire fondre (DT, id.vars, measure.vars)
    # transformer en format long
    # pour plusieurs colonnes, utilisez measure.vars = patterns (...)
  • dcast (DT, formule)
    # transformer en format large
  • rbind (DT1, DT2, ...)
    # piles énumérées data.tables
  • rbindlist (DT_list, idcol)
    # empile une liste de data.tables
  • split (DT, par)
    # diviser un data.table en une liste
  • ################# Some other functions specialized for data.tables
  • foverlaps
    # chevauchement des jointures
  • fusionner
    # une autre façon de joindre deux tables
  • ensemble
    # autre moyen d'ajouter ou de modifier des colonnes
  • fintersect, fsetdiff, funion, fsetequal, unique, dupliqué, anyDuplicated
    # Opérations de théorie des ensembles avec des lignes en tant qu'éléments
  • uniqueN
    # le nombre de lignes distinctes
  • rowidv (DT, cols)
    # ID de ligne (1 à .N) dans chaque groupe déterminé par les cols
  • rleidv (DT, cols)
    # ID du groupe (1 à .GRP) dans chaque groupe déterminé par des exécutions de cols
  • shift (DT, n, type = c ("lag", "lead"))
    # appliquer un opérateur de décalage à chaque colonne
  • setorder, setcolorder, setnames, setkey, setindex, setattr
    # modifier les attributs et ordonner par référence

Remarques

Installation et support

Pour installer le package data.table:

# install from CRAN
install.packages("data.table")       

# or install development version 
install.packages("data.table", type = "source", repos = "http://Rdatatable.github.io/data.table")

# and to revert from devel to CRAN, the current version must first be removed
remove.packages("data.table")
install.packages("data.table")

Le site officiel du paquet contient des pages wiki pour vous aider à démarrer et des listes de présentations et d'articles du Web. Avant de poser une question - ici sur StackOverflow ou ailleurs - veuillez lire la page de support .

Chargement du paquet

De nombreuses fonctions dans les exemples ci-dessus existent dans l'espace de noms data.table. Pour les utiliser, vous devrez d'abord ajouter une ligne comme la library(data.table) ou utiliser leur chemin complet, comme data.table::fread au lieu de simplement fread . Pour obtenir de l'aide sur des fonctions individuelles, la syntaxe est help("fread") ou ?fread . Encore une fois, si le paquet n'est pas chargé, utilisez le nom complet comme ?data.table::fread .

data.table Exemples Liés