R LanguageEmpezando con R Language


Observaciones

Edición de documentos R en desbordamiento de pila

Vea las pautas de documentación para las reglas generales al crear documentación.

Algunas características de R que los inmigrantes de otro idioma pueden encontrar inusuales

  • A diferencia de otros idiomas, las variables en R no necesitan una declaración de tipo.
  • A la misma variable se le pueden asignar diferentes tipos de datos en diferentes instancias de tiempo, si es necesario.
  • La indexación de vectores atómicos y listas comienza desde 1, no 0.
  • Las arrays R (y el caso especial de matrices) tienen un atributo dim que las diferencia de los "vectores atómicos" de R que no tienen atributos.
  • Una lista en R le permite reunir una variedad de objetos bajo un nombre (es decir, el nombre de la lista) de una manera ordenada. Estos objetos pueden ser matrices , vectores , marcos de datos , incluso otras listas , etc. Ni siquiera es necesario que estos objetos estén relacionados entre sí de ninguna manera.
  • Reciclaje
  • Valores faltantes

Obteniendo ayuda

Puede utilizar la help() función help() o ? para acceder a las documentaciones y buscar ayuda en R. Para búsquedas aún más generales, puede usar help.search() o ?? .

#For help on the help function of R
help()

#For help on the paste function
help(paste)    #OR
help("paste")  #OR
?paste         #OR
?"paste"
 

Visite https://www.r-project.org/help.html para obtener información adicional

Hola Mundo!

"Hello World!"
 

Además, consulte la discusión detallada de cómo, cuándo, si y por qué imprimir una cadena .

Instalando R

Es posible que desee instalar RStudio después de haber instalado R. RStudio es un entorno de desarrollo para R que simplifica muchas tareas de programación.

Sólo Windows:

Visual Studio (a partir de la versión 2015, actualización 3) ahora presenta un entorno de desarrollo para R llamado R Tools , que incluye un intérprete en vivo, IntelliSense y un módulo de depuración. Si elige este método, no tendrá que instalar R como se especifica en la siguiente sección.

Para ventanas

  1. Vaya al sitio web de CRAN , haga clic en descargar R para Windows y descargue la última versión de R.
  2. Haga clic derecho en el archivo del instalador y EJECUTE como administrador.
  3. Seleccione el idioma de operación para la instalación.
  4. Siga las instrucciones de instalación.

Para OSX / macOS

Alternativa 1

(0. Asegúrate de que XQuartz esté instalado)

  1. Vaya al sitio web de CRAN y descargue la última versión de R.
  2. Abra la imagen del disco y ejecute el instalador.
  3. Siga las instrucciones de instalación.

Esto instalará tanto R como R-MacGUI. Colocará la GUI en la carpeta / Aplicaciones / como R.app donde se puede hacer doble clic o arrastrar al Doc. Cuando se lance una nueva versión, el proceso de (re) instalación sobrescribirá R.app, pero las versiones principales anteriores de R se mantendrán. El código R real estará en el directorio /Library/Frameworks/R.Framework/Versions/. El uso de R dentro de RStudio también es posible y usaría el mismo código R con una GUI diferente.

Alternativa 2

  1. Instale homebrew (el administrador de paquetes faltantes para macOS) siguiendo las instrucciones en https://brew.sh/
  2. brew install R

Quienes elijan el segundo método deben saber que el mantenedor de la bifurcación de Mac desaconseja hacerlo y no responderá a las preguntas sobre las dificultades en la Lista de correo de R-SIG-Mac.

Para Debian, Ubuntu y derivados.

Puede obtener la versión de R correspondiente a su distro a través de apt-get . Sin embargo, esta versión con frecuencia estará bastante lejos de la versión más reciente disponible en CRAN. Puede agregar CRAN a su lista de "fuentes" reconocidas.

sudo apt-get install r-base
 

Puede obtener una versión más reciente directamente de CRAN agregando CRAN a su lista de fuentes. Siga las instrucciones de CRAN para más detalles. Tenga en cuenta, en particular, la necesidad de ejecutar esto también para que pueda usar install.packages() . Los paquetes de Linux generalmente se distribuyen como archivos de origen y necesitan compilación:

sudo apt-get install r-base-dev
 

Para Red Hat y Fedora.

sudo dnf install R
 

Para archlinux

R está directamente disponible en el paquete Extra .

sudo pacman -S r

Puede encontrar más información sobre el uso de R en Archlinux en la página ArchWiki R.

Modo interactivo y scripts R

El modo interactivo

La forma más básica de usar R es el modo interactivo . Escribe comandos y obtienes inmediatamente el resultado de R.

Usando R como una calculadora

Inicie R escribiendo R en el símbolo del sistema de su sistema operativo o ejecutando RGui en Windows. A continuación puede ver una captura de pantalla de una sesión interactiva de R en Linux:

Captura de pantalla de un terminal de linux ejecutando R

Esto es RGui en Windows, el entorno de trabajo más básico para R en Windows: Captura de pantalla de un terminal RGui en Windows

Después del signo > , se pueden escribir las expresiones. Una vez que se escribe una expresión, el resultado se muestra con R. En la captura de pantalla anterior, se usa R como calculadora: Tipo

1+1
 

para ver inmediatamente el resultado, 2 . El [1] inicial indica que R devuelve un vector. En este caso, el vector contiene solo un número (2).

La primera parcela

R se puede utilizar para generar parcelas. El siguiente ejemplo utiliza el conjunto de datos PlantGrowth , que se presenta como un conjunto de datos de ejemplo junto con R

Escriba int las siguientes líneas en el indicador de R que no comienzan con ## . Las líneas que comienzan con ## están destinadas a documentar el resultado que R devolverá.

data(PlantGrowth)
str(PlantGrowth)
## 'data.frame':    30 obs. of  2 variables:
## $ weight: num  4.17 5.58 5.18 6.11 4.5 4.61 5.17 4.53 5.33 5.14 ...
## $ group : Factor w/ 3 levels "ctrl","trt1",..: 1 1 1 1 1 1 1 1 1 1 ...
anova(lm(weight ~ group, data = PlantGrowth))
## Analysis of Variance Table
## 
## Response: weight
##           Df  Sum Sq Mean Sq F value  Pr(>F)  
## group      2  3.7663  1.8832  4.8461 0.01591 *
## Residuals 27 10.4921  0.3886                  
## ---
## Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
boxplot(weight ~ group, data = PlantGrowth, ylab = "Dry weight")
 

Se crea la siguiente trama:

Gráfico de caja, creado a partir del conjunto de datos de ejemplo de PlantGrowth

data(PlantGrowth) cargan el conjunto de datos de ejemplo PlantGrowth , que es un registro de masas secas de plantas que se sometieron a dos condiciones de tratamiento diferentes o que no recibieron ningún tratamiento (grupo de control). El conjunto de datos está disponible bajo el nombre PlantGrowth . Tal nombre también se llama una variable .

Para cargar sus propios datos, las siguientes dos páginas de documentación pueden ser útiles:

str(PlantGrowth) muestra información sobre el conjunto de datos que se cargó. La salida indica que PlantGrowth es un data.frame , que es el nombre de R para una tabla. El data.frame contiene dos columnas y 30 filas. En este caso, cada fila corresponde a una planta. Los detalles de las dos columnas se muestran en las líneas que comienzan con $ : la primera columna se llama weight y contiene números ( num , el peso seco de la planta respectiva). La segunda columna, group , contiene el tratamiento al que se sometió la planta. Estos son datos categoriales, que se llaman factor en R. Lea más información sobre marcos de datos .

Para comparar las masas secas de los tres grupos diferentes, se realiza un ANOVA de una vía utilizando anova(lm( ... )) . weight ~ group significa "Comparar los valores del weight de la columna, agrupando por los valores del group de la columna". Esto se denomina Fórmula en R. data = ... especifica el nombre de la tabla donde se pueden encontrar los datos.

El resultado muestra, entre otros, que existe una diferencia significativa (Columna Pr(>F) ), p = 0.01591 ) entre algunos de los tres grupos. Deben realizarse pruebas post hoc, como la Prueba de Tukey, para determinar qué medios de los grupos difieren significativamente.

boxplot(...) crea un diagrama de caja de los datos. De donde provienen los valores a trazar. weight ~ group significa: "Grafique los valores del peso de la columna frente a los valores del group columnas. ylab = ... especifica la etiqueta del eje y. Más información: Trazado de base

Escriba q() o Ctrl - D para salir de la sesión R.

R scripts

Para documentar su investigación, es favorable guardar los comandos que utiliza para el cálculo en un archivo. Para ese efecto, puedes crear R scripts . Un script R es un archivo de texto simple, que contiene los comandos R

Cree un archivo de texto con el nombre plants.R y rellénelo con el siguiente texto, donde algunos de los comandos son familiares en el bloque de código anterior:

data(PlantGrowth)

anova(lm(weight ~ group, data = PlantGrowth))

png("plant_boxplot.png", width = 400, height = 300)
boxplot(weight ~ group, data = PlantGrowth, ylab = "Dry weight")
dev.off()    
 

Ejecute el script escribiendo en su terminal (¡el terminal de su sistema operativo, no una sesión interactiva de R como en la sección anterior!)

R --no-save <plant.R >plant_result.txt
 

El archivo plant_result.txt contiene los resultados de su cálculo, como si los hubiera escrito en el indicador interactivo de R. Por lo tanto, sus cálculos están documentados.

Los nuevos comandos png y dev.off se utilizan para guardar el diagrama de caja en el disco. Los dos comandos deben incluir el comando de trazado, como se muestra en el ejemplo anterior. png("FILENAME", width = ..., height = ...) abre un nuevo archivo PNG con el nombre del archivo, el ancho y la altura especificados en píxeles. dev.off() finalizará el trazado y guardará el trazado en el disco. No se guarda ninguna salida hasta que se llama a dev.off() .