Appendix A — Introdución a R
A.1 Ventajas de R
Open Source (gratuito)
Usado por muchos desarrolladores y en muchos trabajos, especialmente aquellos intensivos en “data analysis”
Sustituto perfecto de
Stata
aunque es menos amigableVisualización más flexible que
Stata
Es más eficiente en algunas funcionalidades como uso de datos geográficos
A.2 DataCamp
DataCamp es una plataforma que contiene cursos y contenido para aprender
R
y otros softwares de Data Analysis (ej.Python
)Recibirán una invitación a su correo del ITAM. Tendrán acceso a los cursos por 6 meses. El uso de DataCamp es opcional para el curso.
Al usar DataCamp podrán practicar como programar en
R
y el sistema les da feedback inmediatoPara usarlo no es necesario instalar
R
en su computadora, aunque para las Tareas sí lo necesitarán
A.3 Instalando R
Entrar a
CRAN
e instalarR
siguiendo el link relevante del cuadro que indicaDownload and install R
Windows: seguir los links
Download R for Windows
yDownload R 4.0.2 for Windows
. Una vez instalado, regresar a la páginaDownload R for Windows
y elige el link que diceRtools
. En la nueva página eligeRtools40.exe
e instala.Mac: seguir los links
Download R for macOS
yR-4.0.2.pkg
(notarized and signed).
Entrar a
RStudio
. Seleccionar la pestaña Products>RStudio, ir a la sección de RStudio Desktop y descargar la versión Open Source Edition
En DataCamp hay un tutorial para instalar R
y RStudio
también
A.3.1 R
y RStudio
R
es un lenguaje de programación con enfoque estadístico y matricial.R
ejecuta todas las operaciones que le indicaremos.RStudio
es una interfaz que nos da flexibilidad al realizar distintas tareas. Podemos integrar todo nuestro proceso de trabajo en el mismo ambiente.Para utilizar
RStudio
es necesario descargar primeroR
.
A.3.2 R
Packages
A diferencia de
Stata
,R
no tiene los comandos en menús y su uso si requiere del conocimiento del nombre de los comandos relevantesLos packages representan un conjunto de funciones, datos y comandos de
R
.Para instalar un nuevo package se utiliza el comando
install.packages(‘nombre_package’)
Para utilizar las funciones que incluye dicho package hay que cargarlos en la sesión utilizando el comando
library(package)
Se recomienda que se carguen todos los packages que se utilizaran en la sesión al inicio del script de
R
A.3.3 Abriendo bases de datos
Utilizar el comando
setwd
para indicar el directorio de trabajo donde pondrán la base de datos por abrir (ojo con la dirección de las diagonales “/
”)- Ej.
setwd("C:/Users/aaeag/Microeconometria_aplicada/Bases Stata")
- Ej.
Para abrir bases en formato:
Stata
: Utilizamos delibrary(haven)
el comandoread_dta(“nombre_archivo”)
CSV
: Utilizamos el comandoread.csv(“nombre_archivo”)
Excel: Utilizamos de
library(gdata)
el comandoread.xlsx(“nombre_archivo”)
En el script de ejemplo se muestra como abrimos una base de Stata
Otra alternativa consiste en utilizar la ventana superior derecha, pestaña Environment
, botón Import Dataset