Professional Documents
Culture Documents
1 Introduccin
R es un lenguaje de software para llevar a cabo complicados (y simple) el
anlisis estadstico. Incluye rutinas para resumen de datos y la exploracin,
la presentacin grfica y el modelado de datos. El objetivo de este
documento es proporcionar a usted con una base mayor fluidez en el
idioma. Se sugiere que usted trabaja a travs de este documento en el
ordenador, habiendo iniciado una sesin R. Escribir todos los comandos que
se imprimen, y asegurarse de que entiende cmo funcionan. A continuacin,
pruebe los ejercicios sencillos al final de cada seccin.
Cuando trabajas en R se crean objetos que se almacenan en el rea de
trabajo actual( a veces llamada image). Cada objeto creado permanece en
la imagen, a menos que explcitamente se elimine. Al final de la sesin el
rea de trabajo se perdern a menos que lo guarde. Puede guardar el
espacio de trabajo en cualquier momento haciendo clic en el icono de disco
en la parte superior del panel de control.
Comandos escritos en R se guardan en la memoria durante toda la sesin.
Puede desplazarse hacia atrs los comandos usando la tecla de flecha
"arriba" y "abajo" para desplazarse de nuevo). Tambin puede 'Copiar' y
'Pegar' utilizando tcnicas editor estndar de Windows (por ejemplo, usando
el 'Copiar' y 'Pegar' botones de dilogo). Si en cualquier momento desea
guardar la transcripcin de la sesin, haga clic en "Archivo" y luego
"Guardar historial", que le permitir guardar una copia de los comandos que
se han utilizado para su uso posterior. Como alternativa, puede copiar y
pegar comandos manualmente en un editor de Bloc de notas o algo similar.
Termine un r la sesin escribiendo
> q(),
punto en el cual tambin se le pedir si o no usted desea guardar el espacio
de trabajo actual si no se perdern.
2 Objetos y aritmtica
R almacena la informacin y funciona sobre objetos. El ms simple de los
objetos son escalares, vectores y matrices.
Pero hay muchos otros: listas y dataframes por ejemplo. En el uso avanzado
de la R tambin puede ser til para definir nuevos tipos de objeto,
especficos para cada aplicacin particular. Nos limitaremos slo con los
objetos ms utilizados aqu.
Una caracterstica importante de R es que va a hacer cosas distintas en
diferentes tipos de objetos. Por ejemplo, escriba:1
> 4+6
El resultado debera ser
[1] 10
> X<-seq(1,10)
genera tambin un vector de nmeros enteros del 1 al 10.
En este punto vale la pena mencionar thehelp facility. Si usted no sabe
cmo utilizar una funcin, o no se sabe cules son las opciones o valores
predeterminados son, typehelp(functionname) donde la funcin- es el
nombre de la funcin que le interesa. Esto suele ayudar y a menudo se
incluyen ejemplos para hacer las cosas an ms claras.
Otra funcin til para la construccin de los vectores es la rep mando para
repetir las cosas. Por ejemplo
> rep(0,100) [1] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 [38] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 [75] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
o
> rep(1:3,6) [1] 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 Aviso tambin una
variacin en el uso de esta funcin
> rep(1:3,c(6,6,6)) [1] 1 1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 3 3
que tambin podramos simplificar inteligentemente como
> rep(1:3,rep(6,3) [1] 1 1 1 1 1 1 2 2 2 2 2 2 3 3 3 3 3 3
ejercicios
1. Definir
> x<-c(4,2,6) > y <-c(1,0,-1)
Decidir cul ser el resultado de las siguientes:
(a) longitud(x) (b) suma(x) (c) suma(x^2) (d) x+y (e) y (f*x) x-2 (g) x^2
Utilice R para comprobar sus respuestas.
2. Decidir cules son las siguientes secuencias y utilizar R para verificar sus
respuestas:
(a) 7:11 (b) seq(2,9) (c) seq(4,10,por=2) (d) seq(3,30,longitud=10) (e)
SEC(6,-4,por=-2)
3. Determinar cul ser el resultado de las siguientes expresiones R y, a
continuacin, utilizar R para verificar que son correctas:
(a) La Rep(2,4) b) Rep(c(1,2),4) (c) Rep(c,c(1,2)(4,4)) (d) Rep(1:4,4) (e)
Rep(1:4,rep(3,4))
4. Utilice la funcin de rep para definir simplemente los siguientes vectores
en R.
6,6,6,6,6,6 (a)
(b) (c) 5,5,5,5,8,8,8,8 5,8,5,8,5,8,5,8
4
3 resmenes y Subscripting
supongamos que hemos recogido algunos datos de un experimento y se
almacenan en un objectx:
> x<-c(7.5,8.2,3.1,5.6,8.2,9.3,6.5,7.0,9.3,1.2,14.5,6.2)
algunos simples estadsticas de resumen de estos datos puede ser
producido:
> significa(x) [1] 7.216667 > var(x) [1] 11.00879 > Resumen(x) Min.
1 Qu. Mediana Media 3 Qu. Max.
1.200 6.050 7.250 7.217 8.475 14.500
que deben ser auto-explicativa. Sin embargo, es posible que posteriormente
hemos aprender que los 6 primeros datos corresponden a las mediciones
efectuadas en una mquina, y la segunda, seis en otra mquina.
Esto podra sugerir que resume los dos conjuntos de datos por separado,
por lo que necesitaramos para extraer desde x los dos subvectors
pertinentes. Esto se logra mediante la subscripting:
> x[1:6]
y
> x[7:12]
dar las correspondientes subvectors. Por lo tanto,
> Resumen(x[1:6]) Min. 1 Qu. Mediana Media 3 Qu. Max.
3.100 6.075 7.850 6.983 8.200 9.300 > Resumen(x[7:12]) Min. 1 Qu.
Mediana Media 3 Qu. Max.
1.200 6.275 6.750 7.450 8.725 14.500
otros subconjuntos pueden ser creados de una manera obvia. Por ejemplo:
> x[c(2,4,9)] [1] 8.2 5.6 9.3
enteros negativos se pueden utilizar para excluir determinados elementos.
Por ejemplo,
x[-(1:6)]
tiene el mismo efecto que x[7:12].
Ejercicios
1. Si x<- c(5,9,2,3,4,6,7,0,8,12,2,9) decida qu cada uno de los siguientes
enunciados y utilizar R para verificar sus respuestas:
(d) x[c(1:5,10:12)]
(e) x[-(10:12)
.] 2. Los datos y<-c(33,44,29,16,25,45,33,19,54,22,21,49,11,24,56)
contienen las ventas de leche en litros durante 5 das en tres diferentes
tiendas (los 3 primeros valores son para tiendas 1,2 y 3 el lunes, etc.)
producen un resumen estadstico de las ventas para cada da de la semana
y tambin para cada tienda.
4 matrices
matrices pueden ser creados en R en una variedad de maneras. Quizs la
ms sencilla es crear las columnas y, a continuacin, pegarlas con el
comando cbind. Por ejemplo,
> x<-c(5,7,9) > y <-c(6,3,4) ><-cbind z(x,y) > x y z [1, 5] 6
[2] 7 3 [3] 9 4
La dimensin de una matriz se puede comprobar con el comando
> thedim dim(z) [1] 3 2
es decir, tres filas y dos columnas. Hay un comando similar, rbind, para la
construccin de matrices por filas de encolado juntos.
Las funciones cbind y rbind puede aplicarse tambin a las matrices a s
mismos (siempre y cuando el di- mensions match) para formar matrices
ms grandes. Por ejemplo,
> rbind(z,z) [,1] [,2] [1] 5 6 [2] 7 3 [3] 9 4 [4] 5 6 [5, 7], 3 [6] 9 4
Matrices tambin pueden ser construidos por construccin explcita
mediante la funcin Matriz. Por ejemplo,
z<-matrix(c(5,7,9,6,3,4),nrow=3) se
traduce en una matriz z z idntico al anterior. Observe que la dimensin de
la matriz se determina por el tamao del vector y el requisito de que el
nmero de filas es 3, especificado por el argumento nrow=3. Como
alternativa, podramos haber especificado el nmero de columnas con el
argumento ncol=2 (obviamente, es innecesario dar a ambas). Observe que
la matriz se rellena la columna 'arriba'-wise. Si desea rellenar la fila-sabio,
agregue la opcin byrow=T. Por ejemplo,
6
> solucionar y(x) [,1] [,2] [1], 0.23076923 -0.1538462 [2], 0.07692308
0.1153846
como con vectores es til para poder extraer los subcomponentes de
matrices. En este caso, queremos destacar elementos individuales, filas o
y 8%%x (d)
(e) t(y) (f) resolver(x) 2. Con x e y como en el caso anterior, calcular el
efecto de las siguientes operaciones de subndice y comprobar tus
respuestas en R.
(a) x[1], (b) x[2], (c) x[,2] (d) y[1,2] (e) y[,2:3]
5 Asociar a objetos
R incluye un nmero de conjuntos de datos que es conveniente utilizar para
ver ejemplos. Puede obtener una descripcin de lo que est disponible
escribiendo
> Datos()
para acceder a cualquiera de estos conjuntos de datos, que luego
typedata(dataset dataset) donde es el nombre del conjunto de datos a la
que desea acceder. Por ejemplo,
> Datos(rboles)
escribiendo
> rboles[1:5] altura circunferencia Volumen 1 8.3 70 2 65 10.3 10.3 8.6
3 8.8 63 10.2 10.5 16.4 5 4 72 10,7 81 18,8
nos da las 5 primeras filas de estos datos, y ahora podemos ver que las
columnas representan las mediciones de circunferencia, altura y volumen de
rboles (cerezos realmente: seehelp(rboles), respectivamente.
Ahora, si queremos trabajar en las columnas de estos datos, podemos
utilizar la tcnica subscripting explicado anteriormente: por
ejemplo,rboles[,2] da a todas las alturas. Esto es un poco tedioso y, sin
embargo, sera ms fcil si pudiramos consultar a las alturas de forma ms
explcita. Esto lo podemos lograr mediante la asociacin a los rboles
dataset:
> Adjuntar(rboles)
Efectivamente, esto hace que el contenido de un directorio y oftrees si
escribimos el nombre de un objeto, R buscar dentro de este directorio para
encontrarlo. Desde la altura es el nombre de una de las columnas de
rboles, R reconoce ahora este objeto cuando nos escriba el nombre. De ah
que, por ejemplo,
> significa(Altura) [1] 76
y
9
11
8 grficos
R tiene muchas instalaciones para producir grficos de alta calidad. Antes
de comenzar una funcin til es dividir una pgina en trozos pequeos con
el fin de que ms de una figura puede ser visualizada. Por ejemplo:
> par(mfrow=c(2,2))
crea una ventana de grficos con 2 filas y 2 columnas. Con esta eleccin, las
ventanas estn llenas de altura histograma
arriba row-wise. Utilice mfcol en lugar de
10mfrow para llenar la columna-wise. La funcin 85 es un par
8 80 general funcin 6 para el ajuste de parmetros de la grfica. Hay
muchas opciones: consulte 75 help(par).
Frecuencia 4 70 2
65 0 60 65 70 75 80 85 90
altura
histograma de volumen
10 70 8 60
6 50
40 4 Frecuencia 30 2 20
0 10 10 20 30 40 50 60 70 80 El
volumen
Figura 1: rbol alturas y volmenes, de
manera que, por ejemplo
> par(mfrow=c(2,2))
> hist(Altura)
> diagrama de caja(Altura)
> hist(Volumen)
> diagrama de caja (volumen)
> par(mfrow=c(1,1)
Cintura
85
80
75
70
65
8 10 12 14 16 18 20
Figura 3: Scatter Plot Matrix para
ver la figura ?? .
R tambin puede producir un Scatter Plot Matrix (Matriz de scatterplots para
cada par de variables)
utilizando la funcin de pares :
> pares(rboles),
vase la figura ?? . Al igual que muchas otras funciones parcela
70 60 50 Altura Volumen
40 30 20 10 10 20 30 40 50 60 70
datos de rbol
es especfica del objeto: su comportamiento depender de la
Frecuencia 50 30 10 0 40 50 60 70 80 90 100
x[ 2]
90
70 x[,]
50 2
1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0
x[ 1]
Figura 4: Salida de varias parcelas.De
ah que, por ejemplo
> Varios.parcelas(fiel)
erupciones
min de espera. 1.600 43.0
15
1st Qu. 58,0 2.163 4.000 3.488 Mediana 76,0 Promedio 70,9 3Qu. 82,0
4.454 Max. 5.100 96.0 que tambin produce la figura ??.
Ejercicios
1. Escribir una funcin que toma como argumento dos vectores,x e y,
produce un Scatter plot, y calcula el coeficiente de correlacin (usando
CDR(x,y).
P P 2. Escribir una funcin que toma un vector (x1, . . . , xn) y calcula tanto
xi y x2i . (Re- miembro de la utilizacin de la funcin SUMA).
10 Otras cosas
hay muchas otras instalaciones en R. Estos incluyen:
1. Funciones para el montaje de los modelos estadsticos tales como lineales
y modelos lineales generalizados.
2. Funciones para ajustar las curvas para suavizar los datos.
3. Las funciones de optimizacin y de ecuaciones.
4. Instalaciones para programar utilizando Bucles y condicionales tales asif y
al mismo tiempo.
5. Trazando las rutinas para ver datos tridimensionales.
Tambin existe la posibilidad de "bolt-on" ms bibliotecas de funciones que
tienen una utilidad concreta.
Escribir
> Biblioteca()
dar una lista y una breve descripcin de las libreras disponibles. Escriba
> Biblioteca(nombrebiblioteca)
donde nombrebiblioteca es el nombre de la biblioteca necesaria le dar
acceso a las funciones de la biblioteca.
11 obtener ms ayuda
este tutorial gua pretende ser slo introductoria. Mucho ms ayuda puede
obtenerse de:
1. El sistema de ayuda incluido en el lenguaje;
2. Los manuales que se incluyen en el idioma: haga clic en 'Ayuda', siga la
ruta a 'manuals'. La 'Introduccin a R' es especialmente til.
3. Libros: ahora hay muchos que cubren el uso de R (y/o el lenguaje similar
S-Plus).
16
c:\Archivos de programa\R
es un buen lugar para instalar los archivos. En el men 'Seleccionar
componentes', es una buena idea elegir archivos principales, los archivos de
ayuda HTML, manuales en lnea (PDF), y el manual de referencia.
Cuando la instalacin est completa, usted debe tener un icono en el
escritorio mostrando el smbolo R.
Es una buena idea para editar las propiedades de este icono (haga clic con
el botn derecho del ratn sobre el icono para obtener el men donde
puede elegir este) y editar la entrada en el cuadro 'Start' bajo la pestaa
'Atajo' para especificar un directorio de su eleccin para su trabajo.
17