You are on page 1of 36

qwertyuiopasdfghjklzxcvbnmqwerty

uiopasdfghjklzxcvbnmqwertyuiopasd
fghjklzxcvbnmqwertyuiopasdfghjklzx
cvbnmqwertyuiopasdfghjklzxcvbnmq
wertyuiopasdfghjklzxcvbnmqwertyui
opasdfghjklzxcvbnmqwertyuiopasdfg
hjklzxcvbnmqwertyuiopasdfghjklzxc
vbnmqwertyuiopasdfghjklzxcvbnmq
wertyuiopasdfghjklzxcvbnmqwertyui
opasdfghjklzxcvbnmqwertyuiopasdfg
hjklzxcvbnmqwertyuiopasdfghjklzxc
vbnmqwertyuiopasdfghjklzxcvbnmq
wertyuiopasdfghjklzxcvbnmqwertyui
opasdfghjklzxcvbnmqwertyuiopasdfg
hjklzxcvbnmrtyuiopasdfghjklzxcvbn
mqwertyuiopasdfghjklzxcvbnmqwert
yuiopasdfghjklzxcvbnmqwertyuiopas
dfghjklzxcvbnmqwertyuiopasdfghjklz



Informe de Prcticas

Entornos de Computacin Estadstica

25/02/2014

Valentina Cueva Lpez




2
1. INTRODUCCIN A R 3
2. ESTADSTICA DESCRIPTIVA 14
3. ESTADSTICA BIDIMENSIONAL 20
4. ANLISIS DESCRIPTIVO DE SERIES TEMPORALES 22
5. INFERENCIA ESTADSTICA 25
6. MODELOS DE REGRESIN LINEAL 33
7. BIBLIOGRAFA 36



3
Una vez realizado el proyecto de programas de prcticas, vamos a
empezar a desarrollar el contenido de este en cada uno de los
apartados propuestos.
Para ello, vamos a ir desarrollando los temas a travs de las
secciones de este documento.
1. Introduccin a R

En este primer contenido del temario, vamos a ensear al alumno como
instalar R, as como empezar a manejar el programa.
Para empezar, indicaremos que, para obtener el programa que se va a
utilizar, introduciremos la direccin cran.r-project.org.
Esta es la pgina oficial donde est el programa y todos los paquetes
que, personas, universidades, ect van creando y colgando en la web
para facilitar el trabajo.
A continuacin, le daremos al hipervnculo Download for R
dirigindonos al hipervnculo que sea conveniente con el sistema
operativo de nuestro ordenador.


4
Ej.:
Mi sistema Operativo es Windows, por lo que pulsar:


Una vez estemos en dicha pgina, pulsaremos install R for the first
time y seguiremos las instrucciones para instalar.


5
Ej.:
Si seguimos con el ejemplo anterior, pulsaremos:

Terminada la instalacin del programa, procederemos a mostrar el
programa.
Primero abrimos el programa R, obteniendo la siguiente pantalla:


6
Como se puede observar en la anterior imagen, existe una ventana
llamada R Console, donde escribiremos las ordenes y se mostrarn los
resultados. Arriba de la ventana, hay unos mens desplegables, con las
siguientes funciones:
a. Archivo:



En esta ventana tenemos las funciones de Interpretar cdigo
fuente R, que nos lee las rdenes implementadas en la consola y
muestra los resultados, Nuevo script nos abre un archivo donde
se puede escribir las ordenes y que se muestren las soluciones
en la consola. Esta funcin, nos permite modificar las rdenes
sin tener que volver a escribirlas o si existe algn error en
las rdenes, poder obtener los resultados sin necesidad de estar
interrumpido por el error. En Abrir script, podemos abrir
archivos de rdenes previamente redactados.
Otra funcin importante es Cambiar dir.., donde podremos poner
la direccin donde R coger los datos, y as nos ahorraremos el
poner la direccin del ordenador donde estn al abrirlos.


7

b. Editar:



En esta ventana, estn las funciones caractersticas de dicho
men en otros programas.

c. Visualizar:





8
d. Misc:



e. Paquetes:


Este men es ms caracterstico de R. En l, podemos cargar
paquetes, previamente instalados en el programa, buscar los
paquetes para instalarlos o actualizarlos.
Tambin podemos instalarlos a partir de .zip previamente
descargados.



9
f. Ayuda:

El ltimo men del programa est compuesto por:



Una vez presentado el programa, procedemos a explicar al alumno cmo
introducir los datos al programa.


10
Los datos los vamos a introducir de dos formas distintas.
Introducimos los datos mediante rdenes:
Se realizar a partir de la siguiente orden:
Nombre_conjunto<- read.table(direccin_ordenador,
header=TRUE/FALSE, sep=, na.strings=NA, dec=.,
strip.white=TRUE)
Donde:
header= es para ver si los datos tienen o no cabecera.
sep= para poner cmo estn separados los datos entre s.
na.strings= indicador de los datos faltantes
dec= el smbolo decimal de los datos.

Introducimos los datos mediante el paquete Rcmdr:

Primero debemos instalar dicho paquete, realizando lo siguiente:





11
Una vez pulsado, le damos a cualquier pas, en nuestro caso
pulsaremos Spain (Madrid).



Una vez pulsado OK, buscamos el paquete y lo instalamos.
Cuando se termine de instalar, procedemos a cargar el paquete
usando Paquetes-> Cargar Paquete o mediante la funcin
library(Rcmdr).


12


Una vez cargado el paquete se abrir la siguiente ventana:




13
Finalmente, realizamos las siguientes acciones:


As, podemos introducir los datos a travs de R, con la opcin
Nuevo conjunto de datos o de Importar datos.


14
2. Estadstica Descriptiva

Para el mdulo de estadstica descriptiva, se va a utilizar el paquete
ds.
Este mdulo lo cre Emmanuel Arnhold, y en l nos vamos a basar para
obtener la mayora de las medidas que se aprendern.
Por tanto, empezaremos introduciendo los datos de la forma que hemos
visto en la seccin anterior. Una vez introducidos los datos,
aplicaremos las siguientes rdenes:
Grfico de nube de puntos
La funcin que usaremos es:
dplot(data,xlab=variable x,ylab=variable
y,position=1,colors=TRUE,type=o,mean=TRUE)

Donde los argumentos que hemos usado son:
- data: es el nombre del conjunto de datos que hemos
introducido anteriormente en el programa
- xlab: es el ttulo del eje x.
- ylab: es el ttulo del eje y.
- position: es la posicin que queremos en que quede la leyenda
del grfico. Las posiciones que vienen dadas por el autor son
las siguientes: top=1, bottomright=2, bottom=3, bottomleft=4,
left=5, topleft=6, topright=7, right=8, center=9.
- colors: si intoducimos TRUE, las lneas aparecern en color y
si utilizamos la orden FALSE, las lneas saldrn de color
negro.
- type: es el tipo de punto.
- mean: si queremos que aparezca el punto media utilizaremos
TRUE, si queremos que slo aparezca el dato original,
pondremos false.


15
Estadsticos descriptivos general:

La orden que utilizaremos para esto es:
gds(data)

Dicha funcin nos devuelve la media, el mximo, el mnimo, la
mediana, la media + o la desviacin tpica, los cuantiles, el
nmero de datos, el rango, la varianza, la desviacin tpica, el
error cuadrtico medio, el coeficiente de variacin de skewness,
curtosis y el test de normalidad, mostrando el p-valor asociado
al test de normalidad de Shapiro-Wilks.

Ahora vamos a realizar un ejemplo de dicho paquete:
Los datos introducidos en el programa son:



16
Y al usar la orden gds(Datos), obtenemos los siguientes resultados:



17
Finalmente, vamos a realizar un grfico con las dos variables que
hemos introducido con nuestros datos.



18
Lo mismo que hemos realizado antes con el paquete ds, podemos
realizarlo a travs del paquete descargado en la seccin anterior,
RCMDR.
Realizando la siguiente operacin:

Una vez pulsado en Resmenes numricos realizamos la siguiente accin:

Y al darle a aceptar, aparecern los valores que hayamos sealizado en
esta ventana.
A continuacin, vamos a introducir otro paquete de R, el cual, no slo
nos servir para esta seccin, sino que lo utilizaremos ms adelante
para realizar algunos anlisis.
Este paquete se llama DescTools. Primero procederemos a
descargarlo y una vez instalado, usaremos las siguientes funciones:

19
Media armnica:

Para realizar la media armnica, utilizaremos la siguiente
orden:
Hmean(x,na.rm=FALSE)

Los argumentos que utilizaremos son:
x: Datos introducidos en R.
na.rm: Indica si existen valores lgicos en los datos que hemos
introducido.

Esta funcin nos devuelve el valor de la media armnica.

Media geomtrica:

La media geomtrica tiene la siguiente orden:

Gmean(x,na.rm=FALSE)

Los argumentos que utilizaremos son:
x: Datos introducidos en R.
na.rm: Indica si existen valores lgicos en los datos que hemos
introducido.

Al final, la funcin nos devuelve el valor de la media
geomtrica.




20
3. Estadstica Bidimensional

Hay veces que nos interesa ver el comportamiento de las variables que
estn relacionados.
Este comportamiento se conoce, a travs de la covarianza, el
coeficiente de correlacin...
Para dicha finalidad, vamos a usar los siguientes paquetes:
- ds
- stats ( puesta por defecto en el programa )
Para calcular la covarianza, vamos a programarlo nosotros mismo,
realizando el siguiente programa:
table<-matrix(Datos,nrow=Nmero de filas,ncol=Nmero de columnas)
table
suma<-0
for(i in 1:length(table[,1])){suma<-table[i,1]*table[i,2]+suma}
covarianza<-suma/10-mean(table[,1])*mean(table[,2])
covarianza

La funcin mean, nos devuelve la media, teniendo en cuenta que esta pertenece
al paquete estadstico stats, que esta implementado por defecto en el
programa.
As, tenemos el siguiente ejemplo:



21

El paquete estadstico para calcular la correlacin es ds, en
concreto,la funcin que nos calcula la correlacin es:
Dscor(data,method=1,option=1)
Esta orden nos devolver el dato de la correlacin y el p-valor del
contraste de correlaciones asociado, pero en nuestro caso, slo nos
interesa el valor de la correlacin.
Si eligisemos el method=2, estaramos calculando la correlacin de
Spearman, de la forma anteriormente escrita, se obtiene la correlacin
de Pearson.
Ejemplo:

En este ejemplo, hemos introducido dos variables de datos, ponindolo
en formato tabla posteriormente.
Finalmente, aplicamos la orden y obtenemos el valor de la correlacin.


22
4. Anlisis Descriptivo de Series Temporales

En dicha seccin, vamos a utilizar el paquete ya instalado en el
programa, por defecto, como es el paquete stats.
Dentro de este paquete, hay una funcin, llamada ts, en la que
podremos realizar la descomposicin de la tendencia a travs de las
Medias Mviles.
Por tanto, introduciremos las siguientes rdenes en el programa:
temp.ts=ts(Datos,start=fecha,frequency=periodo)
temp.ts
plot(temp.ts)
tempdecomp.ts=decompose(temp.ts)
tempdecomp.ts

Hay que recalcar que, en nuestro fichero de datos, Datos, no
introduciremos las fechas de nuestra serie temporal, por ello, la
funcin ts, nos genera la la serie temporal.
Start nos permite incluir la fecha de inicio de nuestros datos, y as
no utilizar la cronologa puesta por defecto por el programa.
Finalmente, en frecuency, marcaremos cual es la frecuencia de nuestros
datos, es decir, si los datos son mensuales, cuatrimestrales,
trimestrales,...

Una vez vistas las rdenes que hay que utilizar para realizar la
descomposicin, vamos a ver un ejemplo.



23
Ejemplo:

Introducimos datos en el programa.


Ahora introducimos la variable tiempo en nuestros datos,

Finalmente, aplicamos la descomposicin por medias mviles:



24


Tambin, podemos realizar un grfico de los datos que hemos introducido:

As, hemos obtenido la tendencia de la serie anteriormente
introducida.

25
5. Inferencia Estadstica
Los contrastes que vamos a realizar sern a travs de los siguientes
paquetes:
- desctools ( ya instalado en secciones anteriores )
- ds
- n
Esta seccin la dividiremos en los siguientes apartados:
5.1. Intervalos de confianza
Para realizar intervalos de confianza para la media, utilizaremos el
paquete desctools, y usaremos la siguiente orden:
MeanCI(x,trim=0,type=c(classic,norm,basic,stud,perc
,bca),conf.level=0.95,na.rm=FALSE,R=999)
Donde tenemos los siguientes argumentos:
- x: vector de datos
- trim: vector de datos
- type: tipo de intervalo que se quieres
- conf.level: nivel de confianza que se requiere
- na.rm: existencia de valores perdidos
- R:Nmero de repeticiones posibles.
Tambin, podemos realizar el intervalo de confianza para la diferencia
de medias, utilizando la siguiente orden:
MeanDiffCI(x,y,type=c(classic,norm,basic,stud,perc,
bca),conf.level=0.95,na.rm=FALSE,R=999)
Donde los argumentos son iguales que en la orden anterior.
Si ahora queremos realizar el intervalo de confianza para la varianza,
se utiliza la siguiente orden:
VarCI(x,type=c(classic,norm,basic,stud,perc,bca
),conf.level=0.95,na.rm=FALSE,R=999)
Con argumentos iguales a la orden de intervalo de confianza para la
media.

26
Hay que tener en cuenta que, en dichas rdenes, tambin aparecer la
estimacin tanto de la media como de la varianza.
As, realizamos un ejemplo:




27

5.2. Contrastes de Hiptesis
Para realizar el contraste de igualdad de medias vamos a usar el
paquete estadstico Rcmdr.
- Contraste de igualdad de medias
Primero empezaremos por cargar el paquete. Una vez cargado, al ser un
programa por mens, seguiremos los siguientes pasos:

Una vez en introducidos, aparece la siguiente pantalla:

28

As, utilizaremos el tipo de contraste que se desee realizar, el valor
con a comparar y la variable que vayamos a analizar.
- Contraste de igualdad de medias de dos muestras dependientes
Si estamos en un cotraste de igualdad de medias de dos muestras
dependientes, realizaremos la siguiente operacin:

As, aparecer la siguiente ventana:


29
Una vez sealadas las variables, nos introduciremos en la ventana
Opciones, donde aparece:

En dicha ventana introduciremos el tipo de contraste que se quiera
realizar y el nivel de confianza al que queramos realizarlo.
- Contraste de Normalidad
Vamos a realizar un contraste de normalidad. El contraste que vamos a
usar es el test de Shapiro-Wilks, instalado en el paquete Ds,
instalado anteriormente.
La orden que utilizaremos para dicho test es la misma utilizado en el
apartado 2 de este documento, gds.
Aplicaremos un ejemplo para su uso:
Los datos introducidos en el programa son:

30

Y al usar la orden gds(Datos), obtenemos los siguientes resultados:




31
5.3. ANOVA
Vamos a proceder a realizar el anlisis de la varianza a partir del paquete
RCMDR.
Para proceder con dicho paquete, primero vamos a crear un modelo por el cual
se relacionen ambas variables.
Este se crea a partir de:




32
Una vez creado el modelo, podemos realizar el anlisis de la varianza
a partir del siguiente men:


Por lo tanto, al aceptar obtendremos el contraste.



33
6. Modelos de Regresin Lineal
Para realizar el ajuste de regresin, vamos a utilizar el paquete
Rcmdr.
En dicho paquete, en el men de Estadsticos -> Ajuste de modelos ->
Regresion lineal, podremos realizar una regresin del tipo:
y=ax+b.
Cuando realizamos dicho ajuste, nos aparece en la ventana de
soluciones los coeficientes de nuestro modelo junto con los contrastes
individuales de estos para saber si son o no significativos.
Una vez estimados los coeficientes, realizaremos el ANOVA del modelo,
usando lo explicado en el apartado anterior.
Si no tenemos dos variables, y queremos realizar un anlisis del tipo:
Y= ax1+bx2+
Para realizar dicho contraste, seguiremos los siguientes pasos:

Al introducirnos en Modelo Lineal, aparece la siguiente ventana:

34

Donde introduciremos la forma de nuestro modelo.
Una vez realizados dichos pasos, obtenemos una estimacin de los
parmetros del modelo, con sus respectivos contrastes individuales de
los modelos.
Para hacer ver si el modelo es significativo, realizaremos el anlisis
ANOVA.
A la hora de validar el modelo, se realizar el contraste de Breuch-
Pagan para heterocedasticidad, utilizando el siguiente men:

Una vez en el men, aparecer la siguiente ventana:

35

En donde podremos realizar el contraste.
Tambin, realizaremos el test de Durbin-Watson para autocorrelacin,
usando el siguiente men:



36
7. Bibliografa
La bibliografa utilizada para dicho trabajo es:
- Cran.r-project.org
- Apuntes de la asignatura Entornos de Computacin
Estadstica, Mster de Estadstica Aplicada, Universidad de
Granada

You might also like