You are on page 1of 3

# Anlisis Captulo 2 (Comandos para R)

================================================================================
========================================================
# 1. Datos de Morley
================================================================================
========================================================
attach(morley)
# Hace disponibles lo que est contenido en morley
plot(Expt, Speed, pch=16, col="blue", main="Diagrama de dispersin (Velocidad fren
te a Experimento)", xlab="Experimento", ylab="Velocidad")
# Diagarama de dispersin (Speed frente a Expt)
# En el 1er experimento hay mayor variabilidad, 2 perturbaciones en el 3er
fExpt <- factor(Expt, labels=c("Expt 1", "Expt 2", "Expt 3", "Expt 4", "Expt 5")
)
# Definir fExpt como un factor (con cinco niveles).
numSummary(Speed, groups=fExpt, statistics=c("mean", "sd", "quantiles"), quantil
es=c(0,.25,.5,.75,1))
# Con R Commander abierto pegar en R
# Mirando las medias van decreciendo, la mediana idem, la desviacin tpica del 1er
mayor
plot(fExpt, Speed, col="blue") # Diagarama de cajas (Speed frente a fExpt).
# 1er asimetra negativa, 3er positiva, 5er positiva, etc. 4 OBSERVACIONES ATPICAS
EN EL EXPERIMENTO 3
bartlett.test(Speed ~ fExpt) # Contraste de homocedasticidad (varianza constante
) de Bartlett.
# Es cte la varianza de Speed a lo largo de los 5 Expt? NO ES HOMOCEDASTICO
ANOVA.Speed <- lm(Speed ~ fExpt) # Ajustar el modelo ADEVA con un nico factor (fg
rupo) usando el commando "lm" (linear model).
summary(ANOVA.Speed, cor=FALSE) # Tabla ADEVA para el ajuste.
# H0 -> La ordenada en el origen es 0? Estimate = para infinitas mediciones. NING
UNO ES 0, los resultados de los 5 expt parecen dif (por la suposicin de homocedast
icidad?)
ANOVA.SpeedB <- aov(Speed ~ fExpt) # Ajustar el modelo ADEVA con un nico factor (
fgrupo) de otra manera usando el commando "aov" (analysis of variance).
# Para despus aplicar TurkeyHSD.
TukeyHSD(ANOVA.SpeedB, conf.level=0.95) # Intervalos de confianza del 95% para l
as diferencias entre las medias para los distintos niveles del factor.
# Las nicas dif. en las medias significativas son Expt 4-Expt 1 y Expt 5-Expt 1. IN
TERPRETACIN PARCIAL POR HOMOCEDASTICIDAD!!
plot(TukeyHSD(ANOVA.SpeedB, "fExpt", conf.level=0.95))
# Diagrama de los intervalos de confianza del 95% para las diferencias entre las
medias para los distintos niveles del factor.
library(MASS) # Cargar paquete MASS (para despus calcular los residuos estudentiz
ados).
sres.Speed <- studres(ANOVA.SpeedB) # Obtener residuos estudentizados.
sres.Speed # Residuos estudentizados.
sort(sres.Speed) # Residuos estudentizados ordenados
# Buscar los mayores de 3 en valor absoluto, la observacin 14 y la 47
hist(sres.Speed, probability=TRUE, main="Histograma de Residuos Estudentizados",
xlab="Residuo Estudentizado", ylab="Densidad", col="grey", breaks=10)
lines(density(sres.Speed, bw="SJ"), col="blue", lwd=2)
x<-seq(from=-3.5, to=3.5, by=0.05)
lines(x, dnorm(x, 0, 1), col="red", lwd=2, lty=2)
# Histograma de los residuos estudentizados con una densidad ncleo y una densidad
normal sobre puestas.
# 10 por ser la raiz cuadrada del nmero de observaciones (100)
# La dif. es por la cola (los dos valores 14 y 47)
qqnorm(sres.Speed, main="Grfico Q-Q normal", xlab="Cuantil terico", ylab="Cuantil
muestral", pch=16, col="red")
qqline(sres.Speed, lwd=2, lty=2, col="blue")
# Grfico Q-Q (Cuantil-Cuantil) normal con lnea diagonal de referencia.
# Los ptos deben caer por encima de la lnea (2 muy por debajo)
shapiro.test(sres.Speed) # Contraste de normalidad de Shapiro-Wilk.
# Rechazamos la normalidad Cuidado con la interpretacin!!
================================================================================
==================================================
(Sin los casos 14 y 47)
Expt2=Expt[-14]
Expt2=Expt2[-46]
Speed2=Speed[-14]
Speed2=Speed2[-46]
# Creamos dos nuevos objetos Expt2 y Speed2
plot(Expt2, Speed2, pch=16, col="blue", main="Diagrama de dispersin (Velocidad fr
ente a Experimento)", xlab="Experimento", ylab="Velocidad")
fExpt2 <- factor(Expt2, labels=c("Expt 1", "Expt 2", "Expt 3", "Expt 4", "Expt 5
"))
numSummary(Speed2, groups=fExpt2, statistics=c("mean", "sd", "quantiles"), quant
iles=c(0,.25,.5,.75,1))
# 19 observaciones en el Expt del 1 y 3
plot(fExpt2, Speed2, col="blue")
bartlett.test(Speed2 ~ fExpt2) # Se ha eliminado el problema de la hocedasticida
d
ANOVA.Speed2 <- lm(Speed2 ~ fExpt2)
summary(ANOVA.Speed2, cor=FALSE) # Rechazamos que alguno sea 0
# p-value final que los alfas son todos iguales y 0
ANOVA.Speed2B <- aov(Speed2 ~ fExpt2)
TukeyHSD(ANOVA.Speed2B, conf.level=0.95)
plot(TukeyHSD(ANOVA.Speed2B, "fExpt2", conf.level=0.95))
# Todos son significativamente diferentes entre el 1er experimento pero no entre
los otros
sres.Speed2 <- studres(ANOVA.Speed2B)
sres.Speed2
hist(sres.Speed2, probability=TRUE, main="Histograma de Residuos Estudentizados"
, xlab="Residuo Estudentizado", ylab="Densidad", col="grey", breaks=10)
lines(density(sres.Speed2, bw="SJ"), col="blue", lwd=2)
x<-seq(from=-3.5, to=3.5, by=0.05)
lines(x, dnorm(x, 0, 1), col="red", lwd=2, lty=2)
qqnorm(sres.Speed2, main="Grfico Q-Q normal", xlab="Cuantil terico", ylab="Cuantil
muestral", pch=16, col="red")
qqline(sres.Speed2, lwd=2, lty=2, col="blue")
shapiro.test(sres.Speed2)
# CONCLUSIN: Algo pas en el 1er expt.

You might also like