Professional Documents
Culture Documents
19 de enero de 2009
Tenemos par
ametros redundantes y por lo tanto hemos de especificar como evitar
esta redundancia. Hemos de especificarlo con options. La opcion de que la suma sea
nula lo indicamos del siguiente modo.
> options(contrasts = c("contr.sum", "contr.poly"))
Tambien podemos indicar que el parametro asociado a la primera categora sea
nulo.
> options(contrasts = c("contr.treatment", "contr.poly"))
Vamos a estudiar la posible asociacion entre el consumo de alcohol y las malformaciones en los fetos.
> Alcohol = factor(c("0", "<1", "1-2", "3-5", ">=6"), levels = c("0",
+
"<1", "1-2", "3-5", ">=6"))
> malformaciones = c(48, 38, 5, 1, 1)
> n = c(17066, 14464, 788, 126, 37) + malformaciones
Indicamos que 1 ha de ser nula.
> options(contrasts = c("contr.treatment", "contr.poly"))
Ajustamos un modelo logit.
> (tabla.5.3.logit = glm(malformaciones/n ~ Alcohol, family = binomial,
+
weights = n))
Call:
Coefficients:
(Intercept)
-5.87364
Alcohol<1
-0.06819
Alcohol1-2
0.81358
Alcohol3-5
1.03736
weights = n)
Alcohol>=6
2.26272
Call:
Coefficients:
(Intercept)
-3.611
revAlcohol3-5
-1.225
revAlcohol1-2
-1.449
revAlcohol<1
-2.331
weights = n)
revAlcohol0
-2.263
1
2
3
4
5
logit
-5.873642
-5.941832
-5.060060
-4.836282
-3.610918
fitted.prop
0.002804721
0.002620328
0.006305170
0.007874016
0.026315789
1
2
3
4
5
logit
-5.873642
-5.941832
-5.060060
-4.836282
-3.610918
fitted.prop
0.002804721
0.002620328
0.006305170
0.007874016
0.026315789
Podemos observar c
omo las proporciones se incrementan conforme aumenta el
consumo de alcohol.
Vamos a ajustar un modelo en donde no hay dependencia entre el consumo de
alcohol y las malformaciones.
> (tabla.5.3.logit3 = glm(malformaciones/n ~ 1, family = binomial,
+
weights = n))
Call:
Coefficients:
(Intercept)
-5.856
Degrees of Freedom: 4 Total (i.e. Null); 4 Residual
Null Deviance:
6.202
Residual Deviance: 6.202
AIC: 26.83
El estadstico del test del cociente de verosimilitudes sera
> summary(tabla.5.3.logit3)$deviance
[1] 6.201998
2
> 1 - pchisq(summary(tabla.5.3.logit3)$deviance, df = 4)
[1] 0.1845623
El test chi-cuadrado de Pearson lo obtenemos con
> sum(residuals(tabla.5.3.logit3, type = "pearson")^2)
[1] 12.08205
> 1 - pchisq(sum(residuals(tabla.5.3.logit3, type = "pearson")^2),
+
df = 4)
[1] 0.01675140
Vemos que los resultados utilizando uno u otro tests son algo contradictorios.
1.
En el an
alisis considerado no se ha tenido en cuenta la naturaleza ordinal de la
covariable consumo de alcohol. Podemos considerar el modelo
logit(i ) = + xi .
En este modelo la hip
otesis de independencia correspondera con
= 0.
Los valores de la covariable seran: x1 = 0, x2 = 0,5, x3 = 1,5, x4 = 4,0, x5 = 7,0
siendo el u
ltimo valor arbitrario.
> puntuaciones = c(0, 0.5, 1.5, 4, 7)
> tabla.5.3.LL = glm(malformaciones/n ~ puntuaciones, family = binomial,
+
weights = n)
> summary(tabla.5.3.LL)
Call:
glm(formula = malformaciones/n ~ puntuaciones, family = binomial,
weights = n)
Deviance Residuals:
1
2
3
0.5921 -0.8801
0.8865
4
-0.1449
5
0.1291
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept)
-5.9605
0.1154 -51.637
<2e-16 ***
puntuaciones
0.3166
0.1254
2.523
0.0116 *
--Signif. codes: 0 ^
a~***^
a 0.001 ^
a~**^
a 0.01 ^
a~*^
a 0.05 ^
a~.^
a 0.1 ^
a~ ^
a 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 6.2020
Residual deviance: 1.9487
AIC: 24.576
on 4
on 3
degrees of freedom
degrees of freedom
1
2
3
4
5
logit
-5.960461
-5.802181
-5.485620
-4.694219
-3.744538
fitted.prop
0.002572090
0.003011861
0.004128844
0.009065077
0.023100302
Finalmente podemos obtener los intervalos de confianza para los parametros con
este modelo.
> library(MASS)
> confint(tabla.5.3.LL)
2.5 %
97.5 %
(Intercept) -6.19302366 -5.7396968
puntuaciones 0.01868149 0.5234947