Professional Documents
Culture Documents
4-1
Dos v as.
E. Barrios
M ODELOS L INEALES
Verano 2011
Tema 4
4-2
Variables Indicadoras
Una variable binaria es aquella que toma solamente dos valores. E.g., s , no; presente, ausente; mujer, hombre; encendido, apagado. Las variables binarias acostumbran a denotarse numericamente mediante va 1. A saber, riables indicadoras como x = 0 o { 0 : no, ausente, mujer, apagado x= 1 : s , presente, hombre, encendido lineal Sea x una variable indicadora y considere el modelo de regresion
y = 0 + 1x +
Entonces,
y (x=0) = 0 y (x=1) = 0 + 1
son respectivamente las respuestas promedio de las mujeres, de los casos ausentes, apagados o negativos; o bien, de los hombres, de los casos presentes, encendidos o positivos. En este contexto, al parametro 1 se le llama el efecto de cambiar del estado 0 al estado 1.
E. Barrios M ODELOS L INEALES Verano 2011
Tema 4
4-3
hombres mujeres
10
15 puntos
20
25
30
E. Barrios
M ODELOS L INEALES
Verano 2011
Tema 4
4-4
30 hombres mujeres 25
20 puntos
15
10 y=5.88+1.01*aos y=5.19+0.76*aos
0 0 5 10 aos
E. Barrios M ODELOS L INEALES Verano 2011
15
20
25
Tema 4
4-5
Considere entonces el modelo de regresion y = 0 + 1z + 2t + 3 zt + donde y es la respuesta puntos, z la variable indicadora que denota el genero (z = 0 si es (error) mujer, z = 1 si es hombre), t el tiempo de antiguedad en la empresa, y la variacion aleatoria. Note que 3 = 0 implica que las pendientes no dependen del genero. De otra forma, si 3 = 0, la pendiente de la recta que corresponde al hombre es 2 + 3. Similarmente, los puntos asignados en un inicio a la mujer son 0, mientras que si 1 = 0 los puntos asigna 0 + 1. dos al hombre en un inicio seran
E. Barrios
M ODELOS L INEALES
Verano 2011
Tema 4
4-6
Estad sticamente 1 0, por lo que concluir amos que en un inicio no hay por genero puntos a los homdistincion pero en el tiempo se le acumulan mas bres (3 > 0) que a las mujeres. En promedio las mujeres ganan 0.76 puntos mientras que los hombres 0.76 + 0.25 = 1.01 puntos por ano. por ano, de Principio de Herencia (de John A. Nelder). Si en un modelo la interaccion cierto orden incluye, por ejemplo, al factor A, entonces el modelo debe incluir el efecto principal del factor A.
E. Barrios M ODELOS L INEALES Verano 2011
Tema 4
4-7
y = 0 + 1z + 2t + 3 zt + 1 (1 = 0) donde z es una variable indicadora, la no signicancia del estimador nos permite probar la igualdad de ordenadas al origen. Similarmente, la no 3 (3 = 0) nos permite probar la igualdad de pensignicancia del estimador dientes entre ambas rectas.
E. Barrios
M ODELOS L INEALES
Verano 2011
Tema 4
4-8
Variables Categoricas
Una variable categorica es aquella cuyos valores corresponden a categor as. E.g., turno: matutino, vespertino y nocturno; experiencia: novato, medio y experto; proveedor zona: norte, sur, este, oeste; etc. variables indiNumericamente, las variables categoricas dan lugar una o mas cadoras. Una manera de codicar la variable categorica x con k + 1 categor as es construyendo k variables indicadoras z1, . . . , zk de la siguiente manera: categor as x 1 2 3 . . k+1
z1 0 1 0 . . 0
z2 0 0 1 . . 0
...
zk 0 0 0 . . 1
E. Barrios
M ODELOS L INEALES
Verano 2011
Tema 4
4-9
Variables Categoricas
Ejemplo: Consumo domestico de electricidad a generadora de electricidad estudia el consumo domestico Una compan co del tamano y del tipo de aire acondicionado en la casa-habitacion. mo funcion de la casa (en m2), y C el tipo (4) del Sea y el consumo (kw-hr ), x el tamano aire acondicionado: sin aire, unidades de ventana, bomba y central.
Tipo de aire acondicionado Sin aire Unidades de ventana Unidad de bomba Unidad central z1 0 1 0 0 z2 0 0 1 0 z3 0 0 0 1
E. Barrios
M ODELOS L INEALES
Verano 2011
Tema 4
4-10
Variables Categoricas
Ejemplo: Consumo domestico de electricidad (cont.) Luego, dependiendo del tipo de aire acondicionado, los correspondientes modelos ser an Tipo de aire acondicionado Modelo
Sin aire Unidades de ventana Unidad de bomba Unidad central y y y y = + x + = ( + 1) + x + = ( + 2) + x + = ( + 3) + x +
Cuando los efectos de pasar de un estado a otro no son similares, se dice que interactuan.
E. Barrios
M ODELOS L INEALES
Verano 2011
Tema 4
4-11
Variables Categoricas
Ejemplo: Consumo domestico de electricidad (cont.) Luego, los correspondientes modelos ser an:
Tipo de aire acondicionado Sin aire Unidades de ventana Unidad de bomba Unidad central Modelo y = + x + y = ( + 1) + x + y = ( + 2) + x + y = ( + 3) + x +
que implican un consumo jo dependiendo del tipo de aire acondicionado. Si a su vez el consumo por tipo de aire acondicionado depende del (intera de la casa, el modelo general queda como cciona con) tamano
M ODELOS L INEALES
Tema 4
4-12
yij = + i + ij , ij N(0, 2)
con j = 1, . . . , ni; i = 1, . . . , a. Note que la respuesta media para observacio nes bajo el i-esimo tratamiento es E[yij ] = E [ + i + ij ] = + i i es: Son las respuestas similares bajo los distintos Una pregunta de interes tratamientos?. O bien, Son los tratamientos iguales? Formalmente, la pre gunta la podemos plantear con la siguiente hipotesis compuesta:
Tema 4
4-13
) + (yij y i) yij = y + ( yi y
Se puede mostrar que
ni a i=1 j =1
SCTCorregido
(yij y )2 =
a i=1
ni ( yi y )2 +
SCTratamientos
ni a i=1 j =1
(yij y i)2
SCResiduales
y que bajo la hipotesis nula H0 : 1 = a a 2 n ( y y ) /(a 1) i i i=1 Fa1,N a Fobs = a ni 2 i) /(N a) i=1 j =1 (yij y a donde a es el numero de niveles o categor as y N = i=1 ni, el numero total de observaciones. Si es el caso que
Tema 4
4-14
SCTrat/(a 1) CMTrat/CMRes
medias son distintas, se calcula el intervalo de conanza para Para ver que todas las diferencias de medias i , y se verica si el intervalo incluye o dado por no el cero. Un intervalo del 100(1 ) % para i esta 1 1 ( i ) t1/2;N a s + , i, = 1, . . . , a; i = ni n donde i = y i , = y y s2 = CMRes = SCRes/(N a).
E. Barrios
M ODELOS L INEALES
Verano 2011
Tema 4
4-15
550
750
B tipo
Tema 4
4-16
Salida de R
Salida de Minitab
Level A B C D
N 6 6 6 6
E. Barrios
Verano 2011
Tema 4
4-17
E. Barrios
M ODELOS L INEALES
Verano 2011
Tema 4
4-18
ij
nij ( yi y ) +
2 SCA
ij
con los correspondientes estad sticos F dados en la siguiente tabla de analisis de varianza.
E. Barrios
M ODELOS L INEALES
Verano 2011
Tema 4
4-19
AB AB = (a 1)(b 1) SCAB SCAB/AB FAB = CMAB/CMRes Interaccion Residuales Res = ij (nij 1) SCRes SCRes/Res Total Corregido SCTotal ij nij 1
E. Barrios
M ODELOS L INEALES
Verano 2011