Professional Documents
Culture Documents
i = 1,2,..., n
Donde Yi es la i-sima observacin de la respuesta para un conjunto de valores fijos xi1 , xi 2 ,..., xik de las k variables de predictoras.
Y = X +
Donde:
Y1 Y Y = 2 , M Yn
1 x11 1 x 21 X= M M 1 xn1
x12 x22 M xn 2
L x1k L x2 k , M M L xnk
0 = 1, M k
1 = 2 M k
Notar que X es una matriz de n m , y es un vector de m filas, donde m=k+1. Para la estimacin de los coeficientes de regresin por mnimos cuadrados, se tiene:
L = T = (Y X ) (Y X )
T
= XT Y XT X
Finalmente:
= XT X = X Y
XT Y
Probabilidades y Estadstica
es el vector de n 1 que contiene a los valores estimados para la respuesta promedio correspondientes Donde Y a los n puntos de observacin de las variables de prediccin.
proporciona el vector de residuos. Notar que la diferencia entre los vectores Y e Y Anlisis de Varianza
Se definen la Hiptesis Nula H 0 : 1 = 2 = ... = k = 0 contra la hiptesis alternativa H 1 : j 0 para algn j = 1,2,..., k La hiptesis H 0 establece que todos los coeficientes excepto 0 son iguales a cero. Con ello se plantea que no existe ninguna relacin igual a la especificada por el modelo entre la variable respuesta y el conjunto de variables predictoras. Por lo tanto, si se rechaza H 0 , quiere decir que existe evidencia suficiente para afirmar que existe relacin significativa entre al menos una de las variables predictoras y la variable respuesta. Al igual que en el caso de regresin lineal, la suma de cuadrados totales es igual a la suma de cuadrados de la regresin ms la suma de cuadrados de los errores, es decir:
SCT = Y
( Y ) Y
i
T X T Y ( Yi ) SCR = n T T T X Y SCE = Y Y
T X T Y ( Yi ) n
SCR m 1
SCR m 1
SCE nm
Error
n-m
T XT Y YTY
S2 =
SCE nm
Total
n-1
Y
La hiptesis nula se rechaza si F > F1 ;m1;mn
( Y ) Y
i
Probabilidades y Estadstica
R2 =
H0 : j = 0
H1 : j 0
( )
, j = 0,1,..., k
s j
( )
2 ;n m
t j j 1 ,n m s j
( )
, j = 0,1,..., k
XT 1 x1 P =[
x2 L xk ]
= XTB Y P P + x + x + ... + x = 0 1 1 2 2 k k est dada por: Es posible demostrar que Var Y P = 2 XT (XT X )1 X Var Y P P P
Edmundo Pea Rozas, Juan Garcs Seguel
( )
( )
Probabilidades y Estadstica
( )
( )
XP
Donde s 2 es la varianza de los residuos y X es la matriz original de valores x. Entonces, un intervalo de confianza del 100(1 )% para la respuesta promedio en x1 , x2 ,..., xk est definido por:
p t1 / 2;nm s Y y P
( )
X particular
X particular
Por lo tanto, un intervalo de confianza del 100(1 )% para la prediccin de una respuesta real en x1 , x2 ,..., xk est definido por:
Probabilidades y Estadstica
Ejemplo: En una planta productiva, uno de los tems de costo ms importantes es el uso de agua. Por ello, los ingenieros desean predecir el consumo de agua, en funcin de otras variables. Se cuenta con una muestra de 17 observaciones.
Nmero de Produccin (Miles Das de Trabajo personas en el de Toneladas) en el mes mes 7107 6373 6796 9208 14792 14564 11964 13526 12656 14119 16691 14571 13619 14575 14556 18573 15618 21 22 22 20 25 23 20 23 20 20 22 19 22 22 21 21 22 129 141 153 166 193 189 175 186 190 187 195 206 198 192 191 200 200 Consumo de agua (Galones) 3067 2828 2891 2994 3082 3898 3502 3060 3211 3286 3542 3125 3022 2922 3950 4488 3295
Temperatura (F) 58,8 65,2 70,9 77,4 79,3 81 71,9 63,9 54,5 39,5 44,5 43,6 56 64,7 73 78,9 79,4
Probabilidades y Estadstica
A partir del anlisis de varianza, se puede concluir que al menos uno de los coeficientes de regresin es significativamente distinto de cero. Analizando los coeficientes de forma individual, se tiene observa lo siguiente:
Coeficiente Estimador Puntual 6360,33733 13,8688644 0,21170294 -126,690357 -21,8179635 Error tpico 1314,39161 5,15981506 0,04554312 48,0223383 7,2845197 Estadstico t 4,838997198 2,687860753 4,648407002 -2,638154687 -2,995113533 Valor -P 0,000405742 0,019747815 0,000561988 0,021647374 0,011167649
0 1 2 3 4
Se tiene que, si se utiliza un nivel de significancia del 5% en las pruebas de hiptesis para los coeficientes individuales, existe evidencia para afirmar que todos ellos tienen valores distintos de cero, por lo tanto s ayudan a predecir el comportamiento de la variable respuesta. Es posible tambin obtener intervalos de un 95% de confianza para los coeficientes individuales, los cuales se detallan a continuacin:
Coeficiente Lmite Inferior 3496,524023 2,626593142 0,112473013 -231,3220437 -37,68956849 Lmite Superior 9224,15064 25,1111356 0,31093286 -22,0586701 -5,94635855
0 1 2 3 4