Professional Documents
Culture Documents
y = 0 + 1x + 2x2 + + kxk +
Si definimos: X1=X, X2=X2,..., Xk=Xk, el modelo polinomial se transforma en un
MRLM con k regresores. As, un modelo polinomial se puede ajustar con las tcnicas
que ya se estudiaron.
Los modelos polinomiales se deben utilizar
:
Cuando el analista sabe que hay efectos curvilneos presentes en la funcin
verdadera de respuesta.
Cuando se aproximan funciones a relaciones no lineales, desconocidas y
posiblemente muy complejas.
y = 0 + 1x + 2x2 +
Donde 1 es el parmetro de efecto lineal, 2 parmetro de efecto cuadrtico y 0 es el
promedio de y cuando x = 0, si x = 0 est dentro del rango de x, en caso contrario, 0
no tiene interpretacin fsica.
I.1.- Principios bsicos.
Cuando se ajustan modelos polinomiales de una variable se deben tener en cuenta varias
consideraciones importantes:
Orden del modelo.- Se debe mantener tan bajo como sea posible el orden del
modelo, se deben intentar transformaciones para mantener un modelo de primer
orden, si lo anterior falla se debe intentar un polinomio de orden 2. Como regla
general, debemos evitar el uso de polinomios de orden superior (k>2), a menos
que se pueda justificar por razones ajenas a los datos. Se debe usar el modelo
ms simple posible que sea consistente con los datos y el conocimiento del
ambiente del problema.
Estrategia para la construccin del modelo.- Un mtodo es ajustar en forma
sucesiva modelos de orden creciente hasta que la prueba t para el termino de
mximo orden sea no significativo. Un mtodo alterno es ajustar el modelo de
orden mximo adecuado, y luego eliminar trminos, uno por uno, comenzando
Ejemplo: La tabla presenta los datos acerca de la resistencia del papel Kraft Y y el
porcentaje de madera dura X en el lote de pulpa con el que se fabric.
n
x
y
1
1
6.3
2
1.5
11.1
3
2
20
4
3
24
5
4
26.1
6
4.5
30
7
5
33.8
8
5.5
34
9
10
6 6.5
38.1 39.9
Grfico de dispersin
60
Resistencia a la tensin
50
40
30
20
10
0
0
10
12
14
16
H1 =Al menos un i
0 , para i=1,2.
DF
2
SS
3104.25
MS
1552.12
Error
Total
16
18
312.64
3416.89
19.54
F
79.4336
P
4.912E-09
H1 : 2 distinto de 0.
POLINOMIOS ORTOGONALES
En el ajuste de modelos polimoniales en una variable, aun cuando se elimine el mal
acondicionamiento no esencial mediante el centrado, pueden haber haber todava altos
niveles de multicolinealidad. Algunas de esas dificultades se pueden eliminar usando
Polinomios Ortogonales para ajustar el modelo, supngase que el modelo es:
i 1,..., n
i 1,..., n
P (x )P ( x ) 0
i 1
rs
r , s 0,1,2,..., k
P0 ( xi ) 1
P1 ( x1 )
P1 ( x2 )
Pk ( x2 )
P1 ( xn )
Pk ( xn )
P0 ( xn )
Pk ( x1 )
i 1
P (x )
2
0
X'X
P12 ( xi )
i 1
0
0
P ( xi )
i 1
como sigue:
2
k
1
partir de X ' X X ' y
P (x ) y
i 1
n
j 0,1,..., k
Como 0 i es un polinomio
Pj2 ( xi ) de grado cero, se puede igualar 0 i 1y en
i 1
consecuencia 0 y
La suma de cuadrados de los residuales es:
SSRe s (k ) SST j
k
i 1
P ( x ) y
n
i 1
SS R ( j ) j Pj ( xi ) yi
i 1
F0
k Pk ( xi ) yi
SS R ( k )
i 1
SS Re s (k ) (n k 1) SS Re s (k ) (n k 1)
P1 1
x x 2 n2 1
P2 2 i
12
d
xi x 3 xi x 3n 2 7
P3 3
20
d
d
x x 4 xi x 2 3n 2 13 3 n 2 1 n 2 9
P4 4 i
d
14
560
335
75
326
100
316
125
313
150
311
175
314
200
318
225
328
250
337
275
345
Como se sabe que el costo anual promedio del inventario es una funcin compleja de las
cantidades de pedidos se cree que un polinomio de segundo orden tiene el orden
mximo que se debe tener en cuenta, en consecuencia se ajustar con el siguiente
modelo:
yi 0 P0 ( xi ) 1 P1 ( xi ) 2 P2 ( xi ) i
i 1,2,...,10
Los coeficientes de los polinomios ortogonales 0 i , 1 i y 2 i , obtenidos
de la tabla mencionada anteriormente, se obtendr:
i
1
2
3
4
5
6
7
8
9
10
Pj2 ( x i )
P0 x i
1
1
1
1
1
1
1
1
1
1 X'X
10
i 1
P1 x i
P2 x i
-9
6
-7
2
-5
-1
-3
-3
-1
-4
1
-4
3
-3
5
-1
7 10
02
6
9 0 330
P3 x i
-42
14
35
31
12
-12
-31
-35
0 -14
0 42
0
132
132
8580
330 0
2
n = 10
P ( x1/2) y
10
5/3
3243
X ' y correspondientes
P1 ( xi ) yi tenemos:
245
Realizando los clculos
i101
369
P2 ( xi ) yi
i 1
324.3
1
( X ' X ) X ' y 0.7424
2.7955
i 1
10
P4 x i
P5 x i
P6 x i
18
-22
-17
3
18
18
3
-17
-22
18
-6
14
-1
-11
-6
6
11
1
-14
6
3
-11
10
6
-8
-8
6
10
-11
3
2860
780
660
5/12
1/10
11/240
Cuadrados Libertad
Medio
Fo
Valor P
Regresin
1213.43
606.72
159.24
<0.0001
Lineal
(181.89)
181.89
47.74
<0.0002
Cuadrtica
(1031.54)
1031.54
270.75
<0.0001
Residual
26.67
3.81
Total
1240.1
25
25
y 312.7686 0.0594( x 162.5) 0.0022( x 162.5) 2
102 1
12
REGRESIN NO PARAMTRICA
Es un procedimiento muy relacionado con la regresin polinomial por segmentos. Este
procedimiento consiste bsicamente en desarrollar una base de modelo libre para
predecir la respuesta sobre el rango de los datos. La idea fundamental de la regresin no
paramtrica es la naturaleza del valor predicho. Considerando los mnimos cuadrados
ordinarios se tiene que:
y X X X X
X y
Hy
h11
h
21
hn1
h12
h1n
h2 n
hnn
h22
hn 2
y1
y2
yn
y i hij y j
j 1
Entonces se tiene que el valor predicho para la i-sima respuesta es una combinacin
lineal de los datos originales.
Regresin De Kernel
Llamado el mtodo alisador de Kernel, el cual esta basado en un promedio ponderado
y i es el estimado del alisador de ncleo para i-sima respuesta, se tiene
de los datos. Si ~
que el alisador de Kernel es
n
~
yi wij y j
j 1
~
y Sy
wij 1
j 1
2.
K (t )dt
t
1
3. K (t ) K (t )
xi x j
wij n
x xk
K i
k 1
K
2
SS Re s yi ~
yi
i 1
y Sy
y Sy
y ' [ I S ' ][ I S ] y
y ' [ I S ' S S ' S ] y
~ 2
y
i 1
~
yi
SST SS Re s
SST
y 0 1 x1 2 x2 11 x1 22 x2 12 x1 x2
2
E y 0 1 x1 2 x2 11 x1 22 x2 12 x1 x2
2
Observacin
Orden
de la
corrida
4
12
11
5
6
7
1
3
8
10
9
2
1
2
3
4
5
6
7
8
9
10
11
12
Temperatura(C) Conc.(%)
T
C
200
250
200
250
189.65
260.35
225
225
225
225
225
225
15
15
25
25
20
20
12.93
27.07
20
20
20
20
x1
x2
-1
1
-1
1
-1.414
1.414
0
0
0
0
0
0
-1
-1
1
1
0
0
-1.414
1.414
0
0
0
0
43
78
69
73
48
76
65
74
76
79
83
81
y 0 1 x1 2 x2 11 x1 22 x2 12 x1 x2
2
1
1
1
1 1
1
1
1 1
1
1 1.414
0
2 0
1 1.414
0
2 0
X
1
0
1.414 0 2
1
0
1.414
0 2
1
0
0
0 0
1
0
0
0 0
0
0
0 0
1
0
0
0 0
Donde 1la segunda
y tercera
columna
1
43
78
1
69
1
1
73
48
0
0
76
y
0
65
0
74
76
0
0
79
0
83
0
representan
a las 81
variables
x1 y x2, y la cuarta y
quinta columna representan a las variables x12 y x22, y la ultima columna representan a la
variable x1x2.
La matriz XX y el vector Xy son:
12
0
0
X X
8
8
8
0
0
0
0
0
8
0
0
0
0
0
12
4
0
0
0
4
12
0
845.000
78.592
0
0
33.726
0 X y 511 .000
0
541.000
4
31.000
Y a partir de X X 1 X y se obtiene
79.75
9.83
4.22
8.88
5.13
7.75
DF
5
6
3
3
11
SS
1733.57
35.34
8.59
26.75
1768.92
MS
346.71
5.89
2.86
8.92
F
58.86
P
0.000
0.32
0.812
Dado que hay replicas en los datos, se puede agrupar la suma de cuadrados de residuales
en componentes de error puro y falta de ajuste, para este caso la falta de ajuste es para el
modelo cuadrtico. Dado que el valor P=0.812 para esta prueba es grande se puede
decir que el modelo cuadrtico es adecuado para estos datos. La prueba F para la
significanca de la regresin es F0=58.86, y como su valor P es muy pequeo, se rechaza
la hiptesis de que los coeficientes son todos iguales a cero. A continuacin se muestra
la suma de cuadrados debido a todas las variables en el modelo:
Source
x1
x2
x1_2
x2_2
x1_x2
DF
1
1
1
1
1
Seq SS
772.20
142.20
410.82
168.10
240.25
Con estas sumas de cuadrados se puede probar la contribucin de los trminos lineales y
cuadrticos al modelo. Para los terminos lineales seria:
SS , / / 2 772.20 142.20 / 2
F0 R 1 2 0
77.62
MS Re s
5.89
Cuyo valor P=5.2 x 10-5.
Y para los terminos cuadrticos seria:
SS , , / , , / 3 410.82 168.10 240.25 / 3
F0 R 11 22 12 0 1 2
46.37
MS Re s
5.89
Cuyo valor P=0.0002. por tanto los terminos lineales y cuadrticos contribuyen al
modelo en forma significativa. A continuacin tambin se muestran los valores para las
pruebas t da cada variable individual, las cuales muestran que no hay terminos no
significativos en el modelo.
Predictor
Constant
x1
x2
x1_2
x2_2
x1_x2
Coef
79.750
9.8255
4.2164
-8.8750
-5.1250
-7.750
SE Coef
1.214
0.8582
0.8582
0.9594
0.9594
1.214
T
65.72
11.45
4.91
-9.25
-5.34
-6.39
P
0.000
0.000
0.003
0.000
0.002
0.001
R-Sq = 98.0%
PRESS = 108.667
R-Sq(adj) = 96.3%
R-Sq(pred) = 93.86%
Los cuales son satisfactorios para el modelo, dado que indican que el modelo explica
probablemente un 94% ms o menos de la variabilidad de los datos.
Ejercicio
El grado de carbonatacin de una bebida gaseosa se afecta por la temperatura del
producto y por la presin de funcionamiento de la llenadora. Se obtuvieron 12
observaciones, y los datos resultantes se presentan a continuacin.
Carbonatacin,y
2.60
2.40
17.32
15.60
16.12
5.36
6.19
10.17
2.62
2.98
6.92
7.06
a.
b.
c.
d.
e.
Temperatura,x1
31.0
31.0
31.5
31.5
31.5
30.5
31.5
30.5
31.0
30.5
31.0
30.5
Presin,x2
21.0
21.0
24.0
24.0
24.0
22.0
22.0
23.0
21.5
21.5
22.5
22.5