SAS - 11. Seleccion de Variables

SELECCIN DE
VARIABLES
MATRIZ DE CORRELACIONES
PROC CORR; VAR PH ST SV FND ...; RUN;
Beccaccia et al., 2015
SIGNIFICADO COEFICIENTE CORRELACIN

r = 0,9
r = -0,8
Lineal!!
R2
-1 a +1
r = -0,4
r = 0,6
r = 0,0
r = 0,0
PROC REG; MODEL Y=X; RUN;

Source
DF
Sum of
Squares
Model
Error
Corrected Total
1
4
5
78.22857
7.77143
86.00000
Mean
Square
Root MSE
1.39386
Dependent Mean 12.00000
Coeff Var
11.61553
Variable
DF
Parameter
Estimate
Intercept
X
1
1
4.60000
2.11429
F Value Pr > F
78.22857
1.94286
40.26
R-Square
Adj R-Sq
0.9096
0.8870
Standard
Error
t Value
1.29762
0.33320
3.54
6.35
0.0032
Pr > |t|
0.0239
0.0032
PREDICCIN EMAN AVES

Ingrediente
EMA
Media
EMA
Rango
DS
Media
R2
Ecuacin
DRS
Ecuacin
H. Soja 44
2457
444
157
0,45
128
H. Soja 47
12
2665
356
93
0,53
66
H. Soja 44-47
19
2588
591
155
0,60
104
Soja integral
3525
288
134
0,30
125
Sojas
28
2889
1438
468
0,96
121
Conc. Proteicos
+girasol, colza, palmiste
55
2284
2750
773
0,95
180
Losada et al. (2010) Anim. Feed Sci. Technol. 160, 62-72
ECUACIONES PREDICCIN EM SOJAS

4000
NS
kcal EMA/kg MS
3600
3200
R2 = 0,60
P = 0,001
2800
2400
2000
38
40
42
44
46
48
%PB/MS
habas
harinas
50
52
54
ECUACIONES PREDICCIN EM-SOJAS

4000
NS
kcal EMA/kg MS
3600
R2 = 0,965;
P< 0,0001
3200
R2 = 0,60
P = 0,001
2800
2400
2000
38
40
habas
42
44
harinas
46
%PB/MS
48
50
52
54
SELECCIN DE VARIABLES PASO A PASO (STEPWISE)

STEPWISE;
En un primer paso selecciona la variable independiente que genera el mejor modelo.
En pasos sucesivos va aadiendo variables que reducen la suma de cuadrados del error (aumentan
el R2).
Cada vez que incluye una nueva variable en el modelo, ste es examinado y si alguna de las
variables anteriormente incorporadas muestra un coeficiente con un valor elevado de P, es eliminada.
PROC REG;
Model y = x1 x2 x3 ... xn / SELECTION = stepwise
sle=0.05 sls=0.05;
RUN;
Anlisis de regresin por pasos para las variables dependientes EMAn/EB (%) y EMAn
(kcal/kg MS) usando la composicin qumica (% MS) como predictor (n = 96)
R2
RSD
EMAn /EB = 88.6 0.920 FND

(1.43)a (0.057)
0.736
5.76
EMAn /EB = 64.0 0.407 FND + 0.265 almidn

(3.69) (0.086) (0.038)
0.829
4.66
EMAn /EB
EMAn /EB = 58.3 0.341 FND + 0.322 almidn + 0.291 EE

(4.32) (0.089) (0.044)
(0.123)
0.839
4.55
EMAn
EMAn = 3840 32.1 FND

(66.0) (2.64)
0.616
265
EMAn
EMAn = 3810 36.5 FND + 28.2 EE

(58.1) (2.45) (5.25)
0.718
232
EMAn
EMAn = 3697 11.7 FND + 57.1 EE - 177 cenizas

(52.9) (4.63) (6.58) (29.7)
0.791
198
Variable
dependiente
Paso
EMAn /EB
EMAn /EB
Ecuacin de regresin.
Los valores entre parntesis son errores estndar.
Losada et al., 2009
CONSTRUCCION DE MODELOS
PCC, %PV
10
8
6
4
2
15
20
25
30
35 40 45
FND, %MS
50
55
60
PRESENTACIN DE RESULTADOS
PRESENTACIN DE RESULTADOS
Table III. Factors affecting caecal volatile fatty acid concentration (mmol/l)
Equation
1
2
3
4
y=
y=
y=
y=
NDF2
Intercept
NDF
ADLNDF
20.9 6.98
1.08
0.20
74.0 26.3
- 2.11
0.51
0.045
0.022
83.2 23.1
-1.90
0.46
0.042
0.017
-0.79
0.16
94.3 21.6
-1.72
0.42
0.041
0.016
-2.62
0.53
ADLNDF2
0.040
0.011
R2
78
0.27
78
0.31
78
0.48
78
0.56
rsd
14.1
< 0.001
13.8
< 0.001
12.1
< 0.001
11.2
< 0.001
NDF: Dietary NDF (% DM) (range: 19.3-55.0). ADLNDF: Dietary ADL*100/dietary NDF (range: 5.1-48.6).
Anim. Res. 2002. 51:165-173
FORWARD;
Sigue el mismo procedimiento que el STEPWISE pero una vez que ha incluido una variable en
el modelo ya no la retira.
BACKWARD;
En primer lugar calcula un modelo con todas las variables especificadas.
En un segundo paso selecciona la variable que aporta menos al modelo (coeficiente con mayor valor
de P, o menor valor relativo de F) y la retira.
En pasos sucesivos va retirando las variables menos significativas. Una vez que ha retirado una
variable del modelo no la vuelve a incluir.
MAXR;
Comienza seleccionando los mejores modelos con una y dos variables. En ese momento examina
si alguna sustitucin de estas dos variables por otra que no est en el modelo lo mejora y si es as la
sustituye. De esta forma se obtiene el mejor modelo formado por dos variables. Se selecciona una
tercera variable y de nuevo se examina si la sustitucin de alguna de las tres variables por otra que
no est en el modelo lo mejora, y si es as la sustituye.
El proceso se repite sucesivamente.
Este procedimiento suele obtener modelos ms optimizados (mejora mxima del R2).
SELECCIN DE VARIABLES: RSQUARE

PROC REG;
Model y = x1 x2 x3 ... xn / SELECTION = rsquare best=4 cp B;
RUN;
Es el procedimiento que permite la obtencin de modelos ms optimizados.
best=k especifica que nicamente muestre los k mejores modelos de 1, 2, 3 variables (etc).
cp: Es el estadstico de Mallows que ayudar a la seleccin del mejor modelo.
Cp = (SSEP/MSE) (N 2p) + 1
SSEP = SSE del modelo sin trmino independiente con p variables independientes.
MSE = MSE del modelo completo
Se recomienda, partiendo de los modelos con ms variables a los que tienen menos variables, elegir el modelo que
con menor valor de Cp antes se aproxime a (p+1), siendo p el nmero de variables independientes.
Cp > (p+1)..al modelo le faltan variables
Cp < (p+1)..al modelo le sobran variables
Si quito la B no me salen los coeficientes de las variables independientes.
proc reg;
model PCCpv= fnd fnd2 fadfnd ladfnd hemifnd celfnd cehefnd/selection=rsquare best=4 cp B;
N = 40
Regression Models for Dependent Variable: PCCPV

Parameter
Number in
R-square
C(p) Estimates
Model
Intercept
FND
FND2
FADFND
LADFND HEMIFND
CELFND CEHEFND
1
0.07166399
33.15157
3.3111
.
.
.
.
.
.
0.0285
1
0.07166399
33.15157
6.1615
.
.
. -0.0285
.
.
.
1
0.05017194
34.75251
6.5916 -0.0266
.
.
.
.
.
.
1
0.02616849
36.54052
4.8864
.
.
.
.
.
0.0161
.
-------------------------------------------------------------------------------------------------------2
0.45637622
6.49443
17.7290 -0.6621 0.00851
.
.
.
.
.
2
0.15339465
29.06347
4.0199 -0.0347
.
.
.
.
.
0.0350
2
0.15339465
29.06347
7.5172 -0.0347
.
. -0.0350
.
.
.
2
0.11617425
31.83601
3.3613
. -0.00034
.
.
.
.
0.0336
-------------------------------------------------------------------------------------------------------3
0.51986583
3.76510
15.2069 -0.6404 0.00813
.
.
.
.
0.0276
3
0.51986583
3.76510
17.9668 -0.6404 0.00813
. -0.0276
.
.
.
3
0.51089564
4.43329
20.0488 -0.7164 0.00922 -0.0206
.
.
.
.
3
0.51089564
4.43329
17.9869 -0.7164 0.00922
.
.
0.0206
.
.
-------------------------------------------------------------------------------------------------------4
0.53013705
5.00000
16.1227 -0.6767 0.00864
.
.
. -0.0113
0.0304
4
0.53013705
5.00000
17.2489 -0.6767 0.00864 -0.0113
.
.
.
0.0191
4
0.53013705
5.00000
16.1227 -0.6767 0.00864
.
.
0.0113
.
0.0191
4
0.53013705
5.00000
19.1608 -0.6767 0.00864
. -0.0304
. -0.0113
.
-------------------------------------------------------------------------------------------------------NOTE: Models of not full rank are not included.
Cp > (p+1)..al modelo le faltan variables

Cp < (p+1)..al modelo le sobran variables

SAS - 11. Seleccion de Variables

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

SAS - 11. Seleccion de Variables

Uploaded by

Copyright:

Available Formats

SELECCIN DE

Beccaccia et al., 2015

SIGNIFICADO COEFICIENTE CORRELACIN

PROC REG; MODEL Y=X; RUN;

PREDICCIN EMAN AVES

Losada et al. (2010) Anim. Feed Sci. Technol. 160, 62-72

ECUACIONES PREDICCIN EM SOJAS

ECUACIONES PREDICCIN EM-SOJAS

SELECCIN DE VARIABLES PASO A PASO (STEPWISE)

EMAn /EB = 88.6 0.920 FND

EMAn /EB = 64.0 0.407 FND + 0.265 almidn

EMAn /EB = 58.3 0.341 FND + 0.322 almidn + 0.291 EE

EMAn = 3840 32.1 FND

EMAn = 3810 36.5 FND + 28.2 EE

EMAn = 3697 11.7 FND + 57.1 EE - 177 cenizas

Los valores entre parntesis son errores estndar.

Losada et al., 2009

Anim. Res. 2002. 51:165-173

SELECCIN DE VARIABLES: RSQUARE

Si quito la B no me salen los coeficientes de las variables independientes.

Regression Models for Dependent Variable: PCCPV

Cp > (p+1)..al modelo le faltan variables

You might also like