You are on page 1of 6

EJEMPLO

RESUELTO DE ANLISIS DE REGRESIN MLTIPLE.


[NOTA: Ms adelante (en las respuestas a las preguntas) veris parte del texto en rojo, esta zona
roja no formara parte de la respuesta del examen. Se ha introducido en el ejemplo como
explicacin y repaso de teora].
Un grupo de investigacin est interesado en estudiar el rendimiento en el trabajo. Para llevar a cabo el
estudio utiliz una m.a.s. de 197 trabajadores, los cuales recibieron una valoracin de rendimiento general
por parte de sus superiores directos con una puntuacin comprendida entre 0 y 7. Tambin fueron
evaluados mediante pruebas psicomtricas debidamente validadas en las variables rendimiento contextual,
rendimiento de tarea, adaptabilidad y proactividad. Los resultados del anlisis fueron los siguientes:
Modelo

1
2
3

.776
b
.839
c
.845

Resumen del modelo


R cuadrado
corregida
.602
.600
.703
.700
.714
.710

R cuadrado
a

Error tp. de la
estimacin
.63180
.54701
.53810

Modelo
1

Regresin
Residual
Total
Regresin
Residual
Total
Regresin
Residual
Total

ANOVA
Suma de
cuadrados
117.768
77.838
195.606
137.559
58.048
195.606
139.722
55.884
195.606

gl
1
195
196
2
194
196
3
193
196

Media
F
cuadrtica
117.768 295.031
.399

Sig.
.000

68.779 229.866
.299

.000

46.574 160.847
.290

.000

a. Variables predictoras: (Constante), Rendimiento contextual


b. Variables predictoras: (Constante), Rendimiento contextual, Rendimiento de tarea
c. Variables predictoras: (Constante), Rendimiento contextual, Rendimiento de tarea, Proactividad
d. Variable dependiente: Rendimiento general

Modelo
(Constante)
Rendimiento contextual
(Constante)
Rendimiento contextual
Rendimiento de tarea
(Constante)
Rendimiento contextual
Rendimiento de tarea
Proactividad

1
2

Coeficientes no
estandarizados
Error
B
tp.
.650
.249
1.127
.066
-.333
.247
.682
.079
.752
.093
-.210
.247
.543
.093
.709
.092
.169
.062

Coeficientes
Coeficientes
tipificados

Correlaciones
t

Sig.

Beta
.776
.469
.442
.374
.417
.155

2.610
17.176
-1.349
8.640
8.133
-.850
5.862
7.683
2.733

.010
.000
.179
.000
.000
.396
.000
.000
.007

Orden
cero

Parcial

Semiparcial

.776

.776

.776

.776
.767

.527
.504

.338
.318

.776
.767
.672

.389
.484
.193

.226
.296
.105

Variables excluidas
Beta
dentro

Modelo
1

2
3

Rendimiento de tarea
Adaptabilidad
Proactividad
Adaptabilidad
Proactividad
Adaptabilidad

.442
.060
.229
.013
.155
-.092

t
8.133
.915
3.595
.219
2.733
-1.400


Responda a las siguientes cuestiones:

Sig.
.000
.361
.000
.827
.007
.163

Correlacin
parcial
.504
.066
.250
.016
.193
-.101

Estadsticos de
colinealidad
Tolerancia
.518
.470
.472
.465
.459
.340

1.


2.

Qu tcnica estadstica (y procedimiento) utiliz el investigador? Cules son las variables implicadas y
su funcin?

Se trata de un anlisis de regresin lineal mltiple. Es un anlisis de regresin lineal porque queremos
explorar y cuantificar la relacin lineal entre una variable cuantitativa llamada dependiente o criterio
que queremos predecir (Y) que en nuestro caso es el rendimiento general y las variables
independientes. Es mltiple porque hay ms de una variable independiente o predictora (Xi), en nuestro
caso seran las variables: rendimiento contextual, rendimiento de tarea, adaptabilidad y proactividad
tambin de tipo cuantitativo.

Sobre la base del modelo de regresin que construimos podemos valorar el impacto individual y
colectivo de las variables independientes sobre la dependiente, y tambin efectuar pronsticos sobre la
variable dependiente.

A la hora de realizar un anlisis de regresin lineal mltiple se llevan a cabo 5 tipos diferentes de
contrastes de hiptesis para evaluarlo:

Contraste sobre el modelo de regresin (se lleva a cabo mediante un ANOVA).
Contraste sobre las pendientes de cada variable independiente (aparecen en la tabla
coeficientes).
Contraste sobre el origen de la recta (aparece en la tabla coeficientes).
Contraste sobre el valor predicho en la variable dependiente para un sujeto con un
determinado valor en las variables independientes
Contraste sobre la correlacin mltiple al cuadrado.

El procedimiento que se ha utilizado como mtodo de seleccin de variable es Stepwise (regresin por
pasos sucesivos).
Cules son las hiptesis nulas que se comprueban mediante el ANOVA en los modelos 1, 2 y 3? Cul
es la decisin que tomamos en cada modelo?
Consideremos: rendimiento contextual (X1), rendimiento de tarea (X2), adaptabilidad (X3) y proactividad
(X4).

a) Modelo 1, en el cul slo aparece la variable independiente Rendimiento contextual:

, o lo que es lo mismo


En la tabla ANOVA se puede apreciar que el nivel crtico del estadstico de contraste F para el
primer modelo es 0,000 (menor que alfa), por lo tanto se rechaza la hiptesis nula en el
contraste del modelo 1 de regresin. Se concluye que el modelo 1 de regresin en su
conjunto es predictivo.

b) Modelo 2, en el cul aparecen las variables independientes Rendimiento contextual y
Rendimiento de tarea:

, o lo que es lo mismo


En la tabla ANOVA se puede apreciar que el nivel crtico del estadstico de contraste F para el
segundo modelo es 0,000 (menor que alfa), por lo tanto se rechaza la hiptesis nula en el
contraste del modelo 2 de regresin. Se concluye que el modelo 2 de regresin en su
conjunto es predictivo.


c) Modelo 3, en el cul aparecen las variables independientes Rendimiento contextual y
Rendimiento de tarea y Proactividad:

, o lo que es lo mismo


En la tabla ANOVA se puede apreciar que el nivel crtico del estadstico de contraste F para el
tercer modelo es 0,000 (menor que alfa), por lo tanto se rechaza la hiptesis nula en el
contraste del modelo 3 de regresin. Se concluye que el modelo 3 de regresin en su
conjunto es predictivo.

3.

Cul es la ecuacin final resultante del anlisis? Cul es la ecuacin en puntuaciones tpicas?

Recordemos que hemos usado como mtodo de seleccin de variables el mtodo de pasos sucesivos.
Con este mtodo se pretende encontrar la ecuacin de regresin capaz de ofrecer el mejor ajuste con el
menor nmero de variables. El mtodo se detiene cuando no hay ms variables que contribuyen
significativamente al ajuste. En nuestro caso el procedimiento se para cuando nuestro modelo tiene 3
variables independientes, es decir, en el Modelo 3.

Para obtener la ecuacin de regresin en puntuaciones directas del Modelo 3 tenemos que fijarnos en
la tabla coeficientes. La ecuacin sera la siguiente:

, o lo que es lo mismo:

La ecuacin de regresin en puntuaciones tpicas del Modelo 3 sera la siguiente:



, o lo que es lo mismo:

Pronstico (ZRendimiento
laboral i ) = 0,374ZRendimiento contextual i1 + 0,417ZRendimiento de tarea i2 + 0,155ZProactividad i4


Hay que ser cautelosos a la hora de interpretar la importancia relativa de las variables en la ecuacin
puesto que el peso depende tanto del resto de variables que estn en la ecuacin como de variables
que no estn en la ecuacin y podran haber entrado. Slo podra interpretarse adecuadamente a partir
del peso de los coeficientes estandarizados si las variables independientes no tuvieran ninguna relacin
entre ellas, pero en la prctica este caso es muy raro. Para hacerse una idea, antes de hacer un anlisis
de regresin conviene mirar la matriz de correlaciones

4.

Cules son los supuestos del anlisis?


Los supuestos del anlisis de regresin mltiple son: independencia, normalidad multivariada,
homocedasticidad y linealidad. Tambin conviene que exista baja colinealidad (o multicolinealidad si
son ms de dos variables independientes) y que no haya casos atpicos.

Los supuestos de linealidad, baja colinealidad, independencia y homocedasticidad son necesarios para
que los coeficientes de regresin sean estimadores insesgados y eficientes de sus correspondientes
parmetros. Y para contrastar hiptesis sobre los coeficientes de regresin y construir intervalos de
confianza es necesario, adems, asumir normalidad.

Una forma de medir la colinealidad (o multicolinealidad), es a travs del ndice de tolerancia para cada
una de las variables independientes. Este dato aparece en la tabla variables excluidas. Si una variable

5.

independiente tiene mucha colinealidad (o lo que es lo mismo, una tolerancia menor de 0,10) con el
resto de las variables independientes no debe incluirse en el modelo de regresin.

Qu puntuacin en rendimiento general predice nuestro modelo de regresin para el trabajador Carlos
Martnez cuyas puntuaciones en las variables son: rendimiento contextual = 3,01 , rendimiento de tarea
= 2,25, adaptabilidad = 1,18 y proactividad = 4,92?



Nuestro modelo de regresin (Modelo 3) predice una puntuacin en rendimiento general para el
trabajador Carlos Martnez de 3,851 puntos.

6.

Bondad de ajuste y tamao del efecto. Cunto explican cada uno de los modelos? Cual es la
proporcin de varianza de la variable criterio que no est explicada por nuestro modelo de regresin?

Una vez que hemos calculado la ecuacin de regresin mediante el mtodo de mnimos cuadrados,
sabemos que esa ecuacin es la mejor para nuestra muestra, pero eso no significa que sea buena. Para
valorar la calidad de una ecuacin es necesario utilizar algn indicador de la precisin, es decir, del
tamao del efecto. Un indicador de la bondad de ajuste de nuestro modelo de regresin es el
coeficiente de correlacin mltiple al cuadrado o coeficiente de determinacin que se puede encontrar
en la tabla Resumen del modelo. El coeficiente que se usa en la interpretacin de un modelo de
regresin mltiple es R2 corregido o ajustado por ser estimador insesgado. En esta tabla, aparece el
ndice de bondad de ajuste (R2) para cada uno de los modelos. Este ndice se interpreta como
porcentaje de la varianza de la variable dependiente que es capaz de explicar nuestro modelo o
porcentaje de varianza comn.

Para el Modelo 1 el ndice de bondad de ajuste R2 arroja un valor de 0,6 lo que significa que nuestro
modelo (con una variable predictora: rendimiento contextual) explica un 60% de la varianza de la
variable rendimiento general. O de otra forma un 60% de la variabilidad del rendimiento general se
puede predecir a partir del rendimiento contextual.

Para el Modelo 2 el ndice de bondad de ajuste R2 arroja un valor de 0,7 lo que significa que nuestro
modelo (con dos variables predictoras: rendimiento contextual y rendimiento de tarea) explica un 70%
de la varianza de la variable rendimiento general. O de otra forma un 70% de la variabilidad del
rendimiento general se puede predecir a partir del rendimiento contextual y rendimiento de tarea de
forma conjunta.

Para el Modelo 3 el ndice de bondad de ajuste R2 arroja un valor de 0,71 lo que significa que nuestro
modelo (con tres variables predictoras: rendimiento contextual, rendimiento de tarea y proactividad)
explica un 71% de la varianza de la variable rendimiento general. O de otra forma un 71% de la
variabilidad del rendimiento general se puede predecir a partir del rendimiento contextual, rendimiento
de tarea y proactividad de tarea de forma conjunta.

Sabemos que el coeficiente de determinacin es un valor que est entre 0 y 1. Por tanto tambin
podramos hallar el porcentaje de varianza (de la variable criterio o variable dependiente) que no
explica cada modelo, simplemente restndole a 1 el R2 correspondiente. Pero slo nos piden el
porcentaje de varianza no explicada de nuestro modelo de regresin. Como el procedimiento por pasos
sucesivos se ha parado en el Modelo 3, es este el modelo con mejor ajuste y su porcentaje de varianza
no explicada sera: 1- R2 = 1- 0,71 = 0,29. Es decir un 29% de la varianza de rendimiento general no est
explicada por nuestro Modelo 3 (o por las variables rendimiento contextual, rendimiento de tarea y
proactividad).


7.

Cul es la correlacin entre el rendimiento general y el rendimiento de tarea, eliminado el influyo de la


variable rendimiento contextual sobre el rendimiento de tarea?


Nos estn pidiendo la correlacin semiparcial entre rendimiento general y rendimiento de tarea
quitando slo de rendimiento de la tarea el influjo de la variable rendimiento contextual (la variable
que ya est en el modelo). La correlacin semiparcial es la relacin entre la variable dependiente
(Y) y una variable independiente (X2), eliminando slo de la variable independiente (X2) la influencia
de otra variable independiente (X1 , que ya est en la ecuacin). Este dato aparece en la tabla
coeficientes y es 0,318.

En el caso de que no nos den las correlaciones semiparciales (cosa habitual), la forma de sacar la
contribucin de una variable a la ecuacin es restando los R2 de los modelos. Es decir, nos vamos a la
tabla resumen del modelo, nos vamos a la columna R cuadrado y restamos del R2 del modelo que
incluye la variable el R2 del modelo anterior que no la incluye 0,703-0,602 = 0,101. Este resultado es
la correlacin semiparcial al cuadrado, si calculamos la raz obtenemos, 0.318.

8. Cul es la correlacin entre el rendimiento general y rendimiento de tarea, eliminado el influyo de la
variable rendimiento contextual?

Nos estn pidiendo la correlacin parcial entre rendimiento general y rendimiento de tarea
quitando tanto de rendimiento general como de rendimiento de la tarea el influjo de la variable
rendimiento contextual (la variable que ya est en el modelo). La correlacin parcial es la relacin
entre la variable dependiente (Y) y una variable independiente (X2), eliminando de ambas la
influencia de otra variable independiente (X1 , que ya est en la ecuacin). Este dato aparece en la
tabla coeficientes y es 0,504.

9. Cuanto aporta la variable proactividad (la ltima en entrar en el modelo) en la prediccin de la
rendimiento general que no era explicado por rendimiento contextual y rendimiento de tarea.

Los coeficientes de correlacin parcial y semiparcial desempean un importante papel en el anlisis
de regresin mltiple. El parcial se utiliza normalmente para elegir variables en los mtodos de
seleccin por pasos y el semiparcial se utiliza para cuantificar la contribucin neta de cada variable
al ajuste global.

Nos estn pidiendo la correlacin semiparcial al cuadrado o lo que es lo mismo, el incremento en R2
al incluir la variable proactividad en la ecuacin. Si en la tabla de resultados del ejercicio nos dan las
correlaciones semiparciales (como es el caso), lo que tendramos que hacer es elevarla al cuadrado
(0,105 al cuadrado), cuyo resultado es 0,011.

En el caso de que no nos den las correlaciones semiparciales (cosa habitual), la forma de sacar la
contribucin de una variable a la ecuacin es restando los R2 de los modelos. Es decir, nos vamos a la
tabla resumen del modelo, nos vamos a la columna R cuadrado y restamos del R2 del modelo que
incluye la variable el R2 del modelo anterior que no la incluye 0,714 - 0,703 = 0,011


10. Indique cul es la primera variable que entra a formar parte de la ecuacin de regresin y por qu.
Indique qu variables han sido excluidas del modelo final y por qu.

Recordemos que hemos utilizado el mtodo de seleccin de variables por pasos sucesivos. Este mtodo
acta de la siguiente manera: primero elige la variable que mayor correlacin simple tiene con la
variable dependiente (rendimiento general). Si nos fijamos en la tabla coeficientes, la columna
correlaciones de orden cero se refiere a las correlaciones simples. Vemos que la variable que mayor
correlacin tiene con rendimiento general es rendimiento contextual con una correlacin de 0,776. Es
por ello que rendimiento contextual es la variable que primero entra en el modelo.


En el caso de que en la tabla coeficientes no aparezca la columna correlaciones de orden cero (cosa
habitual), sabemos que en el Modelo 1 (paso 1) se pone a prueba una regresin simple (una variable
independiente). En el caso de la regresin simple el valor que aparece en la columna R de la tabla
Resumen del modelo es la correlacin simple. La correlacin simple tambin aparece en la tabla
coeficientes para el primer modelo en la columna coeficientes estandarizados (o tipificados)/Beta.

Para ver las variables que han sido excluidas del modelo tenemos que irnos a la tabla variables
excluidas. Nuestro modelo final es el 3 y slo se ha excluido la variable adaptabilidad. La tabla ofrece el
coeficiente de regresin tipificado que correspondera a cada una de las variables en caso de ser
elegidas en el siguiente paso (beta dentro) y un contraste de la hiptesis nula de que ese coeficiente
vale cero en la poblacin.

La nica variable que no es incorporada al modelo tiene asociado un coeficiente de correlacin parcial
de -0,101 que no es significativamente distinto de cero (nivel crtico de 0,163). Lo que significa que esta
variable no entra en el modelo porque no contribuye a mejorar el ajuste del mismo.

You might also like