Professional Documents
Culture Documents
de estudos
Psicologia
2002, 7 (Nmero
Especial), 19-29
Aplicaes da regresso mltipla
de psicologia
organizacional
19
Resumo
Este artigo discute algumas aplicaes das tcnicas de anlise de regresso mltipla stepwise e hierrquica, as quais so muito utilizadas em pesquisas da rea de Psicologia Organizacional. So discutidas algumas estratgias de identificao e de soluo de problemas relativos ocorrncia de erros do
Tipo I e II e aos fenmenos de supresso, complementaridade e redundncia nas equaes de regresso mltipla. So apresentados alguns exemplos de pesquisas nas quais esses padres de associao
entre variveis estiveram presentes e descritas as estratgias utilizadas pelos pesquisadores para
interpret-los. So discutidas as aplicaes dessas anlises no estudo de interao entre variveis e na
realizao de testes para avaliao da linearidade do relacionamento entre variveis. Finalmente, so
apresentadas sugestes para lidar com as limitaes das anlises de regresso mltipla (stepwise e
hierrquica).
Palavras-chave: Regresso mltipla stepwise e hierrquica, Supresso, Complementaridade, Redundncia, Interao, Psicologia Organizacional.
Abstract
Stepwise and hierarchical multiple regression in organizational psychology: Applications, problemas and solutions. This article discusses applications of stepwise and hierarchical multiple regression
analyses to research in organizational psychology. Strategies for identifying type I and II errors, and
solutions to potential problems that may arise from such errors are proposed. In addition, phenomena
such as suppression, complementarity, and redundancy are reviewed. The article presents examples of
research where these phenomena occurred, and the manner in which they were explained by researchers.
Some applications of multiple regression analyses to studies involving between-variable interactions
are presented, along with tests used to analyze the presence of linearity among variables. Finally,
some suggestions are provided for dealing with limitations implicit in multiple regression analyses
(stepwise and hierarchical).
Key words: Stepwise and hierarchical multiple regressions, Suppression, Complementarity, Redundancy, Organizational
Psychology.
presente artigo tem como objetivo discutir as principais aplicaes e problemas ligados ao uso da
anlise de regresso hierrquica e stepwise em Psicologia Organizacional. As pesquisas em Psicologia
Organizacional tm utilizado modelos multivariados para
examinar os complexos relacionamentos entre comportamentos e ambientes organizacionais. A multiplicidade de fatores
explicativos das principais variveis dependentes da rea,
como desempenho produtivo e atitudes do trabalhador, vem
obrigando os pesquisadores a realizarem pesquisas de cam-
po com delineamentos multivariados. Em reviso da literatura nacional sobre treinamento e desenvolvimento de pessoal, Borges-Andrade e Abbad (1996) encontraram que as
pesquisas sobre avaliao de treinamento tm utilizado modelos multivariados de investigao, muitas das quais utilizando anlises de Regresso Mltipla.
Pesquisas nacionais sobre comprometimento
organizacional (Bastos, 1994a; Bastos, 1994b; BorgesAndrade, 1994; Dias & Moraes, 1994), clima organizacional
(Sbraglia, 1983), levantamento de necessidades de treina-
20
alm de afetar todos os parmetros da equao, poder tambm reduzir os problemas advindos da violao desse pressuposto. Segundo o teorema do limite central, quanto maior
a amostra, maior a chance de que as distribuies das mdias das variveis envolvidas estejam normalmente distribudas, apesar de no terem individualmente o formato normal.
Logo, aumentando-se o tamanho da amostra, os efeitos da
no-normalidade das variveis so reduzidos, aumentando
a robustez da anlise, e tornando menos necessria a transformao dessas variveis (Tabachnick & Fidell, 1996).
Quando o pressuposto da linearidade violado, o pesquisador deve estar ciente de que o modelo de regresso linear
no o melhor modelo explicativo para o estudo das variveis envolvidas, e que outros modelos (e.g. o quadrtico)
devem ser utilizados. Finalmente, a violao do pressuposto
da homogeneidade das varincias no, necessariamente, invalida a anlise, a depender da sua finalidade, mas a enfraquece. A heterogeneidade das varincias, ou violao da
homogeneidade das varincias, pode ser reduzida por intermdio da transformao de variveis que no possuem distribuio normal (e.g., assimetria positiva ou negativa).
necessrio ressaltar que a qualidade do modelo de
investigao adotado pelo pesquisador pode ser avaliada por
meio do valor do coeficiente de determinao, R2, e da distribuio dos resduos. Tomando como base uma equao
de regresso linear (y = a + xi + ), diz-se, por exemplo,
que um R 2 = 0,401 significa que o(s) preditor(es) explica(m)
40% da varincia de y. Em outras palavras, o R2 a quantidade da varincia da varivel dependente que explicada
conjuntamente pela(s) varivel(is) independente(s) e a estatstica mais utilizada para interpretar os resultados da regresso (Tabachnick & Fidell, 1996).
Como observado anteriormente, a regresso permite
verificar o quanto cada varivel preditora aumenta o poder
2
explicativo da equao de regresso (R ). Na equao de
RM, obtm-se um coeficiente de correlao, o parmetro
(ou peso padronizado), que representa a magnitude do relacionamento entre cada um dos preditores e o critrio, sendo
que sua interpretao depende do conhecimento dos erros
padres ele associados (Dunlap & Landis, 1998). O valor
de influenciado por todas as variveis preditoras includas na equao e est sujeito a mudanas em sua magnitude, dependendo do conjunto de preditores investigados. Uma
vez apresentados alguns dos principais conceitos relacionados RM, sero discutidas algumas das principais aplicaes deste conjunto de tcnicas.
21
tes referentes: (1) ao grau de relacionamento entre as variveis, indicando se uma correlao significativamente diferente de zero; (2) importncia relativa das variveis
preditoras na explicao da varivel dependente; (3) magnitude do aumento da correlao mltipla resultante da adio de uma ou mais variveis na equao; (4) maneira
pela qual uma varivel independente se comporta no contexto de outra(s) varivel(is); (5) natureza do relacionamento entre as variveis independentes e dependentes, indicando se o relacionamento linear ou no-linear (e.g., valores quadrados, cbicos, produtos cruzados entre as variveis); (6) comparao entre conjuntos diferentes de variveis independentes na predio da varivel dependente; (7)
ao clculo estimativo dos escores da varivel dependente
para os membros de uma nova amostra ainda no pesquisada;
e (8) identificao de relacionamentos causais entre variveis quando aplicada como um caso especial de path analysis
ou equao estrutural.
No caso do uso da regresso para a finalidade mencionada no item 5 (verificar se o relacionamento entre as variveis linear ou no ), a RM pode ser empregada na identificao de variveis mediadoras e moderadoras. Em funo
da grande difuso desta estratgia nas pesquisas internacionais (e.g., Kromrey & Foster-Johnson, 1999) e na rea
de Psicologia Organizacional, os fenmenos de mediao e
moderao sero definidos a seguir, assim como a forma
pela qual a regresso pode ser utilizada para identific-los.
Mediao: o conceito de mediao implica suposio
de relacionamentos causais entre as variveis envolvidas.
Uma varivel mediadora aquela que, ao estar presente na
equao de regresso, diminui a magnitude do relacionamento entre uma varivel antecedente e uma varivel dependente ou critrio. Para melhor ilustrar a definio de uma
varivel mediadora, podemos analisar o relacionamento entre trs variveis hipotticas, sendo a varivel B a mediadora do relacionamento de A com C (A B C). Note-se
que a relao entre as variveis A e C ficar enfraquecida na
presena da varivel B. No caso de uma varivel mediadora
pura, o relacionamento entre A e C deixa de existir na presena da varivel B.
Segundo Tabachnick e Fidell (1996) e Keppel (1991),
a identificao de variveis mediadoras pode ser feita, por
exemplo, com base na observao dos padres assumidos
pelos pesos das variveis envolvidas. No caso de uma varivel mediadora pura, tem-se um significativo de A para
C, antes da entrada de B na equao. Contudo, uma vez que
B adicionado equao, o de B torna-se significativo,
enquanto a significncia do de A desaparece. No caso de
uma mediao pura, o B captura totalmente a relao entre
A e C. Contudo, quando a mediao no total, pode ainda
existir uma relao entre A e C mesmo na presena de B.
22
Moderao: o conceito de moderao implica influncia entre as variveis e no suposio de causalidade, como
no caso da mediao. Para testar a moderao, o pesquisador deve observar a interao entre A e B. Para tal, procurase observar se A um bom preditor de C. Em caso positivo,
verifica-se se A e B predizem C, e se a interao entre A e
B, calculada por meio do produto A x B, tambm prediz C.
Caso a interao seja uma preditora estatisticamente significativa de C, diz-se que B uma varivel moderadora. A
existncia de uma interao entre A e B s um indicador
de moderao quando, adicionada equao, preditora do
critrio. Logo, na moderao, o relacionamento entre A e C
depende do valor assumido pela varivel B.
Vale salientar que, no caso da mediao, a relao entre
A e C fica enfraquecida com a entrada de B na equao. No
caso do moderador, alm da interao A x B tornar-se um
preditor significativo, a relao entre A e C poder aumentar ou diminuir, dependendo do valor de B. Pedhazur (1982)
discute detalhadamente a diferena entre moderadores e
mediadores. Os trabalhos de Gordon (2000) e Torres (1999)
exemplificam o uso da RM na identificao de mediadores
e moderadores, respectivamente. OConnor (1998), comparando testes e programas estatsticos, discutiu
detalhadamente procedimentos para identificao de moderadores por meio da regresso mltipla.
A RM pode, ainda, ser utilizada para a identificao da
ocorrncia de outros fenmenos estatsticos que indicam relaes complexas entre variveis, tais como a redundncia,
a complementaridade e a supresso. Tais fenmenos, e como
identific-los atravs da RM, so brevemente discutidos abaixo.
Redundncia: este fenmeno refere-se entrada de
preditores correlacionados positivamente entre si na equao, acarretando perda de parcimnia na explicao de um
critrio. A redundncia pode ser observada quando os pesos
2
e os Sr (i.e., soma das contribuies nicas de cada varivel) para cada preditor so menores do que a correlao
bivariada entre cada um desses preditores e o critrio. Por
exemplo, Abbad (1999) identificou redundncia em variveis preditoras que mantinham fortes correlaes (0,70 r
0,50) com a varivel critrio e que, ao entrarem na equao de regresso mltipla, resultaram em coeficientes de correlao mltipla muito menores (e.g., s variando de 0,11 a
0,23 e Sr2s de 0,07 a 0,14). Este fenmeno reflete que cada
preditor explica parte da varincia do critrio que j foi
explicada por outro preditor. Nas Cincias Sociais, em geral
(Cohen & Cohen, 1975), grande parte das variveis so
correlacionadas entre si. Na Psicologia Organizacional, em
particular, este fato se deve ao uso de mltiplas medidas
redundantes (Dunlap & Landis, 1998), estratgia esta considerada necessria para conferir validade de contedo e
consistncia interna aos instrumentos.
Complementaridade: refere-se a um padro pouco freqente de associao entre preditores e critrio, em que a
soma da contribuio nica de um conjunto de preditores
excede a soma das contribuies individuais de cada preditor
na explicao do critrio. Na complementaridade, dois
preditores (x1 e x2) devem ter uma alta correlao negativa
entre si (Tabachnick & Fidell, 1996), bem como uma correlao bivariada positiva com a varivel critrio (Keppel,
1991). Em alguns casos, observa-se um decrscimo no valor do de x1, podendo o mesmo assumir valores negativos
quando a varivel x2 entra na equao. Nestes casos, os dois
preditores (x1 e x2) so considerados interdependentes ou
complementares. A conseqncia da complementaridade
uma diminuio no poder estatstico da pesquisa devido
incluso de duas variveis que, juntas, acrescentam pouca
explicao varincia do critrio e, portanto, representam
uma diminuio nos graus de liberdade.
Um exemplo de complementaridade pode ser observado na pesquisa de Torres (1999), que utilizava, como
preditores da preferncia por estilos de liderana (y), as variveis padro cultural (x1) e pas de origem (x2) dos participantes, medidas por escala intervalar de atitude (x1) e dados
categricos (x2). Torres observou uma correlao negativa
(rx1x2 = - 0, 11) entre x1 e x2 e correlaes positivas entre x1
e y (rx1y = 0, 22) e entre x2 e y (rx2y = 0,29). Na anlise de
regresso hierrquica, foi observado um forte decrscimo
com inverso de sinal do x1 depois que a varivel x2 entrava na equao (de 0,29 para - 0,61). Neste caso, x1 foi caracterizado como uma varivel complementar a x2.
Complementaridade, na verdade, um caso especial do fenmeno de supresso, que ser descrito a seguir.
Supresso: refere-se situao na qual uma varivel
(x1), que mantm uma fraca correlao bivariada com a varivel critrio (y), entra como preditora na equao de regresso mltipla com um de sinal oposto ao da correlao
bivariada que mantm com y. Trata-se de um fenmeno estatstico raro, conforme Cohen e Cohen (1975) e Tabachnick
e Fidell (1996). A supresso pode ser um sinal de relaes
complexas entre variveis preditoras na explicao da varivel critrio. Esse fenmeno inicialmente identificado por
meio da anlise do padro assumido pelos coeficientes de
regresso e de correlao de cada preditor com o critrio.
Entre os sinais de supresso, deve-se observar, segundo
Tabachnick e Fidell, os dois seguintes: (1) o valor absoluto
da correlao simples entre as variveis x1 e y deve ser substancialmente menor que o peso para a varivel supressora
x1; e (2) a correlao simples e o peso dessa varivel devem ter sinais opostos. Para Cohen e Cohen (1975), h mais
dois indicadores importantes da supresso: (1) a soma das
2
contribuies nicas de cada varivel (Sr ) na explicao da
varivel critrio excede o valor assumido por R2; e (2) em
23
24
25
26
culdades na rea para a identificao de variveis moderadoras. Segundo Kromrey e Foster-Johnson, essas dificuldades se devem, por exemplo, a erros de medida,
multicolinearidade.
Existe, ainda, um problema com relao diferenciao entre o efeito da interao e as relaes no-lineares.
Neste caso, muitos pesquisadores (e.g., Bee-Hua, 1999) fazem uso da regresso hierrquica e inferem que um aumento significativo no R2, quando o moderador adicionado
equao, indicativo de que o melhor modelo representativo da populao em questo o modelo multiplicativo ou
moderador. Mudanas no-significativas no R2 sugeririam
que o melhor modelo seria o aditivo (ou linear). O problema
dessa inferncia relaciona-se s dificuldades de identificao de variveis moderadoras (Lubinski & Humphreys,
1990). Os efeitos do moderador em uma regresso podem
no ser significativos (mesmo na presena de um modelo
multiplicativo) devido aos erros de medida e de amostragem
ou, ainda, a regresso hierrquica pode indicar um efeito
significativo do moderador, quando, na verdade, o melhor
modelo explicativo o quadrtico ou o cbico no-linear.
Se houver evidncia de que o modelo de regresso no
linear, o pesquisador no saber identificar com certeza
um modelo (multiplicativo, quadrtico ou cbico) que melhor descreve a relao entre os preditores e o critrio
(Lubinski & Humphreys, 1990). Alm disso, esse modelo
poder ainda ser representado por uma relao no-linear
entre qualquer um dos preditores e o critrio, entre dois
preditores e o critrio ou por uma combinao de nolinearidade e moderao. O equvoco na escolha do melhor
modelo poder ocasionar erros do Tipo I, Tipo II ou ambos.
Com o objetivo de solucionar esse problema, Lubinski
e Humphreys (1990) propem o uso de uma regresso
stepwise para diferenciar um moderador de um modelo nolinear. Esta proposio conhecida como mtodo de comparao da magnitude do efeito - ME (Kromrey & FosterJohnson, 1999). Este mtodo envolve duas etapas, que permitem que o pesquisador diferencie o efeito de um
multiplicativo do quadrtico. Em primeiro lugar (passo 1), a
equao da regresso linear ou aditiva (y = a + x + z + )
obtida. Em seguida (passo 2), o produto e o produto cru2 2
zado dos termos (xz; x ; z ) entram como preditores da equao obtida no passo 1. Estes termos entram na equao como
qualquer varivel preditora na regresso stepwise, ou seja,
por meio do uso do algoritmo para selecionar em qual seqncia os termos entraro na equao. Logo, esses trs termos competem entre si estatisticamente para determinar qual
deles (o moderador - xz, ou os termos quadrticos - x2 e z2)
melhor caracteriza a relao preditor-critrio.
Segundo Kromrey e Foster-Johnson (1999), as limitaes do procedimento sugerido por Lubinski e Humphreys
(1990) referem-se basicamente s limitaes da prpria regresso stepwise. Utilizando esse mtodo baseado em regresso stepwise, o pesquisador ter maiores chances de
cometer um erro do Tipo I, principalmente quando o modelo
que melhor caracteriza a populao em estudo o aditivo.
Nesses casos, a regresso pode produzir resultados que no
so generalizveis para outras amostras.
Para testar o mtodo ME, Kromrey e Foster-Johnson
(1999) realizaram estudos de Monte Carlo, gerando aleatoriamente dados que caracterizavam amostras de uma populao cujos relacionamentos entre variveis eram linear, nolinear e multiplicativo. O mtodo de Lubinski e Humphreys
foi utilizado para auxiliar o pesquisador na escolha do modelo (e.g., linear, quadrtico e moderador) que melhor descreveria a relao entre variveis.
Nessas simulaes, Kromrey e Foster-Johnson observaram alguns problemas provocados pelo uso da regresso
stepwise. Como esperado, consistentemente e em todas as
condies examinadas, o procedimento mostrou pouco controle sobre a ocorrncia do erro Tipo I. Porm, seus resultados mais surpreendentes foram os que indicaram erros Tipo
II. Para populaes com caractersticas moderadoras (noaditivas), houve uma grande ocorrncia de erros Tipo II, uma
vez que o mtodo no distinguiu os modelos multiplicativos
dos aditivos. A maior parte dos erros levou o pesquisador a
selecionar erradamente o modelo no-linear. No caso de populaes com caractersticas quadrticas (no-lineares), o
mtodo falhou em detectar diferenas entre estes modelos e
o linear, o que tambm caracterizou a ocorrncia de erros
Tipo II. Para essas populaes, o modelo moderador foi
indevidamente escolhido.
Kromrey e Foster-Johnson (1999) notaram ainda que
as ocorrncias dos erros Tipo I e II resultantes do uso da
regresso stepwise podem ser evitadas ou reduzidas quando
alguns fatores so controlados. Os casos de erro Tipo I no
parecem estar relacionados nem com o tamanho da amostra,
2
nem com a magnitude do R . Contudo, houve um certo aumento do controle da regresso stepwise sobre a ocorrncia
de erros Tipo I, quando havia menos redundncia no modelo
e aumento na consistncia interna das medidas. Como era
esperado, observou-se um grande decrscimo de erros Tipo
II quando houve um aumento na magnitude do efeito e um
aumento no tamanho da amostra. Houve tambm uma reduo dos erros Tipo II com o aumento na confiabilidade dos
preditores. Finalmente, observou-se um pequeno, ainda que
consistente, aumento na ocorrncia de erros Tipo II quando
a correlao entre os preditores aumentava.
Tambm foi observado por outros autores (MacCallum
& Mar, 1995, conforme citado por Kromrey & FosterJohnson, 1999) que o sucesso do uso da regresso stepwise
decresce na medida em que a multicolinearidade aumenta e
Concluses e recomendaes
Nas ltimas dcadas, nota-se uma tendncia dos pesquisadores da rea de Psicologia Organizacional em utilizar
tcnicas estatsticas mais sofisticadas que a anlise de regresso mltipla. Contudo, o uso de tcnicas mais refinadas, como a Equao Estrutural, no deveria significar o
abandono de procedimentos estatsticos mais simples, como
a RM. Anlises de Regresso Mltipla tm seus usos e limitaes bem conhecidos pelos pesquisadores, o que torna a
sua utilizao mais segura e confivel.
Entre os cuidados a serem tomados pelo pesquisador
ao utilizar RM para anlise de dados, est o de selecionar
27
28
erro Tipo II. Erros deste tipo podem comprometer drasticamente a qualidade do diagnstico e a eficcia das intervenes. Neste contexto, o erro Tipo I, to discutido nas pesquisas acadmicas, oferece menos riscos para o trabalho do
consultor do que o erro Tipo II. O erro advindo da entrada
de variveis esprias nos modelos de predio produz um
impacto menor na interveno do que a excluso de variveis relevantes. Nesses caos, talvez seja prefervel errar por
excesso de zelo do que por falta dele.
Apesar de necessrio obteno de dados empricos
confiveis, o conhecimento dos riscos, limitaes e desafios
associados ao uso de regresso mltipla no suficiente para
garantir qualidade s anlises e aos resultados de pesquisa.
A confiabilidade dos resultados empricos no produto apenas do uso adequado de tcnicas estatsticas de anlise de
dados. Seguramente, as anlises estatsticas no constituem
as melhores nem as nicas respostas aos problemas de confiabilidade enfrentados pelo pesquisador em seus trabalhos.
Para Kromrey e Foster-Johnson (1999), talvez a melhor
resposta no esteja em estatsticas melhores, mas em um
melhor pensamento ou elaborao sobre a natureza do problema (p. 413) investigado.
Agradecimentos
Os autores agradecem a contribuio de Renata Silveira
Carvalho, que forneceu valorosos comentrios, sugestes e
correes nas verses anteriores desse artigo.
Referncias
Abbad, G. (1999). Um modelo de avaliao do impacto do treinamento no
trabalho IMPACT. Tese de doutorado no-publicada, Universidade de
Braslia, Braslia.
Adler, N. J. (1991). International dimensions of organizational behavior
a
(3 ed.). Boston: Kent.
Bastos, A.V.B. (1994a). Comprometimento no trabalho: a estrutura dos
vnculos do trabalhador com a organizao, a carreira e o sindicato.
Tese de doutorado no-publicada, Universidade de Braslia, Braslia.
Bastos, A.V. B. (1994b). Comprometimento no trabalho: seus antecedentes em distintos setores da administrao e grupos ocupacionais. Temas em Psicologia, 1, 73-90.
Bee-Hua, G. (1999). An evaluation of the accuracy of the multiple regression
approach in forecasting sectoral construction demand in Singapore.
Construction Management and Economics, 17(2), 231-241.
Borges-Andrade, J. E. (1994). Comprometimento organizacional na administrao pblica e em seus segmentos meio e fim. Temas em Psicologia, 1, 49-62.
Borges-Andrade, J. E., & Abbad, G. (1996). Treinamento no Brasil: reflexes sobre suas pesquisas. Revista de Administrao, 31(2), 112-125.
Borges-Andrade, J. E., & Lima, S. M.V. (1983). Avaliao de necessidades de treinamento: um mtodo de anlise de papel ocupacional.
Tecnologia Educacional, 12(54), 6-22.
Boyacigiller, N., & Adler, N. J. (1991). The parochial dinosaur:
Organizational science in global context. Academy of Management
Review, 16, 262-290.
Shadur, M. A., Kienzle, R., & Rodwell, J.J. (1999). The relationship
between organizational climate and employee perceptions of
involvement. Group and Organization Management, 24(4), 479-503.
Singelis, T. M., Triandis, H. C., Bhawuk, D. P. S., & Gelfand, M. J. (1995).
Horizontal and vertical dimensions of individualism and collectivism:
A theoretical and measurement refinement. Journal of Cross-Cultural Research, 29, 240-275.
Siqueira, M. M. M. (1995). Antecedentes do comportamento de cidadania
organizacional: a anlise de um modelo ps-cognitivo. Tese de doutorado no-publicada. Universidade de Braslia, Braslia.
29
a
Gardnia Abbad, doutora em Psicologia Social e do Trabalho pela Universidade de Braslia, DF,
professora do Departamento de Psicologia Social e do Trabalho, Instituto de Psicologia da Universidade de Braslia, Braslia, DF.
Cludio Vaz Torres, doutor em Psicologia Social e do Trabalho pela Califrnia School of Professional
Psychology, EUA, professor do Departamento de Psicologia Social e do Trabalho, Instituto de
Psicologia da Universidade de Braslia, Braslia, DF.
Endereo para correspondncia: (GA) SQN 205, Bloco C, ap. 201, Asa Norte, 70.843-030, Braslia,
DF. Telefone residencial: (61) 272.0043. Telefone UnB: (61) 307.2625, Ramal 222. Fax IP/UnB:
(61) 273.8259. E-mails: (GA) gardenia@unb.br e (CVT) ctorres@unb.br.
Recebido em 06.01.01
Revisado em 09.04.01
Aceito em 25.07.01