Professional Documents
Culture Documents
8
ANLISISESTADSTICO:
SEGUNDAPARTE
INTRODUCCIN
Conestecaptulosecomplementael10deMetodologadelainvestigacin,5edicin,
adems de que se actualiz su contenido. Se presentan primero las hiptesis
estadsticas, las puntuaciones z, clculos inferenciales o estimaciones de parmetros y
luego el clculo del coeficiente alfaCronbach y el sustento del anlisis de varianza
unidireccional.Finalmentelosanlisismultivariadosyalgunasfrmulas,ascomouna
secuencia de anlisis en Minitab y otra en SPSS. Los autores asumimos que se revis
previamenteelcaptuloencuestin.
HIPTESISESTADSTICAS
Enelcaptulo10sesealquecadapruebaestadsticaobedeceauntipodehiptesis
de investigacin e hiptesis estadstica distinta. Las hiptesis estadsticas son la
transformacin de las hiptesis de investigacin, nulas y alternativas en smbolos
1
estadsticos. Algunas revistas acadmicas solicitan que se incluyan estas hiptesis y
ayudanaconceptualizarciertaspruebasrevisadasenelcaptulo10deltextoimpreso.
Enocasiones,elinvestigadortraducesuhiptesisdeinvestigacinynula(ycuando
se formulan hiptesis alternativas, tambin stas) en trminos estadsticos. Bsicamente
haytrestiposdehiptesisestadsticas,quecorrespondenaclasificacionesdelashiptesis
deinvestigacinynula:1)deestimacin,2)decorrelaciny3)dediferenciasdemedias.A
continuacinmencionaremosydaremosejemplosdecadaunadeellas.
Hiptesisestadsticasdeestimacin
Corresponden a las que, al hablar de hiptesis de investigacin, se les denomina
hiptesisdescriptivasdeundatoquesepronostica.Sirvenparaevaluarlasuposicinde
un investigador respecto del valor de alguna caracterstica en una muestra de
individuos,otrosseresvivos,sucesosuobjetos,yenunapoblacin.Sefundamentanen
informacin previa. Supongamos que, basndose en ciertos datos, un investigador
plantea la siguiente hiptesis: el promedio mensual de casos de trastorno
psiconeurtico caracterizados por reaccin astnica, que sern atendidos en los
hospitales de la ciudad de Linderbuck, resultar mayor a 20. Adems, desea
transformarestahiptesisdeinvestigacinenunahiptesisestadstica.Loprimeroque
debe hacer es analizar cul es la estadstica a que su hiptesis hace referencia (en el
ejemplosetratadeunpromedioomediamensualdecasosatendidos).Elsegundopaso
consiste en encontrar cmo se simboliza esa estadstica (promedio se simboliza
como ).Eltercerpasoconsisteentraducirlahiptesisdeinvestigacinaunaforma
estadstica:
Hi: >20(elpromediomensualdecasosatendidossermayora20.)
Lahiptesisestadsticanulaseralanegacindelahiptesisanterior:
Ho: <20(elpromediomensualdecasosatendidossermenora20.)
ylahiptesisalternativapodraser:
Ha: =20(elpromediomensualdecasosesiguala20.)
2
con esta comparacin. Y como sealan Black y Champion (1976), algunos
investigadores consideran las hiptesis estadsticas de estimacin como hiptesis de
diferencia, pues en ltima instancia lo que se evala es la diferencia entre un valor
planteadoenlahiptesisyunvalorobservadoenunamuestra.
La estimacin de estas hiptesis no se limita a promedios, ya que puede incluirse
cualquierestadstica:porcentajes,medianas,modas,etc.(Crosbyetal.,2006).
Hiptesisestadsticasdecorrelacin
Estas hiptesis tienen por objetivo traducir en trminos estadsticos una correlacin
entre dos o ms variables. El smbolo de una correlacin entre dos variables es r
(minscula), y entre ms de dos variables R (mayscula). La siguiente hiptesis: a
mayor cohesin en un grupo, mayor eficacia en el logro de sus metas primarias, se
traduciratalcomosemuestraenelesquema.
Hi:rxy 0(noesigualaceroo,loqueeslomismo,ambas
variablesestncorrelacionadas)
Lacorrelacin
entredosvariables(cohesinyeficacia)
Lahiptesisnulasetraducira:
Ho:rxy=0(Lasdosvariablesnoestncorrelacionadas;sucorrelacinescero.)
Otroejemplo:
Hi:Rxyz0(Lacorrelacinentrelasvariablesautonoma,variedadymotivacin
intrnseca no es igual a cero. Es decir, las tres variables x, y, z estn
asociadas).
Ho:Rxyz=0 (Nohaycorrelacin)
Hiptesisestadsticasdeladiferenciademediasuotrosvalores
Enestashiptesissecomparaunaestadsticaentredosomsgrupos.Supongamosque
uninvestigadorplantealasiguientepreguntadeestudio:difierenlosperidicosTlexy
Noticias en cuanto al promedio de editoriales mensuales que dedicaron, durante el
3
ltimoao,altemadelterrorismointernacional?1Suhiptesisdeinvestigacinpodra
ser: existe una diferencia entre el promedio de editoriales mensuales que dedic,
durante el ltimo ao, al tema del terrorismo internacional el diario Tlex, y el que
dediceldiarioNoticias.Laestadsticaquesecomparaentrelosgrupos(editorialesde
Tlex,ungrupo,yeditorialesdeNoticias,otrogrupo)eselpromediomensual( ).La
hiptesisestadsticaseformularaas:
esdiferente
Hi: 1 2(promediodelgrupo2:editorialesdeNoticias)
(promediodelgrupouno:editorialesdeTlex)
Lahiptesisnula:
Ho: 1 = 2 (No hay diferencia entre los promedios de los dos grupos de
editoriales.)
Conotraestadstica(porcentaje)ytresgrupos,seobtendranhiptesisestadsticas
comolassiguientes:
Hi:%1%2%3(Losporcentajesdelostresgrupossondistintos.)
Ho:%1=%2=%3(Nohaydiferencias.)
PUNTUACIONESz
PuntuacinzMedida
Las puntuaciones z son transformaciones que se pueden queindicaladirecciny
hacer a los valores o las puntuaciones obtenidas, con el elgradoenqueunvalor
individualsealejadela
propsito de analizar su distancia respecto a la media, en media,enunaescalade
unidadesdedesviacinestndar.Unapuntuacinznosindica unidadesdedesviacin
estndar.
la direccin y el grado en que un valor individual obtenido se
1Nombrescompletamenteficticios
4
alejadelamedia,enunaescaladeunidadesdedesviacinestndar.Comomencionan
Nie et al. (1975), las puntuaciones z son el mtodo ms comnmente utilizado para
estandarizarlaescaladeunavariablemedidaenunnivelporintervalos.
XX
Sufrmulaes: z=
s
dondeXeslapuntuacinoelvaloratransformar, eslamediadeladistribucinysla
desviacin estndar de sta. El resultado z es la puntuacin transformada en unidades
dedesviacinestndar.
Supongamosqueenunadistribucindefrecuenciasobtuvimosunamediade60y
una desviacin estndar de 10, y deseamos comparar una puntuacin de 50 con el
resto de la distribucin. Entonces, transformamos esta puntuacin o tal valor en una
puntuacinz.Tenemosque:
X = 50
= 60
s = 10
Lapuntuacinzcorrespondienteaunvalorde50es:
50 60
z= = 1.00
10
Podemosdecirqueelvalor50selocalizaaunadesviacinestndarpordebajode
lamediadeladistribucin(elvalor30estatresdesviacionesestndarpordebajode
lamedia).
Estandarizar los valores permite comparar puntuaciones de dos distribuciones
diferentes (la forma de medicin es la misma, aunque se trata de distribuciones
distintas). Por ejemplo, podemos contrastar una distribucin obtenida en una
5
preprueba con otra obtenida en una posprueba (en un contexto experimental).
Supongamos que se trata de un estmulo que incrementa la productividad. Un
trabajadorobtuvoenlaprepruebaunaproductividadde130(lamediadelgrupofuede
122.5yladesviacinestndarde10).Yenlapospruebaobtuvo135(lamediadelgrupo
fuede140yladesviacinestndarde9.8).Mejorlaproductividaddeltrabajador?En
apariencia, la mejora no es considerable. Sin transformar las dos calificaciones en
puntuacionesz,noesposibleasegurarloporquelosvaloresnopertenecenalamisma
distribucin. Entonces transformamos ambos valores a puntuaciones z, los pasamos a
unaescalacomndondelacomparacinesvlida.Elvalorde130enproductividaden
trminosdeunidadesdedesviacinestndaresiguala:
130 122.5
z= = 0.75
10.0
Yelvalorde135correspondeaunapuntuacinzde:
135 140
z= = 0.51
9.8
Como observamos, en trminos absolutos 135 es una mejor puntuacin que 130,
peronoentrminosrelativos(enrelacinconsusrespectivasdistribuciones).
La distribucin de puntuaciones z no cambia la forma de la distribucin original,
pero s modifica las unidades originales a unidades de desviacin estndar (Wright,
1979).Ladistribucindepuntuacionesztieneunamediade0(cero)yunadesviacin
estndarde1(uno).Lafigura8.1muestraladistribucindepuntuacionesz.
Figura8.1Distribucindepuntuacionesz
Laspuntuacionesztambinsirvenparacompararmedicionesdedistintaspruebas
oescalasaplicadasalosmismosparticipantes(losvaloresobtenidosencadaescalase
transforman en puntuaciones z y se comparan) (Delbaere et al., 2007). No debe
olvidarsequeloselementosdelafrmulaespecficamentesonlamediayladesviacin
estndarquecorrespondenalvaloratransformar(desumismadistribucin).Tambin,
las puntuaciones z sirven para analizar distancias entre puntuaciones de una misma
distribucin y reas de la curva que abarcan tales distancias, o para sopesar el
desempeodeungrupodeparticipantesenvariaspruebas.Laspuntuacioneszsonun
elementodescriptivoadicionalqueseagregaparaanalizarnuestrosdatos.
ESTIMACINDEPARMETROS:
UNEJEMPLOCONLAMEDIAPOBLACIONAL
En el captulo 10 del texto impreso se mencion que una de las funciones de la
estadsticainferencialeslaestimacindeparmetros,puesbien,alcalcularlamediade
nuestramuestraysinoestamosmuysegurosdesurepresentatividadpodemosseguir
un procedimiento para ver si nuestra hiptesis respecto a la media poblacional es
aceptada o rechazada.2 Lo anterior es para responder a la siguiente pregunta: qu
2Enesteejemploseutilizalamedia,talvezelcasomsconocido,peropuedesercualquierotroparmetro
poblacional.
7
hacemos para ver si nuestra hiptesis sobre la media poblacional es aceptada o
rechazada? Pero antes de estudiar el procedimiento, es necesario hacer las siguientes
consideraciones:
Sipartimosdeestasconsideraciones,elprocedimientoes:
s
X Sx =
n
8
Enelejemplo:
1.2
Sx =
312
1.2
Sx = = 0.0679
312
X X
z=
Sx
dondeXeslamediadelamuestra(recordemosqueladistribucinmuestralesde
mediasynodepuntuaciones),X eslamediahipotticadeladistribucinmuestral
(parmetro poblacional), Sx es ladesviacin estndar de ladistribucin muestral
demedias.As,tenemos:
1.984
=
2.48
6. Enlatabladereasbajolacurvanormal(verapndice,4tabla1deesteCD),buscar
aquellapuntuacinzquedejea25%porencimadeella,quees1.96.Enlatabladel
apndice 4 se presenta la distribucin de puntuaciones z, slo la mitad, pues
debemos recordar que es una distribucin simtrica y se aplica igual para ambos
ladosdelamedia.Asseincluyeenlostextosdeestadstica.Sebusca2.5%,porque
latablasloabarcalamitaddeladistribucinyelriesgoqueestamosafrontandoes
de 5% (2.5% del extremo de cada lado). La tabla mencionada contiene cuatro
columnas: la primera indica puntuaciones z, la segunda expresa la distancia de la
puntuacinzalamedia.Latercera,elreaqueestpordebajodeesapuntuacin
9
desdeelcomienzodeladistribucin,comosemuestraenlagrfica:
Ylacuarta,delreaqueestporencimadeesapuntuacin:
z
Las reas se expresan en proporciones. Lo que buscamos es una puntuacinz
que deje por encima un rea de 0.0250 o 2.5% (la encontramos en la cuarta
columna de la tabla); esta puntuacin z es de 1.96. Siempre que nuestro nivel de
significanciasea0.05,tomamoslapuntuacinzde1.96.
7. Compararlamediadelamuestratransformadaapuntuacinzconelvalor1.96;si
esmenor,aceptarlahiptesis;siesmayor,rechazarla.Veamoselejemplo:
Mediadelamuestratransformadaaz Niveldesignificanciadel0.05
1.47 1.96
Decisin:Aceptarlahiptesisaunniveldesignificanciade0.05(95%afavory5%de
riesgodecometerunerror).
Silamediaobtenida
altransformarseenz,
Hubierasido3.25,
7.46 ounvalormayorRechazarlahiptesis
Porejemplo:
Mediadelamuestra=2.0
Desviacinestndardelamuestra=0.65
10
n=700
S =0.0246
z=40.65
Lamediaestsituadaamsde40desviacionesestndardealmedia;selocalizaenla
zonacrtica(msallde1.96desviacionesestndar).Rechazarlahiptesis.
PORQUESIMPORTANTEOTROCONCEPTOPARALA
ESTIMACINDEPARMETROS:ELINTERVALODECONFIANZA?
Sehahabladodeladistribucinmuestralporloquerespectaalapruebadehiptesis,
perootroprocedimientodelaestadsticainferencialesconstruirunintervalodondese
localiza un parmetro (Wiersma y Jurs, 2008). Por ejemplo, en lugar de pretender
probarunahiptesisacercadelamediapoblacional,puedebuscarseunintervalodonde
se ubique dicha media. Lo anterior requiere un nivel de confianza, al igual que en la
prueba de hiptesis inferenciales. El nivel de confianza es al intervalo de confianza lo
que el nivel de significancia es a la prueba de hiptesis. Es decir, se trata de una
probabilidaddefinidadequeunparmetrosevaaubicarenundeterminadointervalo.
Recordemosquelosnivelesdeconfianzaexpresadosenporcentajesmscomunesen
lainvestigacinson0.95y0.99(.05y.01).Susentidoessimilaralyacomentado,sies
de 0.95; quiere decir que tenemos 95% en favor de que el parmetro se localice en el
intervaloestimado,contra5%deelegirunintervaloequivocado.Elnivelde0.99seala
99%deprobabilidaddeseleccionarelintervaloadecuado.Talesnivelesdeconfianzase
expresan en unidades de desviacin estndar. Una vez ms se acude a la distribucin
muestral,concretamentealatabladereasbajolacurvanormal(apndice4,tabla1de
este CD anexo o en STATS reas bajo la curva normal)3, y se elige la puntuacin z
correspondiente al nivel de confianza seleccionado. Una vez hecho esto, se aplica la
siguientefrmula:
Puntuacinzque Desviacinestndarde
Intervalodeconfianza=estadgrafo+ expresaelnivelde ladistribucinmuestral
confianzaelegido correspondiente
3TambinSTATScontieneestatabla.
11
Enlafrmula,elestadgrafoeslaestadsticacalculadaenlamuestra,lapuntuacin
z es 1.96 con un nivel de 0.95 y de 2.58 con un nivel de 0.99, en tanto que el error
estndardependedelestadgrafoencuestin.Vemosloconelejemplodelamediaen
elcasodelaexposicindiariaalatelevisin(enfindesemana)porpartedelosnios
deValladolid:
Media=2.9horas
s=1.2horas
(desviacinestndardeladistribucinmuestraldelamedia).
Niveldeconfianza =0.95(z=1.96)
Intervalodeconfianza =2.9(1.96)(0.0679)
=2.9(0.133)
Intervalo de confianza: la media poblacional est entre 2.767 y 3.033 horas, con
95%deprobabilidadesdenocometererror.
CLCULODELCOEFICIENTEDECONFIABILIDAD
(FIABILIDAD)ALFACRONBACH
Enloscaptulos9y10sedefinielcoeficientealfadeCronbach(),ascomosususose
interpretacin.LosprogramasdeanlisisestadsticocomoSPSS,Minitab,SASyotros,lo
incluyen y calculan instantneamente. Pero para quienes no tienen acceso a estos
programas, presentamos la forma de obtenerlos. De acuerdo con Carmines y Zeller
(1988, pp. 44 y 45), as como Corbetta (2003), existen tres procedimientos para
determinarelcoeficienteoalfa:
s 2 (Yi)
12
En donde N representa el nmero de tems de la escala, s 2 (Yi) es igual a la
sumatoriadelasvarianzasdelostemsys2xequivalealavarianzadetodalaescala.
2. Sobrelabasedelamatrizdecorrelacindelostems,elprocedimientosera:
a) Seaplicalaescala.
b) Seobtienenlosresultados.
(todoscontratodosdeparenpar).
d) Seelaboralamatrizdecorrelacinconloscoeficientesobtenidos.Porejemplo:
tems
1 2 3 4
1 0.451 0.399 0.585
2 yafuecalculado 0.489 0.501
3 yafuecalculado yafuecalculado 0.541
4 yafuecalculado yafuecalculado yafuecalculado
P
p= ( es la sumatoria de los valores de las correlaciones y NP el nmero
NP
decorrelacionesnorepetidasonoexcluidas).
13
0.451 + 0.399 + 0.585 + 0.489 + 0.541
p=
6
p = 0.494
f) Seaplicalafrmulasiguiente:
Np
=
1 + p (N + 1)
Np
=
1 + p (N + 1)
DondeNeselnmerodetemsy elpromediodelascorrelacionesentretems.
Enelejemplo:
4(0.494)
=
1 + 0.494(4 1)
1.984
=
2.48
= 0.798
= 0.80(cerrando)
14
nr
=
1 + r(n 1)
Donde n representa el nmero de tems o elementos de la escala y r es su
correlacinpromedio.
SUSTENTODELANLISISDEVARIANZAUNIDIRECCIONAL
Figura8.2Ejemplodelasvariacionesdelosgruposcomparados
15
Es decir, esperamos homogeneidad intrafamilias y heterogeneidad interfamilias.
Qusucederasilosmiembrosdelasfamiliasseparecieranmsalosintegrantesdelas
otrasfamiliasquealosdelasuyapropia?Quieredecirquenohaydiferenciaentrelos
grupos(enelejemplo,familias).
EstamismalgicaseaplicaalaraznF,lacualnosindicasilasdiferenciasentre
los grupos son mayores que las diferencias intragrupos (dentro de stos). Estas
diferencias se miden en trminos de varianza. La varianza es una medida de
dispersin o variabilidad alrededor de la media y se calcula en trminos
de desviaciones elevadas al cuadrado. Recuerde que la desviacin estndar es un
promedio de desviaciones respecto a la media X X y la varianza es un promedio
de desviaciones respecto a la media elevadas al cuadrado. La varianza por eso se
( )
2
simboliza como S2 y su frmula es X X n . En consecuencia, la razn F, que es
unarazndevarianzas,seexpresaas:
En donde la media cuadrtica implica un promedio de varianzas elevadas al
cuadrado. La media cuadrtica entre los grupos se obtiene al calcular la media de las
puntuacionesdetodoslosgrupos(mediatotal),despusseobtieneladesviacindela
mediadecadagruporespectoalamediatotalyseelevaalcuadradocadaunadeestas
desviaciones,yluegosesuman.Finalmentesesopesaelnmerodeindividuosencada
grupoylamediacuadrticaseobtieneconbaseenlosgradosdelibertadintergrupales
(nosecalculaconbaseenelnmerodepuntuaciones).Lamediacuadrticadentrode
losgrupossecalculaobteniendoprimeroladesviacindecadapuntuacinrespectoala
media de su grupo; posteriormente esta fuente de variacin se suma y combina para
obtenerunamediadelavarianzaintragrupalparatodaslasobservaciones,tomandoen
cuentalosgradosdelibertadtotales(Wright,1979;DoncasteryDavey,2007).
Lasfrmulasdelamediacuadrticason:
16
Suma de cuadrados entre grupos
Media cuadrtica entre grupos =
Grados de libertad entre grupos
Losgradosdelibertadentregrupos= (dondeKeselnmerodegrupos).
Losgradosdelibertadintragrupos= n K (neseltamaodelamuestra,lasuma
delosindividuosdetodoslosgrupos,yKrecordemosqueeselnmerodegrupos).
Pues bien, cuando F resulta significativa, quiere decir que los grupos difieren
significativamente entre s. Es decir, se acepta la hiptesis de investigacin y se
rechazalahiptesisnula.
Cuandoseefectaelanlisisdevarianzapormediodeunprogramacomputacional
estadstico,segeneraunatabladeresultadosconloselementosdelatabla8.1.
Tabla8.1Elementosparainterpretarunanlisisdevarianza
unidireccionalrealizadoenSPSS
17
Elvaloralfaoprobabilidadaelegirunavezmses0.05o0.01.Siesmenorque0.05es
significativo en este nivel, y si es menor que 0.01 tambin es significativo en este nivel.
Cuandoelprogramaopaqueteestadsticonoincluyelasignificanciaseacudealatabla3del
apndice4(tabladeladistribucinFoenSTATSaValoresdeFalniveldeconfianza
de .05 y .01). Esta tabla contiene una lista de razones significativas (razones F)
quedebemosobtenerparaaceptarlahiptesisdeinvestigacinenlosnivelesdeconfian
za de 0.05 y 0.01. Al igual que en caso de la razn t, el valor exacto de F que debemos
obtenerdependedesusgradosdelibertadasociados.Porlotanto,lautilizacindelatabla
seiniciaalbuscarlosdosvaloresgl,losgradosdelibertadentrelosgruposylosgradosde
libertad intragrupos. Los grados de libertad entre grupos se indican en la parte superior
de la pgina, mientras que los grados de libertad intragrupos se han colocado al lado
izquierdo de la tabla. El cuerpo de la tabla de la distribucin F presenta razones F
significativasenlosnivelesdeconfianzade0.05y0.01.
SiF = 1.12
glentre = 2
glintra = 60
EstevalorFsecomparaconelvalorqueapareceenlatabladeladistribucinFque
es 3.15 y como el valor F calculado es menor al de dicha tabla, rechazaramos la
hiptesisdeinvestigacinyaceptaramoslahiptesisnula.ParaqueelvalorFcalculado
seasignificativodebeserigualomayoraldelatabla.
ANLISISMULTIVARIADO
En el captulo 10 del libro, cuando se analizaron los principales mtodos estadsticos
paramtricos, concretamente, despus de revisar el ANOVA unidireccional, nos
preguntbamos: pero qu ocurre cuando tenemos diversas variables independientes y
una dependiente, varias independientes y dependientes? Tal como observbamos en
diagramascomoelquesemuestraenlafigura8.3.
18
Autoestimade
lapersona
Sentido
Edad devida
dela
persona
Gnero
Religin
Figura8.3Ejemploconcuatrovariablesindependientesyunadependiente.
Larespuestaera:entonces,requerimosdeotrosmtodosestadsticos.stossonlos
que revisaremos a continuacin y una vez ms, sobre la base de que existen
computadoras y programas como el SPSS, del mismo modo centrndonos en los
elementosfundamentalesdeinterpretacin.
Qusonlosmtodosdeanlisismultivariado?
Los mtodos de anlisis multivariado son aquellos en que se analiza la relacin entre
diversas variables independientes y al menos una dependiente. Son mtodos ms
complejosquerequierendelusodecomputadorasparaefectuarlosclculosnecesarios
(normalmenteseenseananivelposgrado).
Queselanlisisfactorialdevarianza?
ANOVA(anlisisdevarianzadekdireccionesovariosfactores)
Definicin: Es una prueba estadstica para evaluar el efecto de dos o ms variables
independientessobreunavariabledependiente.
Respondeaesquemascomoelquesemuestraenlafigura8.4.
19
X1
X2
Y
Xk
Figura8.4Esquemadeunanlisisfactorialdevarianza
Constituyeunaextensindelanlisisdevarianzaunidireccional,solamentequeincluye
ms de una variable independiente. Evala los efectos por separado de cada variable
independienteylosefectosconjuntosdedosomsvariablesindependientes.
Variables:dosomsvariablesindependientesyunadependiente.
Niveldemedicindelasvariables:lavariabledependiente(criterio)debeestarmedida
enunnivelporintervalosorazn,ylasvariablesindependientes(factores)pueden
estarencualquierniveldemedicin,peroexpresadasdemaneracategrica.
Interpretacinyejemplo
20
Fuente de la variacin (source of variation). Es el factor que origina variacin en la
dependiente.Siunafuentenooriginavariacinenladependiente,notieneefectos.
Efectos principales (main effects). Es el efecto de cada variable independiente por
separado;noestcontaminadodelefectodeotrasvariablesindependientesnideerror.
Sueleproporcionarselasumadetodoslosefectosprincipales.
Interacciones de dos direcciones (2way interactions). Representa el efecto conjunto de
dos variables independientes, aislado de los dems posibles efectos de las variables
independientes (individuales o en conjuntos). Suele proporcionarse la suma de los
efectosdetodasestasinteracciones.
Interacciones de tres direcciones (3way interactions). Constituye el efecto conjunto de
tresvariablesindependientes,aisladodeotrosefectos.Sueleproporcionarselasumade
losefectosdetodasestasinteracciones.
Puede haber efecto de Kdirecciones, esto depende del nmero de variables
independientes.
Ennuestroejemplo,tenemoslosresultadosquesemuestranenlatabla8.2.
Tabla8.2EjemploderesultadosenelANOVA
VARIABLEDEPENDIENTE:SATISFACCINENLARELACIN
Fuentedevariacin Sumade Gradosde Medias Razn Significancia
(SOURCEOFVARIATION) cuadrados libertad cuadrticas deFOP
(SUMSOF (DEGREESOF (MEAN
SQUARES) FREEDOM) SQUARES)
Efectosprincipales 22.51 0.001**
(maineffects)
21
Atraccin
Realimentacin
Residual
Total
Nota: AlosestudiantesqueseinicianenelANOVAnormalmentelesinteresasabersilasrazonesF
resultarononosignificativas;portanto,sloseincluyenestosvalores.Porloqueesaellosaquieneslos
autoresrecomiendanconcentrarseendichosvaloresyevitarconfusiones.Desdeluego,elinvestigador
experimentadoacostumbraestudiartodoslosvalores.
**RaznFsignificativaalniveldel0.01(p<0.01)
*RaznFsignificativaalniveldel0.05(p<0.05)
Queselanlisisdecovarianza?
Definicin: es un mtodo estadstico que analiza la relacin entre una variable
dependienteydosomsindependientes,conelqueseeliminaocontrolaelefectodeal
menosunadeestasindependientes.SimilaralANOVA,exceptoquepermitecontrolarla
influencia de una variable independiente, la cual con frecuencia es una caracterstica
antecedentequepuedevariarentrelosgrupos(Mertens,2005;Babbie,2009)oinfluir
losresultadosyafectarlaclaridaddelasinterpretaciones.
Perspectivasousos:WildtyAhtola(1978,pp.89)destacantresperspectivasparael
anlisisdecovarianza:
22
Variables X1
independientes X2
categricas
Xk
Variable
dependiente
Y
Variables
independientes
Z1
cuantitativas
continuas Z2
Zk
Figura8.5Ejemplodevariablesindependientesqueafectanaunadependiente
X1
X2
Xk
Y Removero
controlar
Z1
Z2
Zk
Figura8.6Ejemplodecontroldevariablesindependientesnocategricas.
23
El objetivo es purificar la relacin entre las independientes categricas y la
dependiente,medianteelcontroldelefectodelasindependientesnocategricaso
continuas.
Ejemplos de variables independientes categricas seran: gnero (masculino,
femenino),inteligencia(alta,media,baja),ingreso(menosdeunsalariomnimo,dos
acuatrosalariosmnimos,cincoa10salariosmnimos,11omssalariosmnimos).
Los niveles de medicin nominal y ordinal son categricos en s mismos, mientras
que los niveles de intervalos y razn deben transformarse en categoras ms
discretas.Estosltimossonens:cuantitativos,continuosydecategorasmltiples.
Porejemplo,elingresoensuestadonatural(pesos,dlares,euros,etc.)varadela
categoracerohastalacategora(K)k,yaquepuedehabermillonesdecategoras.
Variablecategricaunascuantascategorasounrangomedio.
Variablecontinuamuchascategoras(avecesunainfinidad).
Adichasvariablesindependientescuantitativascontinuas,cuyainfluenciase
controla,selesdenominacovariables.Unacovariableseincluyeenelanlisis
para remover su efecto sobre la variable dependiente, e incrementar el
conocimiento de la relacin entre las variables independientes categricas de
inters y la dependiente, lo cual aumenta la precisin del anlisis(Doncaster y
Davey,2007).
Enestaperspectiva,elanlisisdecovarianzapuedeserconcebidoprimerocomo
un ajuste en la variable dependiente respecto a diferencias en la covariable o las
covariables y, posteriormente, como una evaluacin de la relacin entre las
variables independientes categricas y los valores ajustados de la variable
dependiente (Wildt y Ahtola, 1978). En trminos de Creswell (2005): el
procedimiento ajusta las puntuaciones en la dependiente para dar cuenta de la
covarianza (por decirlo en trminos sencillos: hace equivalentes a los grupos en
la(s) covariable(s) y controla influencias potenciales que pueden afectar a la
variabledependiente).
24
B. Perspectivadeintersporlacovariable.Estaperspectivaseejemplificaconaquellas
instanciasenlascualeselintersprincipalsecentraenanalizarlarelacinentrela
variable dependiente y la covariable (variable cuantitativa continua) o las
covariables. Aqu el enfoque es distinto; la influencia que se remueve es la de las
variables independientes categricas. Primero se controla el efecto (en este caso
contaminante)deestasvariablesydespusseanalizaelefectopurificadodelas
covariables.
C. Perspectiva de regresin. En esta tercera perspectiva, tanto las variables
independientes categricas como las covariables resultan de inters para el
investigador, quien puede desear examinar el efecto de cada variable
independiente(covariablesynocovariables,todas)ydespusajustarocorregirlos
efectosdelasdemsvariablesindependientes.
Encualquiercaso,elanlisisdecovarianzaeliminainfluenciasnodeseadassobrela
variable dependiente. Se puede utilizar en contextos experimentales y no
experimentales. La mayora de las veces la funcin del ANCOVA es remover la
varianzacompartidaentreunaomscovariablesyladependiente,deestemodo,
se valora en su justa dimensin la relacin causal entre la(s) variable(s)
independiente(s) de inters y la dependiente (Creswell, 2005). Vemoslo
conceptualmenteperodeformagrficaconunejemplosimple:
EJEMPLO
Estudio:Alinvestigadorleinteresaanalizarelefectoenelaprendizajedelacomputacin,pormedio
deunnuevomtodoparasuenseanzaanios.Lahiptesises:elnuevomtododeenseanzade
lacomputacin(MARH)provocarunmayoraprendizajeenlosniosqueunmtodotradicional.
Entonces, implementa el siguiente experimento: a un grupo de infantes lo expone al nuevo
mtodo de enseanza de computacin (MARH); el otro grupo aprende con el mtodo tradicional;
finalmente,untercergrupo,decontrol,norecibeningntipodeenseanzaencomputacin.
La variable independiente es el tipo de mtodo con tres categoras o niveles (mtodo nuevo,
mtodotradicionalyausenciademtodo),ladependienteeselaprendizajeencomputacin(medida
porunapruebaestandarizadaaniveldeintervalos).Setieneunesquemacomoeldelafigura8.7.
25
Tipodemtodo(X) Aprendizaje(Y)
Elinvestigadorsabequeelaprendizajesepuededeberamuchasrazones,ademsdelmtodo.Esdecir,el
aprendizajevarapordiversosmotivos,locualserepresentaenformadeconjuntosdelasiguientemanera:
Variable Variable
independiente: dependiente:
mtodo(X) aprendizaje(Y)
Varianzadelaprendizajeno
explicada(quenosedebeal
mtodosinoaotrosfactores)
Varianzaencomnentre
mtodoyaprendizaje
Conelexperimentoelinvestigadordeseaconocerlavarianzaencomnentremtodoyaprendizaje
(cuantificarla),larelacinXY(pura).Silosniossonasignadosalazaralosgruposdelexperimento
ytienegruposdetamaoaceptable,poreldiseomismo,remuevelainfluenciadelascovariables
quepudieranafectar.Perosinoesfactiblehacerloytieneundiseocuasiexperimental(grupos
intactos),deberemovertalinfluenciaconelanlisisdecovarianza(eliminaralmnimoposiblela
varianzadelaprendizajenoexplicada),paraevitarquelascovariablesimpidanverconclaridadla
relacinXY.Porejemplo,elniveleducativotecnolgicodelospadrespuedeinfluir(hacevariaral
aprendizaje)yesteefectodebesercontrolado,alintroducirlocomocovariable.
26
Variable
dependiente:
aprendizaje(Y)
Variable
independiente:
mtodo(X)
Elniveleducativo
tecnolgicodelos
padres(COVARIABLE)
Varianzaencomn:entre
mtodoyaprendizaje
Varianzacompartidaentreelnivel
educativodelospadresyelaprendizaje(la
cualsecontrolaconelANCOVA)
Entremscovariablessecontrole,msseexplicarsobrelavarianzacomnentreelmtodoyel
aprendizaje.
Figura8.7Ejemplodelcontroldelascovariables(conunacovariable).
Loqueelinvestigadordeseatambinsepuedeexpresar
grficamenteas:
Tipodemtodo Aprendizaje
ANCOVA
Niveleducativo
tecnolgicodelos
padres(covariable) Controlarinfluenciadelacovariable
WildtyAhtola(1978,p.13)definenalgunosusosdelanlisisdecovarianza:
27
1. Incrementarlaprecisinenexperimentosconasignacinalazar.
2. Eliminar influencias extraas o contaminantes que pueden resultar cuando las
pruebas o los individuos no son asignados al azar a las diferentes condiciones
experimentales(gruposdeunexperimento).
3. Eliminar efectos de variables que confundan o distorsionen la interpretacin de
resultadosenestudiosnoexperimentales.
Nivel de medicin de las variables: la variable dependiente siempre est medida por
intervalosoraznylasvariablesindependientespuedenestarmedidasencualquiernivel.
Interpretacin: depende de cada caso especfico, ya que el anlisis de covarianza
efectuado mediante un programa estadstico computacional, produce un cuadro de
resultados muy parecido al del anlisis de varianza. Los elementos ms comunes
puedenobservarseenlatabla8.3.
Tabla8.3Ejemplodeelementoscomunesdeunanlisisdecovarianza
28
covariableocovariables.
EJEMPLO
Diseodeinvestigacinqueutilizaelanlisisdecovarianza
Hi:lostrabajadoresquerecibanretroalimentacinverbalsobreeldesempeodeparte
desusupervisormantendrnunnivelmayordeproductividadquelostrabajadoresque
reciban retroalimentacin sobre el desempeo por escrito, y ms an que los
trabajadoresquenorecibanningntipoderetroalimentacin.
Elinvestigadorplanteaundiseoexperimentalparaintentarprobarsuhiptesis.
Sinembargo,nopuedeasignaraleatoriamentealostrabajadoresalostresgruposdel
experimento. El diseo sera con grupos intactos (cuasiexperimental) y se
esquematizaraas:
G1 X1
1
G2 X2
2
G3
3
Asimismo, el investigador presupone que hay un factor que puede contaminar los
resultados (actuar como fuente de invalidacin interna): la motivacin. Diferencias
iniciales en motivacin pueden invalidar el estudio. Como la asignacin al azar est
29
ausente, no se sabe si los resultados se ven influidos por dicho factor. Entonces, el
experimentador decide eliminar o controlar el efecto de la motivacin sobre la
productividad para conocer los efectos de la variable independiente: tipo de
retroalimentacin. La motivacin se convierte en covariable. El esquema es el que se
muestraenlafigura8.8.
Retroalimentacin(variable Productividad(variable
independientecategrica) dependiente)
ANCOVA
Motivacin
(covariable)
Figura8.8Ejemplodondelamotivacinescovariable
Cabe destacar que, para introducir una covariable en el anlisis, de preferencia debe
medirseantesdeliniciodelexperimento.
Elanlisisdecovarianzaquitaalavariabilidaddeladependienteloquesedebeala
covariable. Ajusta la varianza de la variable dependiente en las categoras de la
independiente, al basarse en la covariable. En el ejemplo, ajusta la varianza de la
productividad debida a la motivacin, en las categoras experimentales (tratamientos o
grupos). El ajuste se realiza sobre la base de la correlacin entre la covariable y la
dependiente.Estosemuestraesquemticamenteenlatabla8.4.
Unavezrealizadoelanlisisdecovarianza,seevalasiFesonosignificativa.CuandoF
resultasignificativaseaceptalahiptesisdeinvestigacin.
Sielresultadofuera:
G1=35
G2=36
Lacorrelacinentrelacalificacinenmotivacinylaspuntuacionesenproductividades
labaseparaelajuste.
30
G3=38
Glentre=K1=31=2
Glintra=NK=107
F=1.70
G1 0 X1 0
G2 0 X2 0
G3 0 0
Queslaregresinmltiple?
Esunmtodoparaanalizarelefectodedosomsvariablesindependientessobreuna
dependiente. Asimismo, constituye una extensin de la regresin lineal slo que con
mayornmerodevariablesindependientes.Esdecir,sirveparapredecirelvalordeuna
variable dependiente, cuando se conoce el valor y la influencia de las variables
31
independientes incluidas en el anlisis. Si queremos conocer el efecto que ejercen las
variables:a)satisfaccinsobrelosingresospercibidos,b)antigedadenlaempresa,c)
motivacin intrnseca en el trabajo y d) percepcin del crecimiento y desarrollo
personal en el trabajo; sobre la variable permanencia en la empresa (duracin o
estancia), el modelo de regresin mltiple es el adecuado para aplicarlo a los datos
obtenidos.Otroejemploseraelsiguiente:
VARIABLESINDEPENDIENTES
VARIABLE
DEPENDIENTE
Diseodeestrategiasde
cooperacinentremaestrosparala
enseanzaenlasclases.
Gradodeutilizacindelatecnologa
computacionalenelaula.
Desempeoescolar
delosalumnos
Gradodeinvolucramientodelos
padresenlasestrategiasde
enseanza.
Gradodecooperacinytrabajoen
equipoporpartedelosalumnos
pararealizarlastareas.
Figura8.9Esquemadeunmodeloconunavariabledependienteyvariasindependientes,
dondeseconoceelefectodecadaunadestas
Esdecir,elmodeloderegresinmltiplenosindica:
La relacin entre cada variable independiente y la nica dependiente (cmo
cambiosenlaindependientesevinculanconcambiosenladependiente).
32
La relacin entre todas las variables independientes (en conjunto) y la
dependiente (cmo cambios en las independientes se vinculan con cambios en la
dependiente).
Laprediccindeladependienteapartirdelasindependientes.
Lacorrelacinentrelasvariablesindependientes(colinealidad).
Las variables independientes se denominan predictoras4 y anteceden
temporalmentealavariabledependienteocriterio.
La informacin bsica que proporciona la regresin mltiple es el coeficiente de
correlacinmltiple(R)ylaecuacinderegresin.
Coeficiente de correlacin mltiple (R). Seala la correlacin entre la variable
dependienteytodaslasvariablesindependientestomadasenconjunto.
Elcoeficientepuedevariardeceroauno;cuantomsaltoseasuvalor,lasvariables
independientes estarn ms correlacionadas con la variable dependiente y explicarn
en mayor medida sus fluctuaciones (varianza); en consecuencia, son factores ms
efectivosparapredecirelcomportamientodeestaltima.
Enelcaptulo10dellibro,secomentelcoeficientedecorrelacindePearsonyse
mencionquecuandoelcoeficienterseelevaalcuadrado(r2),seobtieneelcoeficiente
de determinacin y el resultado indica la varianza de factores comunes, esto es, el
porcentajedelavariacindeunavariabledebidoalavariacindelaotrayviceversa(o
cuntoexplicaodeterminaunavariablelavariacindelaotra).Puesbien,algosimilar
ocurreconelcoeficientedecorrelacinmltiple,solamentequetenemosmsvariables
aconsiderar.CuandoelcoeficienteRseelevaalcuadrado(R2),seproduceelllamado
coeficientededeterminacinocorrelacinparcial,quenossealalavarianzaexplicada
de la variable dependiente por todas las independientes (dicho de otra forma, el
porcentajedevariacinenladependienteesdebidoalasindependientesconsideradas).
Vemoslogrficamenteenlafigura8.10condosindependientesyunadependiente,
afindequeresultemenoscomplejodeentender.
4Trminoanglosajn.
33
Variableindependiente Variable
1 independiente2
R2(expresaen
porcentajelavarianza
Variable compartidaporlastres
dependiente variables)
Figura8.10Esquemadeuncoeficientededeterminacinocorrelacinparcial
Este coeficiente (R2) resulta til tambin para determinar la cantidad de varianza
que una variable interviniente explica tanto de la variable independiente como de la
dependiente,deestemodo,sepuederemoverlavarianzacompartidadelainterviniente
conlavariableindependienteoladependiente(Creswell,2005;Sengupta,2009),quees
algosimilaraloqueseefectaconelanlisisdecovarianza.
Talseraelcasodeunarelacindelsiguientetipo:
Autoestimadelestudiante relacinnegativa Consumodeestupefacientes
(independiente) (dependiente)
Reforzamientodelos
valoresdelestudiante
porpartedesustutores
(interviniente)
relacinnegativa
Figura8.11Ejemplodelcoeficientededeterminacin(correlacinparcial)
34
Siresumimoslovistoenelcaptulo10dellibrosobrecorrelacinyregresinlineal
yloexpuestohastaaqu,tenemosloscoeficientesqueseresumenenlatabla8.5.
Tabla8.5Resumendecoeficientesdecorrelacinbivariadaymltiple
Coeficiente Smbolo Informacinproducida
Pearson Grado de asociacin entre dos variables
r
(oscilaentre0y1).
Coeficientede Varianzadefactorescomunes(porcentaje
r2
determinacin delavariacindeunavariabledebidoala
variacin de la otra variable y viceversa).
Oscilaentre0y100%.
Mltiple Correlacinentrelavariabledependiente
R
y todas las variables independientes
tomadasenconjunto.Oscilaentre0y1.
Determinacin Varianza explicada de la dependiente por
R2
(correlacinparcial) todas las independientes. Oscila entre
0y100%.
Otra informacin relevante producida por el anlisis de regresin mltiple son los
valores beta ( o b) que indican el peso o la influencia que tiene cada variable
independiente sobre la dependiente, al controlar la varianza de todas las dems
independientes. Cada peso beta es un coeficiente que seala la magnitud de la
prediccin de una variable independiente para una variable dependiente (criterio),
despus de remover los efectos de todas las dems independientes. Los valores beta
estnestandarizados,esdecir,noimportaquecadavariablepredictoraestmedidaen
una escala diferente (como ocurra con las puntuaciones z) y se interpretan como el
coeficientedePearson,de1.00a+1.00(Creswell,2005).
Tambin el anlisis proporciona coeficientes de correlacin bivariados entre la
dependienteycadaindependiente(Shaw,2009).
Parapredecirvaloresdelavariabledependienteseaplicalaecuacinderegresin
mltiple:
y=a+b1X1+b2X2+b3X3+bkXk
35
Dondeaesunaconstantederegresinparaelconjuntodepuntuacionesobtenidas,
b1,b2,b3,bksonlospesosbetadelasvariablesindependientes.MientrasqueX1,X2,X3
y Xk son valores de las variables independientes que fija el investigador para hacer la
prediccin.
La variable dependiente debe estar medida en un nivel por intervalos o de razn. Las
independientes,encualquierniveldemedicin(elmodeloestandarizamediciones).Cuandose
utilizan variables categricas (nominales u ordinales, como gnero, grupo tnico, nivel
jerrquico, etc.) se transforman en variables dummy y se introducen al modelo como
predictores.Loscdigosdummysonseriesdenmerosasignadosparaindicarlapertenenciaa
ungrupoencualquiercategoraexhaustivaymutuamenteexcluyente.
De acuerdo con Mertens (2005), la cantidad de varianza que cada independiente
aporta para la variable dependiente puede tener cambios con diferentes rdenes de
entradadelasvariablesindependientes.Alrespectonohayreglas,seusalalgicadel
investigadorocriterioscomolossiguientes:
Normalizacin(formalizacindepolticasendocumentos).
36
Identificacin del trabajo individual en los resultados generales de la
organizacin.
Comunicacin (percepcin del grado en que la informacin relevante de la
empresalesestransmitidaalosempleadosdesudepartamento).
Desempeo(ndicedeproductividaddelempleado).
Motivacingeneral.
Antigedadenlaempresa(enmeses).
Satisfaccingeneraleneltrabajo.
Liderazgo(percepcindelsuperiorinmediatocomolder).
Cultura(arraigodelaculturaorganizacionaldefinidaporladireccindela
empresa).
Pago(salario).
Primero.Sepresentanlasvariablesintroducidasenelmodeloderegresin:
Tabla8.6Variablesintroducidasenelejemploderegresinmltiple
Variablesintroducidas/eliminadas
Modelo Variables Variables Mtodo(b)
introducidas(a) eliminadas
Pago
Innovacin
Antigedad
Motivacin
Normalizacin
Procesodecalidad Introducir
Cultura
Identificacin
Desempeo
Liderazgo
Satisfaccin
Comunicacin
a. Todaslasvariablessolicitadasintroducidas
b. Variabledependiente:clima
37
Tabla8.7Ejemploderesultadosbsicosdelaregresinmltiple
a
Coeficientes
a.Variabledependiente:clima
38
Tercero.Semuestranlosvaloresestadsticossobrelosresiduos(residuales).
Figura8.12Grficadeunavariableenelejemploderegresinmltiple
Finalmente,mostramosunejemplodeinterpretacindelcoeficienteR2deotrode
los estudios de Hernndez Sampieri (2005), en el cual la variable dependiente es el
climaorganizacionaltotal(medidoporlaescaladelaUniversidaddeCelayaoECOUNI)
y las independientes son: moral, apoyo de la direccin, innovacin, percepcin de la
empresa, comunicacin, percepcin del desempeo, motivacin intrnseca, autonoma,
satisfaccin general, liderazgo, visin y recompensas o retribucin. Las variables
independientes fueron evaluadas a travs de diferentes mediciones no incluidas en la
ECOUNI5).
5MedicionesclsicasdeorigendistintoalasdelaECOUNI.Porejemplo,paralavariablevisinseusla
escala de Anderson y West (1998), para satisfaccin el Job Satisfaction Survey, versin en espaol
(Spector,1997),paramotivacinlaescaladeWangyGuthrie(2004),etctera.
39
EJEMPLO
Paraciertolaboratorioqumicofarmacutico(empresa),laR2fuede0.989
(0.988corregida).Todoslospesosbetatuvieronunasignificanciamenoral0.01
(exceptorecompensas,lacualfuede0.175).Unavezms,estavariablepareceno
ser predictora del clima organizacional. La tendencia resultante es tan
contundente que poco puede comentarse al respecto, tal como lo muestra el
.25
0.00
Figura8.13Diagramadedispersindelclimaorganizacional:laboratorio
Queselanlisislinealdepatronesopathanalysis?
Esunatcnicaestadsticamultivariadapararepresentarinterrelacionesentrevariables
apartirderegresiones,ascomoanalizarlamagnituddelainfluenciadeunasvariables
40
Responsabilidad
experimentadaenel Satisfaccinlaboral
trabajo
Autonomaeneltrabajo
Ingreso
Figura8.14Unesquemapropicioparaelanlisisdepatronesovas
Elanlisispathconstituyeunmtodoparasometerloapruebayunaextensindela
regresinmltiple(WebleyyLea,1997).Lainformacinprincipalqueproporcionason
los coeficientes path, los cuales representan la fuerza de las relaciones entre las
variables(soncoeficientesderegresinestandarizadoscomolospesosbeta).
Tambin cuantifica efectos. En el modelo puede haber variables independientes,
intervinientesydependientes;inclusounavariablepuedeserdependienteenunaparte
del modelo e independiente en otra (en la figura 8.14, ingreso es dependiente de
autonoma y responsabilidad, pero tambin es independiente en relacin con la
satisfaccinlaboral).Laecuacindelanlisiseslasiguiente6paracadasecuenciacausal:
independiente2)+bk(variableindependientek).
6
AdaptadodeWebleyyLea(1997).
41
Al igual que Webley y Lea (1997), se utiliza una notacin diferente para los
coeficientesdeBrymanandCramer,conlafinalidaddeclarificarqueb11enlaprimera
trminosdelavarianzanoexplicada.
Enlafigura8.15semuestraunejemploparailustrarestetipodeanlisis.7Cuanto
msseacerqueuncoeficientepathaceromenorefectotendr(recordemosqueson
equivalentesensuinterpretacinalcoeficientedePearson).
Trabajo
Satisfaccineneltrabajo
Papel 0.32
0.23
0.48 0.18
0.61
Figura8.15Ejemplodeunanlisispathconelmodelodedosetapas
delclimaorganizacional
7ExtradodeParkeretal.(2003),quienesbuscaronpormediodelanlisisprobarelmodelodedosetapas
delclimaorganizacional,elcualyasecomenteneltexto.
42
Queselanlisisdefactores?
Primerejemplo:relacinvendedorcomprador9
El estudio pretendi analizar los factores que determinan la relacin entre los
vendedores y los compradores industriales de las tres principales ciudades de Mxico
(Distrito Federal, Guadalajara y Monterrey). Se midieron variables entre las que
destacan:coordinacin(coord.),conflicto(confl.),frecuenciadelarelacincomprador
vendedor (frec.), reciprocidad econmica en la relacin (RF2), reciprocidad en el
delasoperaciones)(impor.).Losresultadossemuestranenlatabla8.8.
8Enlosejemplos,noseincluyentodoslosanlisis,conelfindenocomplicarsuentendimiento.
9Paniagua(1988)conlacolaboracindelosautores.
43
Tabla8.8Ejemplodealgunosresultadosenunanlisisdefactores
MATRIZDEPATRNFACTORIALELEGIDA
SUBMUESTRACOMPRAS
44
FI= Coordinacin(explica37.7%delavarianza)
FII= Conflicto(explica17.8%delavarianza)
FIII=Frecuencia(explica17.4%delavarianza)
Yassucesivamente.
Eigenvalue:representalacantidaddevarianzaconquecontribuyecadafactor.
Observe que debajo de las columnas FI a FVI aparecen coeficientes que
correspondenalostemsdeunaescala.Siestoscoeficientessonmediosoelevados,se
dice que los tems cargan o forman parte del factor correspondiente. Por ejemplo, los
tems23,24,25y26carganenelprimerfactor(obtienenvaloresde0.84392,0.71642,
0.67853 y 0.74737, respectivamente) y no pesan o cargan en otros factores (tienen
valores bajos). As, descubrimos una estructura de seis factores (F) en 19 tems. Los
factoresrecibenun nombreparasaber qu constructosseencuentransubyacentes(el cual
debereflejaralfactorygeneralmenteseextraedelateora).Elanlisisdefactorestambin
proporciona la varianza explicada y puede diagramarse en forma grfica en las
coordenadasXyY.
45
Segundoejemplo:escaladelclimaorganizacional10
Paralavalidacindelinstrumentosobreelclimaorganizacionalseconsideraron
varias muestras independientes. Entre stas, un laboratorio qumico
farmacutico y una institucin educativa. El primero de 500 trabajadores, dos
subunidades o centros de trabajo, con la inclusin de una planta y oficinas; 19
reas funcionales y una antigedad de ms de 76 aos. Se trata de una
organizacindealtatecnologaypartedeungrupocorporativointernacional.El
tamao de muestra final fue de 421 casos vlidos (n), 216 hombres y 186
mujeres (19 personas no especificaron). De los cuales 90% tienen 18 a 40 aos
(63%menoresa33);mientrasquesolamente2%fuedenivelgerencialomayor.
10EsteejemplofuetomadodeunaaplicacindelinstrumentodelaUniversidaddeCelayaparamedirel
climalaboral(HernndezSampieri,2005).
46
Tabla8.9Cargasdefactoresenelejemplodelaescala
paramedirelclimaorganizacional(laboratorioqumicofarmacutico)
Factoro
Pregunta componente
Frases Factor1 Factor2 Factor3 Factor4 Factor5
Likert
F1 .352 .286 .276 .160 .365
F2 .508 .382 7.527E03 1.853E02 .245
F3 .511 .211 .304 .153 .153
F4 .555 .359 1.285E02 4.903E02 .247
F5 .631 .325 .120 .137 4.398E02
F6 .586 .312 .121 .287 4.812E02
F7 .615 .224 .162 .262 6.974E02
F8 .595 .165 .125 .330 4.410E02
F9 .609 .272 .325 .296 5.500E03
F10 .655 .235 .294 .293 2.404E02
F11 .659 8.963E02 .140 3.780E02 .167
F12 .589 .152 .161 5.420E02 .107
F13 .591 .217 .189 .231 5.625E02
F14 .636 .198 .113 .237 3.174E02
F15 .675 .217 5.034E02 7.586E02 4.885E02
F16 .646 .166 .243 .215 3.701E02
F17 .651 .164 .213 7.052E02 8.041E03
F18 .534 .328 .269 .276 7.664E02
F19 .690 3.630E02 9.095E05 6.007E02 7.306E02
F20 .590 9.375E02 6.703E02 .359 3.371E02
F21 .727 .150 .404 5.516E02 8.518E03
F22 .765 .213 .389 2.251E02 5.801E03
F23 .649 .211 2.260E02 .141 3.218E02
F24 .656 .335 8.049E02 1.521E02 .211
F25 .534 9.697E03 .342 7.291E02 .135
F26NEG 2.383E02 3.496E02 .124 .187 .280
47
F27 .592 .257 4.450E02 .410 3.095E02
F28 .593 .231 .216 .384 .123
F29 .398 .103 8.613E02 .326 .170
F30 .677 8.654E02 .223 5.095E02 3.149E02
F31NEG .236 .210 .114 .102 .333
F32 .673 .317 5.273E02 3.608E02 .204
F33 .657 .276 .226 .277 8.926E02
F34 .604 .397 3.055E02 1.101E02 1.358E02
F35 .547 .417 3.127E02 2.232E04 3.890E02
F36 .669 .256 9.381E02 .296 4.097E04
F37NEG .163 .144 .254 .161 .367
F38NEG .555 .176 .255 1.392E02 .226
F39 .701 .312 9.353E02 .209 .184
F40 .643 .412 .144 .149 .130
F41 .730 .269 .235 .210 2.546E02
F42NOUNI .518 .336 .161 .167 .255
F43 .229 6.211E02 3.422E03 2.360E02 9.347E02
F44NEG .246 .223 .105 .263 .292
F45NEG 8.139E02 .207 .170 7.145E02 .404
F46 .642 .141 .339 3.685E02 .175
F47 .764 .155 .338 5.616E02 2.326E02
F48 .612 .186 .359 .192 8.310E02
F49 .720 .148 .339 .105 .117
F50NOUNI .505 .339 .191 9.964E02 .260
F51 .676 .389 2.925E02 5.744E02 .226
F52NEG .376 .164 6.835E02 .239 .363
F53NEG .156 .214 .187 .336 .244
F54 .542 .128 .117 6.809E02 .115
F55 .509 .344 .233 .333 .101
F56 .467 1.753E02 .273 .343 .132
F57 .528 .393 5.363E02 .321 6.305E02
48
49
11Dacuentade39%delavarianzatotal(lostresprimerosfactoresgeneran60%).Alfactorseledenomin:
Procesodejuiciocomnparaevaluarlaspercepcionesdelentornolaboral.
50
tem
Factor1 Demsfactores
cargafactorialalta cargasfactorialesbajas
Lostemsconcargasbajasentodoslosfactoresdebendesecharsedelaescala,no
miden realmente lo que nos interesa: los componentes o dimensiones del clima
organizacional(afectanlavalidezdelinstrumento).Porejemplo,eltem53(frase):
tem
Factor1 Demsfactores
cargafactorialbaja cargasfactorialesbajas
Enestecaso,laconclusinprincipaldelresultadosera:
Elhechodequeelanlisisdefactoreshayareveladounnicofactorsignificativo
enlamuestra,nosllevaalaconclusinprovisionaldequeelclimaorganizacionalesun
constructo molar, en el cual se funden distintas percepciones sobre aspectos
centralesdelambientedetrabajo.
Porloanterior,hemosdedecirquelosresultadosrespaldanlanocindeParker
etal.(2003)respectoaque,detrsdelasdimensioneslaboralesdelclima,seencuentra
presenteunprocesodejuiciocomn,elcualsereflejaenlasdistintasmedicionesdela
percepcin del entorno de trabajo. Es un proceso subyacente que se expresa de
diversasmaneras.
Asimismo, el anlisis de factores y la matriz de correlacin entre dimensiones
apoyanelmodelodedosnivelespostuladoprincipalmenteporL.A.James,L.R.Jamesy
C.P.Parker.
51
Laconfiabilidadalfaparalaescalafue0.9747,queaumentaa0.98siseeliminan
lostemsquenocarganenalgnfactor.
Tercerejemplo:validacindeuninstrumento
paramedirelesprituempresarialenestudiantes12
Objetivodelestudio:validaruninstrumentoqueevalaelesprituempresarialenuna
muestradeestudiantesmexicanos.
Instrumento desarrollado en 2003 por Leslie Borjas Parra, Universidad
MetropolitanadeVenezuela.
Confiabilidadtotal(alfa):0.925.
Apartirdelanlisisdefactoresporcomponentesprincipales,sepuedeobservaruna
carga mayor a 0.50 de 24 tems hacia el factor 1 (F1), lo que proporciona confianza
respectodequeelinstrumentorealmentemideloquepretende(validezdeconstructo).
Tabla8.10Ejemplodeanlisisdefactoresparalavalidacin
deuninstrumento(esprituempresarialenestudiantes)
PREGUNTA F1 F2 F3 F4 F5 F6 F7 F8
52
P28_AUTODETERMINACI
ON 0.52 0.29 0.01 0.46 0.01 0.22 0.03 0.23
P27_SOCIAL 0.39 0.32 0.02 0.61 0.21 0.12 0.00 0.23
P26_AUTODETERMINACI
ON 0.64 0.06 0.38 0.16 0.06 0.28 0.08 0.06
P25_AUTODETERMINACI
ON 0.68 0.08 0.28 0.04 0.22 0.08 0.12 0.10
P24_GRUPO 0.60 0.21 0.12 0.33 0.01 0.23 0.13 0.15
P23_CAMBIO 0.59 0.16 0.06 0.26 0.25 0.31 0.04 0.32
P22_HONESTIDAD 0.60 0.05 0.43 0.04 0.26 0.08 0.26 0.20
P21_HONESTIDAD 0.41 0.08 0.17 0.07 0.46 0.26 0.47 0.15
P20_SOCIAL 0.53 0.20 0.38 0.19 0.26 0.22 0.19 0.03
P2_CREATIVIDAD 0.64 0.04 0.26 0.27 0.24 0.20 0.01 0.07
P19_SOCIAL 0.49 0.40 0.37 0.32 0.06 0.05 0.03 0.37
P18_CAMBIO 0.70 0.07 0.17 0.17 0.05 0.11 0.07 0.10
P17_SOCIAL 0.64 0.42 0.21 0.25 0.13 0.02 0.02 0.07
P16_GRUPO 0.68 0.19 0.27 0.17 0.26 0.16 0.00 0.06
P15_CAMBIO 0.56 0.15 0.40 0.19 0.15 0.31 0.20 0.03
P14_RIESGOS 0.58 0.21 0.36 0.23 0.04 0.39 0.08 0.13
P13_RIESGOS 0.57 0.17 0.28 0.04 0.21 0.35 0.02 0.06
P12_CAMBIO 0.72 0.42 0.09 0.05 0.01 0.08 0.23 0.12
P11_EVENTOS 0.36 0.59 0.14 0.12 0.14 0.32 0.35 0.03
P10_AUTODETERMINACI
ON 0.31 0.48 0.31 0.14 0.04 0.12 0.37 0.12
P1_HONESTIDAD 0.45 0.26 0.33 0.11 0.41 0.17 0.15 0.25
Para quien desee compenetrarse con esta tcnica recomendamos consultar
Sengupta(2009),Brown(2006),Harman(1976),Gorsuch(1983),Nieetal.(1975),Kim
yMueller(1978ay1978b),ascomoHunter(1980).Delmismomodo,paraaplicarlosse
sugiere revisar a Cooper y Curtis (1976), y en espaol a Padua (2004) y otras
referencias ms sobre el paquete SPSS. Aunque es requisito conocer el programa
estadsticocomputacional.
53
Queselanlisismultivariadodevarianza(MANOVA)?
Esunmodeloparaanalizarlarelacinentreunaomsvariablesindependientesydoso
msvariablesdependientes.Esdecir,estilparaestructurascausalesdeltipo:
X1
Y1
X2
Y2
Yk
Xk
Latcnicaposeevariosusos,entrelosquedestacan:
54
LastresclasesprincipalesdelMANOVAson:
1. Hotelling'sT.Esparecidaalapruebat(dosgrupos)peroconmsdependientes:
unavariableindependientedicotmicayvariasdependientes.
LosmodelosdelMANOVAtienenencomnqueformancombinacioneslinealesde
las dependientes que discriminan mejor entre los grupos en un experimento o una
situacin no experimental. Es una prueba de significancia de las diferencias en los
grupos en un espacio multidimensional donde cada dimensin est definida por
combinacioneslinealesdelconjuntodevariablesdependientes.
Una pregunta que suele hacer el estudiante al revisar el MANOVA es por qu no
hacemos ANOVAS separados, uno para cada dependiente? La respuesta: las
dependientesestncorrelacionadasmuyfrecuentemente,porlocuallosresultadosde
variosANOVApuedenserredundantesydifcilesdeintegrar.Heaquunasntesisdela
explicacindeWiersmayJurs(2008)sobreestetipodeanlisis:
Alincluirdosomsvariablesdependientessimultneamentenoseconsideranlas
diferencias entre las medias en cada variable, sino las diferencias en variables
cannicas. El inters no slo es saber si los grupos definidos por las variables
independientesdifierenenlasvariablescannicas,sinoconocerlanaturalezadestas.
Una variable cannica es una variable artificial generada a partir de los datos.
Representaconstructosysecomponedevariablesreales,lascualesdebenserdescritas
entrminosdevariablesdependientes.Loanteriorseefectapormediodelascargas
de los coeficientes de correlacin entre una variable dependiente y una variable
cannica.Siunacargaentrelavariablecannicayladependienteespositivayelevada,
significaquealtosvaloresenladependienteseasocianconaltosvaloresenlacannica.
Porejemplo,siunavariabledependienteconsisteenpuntuacionesaunapruebasobre
innovacin, y dichas puntuaciones se correlacionan en forma considerable con una
55
(total,tomaencuentaelmodelocompleto),lapruebaHotelling'sTSquare,T2(cuando
hay dos grupos formados por las variables independientes), Wilks' lambda, U (cuando
hay ms de dos grupos formados por las variables independientes), y PillaiBartlett
(cuando hay coeficientes cannicos);13 y si resultan significativas en un nivel de
confianza, se acepta la hiptesis de investigacin de diferencia de medias. Esto indica
que hay, por lo menos, una variable cannica significativa (pero puede haber varias).
Si diversas variables cannicas son significativas, esto muestra que se presentan
diferenciasenlasvariablescannicasencuestin,entrelosgruposocategorasdelas
independientes.
Los paquetes estadsticos que contiene el MANOVA suelen posicionar a los grupos
delasvariablesindependientesporpuntuacionesdiscriminantes;stassecalculancon
una funcin discriminante, que es una ecuacin de regresin para un compuesto
devariablesdependientes.Acadagruposeleasignaunapuntuacindiscriminanteen
cadavariablecannica.Laspuntuacionesdiscriminantesdeunavariableindependiente
pueden ser cero o tener un valor positivo o negativo. Una puntuacin discriminante
positivayelevadaparaungrupoindicaquestesecolocaporencimadelosdemsenla
respectivavariablecannica.Ydebenconsiderarselascargas,lascualessonpositivaso
13 Adems, para comparaciones especficas estn las pruebas post hoc del ANOVA, ya revisadas en el
captulo10dellibro.
56
negativas.Laspuntuacionesdiscriminantesseusanparainterpretarlasseparacionesde
los grupos en las variables cannicas, en tanto que las cargas se usan para evaluar y
ligarlosresultadosdelasvariablesdependientes(WiersmayJurs,2008).Unejemplode
las cargas de los coeficientes de correlacin entre las variables dependientes y las
variables cannicas se muestra en la tabla 8.11, mientras que un ejemplo de las
puntuacionesdiscriminantesvieneenlatabla8.12.
Tabla8.11Cargasdeloscoeficientesdecorrelacinentre
lasvariablesdependientesylasvariablescannicas
VARIABLESCANNICAS
I II III
VARIABLE (MOTIVACIN (ATRIBUCIN (DESEMPEO
DEPENDIENTE INTRNSECA) DE LABORAL)
CAUSALIDAD
EXTERNA)
Motivacin intrnseca (escala 0.90 0.05 0.07
intrnseca del inventario de
caractersticasdeltrabajo)
57
Tabla8.12Puntuacionesdiscriminantesconcuatrogruposentresvariablescannicas
GRUPO VARIABLESCANNICAS
I II III
Comoobservamosenlatabla8.11,seobtuvierontresconstructossubyacentesen
las puntuaciones recolectadas de la muestra: motivacin intrnseca, atribucin de
causalidadexternaydesempeolaboral.Vemosenlatabla8.12quelosgrupos(niveles
en la empresa) estn separados en las tres variables cannicas (los grupos difieren),
particularmente en la primera variable cannica (motivacin intrnseca) y los obreros
ocupanlaposicinmsbaja.Lasvariablesdependientesenmarcadasenunrecuadroen
la primera variable cannica se cargan en ella (tabla 8.11); en consecuencia, los
ejecutivos tienen las puntuaciones ms altas en motivacin intrnseca medida por la
escalamencionada,enatribucionesinternasyensentimientosdexitoeneltrabajo.As
seinterpretantodaslasvariablescannicasydependientes.
En el MANOVA se incluyen razones F y anlisis de varianza. Algunos paquetes
estadsticosagreganunapruebadenominadacorrelacincannica,queesmuysimilar
alMANOVA.staeslamximacorrelacinquellegaaobtenerseentrelosconjuntosde
puntuaciones y las relaciones entre las variables independientes, entre las variables
dependientes y entre los conjuntos de ambas (dependientes e independientes)
(Kerlinger,1979).LasvariablesenelMANOVAylacorrelacincannicaasumenquelas
variablesdependientesestnmedidasenunniveldeintervalosorazn.Talcorrelacin
se interpreta como otras; pero el contexto de interpretacin vara de acuerdo con el
nmerodevariablesinvolucradas.
58
Distanciaseuclideanas
Esunamedidaparaanalizardistanciasentreconstructos(agrupamiento:cercana
o lejana). En el programa SPSS se pueden obtener bsicamente dos valores
opuestos:distanciaeuclidianaodedisimilitudydistanciadeproximidadosimilitud.
Entre mayor sea el valor de una distancia euclidiana, ms alejadas se encuentran
las variables; y entre ms alto sea el valor de proximidad, ms cercanas y
relacionadas estn las variables (este ltimo valor se proporciona en unidades de
correlacindePearson).
Porejemplo,HernndezSampieri(2009)midielclimaorganizacionalenfuncindel
Modelo de los Valores en Competencia (MVC) de Kim S. Cameron y Robert E. Quinn.
Consider cuatro dimensiones del clima organizacional en relacin con la cultura
organizacional (denominados cuadrantes en el MVC) que a su vez contienen diversas
variables:
1)Cuadrantedeorganizacinfamiliaroclan(relacioneshumanas),constituidopor
las siguientes variables: bienestar de los empleados, autonoma, comunicacin,
nfasisenelentrenamiento,integracinysoportedelsuperiorinmediato.
2) Cuadrante de organizacin jerrquica (proceso interno): formalizacin y
tradicin.
3) Cuadrante de organizacin adhocrtica (sistemas): flexibilidad/innovacin,
enfoqueexternoyreflexividad.
4) Cuadrante que corresponde a la organizacin de mercado (metas racionales):
claridad de metas organizacionales, esfuerzo, eficiencia, calidad, presin para
produciryrealimentacindeldesempeo.
Conlafinalidaddeanalizarlaproximidaddetalesdimensionesocuadrantesrealiz
un anlisis de disimilitudes y otro de similitudes, los cuales se presentan en las tablas
8.13Y8.14.
59
Tabla8.13Matrizdedisimilitudes(distanciaseuclidianas).
Relaciones Proceso Sistemas Metas
humanas interno
Tabla8.14Matrizdeproximidadosimilitudes(enunidadesdecorrelacindePearson).
Correlacionesentrevectores
Relaciones Proceso
humanas interno Sistemas Metas
Relacioneshumanas 1.000 .164 .796 .666
Procesointerno .164 1.000 .133 .062
Sistemas .796 .133 1.000 .739
Metas .666 .062 .739 1.000
Hayotrosmtodosmultivariados?
En la actualidad, hay muchos mtodos multivariados de anlisis, los cuales se
desarrollaron con la evolucin de la computadora. Los investigadores disponen del
anlisis discriminante, cuando las variables independientes se miden por intervalos o
razn,yladependienteescategrica.Talanlisissirveparapredecirlapertenenciade
un caso a una de las categoras de la variable dependiente, sobre la base de varias
independientes (dos o ms). Se utiliza una ecuacin de regresin llamada funcin
60
discriminante. Por ejemplo, si queremos predecir el voto obtenido por dos partidos
contendientes (variable dependiente nominal con dos categoras) sobre la base de
cuatro variables independientes, aplicaremos el anlisis discriminante, para resolver
unaecuacinderegresin;asseobtienenlasprediccionesindividuales.Enelejemplo,
haydoscategoras(votarporAovotarporB);porlotanto,losvaloresapredecirson0
y1(AyB,respectivamente).Sielsujetoobtieneunapuntuacinmscercanaacero,se
predicequepertenecealgrupoquevotarporA;silograunapuntuacinmscercanaa
1,sepredicequepertenecealgrupoquevotarporB.Adems,seconsigueunamedida
delgradodediscriminacindelmodelo.
Secuentatambinconelanlisisdeconglomeradosoclusters(tcnicaparaagrupar
loscasosoelementosdeunamuestraengruposconbaseenunaomsvariables),
elescalamientomultidimensional(paradisearescalasquemidanalossujetosen
diversas variables y los ubiquen simultneamente en los ejes de las distintas
variables,ascomoparaconocerlaestructuradelasvariablesentres),elanlisis
deseriescronolgicasodetiempo(paraanalizarlaevolucindeloscasosenuna
omsvariablesatravsdeltiempoypredecirelcomportamientodelasvariables
o sucesos) y la elaboracin de mapas multidimensionales (donde establecemos
distancias entre casos, al basarnos en mediciones mltiples de varias dimensiones o
variables), para los cuales se requieren bases slidas en materia de estadstica y en
matemticas avanzadas. Sugerimos a Loehlin (2009), Sengupta (2009), Shaw (2009),
Ferrn (2001) y Lehamn et al. (2005) para una revisin de tales pruebas y modelos.
Tambin se publica una revista fundamental en la materia: Multivariate Behavioral
Research.
FRMULASYPROCEDIMIENTOSESTADSTICOS
61
Frmulayclculodelamediaopromedio
Lafrmuladelamediaes:
X1 + X 2 + X 3 + X k
X=
N
Porejemplo,situviramoslassiguientespuntuaciones:
876432698
Lamediaseraiguala:
8 + 7 + 6 + 4 + 3+ 2 + 6 + 9 + 8
X= = 5.888
9
Lafrmulasimplificadadelamediaes:
X=
X
N
Elsmboloindicaquedebeefectuarseunasumatoria,Xeselsmbolodeuna
puntuacinyNeselnmerototaldecasosopuntuaciones.Ennuestroejemplo:
53
X= = 5.888
9
62
8 7 6 4 3 2 6 9 20
Lamediasera:
Frmuladeladesviacinestndar
Lafrmuladeladesviacinestndares:
s=
( X X 2
Estoes,ladesviacindecadapuntuacinrespectoalamediaseelevaalcuadrado,
se suman todas las desviaciones cuadradas, se divide entre el nmero total de
puntuaciones,yaestadivisinselesacarazcuadrada.
Clculodelapruebatconfrmulasytablas
Elvalortseobtieneenmuestrasgrandesmediantelafrmula:
X1 X 2
t=
s12 s22
+
n1 n2
63
Recordemosquelosgradosdelibertadsecalculanas:
gl=(n1+n2)2
Unavezcalculadoselvalortylosgradosdelibertad,seeligeelniveldesignificanciayse
compara el valor obtenido contra el valor que le correspondera, en la tabla 2 del
apndice 4 de este CD anexo (tabla de la distribucin t de Student) o en STATS
DistribucintdeStudent.Sielvalorcalculadoesigualomayoralqueapareceenla
tabla, se acepta la hiptesis de investigacin. Pero si es menor, se acepta la hiptesis
nula.
Enlatablasebuscaelvalorconelcualvamosacompararelquehemoscalculado,con
base en el nivel de confianza elegido (0.05 o 0.01) y los grados de libertad. La tabla
contiene los niveles de confianza como columnas y los grados de libertad como
renglones. Los niveles de confianza adquieren el significado del que se ha hablado (el
0.05 implica 95% de que los grupos en realidad difieran significativamente entre s y
5%deposibilidaddeerror).
Cuanto mayor sea el valor t calculado respecto al valor de la tabla y menor sea la
posibilidaddeerror,mayorserlacertezaenlosresultados.
EJEMPLO
64
Resultados:
(hombres)=15
(mujeres)=12
s1(hombres)=4
s2(mujeres)=3
15 12
t=
(4)2 (3)2
+
128 119
t=6.698
Gl=(128+119)2
Gl=245
AlacudiralatabladeladistribucintdeStudent(tabla2,apndice4,incluidoen
esteCD),buscamoslosgradosdelibertadcorrespondientesyelegimosenlacolumnade
gl,elrengln,queseseleccionasiemprequesetienenmsde200gradosdelibertad.
Latablacontienelossiguientesvalores:
gl 0.05 0.01
(mayorde200) 1.645 2.326
Nuestrovalorcalculadodetes6.698yresultasuperioralvalordelatablaenun
niveldeconfianzade0.05(6.698>1.645).Entonces,laconclusinesqueaceptamosla
hiptesisdeinvestigacinyrechazamoslanula.Incluso,elvalortcalculadoessuperior
enunniveldeconfianza
del0.01(6.698>2.326).
65
Si tuviramos 60 grados de libertad y un valor t igual a 1.27, al comparar este
valorconlosdelatablaobtendramos:
gl 0.05 0.01
60 1.6707 2.390
CHICUADRADAMEDIANTESTATSYEJEMPLODETABLADE
CONTINGENCIAPRODUCIDAPORSPSSCONOTROSELEMENTOS
ParacalcularlachicuadradaenSTATS,primeroseeligelaopcincorrespondienteen
elmenprincipal.
Despus, en Cuadrcula colocamos los datos que se nos requiere (nmero de
categoras de cada variable, las de la variable que representa a las filas y las de la
variablequerepresentalascolumnas).
Supongamosquetenemoslasdosvariablesdelejemplodelcaptulo10,Intencin
delvoto(candidataAGuadalupeTorresycandidataBLizAlmanza)ygnero(masculino
yfemenino).
Tenemosdoscategorasencadavariable,porlotanto,laCuadrculasellenaraas:
Filas 2
Columnas 2
DamosclicenAceptar.STATSabrelatablaynosotroscolocamoslasfrecuencias
observadasocontadas:
40 58
32 130
66
Enelsiguientepaso,STATSnospidequeseleccionemossilosvaloresesperados
estncapturadosono.Tenemosdosopciones:marcarqueno(losvaloresesperadosno
estn calculados) o calcularlos. Si elegimos la primera, simplemente damos clic en
Calcular y se nos proporcionan los siguientes resultados: chiCuadrada y grados de
libertad, pero no la significancia. Tenemos que acudir a la tabla de chicuadrada
(apndice4,tabla4deesteCDoaladeSTATSValoresde alosnivelesdeconfianza
Endondeneselnmerototaldefrecuenciasobservadas.
Paralaprimeracelda(candidataAygneromasculino),lafrecuenciaesperadasera:
Veamosdedndesalieronlosnmeros:
Gnero Total
Masculino Femenino
Intencin del 98
voto
Total 72 260
Paraesteejemplo,latabladefrecuenciasesperadasseralatabla8.15.
67
Tabla8.15Cuadrodefrecuenciasesperadasparaelejemplo
Gnero Total
Masculino Femenino
Intencindel CandidataA 27.1 70.9 98
voto GuadalupeTorres
CandidataB 44.9 117.1 162
LizAlmanza
Total 72.0 188.0 260.0
SecolocanlosdatosenelSTATSydamosclicencalcular,obteniendoelvalordechi
cuadrada, los grados de libertad y la probabilidad de que los valores observados y
esperadosseandistintosenporcentaje(siesmayora95%essignificativoenestenivel,
si es mayor a 99% resulta ms significativa; recordemos que STATS proporciona la
significanciaentrminosdelporcentajeennuestrofavor).
Sisehicieramanualmente,aplicaramoslafrmuladechicuadrada:
(0 E)2
=
2
E
dondesignificasumatoria.
0eslafrecuenciaobservadaencadacelda.
Eeslafrecuenciaesperadaencadacelda.
Esdecir,secalculaparacadaceldaladiferenciaentrelafrecuenciaobservadayla
esperada;estadiferenciaseelevaalcuadradoysedivideentrelafrecuenciaesperada.
Finalmente,sesumantalesresultadosylasumatoriaeselvalorde obtenida.
Obtenemoselvalordechicuadradaylosgradosdelibertad:
gl=(r1)(c1)
Endondereselnmeroderenglonesdelcuadrodecontingenciaycelnmerode
columnas;ennuestrocaso:1.
68
Yacudimosconlosgradosdelibertadquecorrespondenalatabla4delapndice
4deesteCD(Distribucindechicuadrada)oSTATSenValoresde alosnivelesde
confianzade.05y.01,eligiendonuestroniveldeconfianza(.05o.01).Sinuestrovalor
relacionadas( fuesignificativa).
Frecuencia(count):nmerodecasosofrecuenciasobservadasencadacelda.
Frecuencia esperada (expected count): nmero de casos en cada celda que se
esperaran,sinohubierarelacinentrevariables.
Porcentajesdentrodecadaceldaquerepresentanlasfrecuenciasobservadas
(en relacin con una variable, con la otra y con el total). Por ejemplo, la primera
celda (intencin por candidato A y gnero masculino = 40), representa 40.8%
dentrodelaintencindelvotodelcandidatoA(marginalhorizontalodesufila=
98), implica 55.6% de los hombres (marginal de su columna = 72), y 15.4%
respectoaltotal(muestra=260). 14
14Losvaloressonredondeadosporelprograma.
69
Tabla8.16EjemplodelatabladecontingenciaproducidaporSPSS(resumida)
Intencindevotoporcandidato*Gnerodelvotante
Gnerodelvotante
Masculino Femenino Total
Intencinde CandidatoA Frecuencia 40 58 98
votopor Guadalupe Frecuencia
candidato Torres esperada 27.1 70.9 98
%dentrode
intencinde
voto 40.8% 59.2% 100.0%
%dentrodel
gnero
delvotante 55.6% 30.9% 37.7%
%deltotal 15.4% 22.3% 37.7%
CandidatoB Frecuencia 32 130 162
LizAlmanza Frecuencia
esperada 44.9 117.1 162
%dentrode
intencin
devoto 19.8% 80.2% 100.0%
%dentrodel
gnerodel
votante 44.4% 69.1% 62.3%
%deltotal 12.3% 50.0% 62.3%
Total Frecuencia 72 188 260
Frecuencia
esperada 72.0 188.0 260
%dentrode
intencin
devoto 27.7% 72.3% 100.0%
%dentrodel
gnerodel
votante 100.0% 100.0% 100.0%
%deltotal 27.7% 72.3% 100.0%
70
En este caso, el valor de chi cuadrada es significativo al nivel del .01, es decir, existe
relacinentrelasvariablesgneroeintencindevotoporlosdiferentescandidatos,se
acepta la hiptesis de investigacin (Liz Almanza gana, pero sobre todo por el voto
femenino).
Conlatablasehacenalgunasconclusiones,comolasquesepresentaronenelapartado:
Quotraaplicacintienenlastablasdecontingencia?
EJEMPLOSDESECUENCIASDEANLISISENMINITABYSPSS
ParacompletarestecaptulodelCDyel10deltextoimpreso,incluimosdosejemplosde
secuenciasdeanlisisdelosdatos.
SecuenciaenMinitab
Esta secuencia corresponde al ejemplo desarrollado en el texto impreso sobre la
televisinyelnio.Lasecuenciasepresentaenlafigura8.16.
Anlisisdescriptivode
Muestraexploratoria lascolumnasotems Muestradefinitiva
(adicionalaladela (distribuciones,estadsticas) (n=2112)
pruebapilotopara
disearelcuestionario). Anlisisdediscriminacin
delostems
Anlisisdescriptivodelasvariables:usode
Pruebasdetablasdecontingenciapara
mediosdecomunicacincolectiva,tiempode
correlacionardatosnominalesy
exposicinalatelevisin,preferenciade
ordinales.Porejemplo:Chicuadraday
contenidostelevisivos(programas),bloquesde
Phientregneroycondicinde
horariosdeexposicinalatelevisin(maana,
exposicinalatelevisin(solo
mediatarde,tardeavanzaday/onoche),
acompaado);coeficientede
personajesfavoritos(culesymotivos)
contingenciaparabloquepreferidode
comparacindelatelevisinconotrasfuentes
horario(nominal)yautonomaenla
deentretenimiento,actividadesquerealiza
eleccindelosprogramas(ordinal).
mientrasobservalatelevisin,condicionesde
Biserialpuntual(gneroytiempode
exposicinalatelevisin(soloacompaado),
exposicinalatelevisin).Pruebatde
autonomaenlaeleccindelosprogramas,
diferenciademediasporgnero,entre
controldelospadressobrelaactividaddever
lospromediosdetiempoquededicana
televisin,usosygratificacionesdelatelevisin,
vertelevisindiariamente(enhoras);
datosdemogrficos(gnero,edad,escolaridad,
entreotrosanlisis.
niveldeingresosfamiliar,tipodeescuelay
estadocivildelospadres).
Figura8.16SecuenciadeanlisisconMinitab
71
SecuenciaenSPSS
Lasecuenciacorrespondealestudiorespectoalclimaorganizacionalcitadoenellibro
impreso(HernndezSampieri,2005).
Objetivocentral:
Validar un instrumento para medir el clima organizacional en el mbito laboral
mexicano.
Preguntadeinvestigacin:
Cules son las variables o dimensiones ms pertinentes que deben incluirse para
medirelclimalaboraldeunamaneravlidayconfiable?
Comentariossobrelosanlisis:
Los anlisis del estudio se llevaron a cabo de manera independiente para cada
muestra, debido a la naturaleza contingente del clima organizacional. Cada empresa
tiene su propia historia, procesos de produccin, estructura, orientacin, filosofa y
otrosfactoressituacionalesquelahacennica.Sinembargo,lavalidacinendiferentes
muestrasvaconsolidandoyrobusteciendoalinstrumentodemedicin.Acontinuacin
se presenta la secuencia de anlisis y algunos resultados obtenidos en una de las
muestras(unainstitucindeeducacinsuperior).
72
Figura8.17SecuenciadeanlisisconelSPSS.
Laconfiabilidad(alfa)delinstrumentofuede0.98(muyelevada,n=163).Elanlisisde
factoresrevelunadimensinnicaydespusdeefectuarlo,seeliminarontrestems.
Loscoeficientesalfaparalasdimensiones,fueronlosquesemuestranenlatabla8.17.
Estadstica descriptiva en el nivel de toda la escala: en la tabla 8.18, se presentan las
principales estadsticas de los resultados a toda la escala del clima organizacional. El
promedio (3.7) y la mediana (3.8) son bastante favorables e indican que esta
organizacin posee un clima organizacional positivo. La respectiva normalizacin, se
presentaenlagrficadelafigura8.18.
Las correlaciones entre los componentes del clima organizacional para esta segunda
muestra,sepresentanenlatabla8.19(matrizdecorrelacionesdePearson).
73
La mayora se encuentra entre rangos que oscilan entre 0.55 y 0.69, es decir,
correlacionesmediasyconsiderables.Destacanlascorrelacionesentrecomunicaciny
direccin (0.800), satisfaccin y liderazgo (0.772), satisfaccin y visin (0.721),
identificacin y motivacin intrnseca (0.716); as como, moral y liderazgo (0.698).
Llama la atencin la correlacin entre autonoma y motivacin intrnseca (0.613), que
respalda la tradicional vinculacin entre ambos conceptos, propuesta por los modelos
sobrecaractersticasdeltrabajo.Identificacinyliderazgoesdelaspocascorrelaciones
bajas(0.425).
Tabla8.17Loscoeficientesalfaparalasdimensionesdelclimaorganizacional
Dimensin n Alfa
Moral 176 0.898
Direccin 176 0.928
Innovacin 177 0.788
Identificacin 175 0.823
Comunicacin 179 0.827
Percepcindeldesempeo 174 0.709
Motivacinintrnseca 178 0.792
Autonoma 179 0.827
Satisfaccin 179 0.865
Liderazgo 177 0.947
Visin 176 0.902
74
Tabla8.18Estadsticadescriptivadelamuestrapara
laescalacompletadelclimaorganizacional
Estadstica Valor
Media 3.7
Mediana 3.8
Moda 3.96
Desviacinestndar 0.62
Varianza 0.38
Asimetra 0.442
Curtosis 0.116
Mnimo 1.84
Mximo 4.92
75
Tabla8.19MatrizdecorrelacionesdePearsonentrevariablesdelclimaorganizacional
76