You are on page 1of 30

METODOLOGA DE LA

INVESTIGACIN
SOCIAL
CUANTITATIVA
Pedro Lpez-Roldn
Sandra Fachelli

METODOLOGA DE LA
INVESTIGACIN
SOCIAL
CUANTITATIVA
Pedro Lpez-Roldn
Sandra Fachelli

Bellaterra (Cerdanyola del Valls) | Barcelona


Dipsit Digital de Documents
Universitat Autnoma de Barcelona

Este libro digital se publica bajo licencia Creative Commons, cualquier persona es libre de copiar,
distribuir o comunicar pblicamente la obra, de acuerdo con las siguientes condiciones:
Reconocimiento. Debe reconocer adecuadamente la autora, proporcionar un enlace a
la licencia e indicar si se han realizado cambios. Puede hacerlo de cualquier manera
razonable, pero no de una manera que sugiera que tiene el apoyo del licenciador o
lo recibe por el uso que hace.
No Comercial. No puede utilizar el material para una finalidad comercial.
Sin obra derivada. Si remezcla, transforma o crea a partir del material, no puede
difundir el material modificado.
No hay restricciones adicionales. No puede aplicar trminos legales o medidas tecnolgicas
que legalmente restrinjan realizar aquello que la licencia permite.

Pedro Lpez-Roldn
Centre d'Estudis Sociolgics sobre la Vida Quotidiana i el Treball (http://quit.uab.cat)
Institut dEstudis del Treball (http://iet.uab.cat/)
Departament de Sociologia. Universitat Autnoma de Barcelona
pedro.lopez.roldan@uab.cat
Sandra Fachelli
Departament de Sociologia i Anlisi de les Organitzacions
Universitat de Barcelona
Grup de Recerca en Eduaci i Treball (http://grupsderecerca.uab.cat/gret)
Departament de Sociologia. Universitat Autnoma de Barcelona
sandra.fachelli@ub.edu

Edicin digital: http://ddd.uab.cat/record/129382


1 edicin, febrero de 2015

Edifici B Campus de la UAB 08193 Bellaterra


(Cerdanyola del Valls) Barcelona Espaa
Tel. +34 93 581 1676

ndice general
PRESENTACIN
PARTE I. METODOLOGA
I.1.
I.2.
I.3.
I.4.

FUNDAMENTOS METODOLGICOS
EL PROCESO DE INVESTIGACIN
PERSPECTIVAS METODOLGICAS Y DISEOS MIXTOS
CLASIFICACIN DE LAS TCNICAS DE INVESTIGACIN

PARTE II. PRODUCCIN


II.1.
II.2.
II.3.
II.4.
II.5.

LA MEDICIN DE LOS FENMENOS SOCIALES


FUENTES DE DATOS
EL MTODO DE LA ENCUESTA SOCIAL
EL DISEO DE LA MUESTRA
LA INVESTIGACIN EXPERIMENTAL

PARTE III.

ANLISIS

III.1. SOFTWARE PARA EL ANLISIS DE DATOS: SPSS, R Y SPAD


III.2. PREPARACIN DE LOS DATOS PARA EL ANLISIS
III.3. ANLISIS DESCRIPTIVO DE DATOS CON UNA VARIABLE
III.4. FUNDAMENTOS DE ESTADSTICA INFERENCIAL
III.5. CLASIFICACIN DE LAS TCNICAS DE ANLISIS DE DATOS
III.6. ANLISIS DE TABLAS DE CONTINGENCIA
III.7. ANLISIS LOG-LINEAL
III.8. ANLISIS DE VARIANZA
III.9. ANLISIS DE REGRESIN
III.10. ANLISIS DE REGRESIN LOGSTICA
III.11. ANLISIS FACTORIAL
III.12. ANLISIS DE CLASIFICACIN

Metodologa de la Investigacin
Social Cuantitativa
Pedro Lpez-Roldn
Sandra Fachelli

PARTE III. ANLISIS


Captulo III.5
Clasificacin de las tcnicas de
anlisis de datos

Bellaterra (Cerdanyola del Valls) | Barcelona


Dipsit Digital de Documents
Universitat Autnoma de Barcelona

Cmo citar este captulo:


Lpez-Roldn, P.; Fachelli, S. (2015). Clasificacin de las tcnicas de anlisis de datos.
En P. Lpez-Roldn y S. Fachelli, Metodologa de la Investigacin Social Cuantitativa.
Bellaterra (Cerdanyola del Valls): Dipsit Digital de Documents, Universitat
Autnoma
de
Barcelona.
1
edicin.
Edicin
digital:
http://ddd.uab.cat/record/131468
Captulo redactado en abril de 2015

ndice de contenidos
1. CLASIFICACIN DE LAS TCNICAS DE ANLISIS BIVARIABLE......................... 6
2. EL ANLISIS MULTIVARIABLE: CARACTERSTICAS Y CLASIFICACIN .......... 10
2.1. Definicin y caracterizacin del anlisis multivariable ...................................... 11
2.2. Criterios y clasificacin de las tcnicas de anlisis multivariable ...................... 13

3. BREVE RESEA DE ALGUNAS TCNICAS DE ANLISIS MULTIVARIABLE..... 15


3.1. Tcnicas de anlisis multivariable de interdependencia ..................................... 16

3.1.1. El anlisis de tablas de contingencia multidimensionales ........................... 16


3.1.2. El anlisis log-lineal ............................................................................... 16
3.1.3. El anlisis factorial exploratorio ............................................................. 17
3.1.4. El anlisis de clasificacin ....................................................................... 17
3.1.5. El anlisis de escalonamiento multidimensional ........................................ 18

3.2. Tcnicas de anlisis multivariable de dependencia ............................................. 18

3.2.1. El anlisis de regresin mltiple .............................................................. 18


3.2.2. El anlisis de regresin logstica ............................................................... 19
3.2.3. El anlisis de la varianza multifactorial y multivariable........................... 19
3.2.4. El anlisis de covarianza ........................................................................ 20
3.2.5. El anlisis discriminante......................................................................... 20
3.2.6. El anlisis del camino ............................................................................. 20
3.2.7. El anlisis factorial confirmatorio ............................................................ 21
3.2.8. Modelo de ecuaciones estructurales............................................................ 21
3.2.9. El anlisis de segmentacin ..................................................................... 22
4. BIBLIOGRAFA ..................................................................................................... 22

PARTE III

Clasificacin de las tcnicas


de anlisis de datos

Captulo

n los captulos precedentes hemos tenido ocasin de ver algunas de las


tcnicas de anlisis de datos ms bsicas y fundamentales, presentes en todo
ejercicio de estudio de los datos cuantitativos, pero que tratan con una sola
variable. Con ellas podemos responder a preguntas de investigacin ms
sencillas y nos posibilitan acondicionar nuestros datos para un anlisis ms elaborado
que ahora iniciamos. Se busca responder a cuestiones o hiptesis de investigacin ms
complejas e interesantes donde se plantean relaciones entre varias variables, para as
reflejar la naturaleza multidimensional de los fenmenos sociales y de los modelos
analticos que dan cuenta de ellos. En la sociedad de la informacin actual, adems,
disponemos cada vez ms de inmensos volmenes de datos (Big Data) que requieren
soluciones de procesamiento mediante el tratamiento simultneo de diversidad de
variables y muchos casos. En este sentido ya hemos apuntado anteriormente que las
tcnicas de anlisis de datos estadsticos se pueden clasificar en tres grupos principales
atendiendo a la complejidad que resulta de considerar el nmero de variables
implicadas, as se pueden distinguir las tcnicas univariables, bivariables y
multivariables.
Esta es una primera diferenciacin importante que tenemos presente en este manual.
Por el momento hemos visto las tcnicas relacionadas con el anlisis de una sola
variable introduciendo en particular la diferenciacin entre el aspecto descriptivo y el
aspecto inferencial cuando la informacin se obtiene por muestreo estadstico. A partir
del prximo captulo veremos las tcnicas bivariables y multivariables. Esta distincin
es til para diferenciar instrumentos de anlisis que responden a modelos e hiptesis
de investigacin donde se relacionan dos variables o bien ms de dos, pudiendo llegar
a tratar simultneamente decenas de ellas.
No obstante las tcnicas bivariables no son ms que una versin particular del caso
ms general multivariable, y en este sentido no veremos captulos especficos que las
diferencien sino que se tratar de formulaciones ms bsicas bivariables que se
ampliarn como tcnicas multivariables.
En la clasificacin de las tcnicas de anlisis de datos, adems de la cantidad, es
definitorio el tipo de relacin que se establece entre las variables, donde se realiza una

6 | III. Anlisis
distincin entre tcnicas de anlisis de interdependencia y de dependencia. En el primer
caso se disponen de un modelo de anlisis que plantea de forma ms o menos precisa
la existencia de una serie de interrelaciones entre un conjunto de variables pero donde
no se diferencia su papel al tratarlas de forma simtrica, podemos decir que todas ellas
se consideran como independientes e interesa encontrar o constatar su patrn o
estructura de relaciones mutuas y simultneas. En el segundo caso s que se establece
la diferenciacin entre variable dependiente e independiente, una(s) actan de variables
explicadas y otra(s) de variables explicativas segn un modelo de anlisis explicativo
que conceptualiza y explicita hiptesis sobre el vnculo de dependencia.
Existe un tercer aspecto fundamental para caracterizar las tcnicas de anlisis de datos:
el nivel de medicin de las variables, su mtrica. En funcin de si las variables son
cuantitativas (mtricas, de tipo discreto o continuo) o cualitativas (no mtricas, de tipo
nominal u ordinal) cabe establecer este tercer criterio clasificatorio que las diferencia y
define.

1. Clasificacin de las tcnicas de anlisis bivariable


Con este criterio de la escala de medicin vamos a establecer una clasificacin inicial
bsica de las tcnicas de anlisis de datos que relacionan dos variables. Veremos que
estas tcnicas sern el fundamento de muchos conceptos y tcnicas multivariables que
se irn introduciendo. El esquema clasificatorio es sencillo. Tratndose de dos
variables, nos podemos encontrar con que o ambas son cualitativas, o son cuantitativas
las dos o bien analizamos la relacin entre una cualitativa y una cuantitativa (Tabla
III.5.1).
Tabla III.5.1. Clasificacin de las tcnicas de anlisis de datos

La Tabla III.5.1 se presenta resumida la clasificacin de las tcnicas de anlisis de datos


bsicas, las univariables que hemos visto en los captulos III.3 y III.4, las bivariables
que comentaremos brevemente a continuacin y que sern objeto de tratamiento en

Dipsit Digital de Documents |

http://ddd.uab.cat/record/131468

5. Clasificacin de las tcnicas de anlisis de datos | 7


los captulos III.6, III.7 y III.8, y las multivariables de las que daremos una resea al
final de este captulo y que sern desarrolladas en el resto de los captulos del libro.
Cuando analizamos la relacin entre dos variables cualitativas la tcnica de anlisis de
datos caracterstica es el anlisis de tablas de contingencia. Una tabla de contingencia
en una tabla de frecuencias que resulta del cruce de las categoras o valores de ambas
variables y nos permite estudiar la distribucin de una variable, por ejemplo, la
intencin de voto en la prximas elecciones generales (considerada habitualmente
como variable de inters a explicar o variable dependiente), segn los valores de una
segunda variable, por ejemplo, el sexo. La pregunta que nos formulamos es si existen
diferencias en el comportamiento intencional de voto por los distintos partidos
polticos entre varones y mujeres, y en qu medida, o si por el contrario son similares.
En la Tabla III.5.2 la tabla de contingencia que cruza ambas variables y se representa
en un grfico de barras en el Grfico III.5.11.
Tabla III.5.2. Intencin de voto en supuestas elecciones generales segn sexo

Intencin de voto
en supuestas
elecciones
generales

Podemos
PSOE
PP
IU-ICV
UPyD
CiU
ERC
Ciudadanos
Otros partidos
Sin voto definido
Total

Sexo
Hombre
20,1%
14,4%
11,9%
4,0%
2,0%
2,1%
2,0%
2,0%
3,8%
37,9%
100,0%

2 Mujer
15,3%
14,2%
11,5%
3,4%
2,3%
1,9%
1,9%
1,0%
2,9%
45,6%
100,0%

Total
17,6%
14,3%
11,7%
3,7%
2,1%
2,0%
1,9%
1,5%
3,3%
41,9%
100,0%

Fuente: Centro de Investigaciones Sociolgicas, Estudio 3041 de 2014


Grfico III.5.1. Intencin de voto en supuestas elecciones generales segn sexo

1 Los datos corresponden a la matriz CIS3041.sav.

Lpez-Roldn y Fachelli | Metodologa de la investigacin social cuantitativa

8 | III. Anlisis
De esta informacin se desprende un perfil similar entre varones y mujeres excepto en
la indefinicin del voto, que es superior en las mujeres, y en el voto a Podemos donde
predomina claramente el voto masculino.
Cuando analizamos la relacin entre dos variables cuantitativas la tcnica de anlisis
que las trata es el anlisis de regresin lineal. En este caso tras constar que existe un
grado de correlacin lineal entre las variables, la tcnica expresa a una de ellas, la
variable dependiente, en funcin de otra variable que se considera como independiente
o factor explicativo. El vnculo que se establece es una relacin funcional, y se expresa
a travs de la funcin lineal, es decir, mediante la ecuacin de una recta. As, por
ejemplo, considerando los pases del mundo podemos plantear un modelo de relacin
para explicar en qu medida la tasa de mortalidad infantil est en funcin del nivel de
desarrollo del pas considerando el IDH (ndice de Desarrollo Humano). As
esperamos obtener que a medida que el ndice de desarrollo es mayor la tasa de
mortalidad infantil ser menor, es decir, se dar una relacin inversa. As lo podemos
comprobar en el grfico de dispersin del Grfico III.5.2 y en los coeficientes de la
Tabla III.5.3. Cada punto del grfico es un pas y stos se disponen de manera que los
que tiene alto IDH tiene bajos valores de mortalidad, y al viceversa.
Grfico III.5.2. Mortalidad infantil segn el IDH

Se configura as una nube de puntos que se puede ajustar a la forma de una lnea recta,
y cuyos coeficientes permiten interpretar que por cada punto ms de desarrollo la tasa
de mortalidad se reduce en -141,270, teniendo el modelo una capacidad explicativa del
79,8%2.

2 Los datos corresponden a la matriz IDH2014.sav.

Dipsit Digital de Documents |

http://ddd.uab.cat/record/131468

5. Clasificacin de las tcnicas de anlisis de datos | 9


Tabla III.5.3. Regresin Mortalidad infantil segn el IDH
Modelo lineal
Constante
Human Development Index (HDI)
Capacidad explicativa
Correlacin
Coeficiente de determinacin

Coeficientes de
regresin
122,779
-141,270
Coeficientes
-0,893
0,798

Fuente: United Nations, IDH 2014


Cuando analizamos la relacin entre una variable cuantitativa y una variable cualitativa
la tcnica de anlisis principal que se considera es la comparacin de medias y, de forma
ms general, el anlisis de varianza. En este caso se trata de ver hasta qu punto la
distribucin de los valores de la variable cuantitativa, que es considerada como la
dependiente, cambia, es diferente entre los diferentes grupos definidos por la variable
independiente. Por ejemplo, nos podemos preguntar en qu medida el
posicionamiento ideolgico, tratado como una variable cuantitativa en una escala de 1
a 10 (siendo 1 izquierda y 10 derecha), difiere entre las personas de las distintas
comunidades autnoma y, por tanto, determinar as en qu grado el lugar de residencia
es una variable explicativa de las diferencias ideolgicas. Para ello podemos comparar
las distribuciones por comunidad autnoma calculando la media de cada una como se
presenta en la Tabla III.5.4 y el Grfico III.5.3
Tabla III.5.4. Ideologa segn Comunidad Autnoma

Comunidad autnoma
Rioja (La)
Pas Vasco
Catalua
Andaluca
Navarra (Comunidad Foral de)
Madrid (Comunidad de)
Comunitat Valenciana
Canarias
Balears (Illes)
Cantabria
Galicia
Murcia (Regin de)
Castilla La Mancha
Extremadura
Aragn
Castilla y Len
Asturias (Principado de)
Total

Escala de autoubicacin
ideolgica (1=izq-10=der)
Desviacin
Media
n
tpica
3,46
13
1,613
3,63
87
1,622
3,96
338
1,786
4,13
335
1,741
4,33
27
1,732
4,35
253
2,136
4,48
229
1,791
4,60
75
1,993
4,67
55
2,373
4,82
22
1,651
4,86
123
2,086
4,87
46
1,529
4,88
91
2,299
4,94
48
2,409
4,96
57
1,812
5,04
111
1,926
5,06
48
1,731
4,41
1958
1,944

Fuente: Centro de Investigaciones Sociolgicas, Estudio 3041 de 2014

Lpez-Roldn y Fachelli | Metodologa de la investigacin social cuantitativa

10 | III. Anlisis

Grfico III.5.3. Media de la escala ideolgica segn Comunidad Autnoma

2. El anlisis multivariable: caractersticas y clasificacin


En este apartado3 daremos una visin panormica del conjunto de procedimientos que
de manera genrica se denominan como mtodos y tcnicas de anlisis multivariable,
tambin nombrados como de anlisis multivariante o multivariado4.
Se trata de un conjunto de procedimientos de anlisis estadstico donde se suele
considerar un nmero elevado de variables, de hecho, como venimos diciendo, cuando
hay ms de dos variables en el anlisis se identifica como multivariable. Esta es una
definicin que en primera instancia nos orienta sobre una caracterstica importante de
estas tcnicas. Sin embargo, podemos ser ms precisos y contemplar otros rasgos
importantes. A esta tarea de definicin nos dedicaremos en este apartado y se
completar con la especificacin de varios criterios clasificatorios de las diversas
tcnicas que nos conducirn a proponer una clasificacin de las mismas.
En la investigacin social emprica que se realiza en la actualidad es habitual encontrar
el tratamiento multivariable de los datos estadsticos. La complejidad que conlleva el
tratamiento conjunto de un nmero elevado de variables y las dificultades de
asimilacin de los conceptos y del lenguaje propio de las tcnicas que las tratan ha sido
una de las razones por las que el investigador/a en sociologa, y en las ciencias sociales
en general, no haya hecho un uso generalizado de este tipo de anlisis hasta hace
relativamente poco. La introduccin y generalizacin del uso de los softwares
estadsticos marca un punto de inflexin (Alvira, 1990) en el camino hacia
normalidad de estos instrumentos en la investigacin social aplicada para dar cuenta

3 Este apartado es reflejo de la revisin de publicaciones anteriores (Lozares y Lpez-Roldn, 1991, 2000).
4 La expresin multivariante, al igual que bivariante o univariante, alude sobre todo al tipo de distribucin estadstica

de los datos; multivariado tendra en cuenta la presencia de varios grados de diversidad, mientras que multivariable
destaca la cantidad de variables que intervienen. En ingls la expresin utilizada es multivariate y en francs multivarie.

Dipsit Digital de Documents |

http://ddd.uab.cat/record/131468

5. Clasificacin de las tcnicas de anlisis de datos | 11


de la complejidad de los modelos de anlisis que intentan reflejar una visin
multidimensional de la realidad social5.
No obstante, algunos de estos procedimientos tienen sus antecedentes a finales del
siglo XIX y principios del XX, siendo durante las dcadas de los aos treinta y cuarenta
cuando comenzaron a emplearse las tcnicas de anlisis multivariable. Aun as, no es
hasta la dcada de los ochenta con el desarrollo experimentado por la informtica
aplicada al anlisis estadstico y la facilidad y posibilidades de clculo que conlleva su
implementacin en macro y micrordenadores, que se produce la extensin del uso de
las tcnicas estadsticas de anlisis multivariable en numerosas disciplinas y tambin en
la sociologa.
Las ventajas que presenta el anlisis multivariable sobre el bivariable eran puestos de
manifiesto por Cattell (1966):
Economa en el almacenamiento de datos.
Mayor consistencia en la inferencia estadstica.
Desarrollo de conceptos tericos ms adecuados.
Mayor precisin y perspectiva conceptual.
Hay que insistir sin embargo, que se trata de instrumentos que facilitan:
El anlisis y la sntesis de los datos.
La operativizacin y la validacin de los conceptos.
La mejora en la obtencin y la calidad derivada de los propios datos.
Pero tambin hay que decir que en nada sustituyen la tarea imprescindible de
construccin del objeto de investigacin y su fundamentacin terica, del diseo del
mismo, del anlisis y de la interpretacin de los resultados guiados por referentes
tericos-conceptuales.

2.1. Definicin y caracterizacin del anlisis multivariable


El anlisis multivariable es un conjunto de mtodos y tcnicas destinadas al anlisis
estadstico de las relaciones entre tres o ms variables que son tratadas
simultneamente. Se trata de una definicin bsica e incluyente en la lnea de otros
autores como Hair et al. (2011) o Lvy y Varela (2003: 6), y que supone la extensin y
generalizacin de los conceptos y las tcnicas del anlisis univariable y bivariable.
Partiendo de esta primera acepcin general se propone una definicin ampliada a partir
de una caracterizacin que introduce una serie de condiciones ms especficas para
asegurar ms convenientemente los lmites conceptuales del trmino.
As se contemplan dos aspectos. En primer lugar, el anlisis multivariable lo situamos
en una perspectiva atributiva que supone una clara distincin, ruptura o desagregacin
entre lo que denominamos el universo de los individuos o poblacional (unidades,
5 Recordemos para los ms jvenes que el primer ordenador personal (los IBM PC) aparecen en el ao 1981. En

esa poca se trabajaba con terminales de grandes ordenadores en instituciones y centros de investigacin que podan
acceder a este tipo de recursos. No es hasta 1984 que aparece el SPSS/PC por ejemplo, y es por entonces que
empieza lentamente a extenderse su uso y la enseanza en las universidades tanto de las tcnicas como del software
estadstico que hace posible su utilizacin.

Lpez-Roldn y Fachelli | Metodologa de la investigacin social cuantitativa

12 | III. Anlisis
casos,...), sujetos de la atribucin conceptual, y el espacio de las variables (o espacio de
atributos) presentes en una matriz de datos atributiva. Esta distincin conlleva y
posibilita que los datos, al ser expresables en forma matricial, puedan ser interpretadas
en una doble lectura: desde las unidades y desde las variables. Kendall (1975) se orienta
en esta direccin cuando propone como definicin de anlisis multivariable, a partir
de n individuos y de p variables, la de ser una rama de la estadstica que se interesa en
el estudio de la relacin entre series de variables dependientes de los individuos que las
sustentan, entendiendo por dependencia la vinculacin de las variables a los individuos
de los que se predican.
En segundo lugar, el soporte matricial introduce una segunda caracterstica polar dada
la naturaleza dual del dato. Por un lado, el dato es un resultado algebraico, por tanto,
sometido y sometible a la lgica del lenguaje matemtico que lo lee, mide, trata y
analiza, y, por otra parte, tambin es el resultado de una construccin de naturaleza
cientfica, en tanto en cuanto el dato se inscribe a una determinada teora ms o menos
elaborada, a unos presupuestos e hiptesis y, sobre todo, al haber sido objeto de una
validacin interna y externa en diversos grados. Esta dualidad, intrnseca al dato
concreto, es extensible a la matriz de datos.
En relacin a la primera de las polaridades mencionadas de la dualidad del dato, las
tcnicas son multivariables en el sentido que posibilitan y ofrecen una flexibilidad en
cuanto al lenguaje algebraico, y en particular en cuanto a las diversas mtricas exigibles
en funcin de la estructura algebraica utilizada cuando operativizan los conceptos. La
mtrica definida es mltiple y diversa, adaptable a la naturaleza de la operativizacin.
Las matrices pueden ser, segn los mtodos, de diferente naturaleza: lgicas,
nominales, de frecuencias absolutas, relativas o condicionales, matrices de rangos o
matrices cuantitativas. Definir las tcnicas de anlisis multivariable exclusivamente
como tcnicas estadsticas es de hecho restrictivo: ms ampliamente el lgebra matricial
y vectorial suele ser el fundamento de los mtodos utilizados6.
En relacin a la segunda polaridad, es decir, la relativa a las exigencias ligadas a la
insercin de las tcnicas en la instancia terica, de la corroboracin de hiptesis, etc.,
el conjunto de las tcnicas de anlisis multivariable posibilita varios niveles de anlisis
vinculados a estas exigencias. Son anlisis y orientaciones metodolgicas que pueden
plantearse a partir de estas tcnicas:
- En el orden de la parsimonia exigible a todo mtodo, resalta el efecto simplificador
y reductor que procuran, permitiendo tambin tratamientos simultneos de todas
las variables o unidades que intervienen o un tratamiento escalonado de alguna(s)
unidad(es) o variable(s). En algunos casos incluso las unidades o variables son
introducidas sin intervenir en los clculos con una finalidad descriptiva o de
localizacin en el conjunto.
- Tambin hay que considerar los efectos de consistencia y de validacin en la
construccin y definicin de las variables. Mediante la construccin de tipologas
o la obtencin de variables mtricas que subyacen en la combinacin de un
conjunto inicial de informacin, disponemos de mtodos que tienen una funcin
instrumental destinada a mejorar la calidad del proceso de operativizacin y de los
6 En el anexo del libro se recoge un apartado dedicado al tratamiento matemtico de la informacin para el anlisis

estadstico donde se introducen los conceptos de vector y espacio vectorial, las operaciones con vectores y matrices,
etc., que estn en la base de buena parte de las tcnicas de anlisis multivariable.

Dipsit Digital de Documents |

http://ddd.uab.cat/record/131468

5. Clasificacin de las tcnicas de anlisis de datos | 13

datos en general, pero que se constituyen en un procedimiento heurstico para la


construccin de variables.
Las tcnicas de anlisis multivariable permiten satisfacer un objetivo metodolgico
descriptivo de la problemtica tratada donde se busca dar cuenta de la realidad
investigada especificando los elementos y propiedades fundamentales que lo
caracterizan y estructuran como resultado de una visin conjunta de la informacin
seleccionada y medida. Metodolgicamente pueden responder tanto a necesidades
y dinmicas de exploracin e induccin como de deduccin y validacin.
Cuando el objetivo del mtodo es dar cuenta del porqu del fenmeno
identificamos al procedimiento como explicativo, lo que nos exige un modelo
previamente establecido que explicite y fundamente los factores explicativos que
determinan el comportamiento de una realidad social medida a travs de una o ms
variables que dependen de aqullos. Con este planteamiento las tcnicas de anlisis
multivariable se orientan hacia un tipo de anlisis deductivo y confirmatorio y en
general de estructura causal.
La descripcin y la explicacin pueden llevar asociada una finalidad tambin
predictiva, en este caso, en funcin del modelo de anlisis operativizado, es posible
realizar afirmaciones basadas en los datos que establecen un comportamiento
previsible, una tendencia probable del fenmenos estudiado en un tiempo futuro
prximo.
Podramos introducir adicionalmente el factor tiempo y dar lugar a los diversos
anlisis temporales que tambin se incluyen dentro del mbito del anlisis
multivariable. Y junto al tiempo el espacio, ya sea para una caracterizacin de
fenmenos que tienen una clara expresin espacial y mapificable, como para dar
cuenta de fenmenos que presentan niveles distintos de agregacin territorial.

Las posibilidades y bondades de este tipo de anlisis, ms all de los procedimientos


ms sencillos univariables y bivariables, no nos debe hacer perder de vista que su
utilizacin no puede eludir todo lo que supone un exigente planteamiento terico, la
construccin de un objeto de investigacin que haga verificables las hiptesis, una
operativizacin cuidadosa de los conceptos, la calidad de la produccin de los datos en
todas sus fases, la utilizacin de una mtrica adecuada de las variables as como su
validacin interna.

2.2. Criterios y clasificacin de las tcnicas de anlisis multivariable


Todo intento de clasificacin se encuentra con la dificultad que proviene de la variedad
existente de mtodos/tcnicas de anlisis multivariable y que varios criterios operen
simultneamente. Algunos de ellos incluso se superponen en parte, lo que introduce
un grado ms de dificultad. As pues, introduciremos primero los diferentes criterios
habitualmente utilizados como principios clasificatorios para, a continuacin,
presentar la propuesta de clasificacin.
Un primer criterio de clasificacin depende del modelo de anlisis de la investigacin
y se establece teniendo en cuenta la finalidad analtica explicativa7. En este sentido se
puede hablar de dos tipos de tcnicas:
7 La base inicial de la clasificacin de Evrard y Le Maire (1976), por ejemplo, va en esta direccin.

Lpez-Roldn y Fachelli | Metodologa de la investigacin social cuantitativa

14 | III. Anlisis
- Tcnicas de anlisis multivariable explicativo-causales que buscan formalizar un
modelo de relaciones que conllevan hiptesis proposicionales simples o sistemas
de hiptesis de dependencia lineal.
- Tcnicas exploratorias y de estructuracin donde se incluyen modelos diversos: los
que implican niveles relativamente elementales de categorizacin o de
contrastacin comparativa; los que buscan las dimensiones latentes o de los
factores ms discriminantes de la realidad social considerada estableciendo
estructuras de interrelacin entre las variables; o los que buscan construir tipologas
concretas como formas de tipificacin de la realidad como forma una explicacin
estructural de los fenmenos
Un segundo criterio es algebraico y tcnico-instrumental, como condicin previa a toda
finalidad analtica, que establece la eleccin de las tcnicas segn:
- Impliquen una relacin de dependencia entre las variables, donde se establece la
distincin entre variables dependientes o explicadas y variables independientes o
explicativas.
- Impliquen una relacin de interdependencia o la simple correlacin/asociacin
entre las variables, donde todas las variables tienen la misma consideracin (si se
quiere de variables independientes).
Un posible criterio adicional tcnico sera el nmero de variables que intervienen en el
anlisis:
- Cuando se trata de tcnicas de dependencia, se valora cuntas variables
dependientes intervienen, asumiendo que se considerar ms de una variable
independiente.
- Cuando se trata de tcnicas de interdependencia se considera que se relacionan
ms de dos variables.
Por ltimo, se pueden conjugar los dos criterios anteriores con la mtrica de las
variables: si son variables mtricas o cuantitativas (numricas, medidas como discretas
o continuas) o no son mtricas o cualitativas (categricas, medidas a nivel nominal u
ordinal).
En la Tabla III.5.5 se ofrece una clasificacin donde se conjugan varios criterios
sucesivos que sintetizan y contienen el mayor nmero de tcnicas de anlisis
multivariable teniendo en cuenta la complejidad de los criterios adoptados. De hecho
la propuesta clasificatoria tiene en cuenta los tres ltimos criterios comentados: anlisis
de relaciones de dependencia o de interdependencia, una variable dependiente o dos o
ms, y mtricas de las variables. La tabla se completa con otras tcnicas de anlisis cuya
caracterizacin es difcil de situar en el esquema propuesto.

Dipsit Digital de Documents |

http://ddd.uab.cat/record/131468

5. Clasificacin de las tcnicas de anlisis de datos | 15


Tabla III.5.5. Clasificacin de las tcnicas de anlisis multivariable

Anlisis de
relaciones de
interdependencia
VV

Vs
cualitativas

Anlisis
Anlisis
Anlisis
Anlisis
Anlisis
Anlisis

de Tablas de Contingencia Multidimensionales


Log-Lineal
de Correspondencias
de Clasificacin
de Escalamiento Multidimensional No Mtrico
de Clases Latentes

Anlisis Factorial Exploratorio. Anlisis de Componentes

Vs
Principales
cuantitativas Anlisis de Clasificacin
Anlisis de Escalamiento Multidimensional Mtrico

Anlisis de relaciones de dependencia VI VD

VIs cuantitativas

VD
cuantitativa

Anlisis de Covarianza
VIs cualitativas y
cuantitativas
Anlisis de Series Temporales
VD
Anlisis de Supervivencia
Tiempo
VI cualitativas

1 variable
dependiente

Anlisis de Regresin Lineal Mltiple


Anlisis de Regresin No Lineal Mltiple

Anlisis de Varianza Mltiple


Anlisis de Segmentacin
Anlisis Conjunto

VIs cuantitativas Anlisis Discriminante

VD
cualitativa

Anlisis de Regresin Logstica


Anlisis de Regresin Ordinal
VIs cualitativas y
Anlisis de Regresin Probit
cuantitativas
Anlisis de Regresin Lineal Mltiple con
variables ficticias
VI cualitativas

Anlisis Log-lineal Logit


Anlisis de Segmentacin
Anlisis Conjunta

VIs cuantitativas Anlisis de Modelos


Estructurales

VDs

2 ms
cuantitativas
variables
dependientes
VDs
cualitativas

Otras tcnicas de anlisis

de Ecuaciones

VIs cualitativas y Anlisis de Covarianza Mltiple


Anlisis de Correlacin Cannica
cuantitativas
VIs cualitativas

Anlisis Multivariable de Varianza

VIs cuantitativas Anlisis Discriminante Mltiple


VIs cualitativas

Anlisis Log-lineal Logit Mltiple

Anlisis de Redes Sociales


Minera de Datos
Anlisis de Redes Neuronales
Simulacin Social
Anlisis de Decisin Multicriterio

Notacin: V: variable VD: variable dependiente VI: variable independiente.


Variables cualitativas (no mtricas o categricas): nominales u ordinales.
Variables cuantitativas (mtricas o numricas): de intervalo o de razn (discretas o continuas).
Variable ficticia o dummy: variable binaria codificada con 0 i 1.

3. Breve resea de algunas tcnicas de anlisis multivariable


En este apartado presentaremos de forma muy resumida y ejemplificada las
caractersticas del conjunto de procedimientos que hemos presentado en la
clasificacin anterior para as tener una nocin general de los objetivos y aplicaciones
de cada tcnica analtica. En esta tercera parte del libro, a partir del prximo captulo,
se dar cuenta de buena parte de estos procedimientos de anlisis multivariable.

Lpez-Roldn y Fachelli | Metodologa de la investigacin social cuantitativa

16 | III. Anlisis
Dividiremos la exposicin en dos apartados para diferenciar claramente las tcnicas de
de anlisis de interdependencia de las de dependencia.

3.1. Tcnicas de anlisis multivariable de interdependencia


3.1.1. El anlisis de tablas de contingencia multidimensionales
El anlisis de tablas de contingencia lo hemos presentado ms arriba en su versin
bivariable. El anlisis multivariable implica introducir terceras y cuartas variables en la
tabla, habitualmente no ms, pues el cruce entre ellas aumenta el nmero de casillas
con la consecuente insuficiencia de frecuencias en ellas y la complejidad de la lectura
de la informacin. El anlisis trivariable por ejemplo implica introducir una tercera
variable que se considera como variable de control para ver la relacin entre la tres y
en particular para observar en qu medida una relacin bivariable se modifica a cada
nivel de la tercera. De hecho del anlisis multidimensional consiste en multiplicar el
anlisis bidimensional con tantas tablas como valores tenga la tercera variable. As por
ejemplo podramos analizar la relacin entre el nivel de ingresos y el sexo y
preguntarnos en qu medida su desigual distribucin depende de la categora
ocupacional que se tiene. Si tuviramos dos niveles ocupacionales (alto y bajo)
compararamos la relacin entre ingresos y sexo en una primera tabla entre los que
tienen nivel alto y en una segunda para los que tienen nivel bajo, y las compararamos
entre s. Diversos resultados son posibles, uno podra ser que la relacin desapareciera
por que la verdadera razn de ingresar diferente es tener una ocupacin mejor
remunerada, y cmo los varones suelen estar ocupados en mejores ocupaciones ganan
ms en consecuencia.

3.1.2. El anlisis log-lineal


El anlisis log-lineal permite superar algunas limitaciones lo que se ha venido en llamar
el anlisis clsico de tablas de contingencia que acabamos de ver. La principal limitacin
radica en la imposibilidad de establecer conclusiones significativas estadsticamente de
la relacin entre las variables cuando se introducen terceras y sucesivas variables, si
bien en ambas tcnicas el nmero de variables que se pueden tratar simultneamente
es una limitacin y no suele exceder de cinco. Otras tcnicas como el anlisis de
correspondencias mltiples veremos que evita este aspecto restrictivo. En el caso del
anlisis log-lineal se trata de encontrar el mejor modelo y ms sencillo (ms
parsimonioso) que se ajuste a los datos y exprese la relaciones de asociacin entre las
variables. Las asociaciones (o interacciones) pueden ser entre dos variables, entre tres
o ms, imponiendo en general un criterio de jerarqua: una relacin entre tres variables
presupone un vinculacin entre parejas de ellas. Finalmente se obtiene un modelo y
ste se cuantifica a travs de unos parmetros que dan cuenta de la importancia de las
relaciones entre las variables. Una de las aplicaciones ms habituales en Sociologa es
el anlisis de la movilidad social intergeneracional para obtener modelos que relacionan
el origen social de los padres y madres con el destino social de los hijos e hijas (en
trminos ocupacionales, de clase social, de educacin). Esta relacin entre origen y
destino se relaciona con las diferentes cohortes, diferenciando varones de mujeres y
varones o comparando diferentes territorios entre s. Estos anlisis permitiran concluir

Dipsit Digital de Documents |

http://ddd.uab.cat/record/131468

5. Clasificacin de las tcnicas de anlisis de datos | 17


hasta qu punto las desigualdades sociales que expresa la estratificacin social se han
mantenido constantes en el tiempo, ha aumentado la reproduccin social o la fluidez
social.

3.1.3. El anlisis factorial exploratorio


Dentro del anlisis factorial exploratorio se incluyen procedimientos como el Anlisis
de Componentes Principales o el Anlisis de Correspondencias. Como mtodos
factoriales tratan de descubrir variables latentes, identificarlas y reducir el espacio
vectorial definido por el conjunto ms numeroso de variables originales, haciendo a la
vez que estos factores (variables latentes) sean independientes entre s y estn
ordenados progresivamente de mayor a menor importancia o poder explicativo. Se
trata de anlisis de interdependencia donde tambin se formaliza un modelo
matemtico lineal donde se muestra la relacin entre las variables originales y los
factores. El criterio utilizado para determinar las variables latentes consiste en
encontrar aquellos ejes que en el espacio inicial tengan la mxima dispersin o
variabilidad segn las unidades observadas, es decir, son los factores que ms
discriminan a los individuos o a las unidades consideradas. Bajo este principio general,
el Anlisis de Componentes Principales trabaja a partir de variables cuantitativas
mientras que el Anlisis de Correspondencias lo hace con variables de naturaleza
cualitativa. Como ejemplo de este tipo de anlisis podramos considerar un conjunto
de indicadores de caracterizacin social de los municipios de una regin (de actividad
laboral, de distribucin por sectores de actividad, de categoras profesionales, de
niveles educativos, de movilidad espacial, demogrficos, ...) y el anlisis podra mostrar
que el factor principal de diferenciacin de estos municipios es una variable compleja
asociada al concepto de clase social, en segundo lugar, nos podemos encontrar con un
factor identificado por la dimensin demogrfica de la edad, y un tercero marcado por
el tipo de actividad y la dimensin rural-urbano, que resumiran un conjunto extenso
de variables cuya estructura latente se expresa de forma sinttica en estas tres
dimensiones o factores.

3.1.4. El anlisis de clasificacin


Por Anlisis de Clasificacin (cluster analysis) identificamos una serie de procedimientos
cuyo objetivo es clasificar un conjunto de individuos o unidades en grupos lo ms
homogneos internamente y los ms heterogneos o diferentes entre ellos. Los
procedimientos concretos tienen en cuenta la mtrica utilizada y la definicin de un
criterio inicial de proximidad (de similitud o de distancia) entre las unidades; se trata
entonces de comparar las unidades entre s segn este criterio de proximidad y unir en
un mismo grupo las unidades ms parecidas entre s de acuerdo con el conjunto de
variables que actan de criterios clasificatorios. La forma de realizar estas
comparaciones configuran los diferentes mtodos clasificatorios, los cuales se pueden
dividir en dos tipos. En primer lugar tenemos los mtodos jerrquicos, donde el
nmero de grupos no se establece a priori y se trata de que a partir de considerar cada
unidad como un grupo en s mismo se vayan uniendo progresivamente en grupos de
manera ascendente o aglomerativa hasta tener un solo grupo, o bien, de forma inversa,
descendiente o por divisin, a partir de considerar todas las unidades en un solo grupo
se trata de ir dividindolo sucesivamente. En este proceso ascendente o descendente

Lpez-Roldn y Fachelli | Metodologa de la investigacin social cuantitativa

18 | III. Anlisis
se tratar de decidir la particin o la clasificacin en un nmero de grupos que son
objeto de anlisis y validacin. Por su parte los procedimientos no jerrquicos parten
de un nmero de grupos dado segn hiptesis o anlisis previos y se operan diferentes
algoritmos de clasificacin segn el mtodo. As, por ejemplo, con un determinado
procedimiento clasificatorio podramos buscar la construccin de una tipologa de
zonas o de barrios, de municipios, de regiones, de pases, etc. en funcin de un
conjunto de variables o de indicadores sociales y econmicos previamente
seleccionados que actan de criterios clasificatorios.

3.1.5. El anlisis de escalonamiento multidimensional


El objetivo del anlisis de escalonamiento mltiple (Multidimensional Scaling) consiste en
descubrir la estructura implcita de una matriz de datos, de las unidades (o de las
variables). Se trata de construir un espacio, a partir de una mtrica definida, pero con
un nmero de dimensiones reducido (dos o tres como mximo) de tal forma que se
posibilite expresar, y representar las proximidades o semejanzas entre objetos,
individuos, situaciones, etc. Dado un conjunto de objetos a partir de los cuales se
supone -hipotticamente- o se observa -empricamente- una serie de cercanas
(similitudes o distancias), el mtodo proporciona unas dimensiones a partir de las
cuales se configura un espacio con una configuracin de los objetos con distancias que
son equivalentes o se corresponden, a partir de indicadores de la bondad del ajuste,
con proximidades supuestas u observables. Se pueden distinguir mtodos de
escalonamiento multidimensional no mtrico y mtrico. En un estudio, por ejemplo,
se podra analizar cmo se perciben las diferencias entre los partidos polticos (o de
sus lderes) con datos de las valoraciones de semejanza o proximidad expresadas por
personas encuestadas, mediante el escalonamiento multidimensional, se podran
identificar las dimensiones que describen las preferencias del electorado.

3.2. Tcnicas de anlisis multivariable de dependencia


3.2.1. El anlisis de regresin mltiple
Dado un modelo donde se supone la existencia de una variable dependiente
cuantitativa como funcin de otra variable independiente regressi simple o de otras
variables independientes regresin mltiple, tambin cuantitativas, estos tipos de
anlisis trata de encontrar a partir de los datos una funcin lineal que se ajuste, bajo
determinadas condiciones del modelo matemtico, a esta dependencia. Mediante un
modelo de regresin describimos la relacin de dependencia entre las variables y
podemos establecer predicciones basadas en l. Por ejemplo, si se trata de analizar la
dependencia que puede suponerse lineal entre la variacin de los gastos, como variable
dependiente, en funcin de variables independientes como los ingresos, del nmero
de hijos, etc. el modelo establece que la variacin de la variable dependiente est dado
por las variaciones de las variables independientes afectadas por coeficientes, uno para
cada variable independiente, que se trata de calcular ms otra parte que queda
inexplicada y que se denomina error del modelo. El ajuste, o clculo de los coeficientes,
se realiza mediante, por ejemplo, la tcnica estadstica de mnimos cuadrados

Dipsit Digital de Documents |

http://ddd.uab.cat/record/131468

5. Clasificacin de las tcnicas de anlisis de datos | 19


ordinarios para la que se minimiza la parte inexplicada por las variables independientes.
Cada coeficiente o parmetro (coeficiente de regresin) asociado a cada variable
independiente expresar la importancia relativa en la explicacin de la varianza total.
Adicionalmente disponemos de tests estadsticos de ajuste para validar el modelo
global y de significacin de los coeficientes.

3.2.2. El anlisis de regresin logstica


La regresin logstica sigue los principios generales de una regresin pero tratando
variables dependientes cualitativas. Cuando la variable a explicar es dicotmica se habla
de regresin logstica binaria, cuando es politmica la regresin es multinomial. Si
adems las categoras estn ordenadas y expresan latentemente la continuidad de una
variable entonces la regresin es ordinal. As por ejemplos podemos estar interesados
en explicar el comportamiento electoral abstencionista y elegir una serie de variables
independientes, cuantitativas o cualitativas, que determinen la accin de votar o no
votar en unas elecciones: la edad, el sexo, la clase social, el nivel de estudios, el lugar
de residencia, los ingresos, la cultura poltica, la valoracin de la situacin econmica,
etc. En lugar de explicar la participacin electoral podramos modelizar los perfiles
diferenciados de cada partido poltico viendo los factores que ms explican el voto a
cada opcin. En una regresin ordinal podramos explicar los niveles de ingresos, el
rendimiento acadmico o el grado de satisfaccin con la prestacin de un servicio en
relacin a un conjunto de variables independientes que deben ser objeto de eleccin
en funcin de un modelo sustentado tericamente que justifique su consideracin. En
todos estos casos se trata de explicar las razones de frecuencias entre las categoras a
partir de un vnculo que formalmente se establece con las variables independientes a
travs de la funcin logstica. Finalmente lo que obtenemos es una serie de coeficientes
que estiman la importancia relativa de cada categora o variable como factores
explicativos teniendo en cuenta la presencia del resto de variables en el modelo
multidimensional.

3.2.3. El anlisis de la varianza multifactorial y multivariable


El anlisis de la varianza multifactorial (ANOVA multifactorial) considera una variable
dependiente de naturaleza cuantitativa y diversas variables independientes cualitativas
llamadas factores. Por ejemplo, si se pretende analizar los gastos en funcin de la
categora socioeconmica, el nivel educativo, el tipo de familia, etc. o bien si se quiere
analizar la valoracin que se hace de un producto anunciado en la televisin (mediante
una escala cuantitativa) en funcin de la categora socioeconmica y la edad (como
variables cualitativas). Bajo un modelo lineal y con determinadas condiciones donde la
variacin de la variable dependiente se desglosa como una suma de contribuciones de
cada una de las categoras de los factores y que debe satisfacer el modelo, mediante
este anlisis se trata de diferenciar, de la varianza total, la parte debida a la varianza
entre o explicada por los factores y la parte intra o interna no explicada por factores.
Adems, el modelo proporciona informacin sobre la intensidad y el grado de
significacin de la dependencia. En esta dependencia se tienen en cuenta las diferencias
observadas por los valores (grupos o niveles) definidos por cada una de las variables
independientes y por las interacciones entre estas variables.

Lpez-Roldn y Fachelli | Metodologa de la investigacin social cuantitativa

20 | III. Anlisis

El anlisis multivariable de varianza (MANOVA) considerara varias variables


dependientes. En el caso del ejemplo anterior sobre la valoracin del producto
podramos considerar las valoraciones que se hacen segn varios aspectos: valoracin
del contenido del mensaje, valoracin de la imagen, valoracin del sonido, etc. en
funcin de las mismas variables independientes. Estos modelos de anlisis de la
varianza se pueden plantear desde modelos o diseos experimentales y no
experimentales, segn se d una manipulacin directa o no de las variables, con diseos
adicionales particulares que aqu no consideramos.

3.2.4. El anlisis de covarianza


El anlisis de covarianza (ANCOVA) es una extensin del anlisis de la varianza. Se
considera el mismo modelo de relaciones entre las variables aadiendo un control
estadstico de variables extraas o perturbadoras. Se supone que hay variables
intervinientes que influyen sobre la variable dependiente modificando los resultados
de la dependencia con las variables independientes, por lo tanto, se trata de corregir
este efecto (de la llamada variable concomitante o covariable, o de varias de ellas)
considerando solamente los efectos atribuibles a las variables independientes. Si
consideramos el modelo multifactorial anterior este podra completarse mediante la
introduccin de un factor de covariacin, una variable que acta como factor de
comparacin: si se quiere analizar la valoracin que se hace de un producto anunciado
en la televisin en funcin de la categora socioeconmica y la edad, la introduccin de
la variable valoracin la semana anterior de emisin nos permitira ver si las diferencias
se mantienen al margen del efecto que haya podido tener la semana de referencia.

3.2.5. El anlisis discriminante


En este caso una o ms variables cualitativas se consideran como variables
dependientes en funcin de varias variables independientes de tipo cuantitativo. El
anlisis trata de encontrar la combinacin (lineal) de las variables independientes
(funcin discriminante) que d cuenta de la mxima discriminacin entre dos o ms
grupos definidos por la variable dependiente cualitativa, o los grupos que resultan del
cruce de varias variables cualitativas. As, por ejemplo, el partido poltico votado y el
sexo podran considerarse variables dependientes de los ingresos, del nmero de hijos,
de los aos de residencia en el municipio, de la edad, etc. El anlisis discriminante se
considera una tcnica de clasificacin donde una serie de grupos definidos previamente
(el partido votado segn el sexo) se analizan en funcin de las variables que los hacen
ms diferentes y, por tanto, explican el voto.

3.2.6. El anlisis del camino


El anlisis del camino (path analysis) parte de un modelo de ecuaciones estructurales
donde se explicita en forma de relacin lineal las dependencias entre las variables, todas
ellas cuantitativas. Hay variables endgenas o dependientes y variables exgenas o
independientes, todas ellas observables y bajo un modelo recursivo, es decir, marcado
unidireccionalmente. El anlisis trata de encontrar los coeficientes de relacin

Dipsit Digital de Documents |

http://ddd.uab.cat/record/131468

5. Clasificacin de las tcnicas de anlisis de datos | 21


(coeficientes path) que den cuenta de la dependencia y determinen las ecuaciones
estructurales en que se expresa un modelo terico dado. Estos coeficientes son de
regresin, y se interpretan igualmente como la relacin entre la variacin o cambio de
una variable dependiente en funcin del cambio de una variable independiente, cuando
ambas variables han sido previamente estandarizadas. Un posible modelo por ejemplo
sera intentar explicar la ideologa poltica en funcin de una serie de variables sociales,
como la edad, los aos de estudios del individuo, los aos de estudios de los padres o
los ingresos, las cuales al mismo tiempo se relacionan entre s segn un modelo
explicitado de dependencia.

3.2.7. El anlisis factorial confirmatorio


El anlisis factorial pretende identificar, bajo un modelo predefinido de dependencia y
a partir de un conjunto de variables cuantitativas originales observadas o manifiestas,
las variables no observadas o latentes, llamadas factores, que en un nmero reducido
subyacen a las originales. El anlisis factorial confirmatorio se basa en un modelo
previo donde se postula una dependencia entre las variables manifiestas iniciales y las
latentes o factores, donde se supone que las variables originales contribuyen con un
peso diferenciado en la emergencia de los factores comunes, dado por la parte comn
de las variables, y otra parte especfica que se debe a las variables y que no es explicada
por factores. De hecho, las variables independientes son los factores. El modelo previo
de hiptesis, de relaciones causales, orienta el establecimiento de estos pesos y se
somete a comprobacin. As por ejemplo, a partir de la realizacin de una serie de
pruebas intelectuales de diferente naturaleza se intenta probar que algunas de estas
miden un factor de habilidades verbales y lingsticas, y otras un factor de habilidades
de clculo matemtico.

3.2.8. Modelo de ecuaciones estructurales


Los modelos causales en general y los modelos de ecuaciones estructurales en
particular tienen actualmente una importancia primordial dentro de los mtodos
empleados en la investigacin sociolgica. Representan de alguna manera la
continuacin, desarrollo y superacin de los anlisis de regresin, factoriales y del
anlisis del camino y, en general, de las que suponen relaciones de dependencia entre
variables. Los mtodos de ecuaciones estructurales suponen, por tanto, que la realidad
social debe ser conceptualizada y tratada bajo modelos de causalidad. En sentido
estricto se trata de explicitar relaciones causales entre variables cuantitativas, algunas
de las cuales se declaran dependientes y otros independientes. La particularidad del
modelo de ecuaciones estructurales es doble: las variables pueden ser manifiestas o
latentes, en parte o todas ellas, y el modelo puede ser recursivo o no recursivo. En el
caso de utilizar exclusivamente variables latentes debe ser complementado con los
mtodos factoriales confirmatorios o mtricos que proporcionan las variables latentes
a partir de variables observables. En este sentido se puede hablar de un modelo general
de estructuras de covarianza (las ecuaciones con varianzas y covarianzas entre las
variables son el ncleo algebraico de estos mtodos) que comprende los llamados
modelos factoriales confirmatorios o de medida con variables observables y no
observables, y los modelos de ecuaciones estructurales con variables observables, o
latentes o de ambos tipos a la vez. Un modelo confirmatorio, de entrada, puede darnos,

Lpez-Roldn y Fachelli | Metodologa de la investigacin social cuantitativa

22 | III. Anlisis
a partir de unas variables observables (por ejemplo, la categora socioeconmica de la
familia y de los alumnos/as, el nivel de estudios del padre y de la madre, el nivel de
ingresos, etc.) unas variables latentes de entrada que explican las observables. Otro
anlisis confirmatorio, de salida, proporciona las aspiraciones del ncleo familiar, una
relacin entre variables observables (por ejemplo, las notas, las motivaciones y
aspiraciones del alumnado segn escalas de valoracin de profesiones, etc.) y otros
latentes, de salida, que dan cuenta o son causa de estas variables observables. Pues
bien, el modelo de estructuras causales, cuando se trabaja slo con variables latentes,
establece relaciones causales entre ambos grupos de variables latentes, las de entrada y
las de salida, ya sea de forma recursiva o no recursiva.

3.2.9. El anlisis de segmentacin


El anlisis de segmentacin (Tree Analysis) toma un conjunto de variables, y
determinados hipotticamente dos grupos entre ellas, el grupo de variables
dependientes y el grupo de variables independientes, se trata de ir segmentando o
dividiendo el total de la poblacin sucesivamente a partir de la eleccin de la variable
independiente y de las agrupaciones de sus valores que maximicen la separacin o las
diferencias entre los grupos hacindolos a su vez homogneos en relacin a la o las
variables dependientes. Se trata de un procedimiento con fines clasificadores, pero a
diferencia del anlisis de clasificacin se trata de grupos de individuos. Las variables
dependientes pueden ser cuantitativas o cualitativas, mientras que las variables
independientes se tratan a nivel nominal u ordinal. Esta tcnica se podra utilizar para
segmentar la opinin frente al aborto (a favor o en contra) a partir de considerar
diversas variables independientes que configuraran los grupos caractersticos
favorables o no al aborto: la ideologa, la edad, el sexo, los ingresos, el estado civil, el
nivel de estudios, la prctica religiosa, la actividad laboral, etc. Como resultado podra
salir que la variable que tiene ms poder explicativo es la prctica religiosa,
configurndose dos grupos , los creyentes y los no creyentes, los cuales a su vez podran
dividirse segn el efecto discriminador de una segunda variable: los creyentes se
podran dividir en practicantes y no practicantes, mientras que los no creyentes se
podran dividir en personas de ideologa de izquierdas o de derechas, y as
sucesivamente mientras hubiera divisiones y variables significativas.

4. Bibliografa
Alvira, F. (1990). Comentario a la enseanza de la Estadstica en Sociologa. Estadstica
Espaola, 31, 122, 435-437.
Ato Garca, M.; Lpez Garca, J. J. (1996). Anlisis estadstico para datos categricos. Madrid:
Sntesis.
Barton, A. H. (1985). Concepto de espacio de atributos en sociologa. En Metodologa
de las Ciencies Sociales. I. Conceptos e Indices, editado por R. Boudon i P.F.
Lazarsfeld. Barcelona: Laia, 195-219.
Bertier, P.; Bourouche, J.-M. (1983). Analyse des donnes multidimensionnelles. Paris: PUF.
Bennet, S.; Bower, D. (1976). A introduction to multivariate techniques for social and behavioural
sciences. London: The Macmillan Press.

Dipsit Digital de Documents |

http://ddd.uab.cat/record/131468

5. Clasificacin de las tcnicas de anlisis de datos | 23


Bishop, Y. M.; Fienberg, S. E.; Holland, P. W. (1989). Discrete Multivariate Analysis:
Theory and Practice. Cambridge: Cambridge University Press.
Bisquerra Alzina, R. (1989). Introduccin conceptual al anlisis multivariable. Un enfoque
informtico con los paquetes SPSS-X, BMDP, LISREL y SPAD. Barcelona:
Promociones y Publicaciones Universitarias.
Borrs, V. et al. (1991). Bibliografia sobre anlisi multivariant. Papers. Revista de
Sociologia 37. P. 135-139.
Bosque, J.; Moreno, A. (1994). Prcticas de Anlisis Exploratorio y Multivariante de Datos.
Barcelona: Oikos-Tau.
Calvo Gmez, F. (1993). Tcnicas estadsticas multivariantes. Bilbao: Deusto.
Cattell, R. B. (1966). Handbook of Multivariate Experimental Psychology. Chicago: Rand
McNally.
Cuadras, C. M. (1996). Mtodos de anlisis multivariante. Barcelona: EUB.
Daz De Rada, V. (1999). Tcnicas de Anlisis de Datos para Investigadores Sociales.
Aplicaciones prcticas con SPSS para Windows. Madrid: Editorial Ra-Ma.
Etxeberra, J.; Garca, E.; Gil, J.; Rodrguez, G. (1995). Anlisis de datos y textos. Madrid:
RA-MA.
Garca Ferrando, Manuel (1987) Socioestadstica. Introduccin a la estadstica en sociologa. 2a
edici amp. Madrid: Alianza. Alianza Universidad Textos, 96.
Grande Esteban, I.; Abascal Fernandez, E. (1989). Mtodos multivariantes para la
investigacin comercial. Barcelona: Ariel.
Hair, J. F. et al. (2011). Multivariate Data Analysis. New Jersey: Prentice Hall.
Jreskog, Karl G. (1993). Modelado de ecuaciones con Lisrel. Vitoria: Instituto Vasco de
Estadstica
Kachigan, S. K. (1991). Multivariate Statistical Analysis. A Conceptual Introduction. 2a edici.
New York: Radius Press.
Kendall, M. G. (1975). Multivariate Analysis. London: Griffin.
Kendall, Maurice G. (1978). The History of Statistical Method. En International
Enciclopedia of Statistics, editado per W.H. Kruskal i J.M. Tuner. New York: Free
Press, 1093-1101.
Kinnear, P.R.; Taylor, J.R. (1971). Multivariate Methods in Marketing Research. A
Further Attempt at Classification. Journal of Marketing 35, 4, octubre, 56-59.
Laforgue, H. (1981). Analyse multivariante. Montreal: tudes Vivantes.
Lebart, L.; Morineau, A.; Fenelon, J. P. (1985). Tratamiento estadstico de datos. Mtodos y
programas. Barcelona: Marcombo.
Lefebvre, J. (1983). Introduction aux analyses statistiques multidimensionnelles. Paris: Masson.
Lozares Colina, C.; Lpez-Roldn, P. (1991). El anlisis multivariado: definicin,
criterios y clasificacin. Papers. Revista de Sociologia 37. P. 9-29.
Manly, B. F .J. (1986). Multivariate Statistical Methods. London: Chapman and Hall. P.
17-25
Prieto, G. (1985). Anlisis Multivariable. En Investigacin educativa, editado por A. de la
Orden Hoz. Madrid: Anaya, 26-28.
Riba Lloret, M. D. (1989). Una panormica de las tcnicas estadsticas multivariables.
Bellaterra: Universitat Autnoma de Barcelona.
Snchez Carrin, J. J. (1984). Introduccin a las tcnicas de anlisis multivariable aplicadas a las
ciencias sociales, Madrid: Centro de Investigaciones Sociolgicas.
Sierra Bravo, R. (1994). Anlisis Estadstico Multivariable: Teora y Ejercicios. Madrid:
Paraninfo.

Lpez-Roldn y Fachelli | Metodologa de la investigacin social cuantitativa

24 | III. Anlisis
Stevens, James (1986). Applied Multivariate statistics for the social sciences. Hillsday (New
Jersey): Lawrence Erlbaum.
Stigler, S. M. (1986). The history of statistics: the measurement of uncertainty before 1900.
Cambridge: Belknap Press,.
Tabachnick, B. G.; Fidell, L. S. (1989). Using Multivariate Statistics. 2a. edici. New York:
Harper Collins.
Tacq, J. (1997). Multivariate analysis techniques in social science research: from problem to analysis.
London: Sage Publications.
Visauta Vinacua, B. (1999). Anlisis estadstico con SPSS para Windows: estadstica
multivariante. Madrid: McGraw-Hill.
Volle, M. (1978). Analyse des donnes. Paris: Economica.
VV.AA. (1991). Lanlisi multivariable de dades. Monogrfic de Papers. Revista de
Sociologia, 37.
VV.AA. (1996). La construcci de tipologies. Exemples. Monogrfic de Papers. Revista
de Sociologia, 48.

Dipsit Digital de Documents |

http://ddd.uab.cat/record/131468

You might also like