Professional Documents
Culture Documents
INVESTIGACIN
SOCIAL
CUANTITATIVA
Pedro Lpez-Roldn
Sandra Fachelli
METODOLOGA DE LA
INVESTIGACIN
SOCIAL
CUANTITATIVA
Pedro Lpez-Roldn
Sandra Fachelli
Este libro digital se publica bajo licencia Creative Commons, cualquier persona es libre de copiar,
distribuir o comunicar pblicamente la obra, de acuerdo con las siguientes condiciones:
Reconocimiento. Debe reconocer adecuadamente la autora, proporcionar un enlace a
la licencia e indicar si se han realizado cambios. Puede hacerlo de cualquier manera
razonable, pero no de una manera que sugiera que tiene el apoyo del licenciador o
lo recibe por el uso que hace.
No Comercial. No puede utilizar el material para una finalidad comercial.
Sin obra derivada. Si remezcla, transforma o crea a partir del material, no puede
difundir el material modificado.
No hay restricciones adicionales. No puede aplicar trminos legales o medidas tecnolgicas
que legalmente restrinjan realizar aquello que la licencia permite.
Pedro Lpez-Roldn
Centre d'Estudis Sociolgics sobre la Vida Quotidiana i el Treball (http://quit.uab.cat)
Institut dEstudis del Treball (http://iet.uab.cat/)
Departament de Sociologia. Universitat Autnoma de Barcelona
pedro.lopez.roldan@uab.cat
Sandra Fachelli
Departament de Sociologia i Anlisi de les Organitzacions
Universitat de Barcelona
Grup de Recerca en Eduaci i Treball (http://grupsderecerca.uab.cat/gret)
Departament de Sociologia. Universitat Autnoma de Barcelona
sandra.fachelli@ub.edu
ndice general
PRESENTACIN
PARTE I. METODOLOGA
I.1.
I.2.
I.3.
I.4.
FUNDAMENTOS METODOLGICOS
EL PROCESO DE INVESTIGACIN
PERSPECTIVAS METODOLGICAS Y DISEOS MIXTOS
CLASIFICACIN DE LAS TCNICAS DE INVESTIGACIN
PARTE III.
ANLISIS
Metodologa de la Investigacin
Social Cuantitativa
Pedro Lpez-Roldn
Sandra Fachelli
ndice de contenidos
1. CLASIFICACIN DE LAS TCNICAS DE ANLISIS BIVARIABLE......................... 6
2. EL ANLISIS MULTIVARIABLE: CARACTERSTICAS Y CLASIFICACIN .......... 10
2.1. Definicin y caracterizacin del anlisis multivariable ...................................... 11
2.2. Criterios y clasificacin de las tcnicas de anlisis multivariable ...................... 13
PARTE III
Captulo
6 | III. Anlisis
distincin entre tcnicas de anlisis de interdependencia y de dependencia. En el primer
caso se disponen de un modelo de anlisis que plantea de forma ms o menos precisa
la existencia de una serie de interrelaciones entre un conjunto de variables pero donde
no se diferencia su papel al tratarlas de forma simtrica, podemos decir que todas ellas
se consideran como independientes e interesa encontrar o constatar su patrn o
estructura de relaciones mutuas y simultneas. En el segundo caso s que se establece
la diferenciacin entre variable dependiente e independiente, una(s) actan de variables
explicadas y otra(s) de variables explicativas segn un modelo de anlisis explicativo
que conceptualiza y explicita hiptesis sobre el vnculo de dependencia.
Existe un tercer aspecto fundamental para caracterizar las tcnicas de anlisis de datos:
el nivel de medicin de las variables, su mtrica. En funcin de si las variables son
cuantitativas (mtricas, de tipo discreto o continuo) o cualitativas (no mtricas, de tipo
nominal u ordinal) cabe establecer este tercer criterio clasificatorio que las diferencia y
define.
http://ddd.uab.cat/record/131468
Intencin de voto
en supuestas
elecciones
generales
Podemos
PSOE
PP
IU-ICV
UPyD
CiU
ERC
Ciudadanos
Otros partidos
Sin voto definido
Total
Sexo
Hombre
20,1%
14,4%
11,9%
4,0%
2,0%
2,1%
2,0%
2,0%
3,8%
37,9%
100,0%
2 Mujer
15,3%
14,2%
11,5%
3,4%
2,3%
1,9%
1,9%
1,0%
2,9%
45,6%
100,0%
Total
17,6%
14,3%
11,7%
3,7%
2,1%
2,0%
1,9%
1,5%
3,3%
41,9%
100,0%
8 | III. Anlisis
De esta informacin se desprende un perfil similar entre varones y mujeres excepto en
la indefinicin del voto, que es superior en las mujeres, y en el voto a Podemos donde
predomina claramente el voto masculino.
Cuando analizamos la relacin entre dos variables cuantitativas la tcnica de anlisis
que las trata es el anlisis de regresin lineal. En este caso tras constar que existe un
grado de correlacin lineal entre las variables, la tcnica expresa a una de ellas, la
variable dependiente, en funcin de otra variable que se considera como independiente
o factor explicativo. El vnculo que se establece es una relacin funcional, y se expresa
a travs de la funcin lineal, es decir, mediante la ecuacin de una recta. As, por
ejemplo, considerando los pases del mundo podemos plantear un modelo de relacin
para explicar en qu medida la tasa de mortalidad infantil est en funcin del nivel de
desarrollo del pas considerando el IDH (ndice de Desarrollo Humano). As
esperamos obtener que a medida que el ndice de desarrollo es mayor la tasa de
mortalidad infantil ser menor, es decir, se dar una relacin inversa. As lo podemos
comprobar en el grfico de dispersin del Grfico III.5.2 y en los coeficientes de la
Tabla III.5.3. Cada punto del grfico es un pas y stos se disponen de manera que los
que tiene alto IDH tiene bajos valores de mortalidad, y al viceversa.
Grfico III.5.2. Mortalidad infantil segn el IDH
Se configura as una nube de puntos que se puede ajustar a la forma de una lnea recta,
y cuyos coeficientes permiten interpretar que por cada punto ms de desarrollo la tasa
de mortalidad se reduce en -141,270, teniendo el modelo una capacidad explicativa del
79,8%2.
http://ddd.uab.cat/record/131468
Coeficientes de
regresin
122,779
-141,270
Coeficientes
-0,893
0,798
Comunidad autnoma
Rioja (La)
Pas Vasco
Catalua
Andaluca
Navarra (Comunidad Foral de)
Madrid (Comunidad de)
Comunitat Valenciana
Canarias
Balears (Illes)
Cantabria
Galicia
Murcia (Regin de)
Castilla La Mancha
Extremadura
Aragn
Castilla y Len
Asturias (Principado de)
Total
Escala de autoubicacin
ideolgica (1=izq-10=der)
Desviacin
Media
n
tpica
3,46
13
1,613
3,63
87
1,622
3,96
338
1,786
4,13
335
1,741
4,33
27
1,732
4,35
253
2,136
4,48
229
1,791
4,60
75
1,993
4,67
55
2,373
4,82
22
1,651
4,86
123
2,086
4,87
46
1,529
4,88
91
2,299
4,94
48
2,409
4,96
57
1,812
5,04
111
1,926
5,06
48
1,731
4,41
1958
1,944
10 | III. Anlisis
3 Este apartado es reflejo de la revisin de publicaciones anteriores (Lozares y Lpez-Roldn, 1991, 2000).
4 La expresin multivariante, al igual que bivariante o univariante, alude sobre todo al tipo de distribucin estadstica
de los datos; multivariado tendra en cuenta la presencia de varios grados de diversidad, mientras que multivariable
destaca la cantidad de variables que intervienen. En ingls la expresin utilizada es multivariate y en francs multivarie.
http://ddd.uab.cat/record/131468
esa poca se trabajaba con terminales de grandes ordenadores en instituciones y centros de investigacin que podan
acceder a este tipo de recursos. No es hasta 1984 que aparece el SPSS/PC por ejemplo, y es por entonces que
empieza lentamente a extenderse su uso y la enseanza en las universidades tanto de las tcnicas como del software
estadstico que hace posible su utilizacin.
12 | III. Anlisis
casos,...), sujetos de la atribucin conceptual, y el espacio de las variables (o espacio de
atributos) presentes en una matriz de datos atributiva. Esta distincin conlleva y
posibilita que los datos, al ser expresables en forma matricial, puedan ser interpretadas
en una doble lectura: desde las unidades y desde las variables. Kendall (1975) se orienta
en esta direccin cuando propone como definicin de anlisis multivariable, a partir
de n individuos y de p variables, la de ser una rama de la estadstica que se interesa en
el estudio de la relacin entre series de variables dependientes de los individuos que las
sustentan, entendiendo por dependencia la vinculacin de las variables a los individuos
de los que se predican.
En segundo lugar, el soporte matricial introduce una segunda caracterstica polar dada
la naturaleza dual del dato. Por un lado, el dato es un resultado algebraico, por tanto,
sometido y sometible a la lgica del lenguaje matemtico que lo lee, mide, trata y
analiza, y, por otra parte, tambin es el resultado de una construccin de naturaleza
cientfica, en tanto en cuanto el dato se inscribe a una determinada teora ms o menos
elaborada, a unos presupuestos e hiptesis y, sobre todo, al haber sido objeto de una
validacin interna y externa en diversos grados. Esta dualidad, intrnseca al dato
concreto, es extensible a la matriz de datos.
En relacin a la primera de las polaridades mencionadas de la dualidad del dato, las
tcnicas son multivariables en el sentido que posibilitan y ofrecen una flexibilidad en
cuanto al lenguaje algebraico, y en particular en cuanto a las diversas mtricas exigibles
en funcin de la estructura algebraica utilizada cuando operativizan los conceptos. La
mtrica definida es mltiple y diversa, adaptable a la naturaleza de la operativizacin.
Las matrices pueden ser, segn los mtodos, de diferente naturaleza: lgicas,
nominales, de frecuencias absolutas, relativas o condicionales, matrices de rangos o
matrices cuantitativas. Definir las tcnicas de anlisis multivariable exclusivamente
como tcnicas estadsticas es de hecho restrictivo: ms ampliamente el lgebra matricial
y vectorial suele ser el fundamento de los mtodos utilizados6.
En relacin a la segunda polaridad, es decir, la relativa a las exigencias ligadas a la
insercin de las tcnicas en la instancia terica, de la corroboracin de hiptesis, etc.,
el conjunto de las tcnicas de anlisis multivariable posibilita varios niveles de anlisis
vinculados a estas exigencias. Son anlisis y orientaciones metodolgicas que pueden
plantearse a partir de estas tcnicas:
- En el orden de la parsimonia exigible a todo mtodo, resalta el efecto simplificador
y reductor que procuran, permitiendo tambin tratamientos simultneos de todas
las variables o unidades que intervienen o un tratamiento escalonado de alguna(s)
unidad(es) o variable(s). En algunos casos incluso las unidades o variables son
introducidas sin intervenir en los clculos con una finalidad descriptiva o de
localizacin en el conjunto.
- Tambin hay que considerar los efectos de consistencia y de validacin en la
construccin y definicin de las variables. Mediante la construccin de tipologas
o la obtencin de variables mtricas que subyacen en la combinacin de un
conjunto inicial de informacin, disponemos de mtodos que tienen una funcin
instrumental destinada a mejorar la calidad del proceso de operativizacin y de los
6 En el anexo del libro se recoge un apartado dedicado al tratamiento matemtico de la informacin para el anlisis
estadstico donde se introducen los conceptos de vector y espacio vectorial, las operaciones con vectores y matrices,
etc., que estn en la base de buena parte de las tcnicas de anlisis multivariable.
http://ddd.uab.cat/record/131468
14 | III. Anlisis
- Tcnicas de anlisis multivariable explicativo-causales que buscan formalizar un
modelo de relaciones que conllevan hiptesis proposicionales simples o sistemas
de hiptesis de dependencia lineal.
- Tcnicas exploratorias y de estructuracin donde se incluyen modelos diversos: los
que implican niveles relativamente elementales de categorizacin o de
contrastacin comparativa; los que buscan las dimensiones latentes o de los
factores ms discriminantes de la realidad social considerada estableciendo
estructuras de interrelacin entre las variables; o los que buscan construir tipologas
concretas como formas de tipificacin de la realidad como forma una explicacin
estructural de los fenmenos
Un segundo criterio es algebraico y tcnico-instrumental, como condicin previa a toda
finalidad analtica, que establece la eleccin de las tcnicas segn:
- Impliquen una relacin de dependencia entre las variables, donde se establece la
distincin entre variables dependientes o explicadas y variables independientes o
explicativas.
- Impliquen una relacin de interdependencia o la simple correlacin/asociacin
entre las variables, donde todas las variables tienen la misma consideracin (si se
quiere de variables independientes).
Un posible criterio adicional tcnico sera el nmero de variables que intervienen en el
anlisis:
- Cuando se trata de tcnicas de dependencia, se valora cuntas variables
dependientes intervienen, asumiendo que se considerar ms de una variable
independiente.
- Cuando se trata de tcnicas de interdependencia se considera que se relacionan
ms de dos variables.
Por ltimo, se pueden conjugar los dos criterios anteriores con la mtrica de las
variables: si son variables mtricas o cuantitativas (numricas, medidas como discretas
o continuas) o no son mtricas o cualitativas (categricas, medidas a nivel nominal u
ordinal).
En la Tabla III.5.5 se ofrece una clasificacin donde se conjugan varios criterios
sucesivos que sintetizan y contienen el mayor nmero de tcnicas de anlisis
multivariable teniendo en cuenta la complejidad de los criterios adoptados. De hecho
la propuesta clasificatoria tiene en cuenta los tres ltimos criterios comentados: anlisis
de relaciones de dependencia o de interdependencia, una variable dependiente o dos o
ms, y mtricas de las variables. La tabla se completa con otras tcnicas de anlisis cuya
caracterizacin es difcil de situar en el esquema propuesto.
http://ddd.uab.cat/record/131468
Anlisis de
relaciones de
interdependencia
VV
Vs
cualitativas
Anlisis
Anlisis
Anlisis
Anlisis
Anlisis
Anlisis
Vs
Principales
cuantitativas Anlisis de Clasificacin
Anlisis de Escalamiento Multidimensional Mtrico
VIs cuantitativas
VD
cuantitativa
Anlisis de Covarianza
VIs cualitativas y
cuantitativas
Anlisis de Series Temporales
VD
Anlisis de Supervivencia
Tiempo
VI cualitativas
1 variable
dependiente
VD
cualitativa
VDs
2 ms
cuantitativas
variables
dependientes
VDs
cualitativas
de Ecuaciones
16 | III. Anlisis
Dividiremos la exposicin en dos apartados para diferenciar claramente las tcnicas de
de anlisis de interdependencia de las de dependencia.
http://ddd.uab.cat/record/131468
18 | III. Anlisis
se tratar de decidir la particin o la clasificacin en un nmero de grupos que son
objeto de anlisis y validacin. Por su parte los procedimientos no jerrquicos parten
de un nmero de grupos dado segn hiptesis o anlisis previos y se operan diferentes
algoritmos de clasificacin segn el mtodo. As, por ejemplo, con un determinado
procedimiento clasificatorio podramos buscar la construccin de una tipologa de
zonas o de barrios, de municipios, de regiones, de pases, etc. en funcin de un
conjunto de variables o de indicadores sociales y econmicos previamente
seleccionados que actan de criterios clasificatorios.
http://ddd.uab.cat/record/131468
20 | III. Anlisis
http://ddd.uab.cat/record/131468
22 | III. Anlisis
a partir de unas variables observables (por ejemplo, la categora socioeconmica de la
familia y de los alumnos/as, el nivel de estudios del padre y de la madre, el nivel de
ingresos, etc.) unas variables latentes de entrada que explican las observables. Otro
anlisis confirmatorio, de salida, proporciona las aspiraciones del ncleo familiar, una
relacin entre variables observables (por ejemplo, las notas, las motivaciones y
aspiraciones del alumnado segn escalas de valoracin de profesiones, etc.) y otros
latentes, de salida, que dan cuenta o son causa de estas variables observables. Pues
bien, el modelo de estructuras causales, cuando se trabaja slo con variables latentes,
establece relaciones causales entre ambos grupos de variables latentes, las de entrada y
las de salida, ya sea de forma recursiva o no recursiva.
4. Bibliografa
Alvira, F. (1990). Comentario a la enseanza de la Estadstica en Sociologa. Estadstica
Espaola, 31, 122, 435-437.
Ato Garca, M.; Lpez Garca, J. J. (1996). Anlisis estadstico para datos categricos. Madrid:
Sntesis.
Barton, A. H. (1985). Concepto de espacio de atributos en sociologa. En Metodologa
de las Ciencies Sociales. I. Conceptos e Indices, editado por R. Boudon i P.F.
Lazarsfeld. Barcelona: Laia, 195-219.
Bertier, P.; Bourouche, J.-M. (1983). Analyse des donnes multidimensionnelles. Paris: PUF.
Bennet, S.; Bower, D. (1976). A introduction to multivariate techniques for social and behavioural
sciences. London: The Macmillan Press.
http://ddd.uab.cat/record/131468
24 | III. Anlisis
Stevens, James (1986). Applied Multivariate statistics for the social sciences. Hillsday (New
Jersey): Lawrence Erlbaum.
Stigler, S. M. (1986). The history of statistics: the measurement of uncertainty before 1900.
Cambridge: Belknap Press,.
Tabachnick, B. G.; Fidell, L. S. (1989). Using Multivariate Statistics. 2a. edici. New York:
Harper Collins.
Tacq, J. (1997). Multivariate analysis techniques in social science research: from problem to analysis.
London: Sage Publications.
Visauta Vinacua, B. (1999). Anlisis estadstico con SPSS para Windows: estadstica
multivariante. Madrid: McGraw-Hill.
Volle, M. (1978). Analyse des donnes. Paris: Economica.
VV.AA. (1991). Lanlisi multivariable de dades. Monogrfic de Papers. Revista de
Sociologia, 37.
VV.AA. (1996). La construcci de tipologies. Exemples. Monogrfic de Papers. Revista
de Sociologia, 48.
http://ddd.uab.cat/record/131468