You are on page 1of 14

CUARTO PARCIAL: “TALLER DE INVESTIGACIÓN SOCIAL”

ANÁLISIS DE DATOS

La recolección de los datos depende de los datos que se hayan recolectado. Una vez
que se hayan codificado los datos, transferido a una matriz de datos y guardado en un
archivo, el investigador procede a analizarlos.

El análisis cuantitativo en la actualidad se hace por computadora y depende de tres


factores:

1. El nivel de medición de las variables

2. La manera como se hayan formulado las hipótesis

3. El interés del investigador

El investigador busca en primer término describir datos y posteriormente efectuar


análisis estadístico para relacionar las variables, es decir realiza análisis de estadística
descriptiva para cada una de sus variables y luego describe relación entre éstas.

Entre los principales análisis estadísticos destacan:

• Estadística descriptiva para variables individuales

• Puntuaciones Z

• Razones y tasas

• Cálculos y razonamientos de estadística inferencial

• Pruebas paramétricas

• Pruebas no paramétricas
• Análisis multivariados

ESTADÍSTICA DESCRIPTIVA

1. Distribución de Frecuencias: es un conjunto de puntuaciones ordenadas en sus


principales respectivas categorías. Ejemplo:

VARIABLES: CONDUCTOR PREFERIDO


CATEGORÍAS CÓDIGOS FRECUENCIAS
AMT 1 50
LEM 2 88
FGI 3 12
MML 4 3
TOTAL 133

Los elementos que contiene una distribución de frecuencias son las relativas
y las acumuladas. Las relativas son porcentajes de casos de cada categoría y las
acumuladas son los que se van acumulando en cada categoría desde la más baja
hasta la más alta. Estas también pueden presentarse en porcentajes. Ejemplo:

VARIABLE: COOPERACIÓN DE PERSONAL PARA EL PROYECTO DE CALIDAD DE


EMPRESA
CATEGORÍAS CÓDIGOS FRECUENCIAS FRECUENCIAS FRECUENCIAS
ABSOLUTAS RELATIVAS ACUMULADAS
Si se ha obtenido 1 91 74.6 % 91
la cooperación
No se ha obtenido 2 5 4.1 % 96
la cooperación
No respondieron 2 26 21.3 % 122
TOTAL 122 100 %

Las distribuciones de frecuencias pueden presentarse en forma de


histogramas, polígono de frecuencias, gráficas circulares, tablas.

2. Medidas de Tendencia Central: son puntos en una distribución, los valores


medios o centrales de ésta y ayudan a ubicarla dentro de la escala de medición. Las
principales medidas son:

 Moda.- es la categoría o puntuación que ocurre con mayor frecuencia.


Utiliza cualquier nivel de medición.

 Mediana.- es el valor que divide a la distribución por la mitad. La mitad de


los casos caen por debajo de la mediana y la otra mitad encima de la
mediana. Niveles de medición: ordinal, intervalos y razón.

 Media.- es el promedio aritmético de una distribución. Es una medida


aplicable a mediciones por intervalos o de razón.

3. Medidas de Variabilidad: indican la dispersión de los datos en la escala de


medición. El nivel de medición son los intervalos, designan distancias en un número
de unidades de escala de medición. Las medidas de variabilidad más utilizadas son:

 Rango.- llamado también recorrido, es la diferencia entre la puntuación


mayor y la puntuación menor e indica el número de unidades en la escala de
medición necesarios para incluir valores máximo y mínimo. Mientras más
grande sea el rango, mayor es la dispersión de los datos.
 Desviación estándar.- es el promedio de la desviación de las puntuaciones
respecto a la media. Se utiliza con variables medidas por intervalo o razón.

 Varianza.- es la desviación estándar elevada al cuadrado.

4. Asimetría y Curtosis: la asimetría es una estadística necesaria para conocer cuánto


se parece la distribución calculada con respecto a una distribución teórica llamada
curva normal. La curtosis es un indicador de lo plana o picuda que es una curva. El
nivel de medición en ambas es por intervalos.

5. Puntuaciones Z: son transformaciones que se pueden hacer a los valores o las


puntuaciones obtenidas, con el propósito de analizar su distancia respecto a la
media, en unidades de desviación estándar. Su nivel de medición es por intervalos.

6. Razones y tasas: una razón es la relación entre dos categorías. Una tasa es la
relación entre el número de casos, frecuencias o eventos de una categoría y el
número total de observaciones, multiplicada por un múltiplo de 10, 100 ó 1000.

ESTADÍSTICA INFERENCIAL

El propósito de la investigación va más allá de describir las distribuciones de las


variables: se pretende generalizar los resultados obtenidos en la muestra a la población o al
universo. A las estadísticas de la población o al universo se le conoce como “parámetros”.
Los parámetros no son calculados, porque no se recolectan datos de toda la población, pero
pueden ser inferidos, de ahí el nombre de estadística inferencial. En este tipo de estadística
pueden realizarse dos tipos de análisis: los análisis paramétricos y los no paramétricos.
Cada uno posee sus características y presuposiciones que lo sustentan. En una misma
investigación puede llevarse a cabo análisis paramétricos para unas variables y análisis no
paramétricos para otras.
1. PRUEBAS PARAMÉTRICAS

1. Prueba Z: son puntuaciones que se pueden hacer a los valores y a las puntuaciones
obtenidas, con el propósito de analizar sus distancias respecto a la media, en
unidades de desviación estándar.

2. Prueba t: es una prueba estadística para evaluar si dos grupos difieren entre sí de
manera significativa respecto a sus medias. La hipótesis es de la diferencia entre
grupos. La hipótesis de investigación propone que los grupos difieren
significativamente entre sí y la hipótesis nula propone que los grupos no difieren
significativamente. La comparación se realiza sobre una variable, si hay diferentes
variables, se efectuarán varias pruebas t. El nivel de medición es razón o por
intervalos. El tamaño de la muestra es <30.

La prueba t puede ser para casos independientes y para casos dependientes.

⇒ CASO I para muestras independientes:


Si las observaciones de una muestra no están relacionadas en ninguna forma
con las observaciones de la otra.
⇒ CASO II para muestras dependientes
Si las observaciones se muestran por pares y que cada observación es una
muestra que está relacionada de alguna forma con observación en otra
muestra.

3. Diferencia de proporciones: es una prueba estadística para analizar si dos


proporciones difieren significativamente entre sí. La hipótesis es de diferencia entre
proporciones en dos grupos. La comparación se realiza sobre una variable. Si hay
varias se realizará una por cada variable. El nivel de medición es por intervalos o
razón, expresados en proporciones o porcentajes.
4. Análisis de varianza unidireccional (oneway): se utiliza para analizar si más de
dos grupos difieren significativamente entre sí en cuanto a sus medias y varianzas.
La prueba t se utiliza para dos grupos y el análisis de varianza unidireccional se
utiliza para tres, cuatro o más grupos. La hipótesis es de la diferencia de más de dos
grupos. La hipótesis de investigación propone que los grupos difieren
significativamente entre sí y la nula propone que los grupos no difieren
significativamente. Las variables que se requieren son una dependiente y una
independiente. El nivel de medición para la VI es categórica y para la VD es por
razón o intervalos. El análisis de produce un valor conocido como prueba F o razón
F.

5. Análisis de Varianza Factorial (ANOVA): prueba estadística para evaluar el


efecto de dos o más variables independientes sobre una dependiente responde a
esquemas de tipo:

X1

X2 Y

X3

Este estadístico es una extensión del análisis de varianza unidireccional,


solamente que incluye más de una variable independiente. Evalúa los efectos por
separado de cada variable independiente y los efectos conjuntos de dos o más
variables independientes. El nivel de medición de la variable dependiente (criterio)
debe estar medida en un nivel por intervalos o razón, y las variables independientes
(factores) pueden estar en cualquier nivel de medición, pero expresadas de manera
categórica.

6. Análisis de Covarianza (ANCOVA): es una prueba estadística que analiza la


relación entre una variable dependiente y dos o más independientes, eliminando y
controlando el efecto de al menos una de las variables independientes.

7. Coeficiente de Correlación de Pearson: es una prueba estadística para analizar la


relación (fuerza y dirección) entre las variables medidas a un nivel de intervalos o
razón, con muestreo aleatorio, distribución normal o una muestra > 30 . Se
simboliza r. La hipótesis a probar se maneja de la siguiente manera “A mayor X,
mayor Y”, “A mayor X, menor Y”. El coeficiente de correlación se calcula a partir
de las puntuaciones obtenidas en una muestra en dos variables. Se relacionan las
puntuaciones obtenidas de una variable con las puntuaciones obtenidas de otra
variable, en los mismos sujetos.

8. Regresión Lineal: es un modelo matemático para estimar el efecto de una variable


sobre otra. Está asociado con la r de Pearson. Sus hipótesis son correlacionales o
causales. Sus variables son dos, una se considera como dependiente, para poder
hacerse debe tenerse un válido sustento teórico. El nivel de medición es por
intervalos o razón
2. PRUEBAS NO PARAMÉTICAS

3. Ji Cuadrada o X²: se usa cuando se tienen datos que se expresan en frecuencias o


que están en términos de porcentajes o proporciones y que pueden reducirse a
frecuencias. Se emplea también para evaluar hipótesis acerca de la relación entre
dos variables categóricas. Las hipótesis son correlacionales y se calcula por medio
de una tabla de contingencia o tabulación cruzada, que es un cuadro con dos
dimensiones y cada dimensión tiene una variable. A su vez, cada variable se
subdivide en dos o más categorías.
Ejemplo de tabla de contingencia

VOTO (variable)

CANDIDATO CANDIDATO
A B

Masculino
(categoría)
Sexo
Femenino
(variable)
(categoría)

4. Coeficientes de correlación e independencia por tabulaciones cruzadas: Existen


otros coeficientes para evaluar si las variables incluidas en la tabla de contingencia
o tabulación cruzada están correlacionadas (no todos utilizan frecuencias) como:
coeficiente de contingencia ø o C de Pearson [C] en donde su nivel de medición es
nominal y los cuadros pueden ser de cualquier tamaño; Fi [ø] con un nivel de
medición nominal y un cuadro de 2 x 2; la V de Cramer con cuadros mayores de 2 x
2 y su medición es nominal; Lambda [ʎb], sus cuadros de contingencia pueden ser
de cualquier tamaño y su nivel de medición nominal; Gamma [r] sus cuadros de
contingencia pueden ser de cualquier tamaño y su nivel de medición ordinal; en la
Tau-b de Kendall los cuadros de contingencia pueden ser de cualquier tamaño y su
nivel de medición es ordinal; en la D de Somers, el tamaño de los cuadros puede ser
de cualquier dimensión y su nivel de medición es ordinal y Eta, cuyo variable
independiente es nominal y dependiente por intervalos o razón, aquí se calculan
medias, los cuadros pueden ser de cualquier tamaño.
El tipo de escala puede ser nominal u ordinal. No hay una distribución normal.

5. Coeficientes de correlación por rangos ordenados de Spearman y Kendall: los


coeficientes de rho de Spearman, simbolizado como rs, y tau de Kendall,
simbolizados con t, son medidas de correlación para variables de un nivel de
medición ordinal, de tal modo que los individuos u objetos de la muestra pueden
ordenarse por rangos (jerarquías).

ANALISIS ESTADÍSTICO CUANTITATIVO DE DATOS

Actualmente los análisis estadísticos se llevan a cabo a través de programas


computacionales utilizando paquetes estadísticos, que están diseñados para el
análisis de datos. Cada paquete tiene sus características, instrucciones y formato. El
procedimiento para utilizar los datos, una vez que se tiene la matriz de datos, es
aplicar o crear un programa basándose en el manual. El programa incluye el llenado
de la matriz y las pruebas estadísticas seleccionadas. Después se corre el programa y
se obtienen los resultados, los cuales se interpretan. Los principales paquetes
estadísticos más conocidos son SPSS y Minitab.

Las pruebas más comunes:

1. SPSS (Statistical Package for the Social Sciences): fue desarrollado en la


Universidad de Chicago, es uno de los más difundidos. Contiene los análisis
estadísticos más comunes.

2. Minitab: es un paquete que goza de gran popularidad por su bajo costo. Incluye
un gran número de pruebas estadísticas y cuenta con un tutorial para aprender.

3. ESP (Paquete Económico de Software): útil para análisis estadísticos de


series cronológicas.
4. BMDP (Programa Biomédico Computarizado): desarrollado por la
Universidad de California en los Ángeles, aunque es utilizado en la biomédica,
contiene gran cantidad de análisis aplicables a las ciencias sociales.

5. OSIRIS (Organized Set of Integrated Routines for Investigation with


Statistics *Conjunto Organizado de Rutinas integradas para la Investigación
con Estadísticas*): fue desarrollado por el Instituto de Investigación Social de
la Universidad de Michigan.

6. SAS (Sistema de Análisis Estadístico): fue diseñado por la Universidad de


Carolina del Norte y es distribuido por SAS Institute

ANALISIS ESTADÍSTICO CUALITATIVO DE DATOS

Algunos de los nombres más utilizados en el análisis cualitativo son:

1. Atlas/ti: programa desarrollado en la Universidad Técnica de Berlín por


Thomas Muhr para codificar datos y construir teoría fundamentada. Introduce
los datos (que pueden ser textos, fotografías, segmentos de audio o vídeo,
diagramas, mapas y matrices) y el programa los codifica automáticamente, de
acuerdo con el esquema diseñado.

2. The Etnograph: identifica y recupera textos de documentos. La unidad básica


es el segmento, codifica unidades partiendo del esquema de categorización que
haya establecido el investigador. Los segmentos pueden ser anidados,
entrelazados y traslapados en varios niveles de profundidad.
3. NUD*IST: se utiliza para construir grandes bases de datos estructurados
jerárquicamente, que puede agregar documentos para ser analizados. Codifica
unidades de contenido, localiza texto por carácter, palabra, frase, tema o patrón
de palabras.

4. SONAR: codifica unidades de contenido de texto, localiza frases y adjunta a la


vista del texto comentarios o notas. Puede desplegar vistas del texto
simultáneamente. Vincula o agrupa categorías.

5. Decisión explorer: excelente programa de mapeo de categorías, el investigador


puede visualizar relaciones entre conceptos o categorías en diagramas. Decisión
explorer muestra las categorías y define sus vinculaciones, también las muestra
gráficamente.

6. Otros programas: HyperQual, HyperResearch, Qualpro y Qualog para fines


similares.

You might also like