Professional Documents
Culture Documents
METODOS ESTADISTICOS
PARA LA INVESTIGACION
TEMA:
CONCEPTOS BASICOS
(1 Y 2 Semana)
INTRODUCCION.
El curso Métodos Estadísticos para la Investigación es un curso teórico-
practico, correspondiente al X ciclo, de la Facultad de Derecho y Ciencias
Políticas- Escuela Profesional de Derecho.
• La asignatura tiene por objetivo adquirir los conocimientos básicos
sobre el método científico y la estadística en un mundo globalizado
actual y finalmente el alumno va a relacionar los elementos esenciales
del mundo de la investigación científica y la estadística.
• La asignatura trata de conceptos relacionados a las metodología
científica y la estadística. proporciona los conceptos y las herramientas
para analizar en el campo de la investigación.
• Los temas que se trataran incluyen conceptos fundamentales de
métodos científicos y la estadística para la utilización en la
investigación social, principalmente en el campo del Derecho.
¡La universidad para todos!
CONTENIDO
TIPOS DE ESTADISTICA
PARAMETROS
ESTADIGRAFOS
POBLACION Y MUESTRA
TIPOS DE VARIABLES
¡La universidad para todos!
¿Porqué la estadística es
importante?
¿Ventas
¿Qué variedad de mensuales?
cemento elegiré?, Pruebas de control de
¿porqué razón? calidad del cemento
¿Mejor resistencia?
Estudios
¿tasa de interés?
interlaboratorios
¿Fenómenos
ambientales?
La estadística
herramienta
fundamental
en la toma
de decisiones
¡La universidad para todos!
¿Qué es la estadística?
Definición
La Estadística es la Ciencia de la
Actualmente se aplica en todas las áreas del saber, por ejemplo en Sociología, Educación, Psicología,
Administración, Economía, Medicina, Ciencias Políticas, entre otras.
2) En Economía: para medir la evolución de los precios mediante números índice o para estudiar los hábitos de
los consumidores a través de encuestas de presupuestos familiares.
3) En Ciencias Políticas: para conocer las preferencias de los electores antes de una votación mediante sondeos
y así orientar las estrategias de los candidatos.
4) En Sociología: para estudiar las opiniones de los colectivos sociales sobre temas de actualidad.
5) En Psicología: para elaborar las escalas de los test y cuantificar aspectos del comportamiento humano (por
ejemplo los test que se aplican a los candidatos para un cargo en una empresa).
6) En Medicina: uno entre muchos usos de la estadística, es para determinar el estado de salud de la población.
En general en las Ciencias Sociales, la estadística se emplea para medir las relaciones entre variables y hacer
predicciones sobre ellas.
¡La universidad para todos!
SUBDIVISIONES DE LA ESTADÍSTICA
Estadística Descriptiva
Estadística Inferencial
50
Nº trabajadores que
Nº días
45
40
35
30 Industrial
X
iR X
i
( X ) 2
se ausentaron
25 Sistemas
X , S 0-4 4
20
15
Civil
Electrónica
n n 1 5-9 10
10-14 8
10
5
0
Ciclo 1 Ciclo2
¡La universidad para todos!
Inferencia Estadística
Inferir: Sacar una consecuencia de una cosa. Sacar consecuencia o deducir una cosa de otra.
La estadística, ciencia o rama de las Matemáticas que se ocupa de recoger datos, analizarlos y
organizarlos, y de realizar las predicciones que sobre esos datos puedan deducirse, tiene dos vertientes
básicas:
ESTADÍSTICA INFERENCIAL
Estadística Inferencial
Parte TODO
Cuando queremos hacer alguna
afirmación sobre más elementos de los
que vamos a medir
Azar - Probabilidad
MUESTRA POBLACIÓN
Aleatoria simple
«La selección de
Representativa una muestra
representativa y
Sistemática
probabilística
Probabilísticas permite hacer
inferencias a
Estratificada partir de la
información que
se posee»
Conglomerado
¡La universidad para todos!
METODO ESTADISTICO
Descriptiva Inferencial
ESTADÍSTICA
• Rama de la estadística
• Rama de la estadística que estudia el comportamiento y
que trata sobre la
propiedades de las muestras, y la posibilidad y límites de la
descripción y análisis
generalización de los resultados obtenidos a partir de aquellas a
estadístico de una
las poblaciones que representan.
población o muestra.
• Se basa en la probabilidad.
• Tiene como objetivo
• Comprende el conjunto de método estadísticos que permiten
caracterizar los datos, de
deducir (inferir) cómo se distribuye la población bajo estudio, a
manera gráfica o analítica,
partir de la información que proporciona una muestra
para resaltar las
representativa obtenida de dicha población.
propiedades de los
• El propósito principal de los métodos estadísticos es legitimar
elementos bajo estudio
generalizaciones sobre poblaciones usando datos de
muestras.
• Los métodos estadísticos inferenciales emplean el razonamiento
inductivo, es decir, razonan de lo particular a lo general.
¡La universidad para todos!
Estimación de Parámetros
Estadístico Parámetro
Estimación
Estimaciones Estimaciones de
puntuales Intervalo
¡La universidad para todos!
Estimación de Parámetros
1 Estimaciones Puntuales
- Sólo un valor numérico sirva para estimar el parámetro, es decir, asigna directamente al
parámetro el valor obtenido para el estadístico
- Constituye la inferencia más simple que se puede realizar: asignar al parámetro el valor del
estadístico que mejor sirva para estimarlo.
Estimación de Parámetros
Estimaciones de
2 Intervalos
20
¡La universidad para todos!
POBLACIÓN Y MUESTRAS
Sistemática Intencionada
Proporcion
Estratifi No
al Por cuota
cada Proporcion
al 21
Por conglomerado
¡La universidad para todos!
Estadística descriptiva
•Media
•Mediana
•Moda
•Rango Medio
¡La universidad para todos!
Media
•
suma de x
Media de la muestra: x barra =
número
Σx
x=
n
¡La universidad para todos!
Ejemplo
• Solución
Σx = 6 + 3 + 8 + 6 + 4 27
x= = = 5.4
n 5 5
¡La universidad para todos!
Media
2 3 4 5 6 7 8
x = 5.4
Mediana
Ejemplo
x=5
¡La universidad para todos!
Nota…
• El valor de d(x) es
la profundidad de la
mediana, NO el valor de
la mediana, x. Como se
muestra en el anterior
ejemplo, cuando n es
impar, la profundidad de
la mediana, d(x),
siempre es un entero. Sin
embargo, cuando n es
par, la profundidad de la
mediana, d(x), siempre
es la mitad de un número
entero.
¡La universidad para todos!
Ejemplo
• Encontrar la mediana de la muestra {9, 6, 7, 9, 10, 8}
1. Los datos, ordenados de manera creciente, son 6, 7, 8, 9, 9, 10
2. Profundidad de la mediana: d(x) = (n+1)/2 = (6+1)/2 = 3.5
3. Es decir, la mediana está a la mitad entre las porciones de datos
tercera y cuarta. Para encontrar el número situado a la mitad de dos
valores cualesquiera, se suman los dos valores y el resultado se
divide entre 2. En este caso, se suman el tercer valor (8) y el cuarto
valor (9), luego se divide entre 2. La mediana es 8.5. Observe que
de nuevo la mediana separa el conjunto de datos ordenados en dos
subconjuntos del mismo tamaño.
9
6 7 8 9 10
x = 8.5
¡La universidad para todos!
Moda
Rango Medio
Nota…
9
6 7 8 9 10
8 8.28.5 9
¡La universidad para todos!
Media
¡La universidad para todos!
Mediana
¡La universidad para todos!
Moda
¡La universidad para todos!
Rango Medio
¡La universidad para todos!
Ejercicios
1. Considere la muestra 2, 4, 7, 8, 9. Encuentre:
• La media
• La mediana
• La moda
• El rango medio
Ejercicios
• A los reclutas de una academia de policía se les solicitó
presentar un examen que mide la capacidad que tienen
para hacer ejercicio. Esta capacidad (medida en minutos) se
obtuvo para cada uno de los 20 reclutas:
25 27 30 33 30 32 30 34 30 27
26 25 29 31 31 32 34 32 33 30
Estadística descriptiva
Medidas de dispersión
Rango
• Es la diferencia
en valor entre las
porciones de datos de
mayor valor (Máx) y rango = Máx - Mín
de menor valor
(Mín):
¡La universidad para todos!
Ejemplo
• El rango de la muestra 3, 3, 5, 6, 8 es
• Máx – Mín =
8–3=5
3
3 5 6 8
Rango
Mín Máx
¡La universidad para todos!
Ejemplo
Σx = 5
x=
n
Datos x 6 3 8 5 3
Desviación x-x 1 -2 3 0 -2
¡La universidad para todos!
Varianza de la muestra
s2 = Σ(x – x)2
n-1
Ejercicio
• Paso 1. Calcula Σx
• Paso 2. Calcula x
• Paso 3. Calcula x – x
• Paso 4. Calcula Σ(x – x)2
• Paso 5. Calcula la varianza
¡La universidad para todos!
Cálculo de la varianza
6
x
x 6-5=1 (1) * (1) = 1
x x
2
3 n 3 - 5 = -2 (-2) * (-2) = 4 18
s 2
4.5
8 8-5=3 (3) * (3) = 9 n 1 4
5 5-5=0 (0) * (0) = 0
3 3 - 5 = -2 (-2) * (-2) = 4
25 5 x x 0 x x 2 18
¡La universidad para todos!
Desviación estándar
• La desviación
estándar de una
muestra, s, es la raíz
cuadrada positiva de s s 2
la varianza:
¡La universidad para todos!
Rango
¡La universidad para todos!
Varianza
¡La universidad para todos!
Desviación estándar
¡La universidad para todos!
Ejercicios
Ejercicios.
• A los reclutas de una academia de policía se les solicitó
presentar un examen que mide la capacidad que tienen para hacer
ejercicio. Esta capacidad (medida en minutos) se obtuvo para cada
uno de los 20 reclutas:
25 27 30 33 30 32 30 34 30 27
26 25 29 31 31 32 34 32 33 30
• Encuentre el rango
• Encuentre la varianza
• Encuentre la desviación estándar
• Use la gráfica de barras que obtuvo en el anterior ejercicio y trace
1) una recta que represente al rango y 2) una recta que empiece
en la media y cuya longitud represente el valor de la desviación
estándar
• Describa cómo están relacionados la distribución de los datos, el
rango y la desviación estándar.
¡La universidad para todos!
ESTADIGRAFO
Es cualquier función de datos empíricos que se usa con fines descriptivos o analíticos; son medidas de
resumen estadístico de un conjunto de datos. Por ejemplo, la media aritmética, la mediana, la
varianza, coeficiente de correlación…etc.
Podemos afirmar entonces que cuando se llevan a cabo investigaciones y sus resultados son
comprobados como ciertos, y los mismos, se generalizan o se aplican a la población, se da
entonces la inferencia estadística como un procedimiento mediante el cual, se estiman los
parámetros.
POBLACIÓN Y MUESTRAS
Sistemática Intencionada
Estratifi Proporcional
Por cuota
cada No
Proporcional
Por conglomerado
¡La universidad para todos!
POBLACION Y MUESTRA
• Población: Conjunto sobre el que se centra el objetivo de un análisis o investigación estadística. Esta
compuesta por unidades a las que se denomina elementos (individuos, items..).
• Dato: Manifestación de un fenómeno de forma cualitativa o numérica. Cuantificación del mundo real
en una representación cualitativa o numérica, comprensible para el individuo, y después
representable para el ordenador.
Fuentes de sesgo
• Las poblaciones objetivo y de estudio pueden diferir en
cuanto a las variables que estudiamos.
• El nivel económico en la población de estudio es mayor que
en la objetivo,...
• Los individuos que se eligen en la calle pueden ser de mayor
edad (mayor frecuencia de jubilados p.ej.)…
– En este caso, diremos que las muestras que se elijan estarán sesgadas.
Al tipo de sesgo debido a diferencias sistemáticas entre población
objetivo y población de estudio se denomina sesgo de selección.
• Hay otras fuentes de error/sesgo
– No respuesta a encuestas embarazosas
• Consumo de drogas, violencia doméstica, prácticas poco
éticas,…
– Mentir en las preguntas “delicadas”.
• ¿Cómo se hace?
Pídele que lance una moneda antes de responder y…
– Si sale cara que diga la “opción compremetida”
• (no tiene por qué avergonzarse, la culpa es de la moneda)
– Si sale cruz que diga la verdad
• (no tiene por qué avergonzarse, el encuestador no sabe si ha
salido cara o cruz)
Con respuesa
aleatorizada Diferencia entre los que han dicho sí y los que debían hacerl
40% No por que así lo indicaba la moneda
60% Sí
0,6 0,5
¡No son mitad y mitad! p
*
0,2 20%
El porcentaje estimado de ind. que tomó drogas 1 0,5
es:
Los que deben decir la verdad
¡La universidad para todos!
Técnicas de muestreo
• Cuando elegimos individuo de una población de estudio para formar muestras podemos encontrarnos en las siguientes
situaciones:
– Muestreos probabilistas
• Conocemos la probabilidad de que un individuo sea elegido para la muestra.
• Interesantes para usar estadística matemática con ellos.
– Muestreos no probabilistas
• No se conoce la probabilidad.
• Son muestreos que seguramente esconden sesgos.
• En principio no se pueden extrapolar los resultados a la población.
– A pesar de ello una buena parte de los estudios que se publican usan esta técnica. ¡Buff!
• En adelante vamos a tratar exclusivamente con muestreos con la menor posibilidad de sesgo (probabilistas): aleatorio simple,
sistemático, estratificado y por grupos.
• Se puede realizar partiendo de listas de individuos de la población, y eligiendo individuos aleatoriamente con
un ordenador.
• En general, las técnicas de inferencia estadística suponen que la muestra ha sido elegida usando m.a.s.,
aunque en realidad se use alguna de las que veremos a continuación.
¡La universidad para todos!
Muestreo sistemático
• Se tiene una lista de los individuos de la población de estudio. Si queremos una muestra de un tamaño dado, elegimos
individuos igualmente espaciados de la lista, donde el primero ha sido elegido al azar.
– Un caso real: Se eligió una de cada cinco casas para un estudio de salud pública en una ciudad donde las casas
se distribuyen en manzanas de cinco casas. Salieron con mucha frecuencia las de las esquinas, que reciben más
sol, están mejor ventiladas,…
Muestreo estratificado
• Se aplica cuando sabemos que hay ciertos factores (variables, subpoblaciones o estratos) que
pueden influir en el estudio y queremos asegurarnos de tener cierta cantidad mínima de individuos de
cada tipo:
– Hombres y mujeres,
– Jovenes, adultos y ancianos…
• Se realiza entonces una m.a.s. de los individuos de cada uno de los estratos.
• Al extrapolar los resultados a la población hay que tener en cuenta el tamaño relativo del estrato con
respecto al total de la población.
¡La universidad para todos!
Variables
• Una variable es una característica observable que varía entre los
diferentes individuos de una población. La información que
disponemos de cada individuo es resumida en variables.
• En los individuos de la población española, de uno a
otro es variable:
– El grupo sanguíneo
• {A, B, AB, O} Var. Cualitativa
– Su nivel de felicidad “declarado”
• {Deprimido, Ni fu ni fa, Muy Feliz} Var. Ordinal
– El número de hijos
• {0,1,2,3,...} Var. Numérica discreta
– La altura
• {1’62 ; 1’74; ...} Var. Numérica continua
67
¡La universidad para todos!
MUESTRAS PROBABILÍSTICAS
Es aquella que se rige por cualquier sistema que garantice el azar o la
aleatoriedad. Es aquella donde todos los elementos del universo tiene
una probabilidad conocida de ser extraídos y esta probabilidad es distinta
de cero o de uno.
MUESTRAS PROBABILÍSTICAS
Similar a la muestra aleatoria simple, sin embargo se diferencia
Muestra en que los elementos del universo van siendo extraídos de
2 acuerdo a un sistema, que en otras palabras no es más que una
sistemática
constante sumadora.
Muestra
Es aquella cuya estructura categorial replica las mismas
estratificada
características porcentuales del universo
Proporcional
Muestra
Es aquella donde no se aplica la estructura porcentual del universo, sino más
estratificada no bien se toma la misma cantidad de personas de cada estrato colectivo con el
Proporcional objetivo de posibilitar las comparaciones
¡La universidad para todos!
MUESTRAS PROBABILÍSTICAS
Muestra
estratificada Pasos para seleccionar una muestra estratificada proporcional
Proporcional
a) Definir la población de estudio
b) Determinar el tamaño de muestra requerido
c) Establecer los estratos o subgrupos
d) Determinar la fracción total de muestreo por estrato, dividiendo el
tamaño del estrato entre el tamaño de la población de estudio.
e) Multiplicar la fracción total de muestreo por estrato por el tamaño
de la muestra para obtener la cantidad de unidades de análisis de
cada estrato que se integrarán a la unidad muestral.
f) Selección y extracción de la muestra aplicando el procedimiento de
muestreo aleatorio simple.
Tipos de variables
• Cualitativas
Si sus valores (modalidades) no se pueden asociar naturalmente a un
número (no se pueden hacer operaciones algebraicas con ellos)
• Cuantitativas o Numéricas
Si sus valores son numéricos (tiene sentido hacer operaciones
algebraicas con ellos)
• Es buena idea codificar las variables como números para poder procesarlas con facilidad.
• Es conveniente asignar “etiquetas” a los valores de las variables para recordar qué significan los
códigos numéricos.
– Sexo (Cualit: Códigos arbitrarios)
• 1 = Hombre
• 2 = Mujer
– Raza (Cualit: Códigos arbitrarios)
• 1 = Blanca
• 2 = Negra,...
– Felicidad Ordinal: Respetar un orden al codificar.
• 1 = Muy feliz
• 2 = Bastante feliz
• 3 = No demasiado feliz
• Se pueden asignar códigos a respuestas especiales como
• 0 = No sabe
• 99 = No contesta...
• Estas situaciones deberán ser tenidas en cuentas en el análisis. Datos perdidos (‘missing data’)
• Aunque se codifiquen como números, debemos recordar siempre el verdadero tipo de las
variables y su significado cuando vayamos a usar programas de cálculo estadístico.
• No todo está permitido con cualquier tipo de variable.
• Los posibles valores de una variable suelen denominarse modalidades.
• Las modalidades pueden agruparse en clases (intervalos)
• Edades:
• Menos de 20 años, de 20 a 50 años, más de 50 años
• Hijos:
• Menos de 3 hijos, De 3 a 5, 6 o más hijos
¡La universidad para todos!
73
¡La universidad para todos!
* POBLACIÓN * POBLACIÓN
CONOCIDA «N» CONOCIDA «N»
d = diferencia que hay entre el estimador y el d = diferencia que hay entre el estimador y el
parámetro parámetro 75
¡La universidad para todos!
Estimación de
Parámetros
«En estadística se refiere a los valores o medidas que
¿Qué son caracterizan a una población como, por ejemplo, la
los media y la desviación típica de una población (…) Son
cantidades indeterminadas, constantes o fijas respecto
parámetros a una condición o situación, que caracterizan a un
? fenómeno en un momento dado que ocurre en una
población» (Sierra Bravo, 1991).
¿Qué son Se contrapone al parámetro porque es un valor que se
los obtiene a partir de los valores muéstrales. Se pueden
obtener media y varianzas muéstrales.
Estadístico
¿Qué
s? es la «En estadística es la operación mediante la cual se
trata de determinar el valor del parámetro, utilizando
Estimación datos incompletos procedentes de una muestra
? (Estadístico)
Estadístico Parámetro
Estimación
76
Estimaciones Estimaciones de
puntuales Intervalo
¡La universidad para todos!
Estimación de Parámetros
Estimaciones
1 Puntuales
Estimación de Parámetros
Estimaciones de
2 Intervalos
- Como el término lo sugiere, una estimación de intervalo es un rango o banda de valores dentro del cual
se dice que el parámetro está con un nivel de probabilidad establecido.
- Proporciona un intervalo, un rango de valores entre los que estará situado el parámetro con una cierta
probabilidad.
- La estimación puntual se utiliza poco, pues no tenemos datos suficientes para que nos indiquen el grado
de fiabilidad de dato muestral hemos tomado. Lo que tiene más sentido plantearse es cuál es la
probabilidad de que la media o proporción poblacional pertenezcan a un intervalo determinado.
- Para comprender el fundamento de las estimaciones de intervalo se requiere un dominio del concepto
de una distribución de muestreo, específicamente, la distribución de muestreo de la media (DMM)
- Dada una muestra, se puede calcular la Distribución de muestreo de la media donde, con cierta
seguridad, estará la media poblacional que se busca.
78
¡La universidad para todos!
DISTRIBUCIONES MUESTRALES
DISTRIBUCIÓN DISTRIBUCIÓN
MUESTRAL DE LA MUESTRAL DE LA
MEDIA POPORCIÓN
La distribución muestral es la
distribución de los resultados
que se presentan si en realidad
se seleccionaron todas las
79
muestras posibles
¡La universidad para todos!
DISTRIBUCIONES
MUESTRALES
Distribución Muestral de
1 la Media
- Es la distribución de todas las medias posibles que surgen si en
realidad se seleccionaran todas las muestras posibles de cierto
tamaño, es decir, es una distribución de frecuencias, no de valores
brutos, sino de medias de la muestra, donde cada media de la
muestra está basada en una muestra aleatoria de n valores brutos
2
1 2 3
La media muestral es imparcial porque la media de
todas las medias muéstrales posibles (de una muestra
dada con tamaño n) es igual a la media poblacional μ.
DISTRIBUCIONES
MUESTRALES
Distribución Muestral de
1 la Media
DISTRIBUCIONES
MUESTRALES
Distribución Muestral de
1 la Media
La prueba de Hipótesis
para la media
poblacional se realizará
haciendo uso de los
puntajes z de la curva
normal.
¡La universidad para todos!
DISTRIBUCIONES MUESTRALES
Distribución Muestral de la
2 Proporción
La distribución muestral de la
proporción generalmente sigue el
modelo de una distribución
probabilística para variables
cuantitativas discretas denominada
Distribución Binomial, sin embargo
cuando ocurre que n * P y n * Q son ≥
5, la distribución binomial puede
aproximarse al modelo de la curva
normal y en consecuencia realizar el
contraste de hipótesis para la
proporción poblacional a través de los
puntajes z de la curva normal.
¡La universidad para todos!
106,4 1169
56
¡La universidad para todos!
¡Gracias!