You are on page 1of 43

Verónica Bittner Schmidt

1) Estimar el valor de un parámetro en base a lo observado en


la muestra.

2) Contrastar el valor supuesto de uno o más parámetros


utilizando pruebas de hipótesis.
ESTIMACIÓN
• Conocer conceptos relacionados con la
construcción de intervalos de confianza.

• Construir intervalos de confianza.

• Interpretar un intervalo de confianza.


Entre las personas con un nivel de escolaridad
mayor a 12 años el % de normopeso está
entre un 77% y un 86% (valores
redondeados):

¿Cómo pudo llegarse a esta conclusión?

¿Por qué no entregaron un porcentaje puntual?


Deseamos conocer (estimar) el peso promedio de la
población de mujeres entre 20 y 25 años en
Concepción.

¿Qué pasos seguiremos?


Extraer m.a. de Calcular el peso promedio
200 mujeres de la muestra

x
x i
 63kg.
n

Informar que el peso promedio de


la población es de 63 kg.
μ = 63

Generalizar a Podemos
La población
Informar que el peso promedio de
la población está entre 60 y 66 kg.
60    66
El proceso anterior es un proceso de

ESTIMACIÓN

Existen dos tipos de estimaciones:

a) Estimación puntual.

b) Estimación por intervalos


Pérez, B., Rivera, L., Atienzo, E., De Castro, F.,Leyva, A. & Chávez, R. (2007). Prevalencia y factores asociados a la ideación e
intento suicida en adolescentes de educación media superior de la República mexicana. Salud Pública de México, 52(4), 324-333.
Extraído el 14 de abril desde http://bvs.insp.mx/rsp/articulos/articulo.php?id=002484.
Es un valor puntual (concreto) que se utiliza
para estimar un parámetro.

En el caso anterior: 63 kg.

En la Encuesta Nacional de Salud del año


2004, aplicada a 3.619 personas mayores
de 17 años, se registró la siguiente
información:
• Hombres: 31,6%

• Mujeres: 21,5%
 x1  60,9



x2  62,3
 

x3  63,8

 



μ = 63 kg.
xk  64,5

Un intervalo de confianza corresponde a dos
valores entre los cuales se encontrará el
parámetro, con cierta probabilidad.

Ej:
Con un 95% de confianza se determinó que entre el
68% y el 86% de los participantes en un estudio
sobre el tratamiento de la lumbalgia aguda con
ausentismo laboral, retornaron a sus trabajos
dentro del mes.
a) Si decimos “Pedro debe tener unos 30
años”, estamos haciendo una
ESTIMACIÓN PUNTUAL.

b) Si decimos: “Pedro debe tener entre 27


y 33 años”, estamos haciendo una
ESTIMACIÓN POR INTERVALO.

PERO ¿qué tan seguros estamos al afirmar


esto? Puede ser un 95%
Afirmando:
“Pedro debe tener entre 10 y 80 años”……

¡100% de seguridad!

Sin embargo:
¿Es útil este intervalo de confianza?, ¿nos entrega información
exacta?
• Los intervalos de confianza se construyen a partir
de fórmulas derivadas del cálculo de
probabilidades y con una distribución específica
para cada caso.

• Los niveles de confianza clásicos son 95% y 99%.

• Si utilizamos un nivel de confianza del 95%,


existirá una probabilidad de 5%, de que nuestro
intervalo sea incorrecto. Este 5% es el
denominado α, que más adelante llamaremos
“nivel de significación”.
􀁘- 20 investigadores buscan
el verdadero valor de μ.

􀁘- Cada uno obtiene un


Intervalo de confianza para
la media poblacional.

􀁘- El 95% de los
investigadores acierta;
el 5% obtiene un
intervalo incorrecto.

􀁘- Problema:
ninguno de ellos sabe
si ha acertado o no.
Se desea estimar el nivel medio de colesterol en
mujeres chilenas entre 50 y 55 años. Se extrae
una m.a. de 123 mujeres y se registra un nivel
medio de colesterol de 176,7 mg/Dl. Se sabe que
la desviación estándar del colesterol es
σ = 45 mg/Dl.
x  176,7 mg / Dl.
  45mg / Dl.
n  123
¿Entre qué valores estará el colesterol promedio de
esta población?
x  z 2 * 
n
   x  z 2 * 
n

Donde:
x media muestral

σ desviación estándar poblacional

z 2 valor que depende del nivel de confianza elegido


y que se encuentra en una tabla normal.
1,96 x45 1,96 x45
176,7     176,7 
123 123
176,7 – 7,95 ≤ μ ≤ 176,7 + 7,95

168,75 ≤ μ ≤ 184,65

Tenemos una confianza del 95% en que este


intervalo contenga la media poblacional y existe
un 5% de probabilidad de que a partir de la
muestra utilizada, el intervalo no incluya el
verdadero valor de μ.
176,7 – 7,95 ≤ μ ≤ 176,7 + 7,95

176,7 mg/Dl es la estimación puntual para el


nivel
de colesterol medio en mujeres entre
50 y 55 años.

7,95 es el error de muestreo, es decir, es


la máxima diferencia que podremos
encontrar entre el estadígrafo encontrado
en la muestra y el verdadero parámetro.
En el ejemplo, la verdadera media diferirá
máximo en 7,95 mg/Dl del valor observado
en la muestra 176 mg/Dl.

Pero, podemos afirmar esto sólo con un


95% de confianza.
Si se conoce la varianza poblacional y/o el
tamaño de la muestra es mayor o igual a
30, se puede utilizar la distribución normal
para construir un intervalo de confianza
para la media aritmética.

Si no se conoce la varianza poblacional y el


tamaño muestral es menor a 30, se debe
utilizar la distribución t de Student.
x  t 2; * s
n
   x  t 2; * s
n

Donde:

 corresponden a los “grados de libertad”

y se calculan como:
  n 1
Se seleccionan al azar 10 matraces de suero
fisiológico marca XX. El contenido promedio de
éstos es de 478 ml. con una desviación estándar
de 9 ml. El contenido neto indicado en cada bolsa
es de 500 ml. Si el contenido de estos matraces
sigue una distribución normal, construir un
intervalo de confianza al 95% para el contenido
medio poblacional.
¿Usamos la distribución normal o la t de Student?

¿Cuál es el requisito para utilizarla?

¿Qué significa esto?

¿Cuál es el resultado?, interpretar cada valor.


¿Y si para nuestra investigación es importante no
tener un error de muestreo mayor a 5 mg/Dl?

La fórmula para el error de muestreo es:


z 2 * n

¿Cómo logramos que este error disminuya?


1,96 x 45
z 2  
n
  7,95
123

1,96 x 45
z 2  
n
  6,24
200

1,96 x45
z 2  
n
  5,58
250
 Z 
2

 
n   2

 e 
 
¿Qué problema encontramos para utilizar esta fórmula?
a) Buscar el valor de σ en estudios
anteriores.

b) Realizar una muestra piloto (n ≥ 30).

c) Estimar σ como σ ≈ R
4
Si el muestreo se realiza sin reposición en una
población finita (n/N ≥ 0,05), el tamaño muestral
anterior debe multiplicarse por un factor de
corrección:

n
n' 
n
1
N
2
 1,96 x 45 
n   311,17  312
 5 
Se desea estimar el APGAR promedio a los 5 minutos de vida de
niños que concurren al Hospital Regional por infección
respiratoria aguda (IRA) durante los tres primeros meses de
vida.

Esta estimación se realizará con un ……% de confianza y un


error de muestreo de…..
1) Es equivalente a una prueba de hipótesis.

2) Es un indicador de la confianza que podemos tener en que


ese parámetro toma en la población aproximadamente el
valor obternido en la muestra.
Hipótesis: La edad promedio en que los jóvenes
chilenos (hombres) inician su actividad sexual es
de 17 años.
Ho: μ = 17

Intervalo de confianza para la media poblacional:

Caso A: 16 ≤ μ ≤ 21

Caso B: 18 ≤ μ ≤ 23
pˆ qˆ pˆ qˆ
pˆ  Z  P  pˆ  Z
2 n 2 n
Clasificación Número Error Intervalo
del de Estándar de confianza
politraumatis sujetos (%) al 95 %
mo.
A-Leves 332 66% +-2% 62%-70%

B-Moderados 126 25% +-2% 21%-29%

C-Graves 44 9% +-1% 8-10%


Si hubiéramos planteado la hipótesis de que el 7% de los
involucrados en un accidente de tránsito en esta región
presenta un diagnóstico grave.

Ho : P = 0,07

¿Qué podemos concluir a partir del intervalo de confianza


anterior?
Se quiere estimar la prevalencia de la hipertensión
arterial en el embarazo.
¿Cuántas embarazadas tenemos que observar para
estimar esta prevalencia con un error no superior
al 3% y un nivel de confianza del 95%?

2
1,96
n  1.067,11  1.068
4  0,032

¿Cómo podemos disminuir este tamaño muestral?


a) Si tenemos alguna idea del valor de p̂
2
ˆ qˆ
Z p
n 2
2
e
b) Si no conocemos el valor de p̂
2
Z
n 2
2
4e
Se desea estimar el porcentaje de niños de 4 años de la ciudad
de Concepción que presenten una proyección anterior de
hombro. Esta estimación se realizará con un ……% de
confianza y un error de muestreo de…..

You might also like