You are on page 1of 27

UNIDAD II:

ESTIMACIÓN
El principio del intervalo de confianza
Un intervalo de confianza tiene un límite inferior de confianza (LIC) y un límite superior de confianza
(LSC).

El nivel de confianza
Se simboliza con (1- α) x 100%, donde α es la proporción de las colas de la distribución que están

fuera del intervalo de confianza. La proporción de la cola superior de la distribución es 2 , y la

proporción de la cola inferior de la distribución es 2
Intervalos de confianza para la media poblacional. Muestras
grandes, (n >= 30)

La fórmula para estimar un intervalo de la media poblacional 𝜇 es ( xത ± Margen de Error )


σ
Donde el Margen de Error es Z ∗ σ xഥ ≫ σ xഥ = n
σ
Fórmula xത ± Z ∗ n

Si las muestras se toman sin reposición de una población finita de tamaño N debe emplearse el factor de
corrección por finitud y el intervalo será
σ N−n
Fórmula xത ± Z ∗ ∗
n N −1
Ejercicio 1.
Se desea estimar el salario promedio de los docentes que trabajan en una Universidad. Para ello se toma una muestra
aleatoria simple de tamaño de 625 docentes, siendo la media muestral de $950.00. Se sabe que la desviación típica
poblacional es de $125.00. Determine:
a) La estimación puntual del salario medio de los docentes de esa universidad. xത = $950.00
b) Los límites de confianza del 95% para estimar la verdadera media poblacional de los salarios de los docentes de esa
universidad e intérprete el resultado.
σ
Datos n = 625 docentes > 30 𝜇 = xത ± Z ∗ n 𝜇 = $950.00 ± 1.96 ∗ 5.00
0.95
n = 625 docentes IC = 95% = = 0.475
2
xത = $950.00 LS = $950.00 + 9.80 = 959.80
σ $125
σ = $125.00 = = 5.000
n 625 LI = $950.00 − 9.80 = 940.20

c) Los límites de confianza del 99% para estimar la media poblacional e interprete el resultado.
σ
Datos n = 625 docentes > 30 𝜇 = xത ± Z ∗ n 𝜇 = $950.00 ± 2.57 ∗ 5.00
0.99
n = 625 docentes IC = 99% = = 0.495
2
xത = $950.00 LS = $950.00 + 12.85 = 962.85
σ $125
σ = $125.00 = = 5.000
n 625 LI = $950.00 − 12.85 = 937.15
Z de una muestra (a)
La desviación estándar supuesta = 125

Error
estándar
de la
N Media media IC de 95%
625 950.00 5.00 (940.20, 959.80)

Z de una muestra (b)


La desviación estándar supuesta = 125

Error
estándar
de la
N Media media IC de 99%
625 950.00 5.00 (937.12, 962.88)
Ejercicio 2.
Una muestra de 50 observaciones de la estatura de estudiantes de secundaria, se tiene una media de 65 y una desviación
típica de 4.2. Se pide determinar los límites de confianza del 95%.

σ
Datos n = 50 observaciones > 30 𝜇 = xത ± Z ∗ 𝜇 = 65 ± 1.96 ∗ 0.594
0.95 n
n = 50 observaciones IC = 95% = = 0.475
2
xത = 65 LS = 65 + 1.164 = 66.16
σ 4.2
= = 0.594
σ = 4.2 n 50 LI = 65 − 1.164 = 63.84

Z de una muestra
RESPUESTA
Se tiene una estimación de confianza del La desviación estándar supuesta = 4.2
95% de que la estatura de los estudiantes
de secundaria entre 66.16 y 63.84 Error
estándar
de la
[ 63.84 ≤ μ ≤ 66.16 ] N Media media IC de 95%
50 65.000 0.594 (63.836, 66.164)
Estimación por intervalo de la media poblacional cuando la DESVIACIÓN
TÍPICA POBLACIONAL (σ) ES DESCONOCIDA, pero se conoce s y el
tamaño de la muestra es pequeña (n < 30)

Caundo se calcula un intervalo de confianza para la media poblacional, suele no contarse


con una estimación de la desviación estándar poblacional. En tales casos se usa la misma
muestra para estimar la media poblacional y la desviación típica poblacional. Esta situación
es el caso que se conoce como σ desconocida. Cuando se usa “s” para estimar σ, el margen
de error y la estimación por intervalo de la media poblacional se basan en una distribución
de probabilidad conocida como distribución t

La fórmula para estimar un intervalo de la media poblacional 𝜇 es ( xത ± Margen de Error )

s
Donde el Margen de Error es t ∗ s xഥ ≫ s xഥ = n

s
Fórmula xത ± t ∗ n
MINITAB
Ejercicio 1.
El ciclo medio de vida operativa de una muestra aleatoria de 10 focos es de 4,000 horas, con una desviación
estándar muestral de 200 horas. Se supone que el ciclo de vida de los focos en general tiene una distribución
aproximadamente normal. Estime el ciclo medio de vida operativa de la población de focos de la que fue tomada
esta muestra, aplicando un intervalo de confianza del 95%.

n = 10 focos < 30 σ
Datos (1.00 − 0.95) 𝜇 = xത ± Z ∗ 𝜇 = 4,000 ± 2.2622 ∗ 63.25
IC = 95% = = 0.025 n
2
n = 10 focos g.l = n – 1 = 10 – 1 = 9
xത = 4,000 LS = 4,000 + 143.07408 = 4,143.074
σ = 200 s 200 LI = 4,000 − 143.07408 = 3,856.926
= = 63.24555
n 10

RESPUESTA
T de una muestra Se tiene una estimación de confianza del
Error 95% de que el ciclo de vida de los focos
estándar esta entre 4,143.1 y 3,856.9 horas
de la
N Media Desv.Est. media IC de 95%
10 4000.0 200.0 63.2 (3856.9, 4143.1) [ 3,856.926 ≤ μ ≤ 4,143.074 ]
Ejercicio 2.
Se ha tomado una muestra aleatoria de 18 tabletas de cierto medicamento, siendo el peso medio de ellas de 50.15
miligramos, con una desviación típica de 0.4 miligramos. Obtenga un intervalo de confianza del 99% para estimar
el verdadero promedio de este tipo de tabletas e interprete el resultado, sabiendo que los datos se comportan
normalmente.

n = 18 tabletas < 30 σ
Datos (1.00 − 0.99) 𝜇 = xത ± Z ∗ 𝜇 = 50.15 ± 2.8982 ∗ 0.094
IC = 99% = = 0.005 n
2
n = 18 tabletas g.l = n – 1 = 18 – 1 = 17
xത = 50.15 LS = 50.15 + 0.272 = 50.422
σ = 0.4 s 0.4 LI = 50.15 − 0.272= 49.878
= = 0.094
n 18

RESPUESTA
T de una muestra Se tiene una estimación de confianza del
Error 99% de las tabletas de cierto
estándar medicamento tienes un peso de entre
de la 50.422 y 49.878 miligramos
N Media Desv.Est. media IC de 99%
18 50.1500 0.4000 0.0943 (49.8768, 50.4232) [50.422 ≤ μ ≤ 49.878]
Ejercicio 3.
Las primeras semanas del año 2011 fueron buenas para el mercado de acciones. En una muestra de 25 fondos
abiertos se encontraron las siguientes ganancias obtenidas desde principio del año al 24 de enero de 2011 (ver
cuadro de datos). a) ¿Cuál es la estimación puntual de la media poblacional de las ganancias en fondos abiertos
desde el principio del año hasta esa fecha? 3.348, b) Puesto que la población tiene una distribución normal, calcule
un intervalo de confianza de 95% para la media poblacional de las ganancias en fondos abiertos desde el
principio del año hasta la fecha.

n = 18 tabletas < 30 σ
Datos (1.00 − 0.95) 𝜇 = xത ± Z ∗ n 𝜇 = 3.348 ± 2.0639 ∗ 0.457
IC = 95% = = 0.025
2
n = 25 fondos g.l = n – 1 = 25 – 1 = 24
xത = 3.348 LS = 3.348 + 0.944 = 4.292
σ = 2.287 s 2.287 LI = 3.348 − 0.944= 2.404
= = 0.457
n 25

RESPUESTA
Se tiene una estimación de confianza del
95% de que las ganancias de los fondos
están entre 4.292 y 2.404.
[ 4.292 ≤ μ ≤ 2.404 ]
MINITAB

T de una muestra: DATOS


Error
estándar
de la
Variable N Media Desv.Est. media IC de 95%
Estadísticos descriptivos: DATOS DATOS 25 3.348 2.287 0.457 (2.404, 4.292)
Conteo
Variable total Media Desv.Est.
DATOS 25 3.348 2.287
Estimación por intervalo de la proporción poblacional

En general para estimar el parámetro “P” usaremos la siguiente relación p ± Z ∗ 𝝈𝒑

Donde Z es el valor critico correspondiente a un determinado coeficiente de confianza y 1-α es el


coeficiente de confianza.
p ∗ (1 − p)
𝝈𝒑 =
n

p ∗ (1 − p)
Fórmula p ± Z ∗ n
Ejercicio 1.
En una encuesta de opinión que se pasó en San Salvador a una muestra aleatoria de 800 ´personas, 720 favorecen
los proyectos prometidos por el actual alcalde la ciudad, para mejorar las condiciones de seguridad y convivencia
de la población.

a) Determinar la estimación puntual de la proporción de personas de San Salvador que favorecen los proyectos
x 720
prometidos. p = n = 800 = 0.9

b) Determine un intervalo de confianza del 95% para estimar la verdadera proporción de personas de San
Salvador que favorecen los proyectos prometidos.

n = 800 personas > 30 p ∗ (1 − p) 𝜇 = 0.9 ± 1.96 ∗ 0.010606602


p±Z∗
Datos IC = 95% =
0.95
= 0.475 n
2
n = 800 personas
LS = 0.9 + 0.02078893992 = 0.92078893992
pത = 0.9
p ∗ (1 − p) 0.9 ∗ (1 − 0.9) LI = 0.9 − 0.02078893992 = 0.87921106008
𝝈𝒑 = = = 0.010606602
n 800
[0.87921106008 ≤ π ≤ 0.92078893992]
RESPUESTA
Se tiene una confianza de 99% la verdadera proporción de las personas que favorecen los proyectos prometidos por el actual alcalde de San
Salvador están entre 0.87921106008 y 0.92078893992
Ejercicio 1.
En una encuesta de opinión que se pasó en San Salvador a una muestra aleatoria de 800 ´personas, 720 favorecen
los proyectos prometidos por el actual alcalde la ciudad, para mejorar las condiciones de seguridad y convivencia
de la población.

c) Determine un intervalo de confianza del 99% para estimar el parámetro “P”.

n = 800 personas > 30 p ∗ (1 − p) 𝜇 = 0.9 ± 2.57 ∗ 0.010606602


p±Z∗
Datos IC = 99% =
0.99
= 0.495 n
2
n = 800 personas
LS = 0.9 + 0.02725896714 = 0.92725896714
pത = 0.9
LI = 0.9 − 0.02725896714 = 0.87274103286
p ∗ (1 − p) 0.9 ∗ (1 − 0.9)
𝝈𝒑 = = = 0.010606602
n 800
[0.87274103286 ≤ π ≤ 0.92725896714]

RESPUESTA
Se tiene una confianza de 99% la verdadera proporción de las personas que favorecen los proyectos prometidos por el actual
alcalde de San Salvador están entre 0.87274103286 y 0.92725896714
MINITAB
b) Determine un intervalo de confianza del 95% c) Determine un intervalo de confianza del
para estimar la verdadera proporción de personas 99% para estimar el parámetro “P”.
de San Salvador que favorecen los proyectos
prometidos.

Z de una muestra Z de una muestra


La desviación estándar supuesta = 0.3 La desviación estándar supuesta = 0.3
Error
estándar Error
de la estándar
N Media media IC de 95% de la
800 0.9000 0.0106 (0.8792, 0.9208) N Media media IC de 99%
800 0.9000 0.0106 (0.8727, 0.9273)
Estimación de diferencia entre dos medias
muéstrales

Se utiliza para comparar entre si dos poblaciones, se pueden utilizar dos métodos de muestreo:
1) Muestreo Pareado (dependiente)
2) Muestreo Independiente.

Se entiende por muestreo pareado, llamado también


de pares coincidentes, al procedimiento en el cual se
hacen coincidir varias parejas de observaciones con la
mayor exactitud posible en las características de
MUESTREO PAREADO interés. Los dos conjuntos de observaciones sólo difieren
en un aspecto o “tratamiento”
(DEPENDIENTE) Muestras pareadas. Se llaman pares coincidentes a dos
observaciones que son lo más parecidas posibles entre
sí. Sólo difieren en un aspecto importante.
Intervalo de confianza para D   1  2  muestras dependientes, observaciones en pares.
Consideraciones:
• En este caso las muestras no son independientes y las varianzas de las dos poblaciones no son necesariamente
iguales.
• Se comparará cada dato de la primera muestra con el dato de la segunda muestra que procede de la misma
fuente
• Los datos, uno de cada conjunto, que provienen de la misma fuente se llaman datos pareados. Estas parejas de
datos se comparan utilizando la diferencia entre sus valores numéricos; estas diferencias se denotan por d1, d2,
d3,…, dn y se denominan diferencias pareadas.

Intervalo de confianza esta dado por: Donde


d: es la media de las diferencias de cada dato pareado
Si n es menor 30 σ 𝑑𝑖
𝑑=
𝑛
Sd Sd Sd: es la desviación estándar observada para cada di
IC = d − t ἀ/2 . < µ < d + t ἀ/2 .
n n
σ 𝑑𝑖 2 − 𝑛 (𝑑)2 σ 𝑑𝑖 2 − (σ 𝑑)2 /𝑛
Si n es mayor o igual a 30 𝑆𝑑 = =
𝑛−1 𝑛−1

IC = d − z .
Sd
< µ< d+z.
Sd µd: es la diferencia entre las medias poblacionales
n n
Ejercicio 1.
Supongamos, por ejemplo, que tenemos las puntuaciones de un test realizado por 10 empleados antes y después de
haber recibido formación en el puesto de trabajo. Las puntuaciones se muestran en el siguiente cuadro. Supongamos
además que queremos utilizar las diferencias entre las puntuaciones anteriores y posteriores de estos 10 empleados
para estimar la diferencia media de puntuaciones de todos los empleados a quienes pudiera impartirse la misma
formación. Considere un nivel de confianza del 90%.

Empleados Antes Despues Datos Prueba T e IC de dos muestras: Antes, Después


1 9 9.2 n = 10 empleados T de dos muestras para Antes vs. Despues
2 7.3 8.2
Error
3 6.7 8.5 n = 18 tabletas < 30 estándar
4 5.3 4.9 (1.00 − 0.95) de la
IC = 95% = = 0.025 N Media Desv.Est. media
5 8.7 8.9 2
g.l = n – 1 = 10 – 1 = 9 Antes 10 7.40 1.11 0.35
6 6.3 5.8 Despues 10 7.90 1.46 0.46
7 7.9 8.2
8 7.3 7.8
9 8 9.5
10 7.5 8
TOTAL 74 79 𝑆𝑑 𝑆𝑑
Media 7.4 7.9 𝐼𝐶 = 𝑑 − 𝑡ἀ/2 . < µ < 𝑑 + 𝑡ἀ/2 .
𝑛 𝑛
Ejercicio 1.

Antes Despues
σ di
74 σ di 79
d= = = 7.40 81.0 84.6 d= = = 7.90
n 10 n 10
53.3 67.2
44.9 72.3
(σ 𝑑)2 28.1 24.0 (σ 𝑑)2
σ 𝑑𝑖 2 − σ 𝑑𝑖 2 −
𝑛 𝑛
Sd = 75.7 79.2 Sd =
𝑛−1 𝑛−1
39.7 33.6
2 62.4 67.2 2
558.6 − 74
10 643.3 − 79
10
Sd =
10−1
= 1.11 53.3 60.8 Sd =
10−1
= 1.46
64.0 90.3
56.3 64.0
Sd 1.11 558.6 643.3 Sd 1.46
= = 0.35 = = 0.46
n 10 ∑di^2 = n 10

S
IS = d + t95% . d S
n IS = d + t95% . d
n
IS = 7.40 + 2.2622 ∗ 0.35 = 8.192 8.192 - 8.941 = - 0.749
6.608 - 6.859 = - 0.251 IS = 7.90 + 2.2622 ∗ 0.46 = 8.941
S
IL = d − t95% . d S
n IL = d − t95% . d
n
IL = 7.40 − 2.2622 ∗ 0.35 = 6.608
IL = 7.90 − 2.2622 ∗ 0.46 = 6.859
MUESTREO PAREADO
(INDEPENDIENTE)
A diferencia de las muestras pareadas, las muestras independientes no tienen por qué ser del mismo tamaño. Además, el
investigador puede enfrentarse a varios conjuntos de condiciones diferentes en el proceso de elegir muestras independientes.
Se pueden presentar varios casos entre estos analizaremos:

• Muestras independientes. Varianzas conocidas. (para n > 30 y para n ≤ 30)


• Muestras independientes. Varianzas desconocidas que se suponen iguales. (para n > 30 y para n ≤ 30)
• Muestras independientes. Varianzas desconocidas y no se suponen iguales. (para n > 30 y para n ≤ 30)
Caso 1.
Cuando se conocen las desviaciones típicas de las dos poblaciones (σ1 y σ2) y, n1 y n2 son > 30.

 x2  x2
 x1  x2   Z . x  x ; donde :  x  x  1
 2
1 2 1 2
n1 n2

Caso 2.
Cuando no se conoce las desviaciones típicas de las dos poblaciones (σ1 y σ2) pero se conocen las desviaciones
típicas muéstrales (s1 y s2) y además n1 y n2 son mayores o iguales de 30.

sx21 sx22
 x1  x2   Z .S x  x ; donde : S x  x  
1 2 1 2
n1 n2
Caso 3.
Cuando no se conoce las desviaciones típicas de las dos poblaciones (σ1 y σ2) pero se conocen las desviaciones
típicas muéstrales (s1 y s2) y además n1 y n2 son menores de 30.

a) S1 y S2 sin corregir:

sx21 sx22
 x1  x2   t.S x  x ; donde : S x  x   ; g.l.  n1  n2  2
1 2 1 2
n1 n2

b) S1 y S2 sin corregir y además  12   22

(n1  1).s12  (n2  1).s22 1 1


 x1  x2   t.S x  x ; donde : S x  x  .  ; g.l.  n1  n2  2
1 2 1 2
n1  n2  2 n1 n2
Caso 4.
Distribución de diferencias entre dos medias muéstrales si  12   22

Cuando no se conoce las desviaciones típicas de las dos poblaciones (σ1 y σ2) pero se supone que  12   22 y se
conocen las desviaciones típicas muéstrales (s1 y s2) y, además n1 y n2 son menores a 30.
Se supone que las poblaciones tienen una distribución aproximadamente normal.

Caso 4.1.
Cuando el ejercicio suministra información para cada una de las observaciones muéstrales, es preferible calcular una
varianza común para las dos muestras:

s2 s2
sx  y    ( x1  x2 )  t.sx  y
n1 n2

s2 
  xi  x     yi  y 
2 2

; ó; s 
2

  xi
2
 n1 . x 2

  
  yi
2
 n2 . y 2

n1  n2  2 n1  n2  2
Caso 4.
Distribución de diferencias entre dos medias muéstrales si  12   22

Cuando no se conoce las desviaciones típicas de las dos poblaciones (σ1 y σ2) pero se supone que  12   22 y se
conocen las desviaciones típicas muéstrales (s1 y s2) y, además n1 y n2 son menores a 30.
Se supone que las poblaciones tienen una distribución aproximadamente normal.

Caso 4.2.
Cuando las dos varianzas muéstrales se dan ya calculadas, éstas supuestamente, están corregidas.

 n1  1 .sx2   n2  1 s y2 1 1
 x  y   t. .  ; g.l.  n1  n2  2
n1  n2  2 n1 n2

  xi  x   xi2  n1.x 2   yi  y    n2 . y 2
2 2 2
y
sx2   ; y ; s y2   i

n1  1 n1  1 n2  1 n2  1
Caso 5.
Intervalos de confianza para la diferencia entre medias de dos distribuciones normales, varianzas poblacionales
desconocidas y desiguales. ( 12   22 ) ó no se puede comprobar su igualdad

Se conocen las desviaciones típicas muéstrales ( s x y s y ) y además n1 y n2 son menores o iguales a 30

2
2
s s 2

 ( s 2
/ n )  ( s 2

2 / n2 ) 
x  y  x  y   t.  ; con : g.l.    2  2
x y 1 1

n1 n2 ( s1 / n1 ) 2 ( s22 / n2 ) 2

(n1  1) (n2  1)

You might also like