Professional Documents
Culture Documents
UNIDAD VI
MÉTODOS DE ESTIMACIÓN
Cualquier inferencia que se haga sobre la población tendrá que basarse en estadísticos
maestrales y la elección de estos estadísticos dependerá de cual sea el parámetro de
interés de la población, en donde el verdadero parámetro será desconocido y el objetivo
será estimar su valor.
2
Un estimador puntual de un parámetro poblacional es una función de la muestra que da
como resultado un único valor y la correspondiente realización se llama estimación
puntual.
10 16 5 10 12 8 4 6 5 4
n 10 X i 80 X 2
i 782
X
X i
80
8
n 10
La estimación puntual de la variancia poblacional es:
X - n . X
2 2
i 782 10.64
S 2
15,78
n -1 9
La estimación puntual del desvío estándar poblacional es:
S S2 15,78 3,97
Finalmente, en la muestra, el número de valores para los cuales la ganancia por acción
es mayor que 8,5 son cuatro. Por lo tanto, la estimación puntual de la proporción
poblacional es:
Xi 4
p 0,4
n 10
3
Para la estimación específica, la elección del estimador puntual se ha hecho en base a
consideraciones intuitivas. En casi todos los casos, la media, variancia, desviación
estándar y proporción muestral son estimadores puntuales satisfactorios para los
correspondientes valores poblacionales. Sin embargo, antes de emplear algún estadístico
de muestra como estimador puntual, se debe comprobar si tiene ciertas propiedades
asociadas con los buenos estimadores puntuales.
E( X ) = E( S 2 ) = E( p ) = p
4
poblacional, por lo tanto, la desviación típica muestral no es un estimador
insesgado de la desviación típica poblacional.
5
La eficiencia relativa de un estimador respecto al otro es el cociente de sus
variancias:
Var( 2 )
Eficiencia relativa =
Var( 1 )
6
Una estimación por intervalos especifica el rango o el intervalo dentro del cual
posiblemente se encuentre el parámetro desconocido y tal intervalo con frecuencia va
acompañado de una afirmación sobre el nivel de confianza que se da en su exactitud.
Sea el parámetro a estimar y supongamos que hemos extraído una muestra aleatoria
y que basándonos en la información muestral es posible encontrar dos variables
aleatorias A y B, siendo A menor que B, de tal forma que:
P A B 1
A B
Por lo general, se trabaja con tres niveles de confianza 90%, 95% y 99%.
7
Uno de los usos más comunes de los intervalos de confianza es estimar la media
poblacional. Por ejemplo:
P Z 1,645 0,95
P Z 1,645 0,05
P Z 1,645 0,05
1,645. 1,645.
0,90 P X X
n n
8
1,645. 1,645.
X X
n n
Z / 2 . Z / 2 .
X X
n n
Por lo tanto:
/ 2 0,025
Para encontrar el valor de Z / 2 , buscamos por tabla aquel valor más cercano a:
0,975 = Z / 2 = 1,96
El intervalo de confianza del 95% para la media poblacional es:
Z / 2 . Z / 2 .
X X
n n
9
(1,96) . (15) (1,96) . (15)
100 100
25 25
94,12 105,88
2 . Z / 2 .
w
n
10
Por lo tanto, la longitud de un intervalo de confianza depende de su contenido
probabilístico, de la desviación típica poblacional y el tamaño muestral. En particular, se
verifica lo siguiente:
3. Dada una desviación típica poblacional y un tamaño muestral, cuanto mayor sea
el contenido probabilístico 1 , mayor será la longitud del intervalo de
confianza. En efecto, basándonos en la misma información muestral, a cambio
de una mayor certidumbre en nuestras declaraciones de probabilidad, obtenemos
una menor precisión de dichas afirmación y esto se refleja en intervalos de
confianza de mayor longitud ya que el contenido probabilístico aumenta.
11
del segundo sin afectar seriamente el contenido probabilístico de los intervalos. Así, el
intervalo de confianza para el caso de utilizar muestras grandes es:
Z / 2 . S Z / 2 . S
X X
n n
Por lo tanto:
/ 2 0,005
Para encontrar el valor de Z / 2 , buscamos por tabla aquel valor más cercano a:
0,995 = Z / 2 = 2,575
El intervalo de confianza del 99% para la media poblacional es:
Z / 2 . S Z / 2 . S
X X
n n
( 2,575) . (0,70) ( 2,575) . (0,70)
4,38 4,38
172 172
4,24 4,52
12
En este caso, de considerable interés práctico, es en el que la variancia de la población
es desconocida y el tamaño de la muestra es pequeño, por lo tanto, es necesario trabajar
con una familia de distribuciones denominada t de Student cuya variable aleatoria es:
X
t
S
n
tn 1; / 2 . S tn 1; / 2 . S
X X
n n
13
X
X i
116 ,90
19,4833
n 6
La variancia y desviación típica muestral es:
X - n . X
2
2282,41 (6).19,4833
2 2
i
S 2
0,96
n -1 5
S S2 0,96 0,98
Por lo tanto:
/ 2 0,05
14
siempre que los puntos en el gráfico tengan un comportamiento suficientemente
rectilíneo.
15
Supongamos que estamos interesados en la proporción de miembros de la población que
poseen un determinado atributo, por ejemplo, una empresa puede estar interesada en
cuantos de sus clientes pagan con tarjeta en relación a los que pagan en efectivo o un
empresario puede estar interesado en que proporción sus productos son no defectuosos
en relación a los defectuosos. En cada uno de estos casos existen solo dos posibles
resultados, por lo tanto, la preocupación se concentra en la proporción de respuestas que
quedan dentro de uno de estos dos resultado.
pp
Z
p . (1 - p) /n
p . (1 - p) p . (1 - p)
n n
pp
Z
p . (1 - p) /n
p . (1 - p) p . (1 - p)
p Z / 2 . p p Z / 2 .
n n
16
Los intervalos de confianza construidos de este modo son generalmente bastante
confiables cuando se basan en tamaños muestrales de 40 observaciones o más.
Por lo tanto:
/ 2 0,05
Para encontrar el valor de Z / 2 , buscamos por tabla aquel valor más cercano a:
0,95 = Z / 2 = 1,645
El intervalo de confianza del 90% para la proporción poblacional es:
p . (1 - p) p . (1 - p)
p Z / 2 . p p Z / 2 .
n n
n2-1
n - 1 . S 2
2
17
Para obtener un intervalo de confianza de 100.1 % para la variancia poblacional, se
obtiene primero el intervalo de confianza de 100.1 % para la variable aleatoria 2 .
Para efectuar este procedimiento se seleccionan los valores de la tabla chi cuadrada de
tal modo que α/2 quede a la izquierda del valor menor y α/2 quede a la derecha del valor
mayor. En otras palabras, los dos valores chi cuadrada se seleccionan de modo que α se
divida en partes iguales entre las dos colas de la distribución.
18
Supongamos que disponemos de una muestra aleatoria de n observaciones procedentes
de una población normal con variancia 2 , el intervalo de confianza viene dado por:
2 v, / 2
n - 1 . S 2 2 v ,1 / 2
2
Se utiliza esta ecuación para obtener una formula con 2 como único término central.
Primero se divide cada término por n - 1 . S2 quedando:
2 v, / 2 1 2 v ,1 / 2
n - 1 . S 2 2 n - 1 . S 2
n - 1 . S 2 2
n - 1 . S 2
2 v, / 2 2 v ,1 / 2
Por lo tanto:
/ 2 0,05
Para encontrar los valores de 2 v , / 2 y 2 v ,1 / 2 , buscamos por tabla los valor para el
cual:
2 v , / 2 2 14, 0, 05 23,68 y 2 v ,1 / 2 2 14, 0,95 6,57
19
n - 1 . S 2 2
n - 1 . S 2
2 v, / 2 2 v ,1 / 2
15 - 1 . 0,64 2
15 - 1 . 0,64
23,68 6,57
0,378 2 1,364
Por lo tanto, el intervalo de confianza del 90% para la desviación típica poblacional de
la concentración porcentual del ingrediente activo de estas pastillas va de 0,61% a
1,17%.
Para comparar las medias poblacionales, se extrae una muestra aleatoria de las dos
poblaciones y la inferencia sobre la diferencia entre ambas medias se basa en los
resultados muestrales. El método apropiado para analizar esta información depende del
procedimiento empleado al seleccionar las muestras. Consideramos las dos
posibilidades siguientes:
20
1. Datos pareados. En este procedimiento las muestras se eligen por pares, una de
cada población, en donde los elementos de cada uno de estos pares deben estar
relacionados de manera que la comparación pueda ser establecida directamente.
tn 1; / 2 . S d tn 1; / 2 . Sd
d x y d
n n
Problema 8. La tabla que se expone a continuación contiene los datos del consumo de
combustible correspondiente s a una muestra aleatoria de ocho automóviles de dos
modelos diferentes. Se forman pares con las dos muestras y cada elemento de un
determinado par fue conducido por el mismo piloto y en la misma ruta de manera que la
variabilidad entre pilotos y rutas puede eliminarse como factor de distorsión.
Suponiendo que la distribución poblacional es normal, determinan un intervalo de
confianza del 99% para la diferencia del consumo medio de combustible de los dos
automóviles.
i Coches x Coches y di di2
1 19,4 19,6 -0,2 0,04
2 18,8 17,5 1,3 1,69
3 20,6 18,4 2,2 4,84
4 17,6 17,5 0,1 0,01
5 19,2 18,0 1,2 1,44
6 20,9 20,0 0,9 0,81
7 19,3 18,8 -0,5 0,25
8 20,4 19,2 1,2 1,44
Total - - 6,2 10,52
21
La media de las diferencias en el consumo de combustible es:
d
d i
6,2
0,775
n 8
La variancia de las diferencias en el consumo de combustible es:
d - n . d
2
10,52 (8). 0,775
2 2
i
S 2
d 0,816
n -1 7
S d S d2 0,816 0,903
Por lo tanto:
/ 2 0,005
El intervalo de confianza del 99% para la diferencia de las medias poblacionales es:
tn 1; / 2 . S d tn 1; / 2 . S d
d x y d
n n
(3,499) . (0,903) (3,499) . (0,903)
0,775 x y 0,775
8 8
0,342 x y 1,892
22
x2 y x2 y
X Y Z
2 2
/2 . x y X Y Z / 2 .
nx ny nx ny
Si el tamaño de las muestras son grandes, sustituyendo las variancias poblacionales por
las muestrales se obtiene una buena aproximación e incluso seguirá siendo válida
cuando las distribuciones poblacionales no sean normales.
2 2
X Y Z /2 .
S 2x S y
nx ny
S2 S y
x y X Y Z / 2 . x
nx ny
Fumadores:
X 2,15 horas
n x 96
S x 2,10 horas
Trabajadores no fumadores:
Y 1,69 horas
n y 206
S y 1,91 horas
Por lo tanto:
/ 2 0,005
Para encontrar el valor de Z / 2 , buscamos por tabla aquel valor más cercano a:
0,995 = Z / 2 = 2,575
El intervalo de confianza del 99% para la diferencia de las medias poblacionales es:
2 2
X Y Z /2 .
S 2x S y
nx ny
S2 S y
x y X Y Z / 2 . x
nx ny
23
(2,09) 2 (1,91) 2
2,15 1,69 2,575 . x y
96 206
(2,09) 2 (1,91) 2
2,15 1,69 2,575 .
96 206
0,19 x y 1,11
1 1 nx ny
Var X Y . 2 2
nx ny
2 2
n n .n
x ny x y
n x - 1 . S 2x n y - 1 . S 2y
S
n x n y - 2
24
nx ny nx ny
X Y t nx ny 2; / 2 .S.
n .n
x y X Y tnx ny 2; / 2 . S .
n .n
x y x y
Problema 10. En un proceso químico para imprimir tarjetas de circuitería, se han
comparado dos catalizadores diferentes para determinar si requieren diferentes tiempos
de inmersión para eliminar cantidades idénticas de material fotorresistente. Se
analizaron 12 lotes con el catalizador 1 y se obtuvo una media de tiempo de inmersión
de 24,6 minutos y una desviación típica de 0,85 minutos. Con el catalizador 2 se
analizaron 15 lotes obteniendo una media de 22,1 minutos y una desviación típica de
0,98 minutos. Determinar un intervalo de confianza del 95% en la diferencia de las
medias poblacionales suponiendo que las variancias en las dos poblaciones son iguales.
Catalizador 1:
X 24,6 minutos
n x 12
S x 0,85 minutos
Catalizador 2:
Y 22,1 minutos
n y 15
S y 0,98 minutos
Por lo tanto:
/ 2 0,025
Para encontrar el valor de tnx ny 2; / 2 , buscamos por tabla el valor para el cual:
tnx ny 2; / 2 t 25; 0, 025 2,060
El intervalo de confianza del 95% para la diferencia de las medias poblacionales es:
nx ny nx ny
X Y t nx ny 2; / 2 .S.
n .n
x y X Y tnx ny 2; / 2 . S .
n .n
x y x y
25
12 15
24,6 22,1 2,060 . 0,925 . x y
12. 15
12 15
24,6 22,1 2,060 . 0,925 .
12. 15
1,76 x y 3,24
Supongamos que una muestra nx de una población con una proporción de éxitos p x da
lugar a una proporción muestral px y que se obtiene una proporción muestral py a
partir de una muestra aleatoria independiente de tamaño ny procedente de una población
con proporción de éxitos p y . Además, si los tamaños muestrales son grandes, la
distribución es aproximadamente normal. Por lo tanto, si los tamaños muestrales son
p
p y Z / 2 .
px .1 px
py.1 py
px py
x
nx ny
p x p y Z / 2 .
px.1 px
py.1 py
nx ny
26
Determinar un intervalo de confianza del 95% en la diferencia de la proporción de
defectos producidos bajo los dos procesos.
Muestra 1:
Defectuosos 12
px 0,16
Total 75
n x 75
Muestra 2:
Defectuosos 10
py 0,12
Total 85
n y 85
Por lo tanto:
/ 2 0,025
Para encontrar el valor de Z / 2 , buscamos por tabla aquel valor más cercano a:
0,975 = Z / 2 = 1,96
El intervalo de confianza del 95% para la diferencia de las medias poblacionales es:
p
p y Z / 2 .
px.1 px
py.1 py
px py
x
nx ny
p x p y Z / 2 .
px .1 px
py.1 py
nx ny
Este intervalo incluye el 0, de modo que, con base en los datos de la muestra, parece
poco probable que los cambios realizados en el proceso de acabado de la superficie
hayan reducido la proporción de los ejes de árbol defectuosos que se están produciendo.
27
Hasta el momento desarrollamos los métodos para construir intervalos de confianza
para estimar un parámetro poblacional basándonos en la información proporcionada por
una muestra. Seguidamente, un intervalo de confianza puede resultar demasiado amplio
y por lo tanto con un grado de incertidumbre poco deseado. Normalmente, la única
manera de reducir esta incertidumbre consiste en tomar una muestra con un tamaño
mayor.
Tamaño de muestra para la media.
Al tomar una muestra aleatoria de tamaño n procedente de una población normal con
media y variancia conocida 2 , como vimos, el intervalo de confianza del
100.1 % viene dado por:
Z / 2 . Z / 2 .
X X
n n
Este intervalo está centrado en la media muestral X , recorriendo a cada lado de esta
una distacia L igual a la mitad de la longitud del intervalo, dada por:
Z / 2 .
L
n
El tamaño muestral que garantiza que el intervalo de confianza tenga una amplitud L a
cada lado de la media muestral es:
2
Z / 2 .
n
L
Problema 12. La longitud de las barras de acero producidas por una cadena de
producción es una variable aleatoria con distribución normal y desviación típica 1,8
mm. Basándose en una muestra aleatoria de 9 observaciones se calculó el siguiente
intervalo de confianza del 99% para la longitud poblacional:
194,65 197,75
28
Se tiene:
L 0,5 mm
1,8 mm
Por lo tanto:
/ 2 0,005
Para encontrar el valor de Z / 2 , buscamos por tabla aquel valor más cercano a:
0,995 = Z / 2 = 2,575
El tamaño muestral exigido es:
2 2
Z / 2 . 2,575 . 1,8
n 85,93
L 0,5
p . (1 - p) p . (1 - p)
p Z / 2 . p p Z / 2 .
n n
Igual que en el caso de la media, este intervalo está centrado en la proporción muestral
p recorriendo a cada lado de esta una distacia L igual a la mitad de la longitud del
intervalo, dada por:
p . (1 - p)
L Z / 2 .
n
Esta ecuación no puede ser aplicada tal cual ya que depende de la proporción muestral,
la cual no conocemos de antemano, pero independientemente del resultado, p . (1 - p )
29
no puede ser mayor que 0,25 cuando el valor de la proporción muestral es de 0,5. De
este modo, la longitud L viene dada por:
0,25 Z / 2 . 0,5
L Z / 2 .
n n
El tamaño muestral que garantiza que el intervalo de confianza tenga una amplitud L a
cada lado de la proporción muestral es:
2
Z / 2
n . 0,25
L
Problema 13. En una muestra aleatoria de 142 piezas de acero con tratamiento
superficial, se evaluó la dureza de la misma y 87 de estas piezas estaban dentro de
especificación. Se construyó el siguiente intervalo de confianza del 95% para la
proporción de piezas dentro de especificación:
0,533 p 0,693
Ahora se quiere construir un nuevo intervalo de confianza del 95% cuya longitud a cada
lado de la proporción muestral no sea superior a 0,06. Determinar cuántas observaciones
debe tener la muestra.
Se tiene:
L 0,06
Por lo tanto:
/ 2 0,025
Para encontrar el valor de Z / 2 , buscamos por tabla aquel valor más cercano a:
0,975 = Z / 2 = 1,96
El tamaño muestral exigido es:
2 2
Z / 2 1,96
n . 0,25 . 0,25 266,78
L 0,06
30
BIBLIOGRAFIA
1. ENCICLOPEDIA DE MATEMÁTICAS
OCEANO Grupo Editorial S.A.
2. ESTADÍSTICA
Murria R. Spiegel - Larry J. Stephens
Mc Graw Hill
Año 2002
6. http://es.wikipedia.org/wiki/Wikipedia:Portada
31