Professional Documents
Culture Documents
Estimacin Puntual
ii)
iii)
p (proporcin muestral).
y s2
c.s (W ) = W E (W )
As. La estimacin de la media poblacional , lo hacemos mediante la media
muestral
es un estimador centrado.
( x x)
i
) con la formulacin
llegaramos a que es
2
s =
xi x
n 1
b) Estimadores eficientes
La eficiencia designa el tamao del error estndar del estadstico.
Si comparamos dos estadsticos de una muestra del mismo tamao y tratamos
de decidir cual es el estimador ms eficiente, se debe seleccionar el estadstico
que tenga el error estndar ms pequeo de la distribucin.
Se pude presentar dos estimadores, w1 y w2 centrados, pero con varianzas
diferentes, por ello un buen estimador debe cumplir la siguiente propiedad.
Diremos que un estimador w2 es ms eficaz que otro w1, si para cualquier
tamao muestral se cumple que
2 w 2 2 w1
Por lo tanto, el estimador ms eficiente es el que tiene menor varianza
La eficiencia de un estimador la podemos cuantificar mediante el coeficiente
de eficacia (c.e)
c.e(w ) =
2w
c) Congruencia (Consistencia)
Un estadstico es un estimador congruente del parmetro de una poblacin si,
al aumentar el tamao de la muestra, se logra una seguridad casi absoluta de
que el valor del estadstico se acerca mucho al valor del parmetro de la
poblacin. Si un estimador es congruente se torna ms confiable en muestras
grandes.
d) Suficiencia
Un estimador es suficiente si utiliza la informacin contenida en la muestra, al
punto que ningn otro estimador podra extraer de esta ltima ms informacin
referente al parmetro de la poblacin que va a ser estimado.
Ejemplo:
De una poblacin N ( ; 1) se obtienen muestras de tamao 2, empleando
como estimador de la media a:
A=
2
1
x1 + x2
3
3
2
4
B= x1 + x2
5
5
C=
x1 + x 2
2
Calculemos:
a) El coeficiente de sesgo de cada uno de ellos
b) La eficacia de los estimadores
c) El error de variacin para determinar el mejor estimador
Solucin
E [w ]
1 2
1
2
1
2
E [ A] = E x1 + x2 = E [ x1 ] + E [ x2 ] = + =
3 3
3
3
3
3
4 2
4
2
4
6
2
E [ B ] = E x1 + x2 = E [ x1 ] + E [ x2 ] = + =
5 5
5
5
5
5
5
1
1
1
x + x 1
E [C ] = E 1 2 = E [ x1 ] + E [ x2 ] = + =
2
2
2
2 2
Por lo tanto:
6
1
= ; estimador sesgado
5
5
1 2
4
1
5
2
1
V [ A] = V x1 + x2 = V [ x1 ] + V [ x2 ] = 1 + 1 = = 0,5556
3 3
9
9
9
3
3
4 2
4
16
20
2
4
V [ B ] = V x1 + x2 = V [ x1 ] + V [ x2 ] = 1 + 1 =
= 0,8000
5 5
25
25
25
5
5
1 1
1
1
2
1
1
V [C ] = V x1 + x2 = V [ x1 ] + V [ x2 ] = 1 + 1 = = 0,5000
2 2
4
4
4
2
2
Por lo que los coeficientes de eficacia sern:
c.s ( A) =
1
1
=
= 1, 7999
V [ A] 0,5556
c.s ( B) =
1
1
=
= 1, 2500
V [ B ] 0,8000
c.s (C ) =
1
1
=
= 2, 0000
V [C ] 0,5000
e.v (W ) = c.s (W ) + V [W ]
2
Por lo tanto:
e.v(A) = 02 + 0,5556 = 0,5556
2
1
0,80
+
=
+ 0,80
e.v (B) =
5
25
N de familias
1
3
3
1
Solucin:
Sea p: nmero de hijos hombres;
p sigue una distribucin binomial, con p constante y suponemos mayor que 0,1
Como hay un parmetro a determinar (p), slo se necesita una ecuacin, por lo
que se igualar un momento los ms sencillos, los centrales de primer orden,
es decir, las medias.
Se sabe que en una distribucin binomial se tiene que:
= np = 4p
Tambin sabemos que la media muestral es:
xn
x=
i i
i =1
12
= 1,5
8
4 p = 1,5 p = 0,375
2.1.3 Mtodo de Mxima Verosimilitud
x1 x2 x3 xn con frecuencias f1 f 2 f n ;
Luego la funcin de verosimilitud V es:
V = [ f ( x1 , a, b) ] 1 [ f ( x2 , a, b) ] 2 [ f ( xn , a, b) ] n
f
d ( Ln V)
=0
da
d ( Ln V)
=0
db
hay una dispersin inevitable que debemos incorporar a nuestra respuesta para
que ella sea realista. Esto nos conduce al siguiente enfoque.
2.2 Estimacin por intervalos
Este tipo de estimacin consiste en dar un conjunto de posibles valores que
pueda tomar el parmetro en base a la muestra dada, esta estimacin se basa
en la teora de probabilidades y es necesario conocer la distribucin muestral
del estimador que se esta utilizando.
Ejemplo:
Supngase una poblacin de cuatro elementos (N = 4). Que para una
caracterstica dada toma los valores 3, 7, 11 y 15. Y considrese todas las
muestras de tamao dos con y sin reemplazo. Hallemos:
a) La media de la poblacin:
b) La desviacin estndar de la poblacin:
c) La media de la distribucin de muestral de media:
Solucin:
Como la poblacin esta formada por 3, 7, 11, 15. Se pueden formar:
4
i) = 6 muestras de tamao dos sin reposicin y
2
ii)
2 4 = 16
Poblacin
3
7
11
15
Tabla 1
3
7
11
(3,3)
(3,7)
(3,11)
(7,3)
(7,7)
(7,11)
(11,3) (11,7) (11,11)
(15,3) (15,7) (15,11)
15
(3,15)
(7,15)
(11,15)
(15,15)
Ntese que todas las muestras que estn sobre y bajo la diagonal principal son
las mismas, por lo tanto, si queremos considerar el muestreo sin reposicin
basta que consideremos las muestras que estn sobre o bajo dicha diagonal.
a)
3 + 7 + 11 + 15
=9
4
(3 9) 2 + (7 9) 2 + (11 9) 2 + (15 9) 2
= 20
b) =
4
2
= 20 = 4,4721
c) La media de la distribucin muestral de medias:
Consideremos que el muestreo se hizo con y sin repeticin, luego se tiene:
i) Si el muestreo se hizo con repeticin.
Tomando las muestras de la tabla 1 y calculando sus medias se tiene la
siguiente distribucin de medias las que se notan en la tabla 2
Tabla 2
3
5
7
9
5
7
9
11
7
9
11
13
9
11
13
15
x =
3 + 5 + 7 + 9 + 5 + 7 + 9 + 11 + 7 + 9 + 11 + 13 + 9 + 11 + 13 + 15
=9
16
= X
Es decir, La media poblacional es igual a la media de la distribucin de
medias
x =
5 + 7 + 9 + 9 + 11 + 13
=9
6
= x Luego
E (XK) = X k
X =
x1 + x 2 + ... + x n
n
E ( x) =
E ( x1 ) + E ( x 2 ) + ...E ( x n ) n *
=
= . Entonces
n
n
E(X) =
10
x = 10 = 3,1623
Lo que comprueba el siguiente teorema
Teorema n 2
Si una poblacin es infinita o si el muestreo es con reemplazo, entonces, la
2
x
2x
esta dada
2
n
2x =
20
= 10
2
2
n
11
2x =
(5 9) 2 + (7 9) 2 + (9 9) 2 + (9 9) 2 + (11 9) 2 + (13 9) 2 40
=
= 6,6667
6
6
Por lo tanto
x = 6,6667 = 2,5820
Lo que comprueba el siguiente teorema
Teorema n 3: Si la poblacin es de tamao N, si el muestreo es sin
reposicin, y si el tamao de la muestra es n N , entonces se tiene:
2
x
2 N n
n N 1
2x =
20 4 2
= 6,6667
2 4 1
ii)
Promedio:
Varianza :
x =
2
x
2
n
12
Laboratorio n 1
13
y si el
n
tamao de la muestra es grande ( n 30 ). Bajo este supuesto llegamos a uno
de los teoremas ms tiles en Estadstica; se le conoce como Teorema del
Lmite Central
Teorema n 4: Teorema del Lmite Central
x
z=
14
Laboratorio n 2
- 1,9
- 2,1
- 2,3
- 2,5
- 2,7
Nmero de
guaguas
20
50
60
50
20
15
2
n
S
l =
n 1
2
2 20
= 10 y
Tomemos la distribucin de muestreo de varianzas anterior l =
2
2 =
2 10
= 20
2 1
de tamao
n1
n2
de
x x = 1 2 = x1 x 2
1
b) Varianza:
1
1
+
n1 n2
2 x x = 2
1
16
xi
i =1
2 =
(x
i =1
=x
n
x=
xi
i =1
(
n
S =
2
i =1
xi x
17
Varianza Poblacional
( x x)
n
=
.
2
i =1
n 1
a ) La media:
l 1 = x1; l 2 = x 2
b ) La varianza
2 =
(n1 1) S 21 + (n2 1) S 22
n1 + n2 2
S 21 y S 2 2
son las
( x x ) , es decir:
1
1 2
es la
1 2 = x1 x 2
18
Ejemplo:
Dadas dos poblaciones formadas por (3, 5, 7) y (2, 4, 6), respectivamente,
Hallar
a) Los promedios de las poblaciones respectivas
b) La distribucin de Medias
c)
x x
d)
x x
Soluciones:
a) Los promedios de las poblaciones respectivas
1 =
3+5+7
=5
3
2 =
2+4+6
=4
3
b) La distribucin de Medias
De las poblaciones anteriores encontrar todas las muestras posibles de tamao
dos y calculando sus respectivas medias se tiene que:
x =
x =
1
1
1
x x
1
es:
1
1
1
19
9
=1
9
x x =
1
d) Calculando
x x = 5 4 = 1
1
1 2 = x1 x 2
5.0 Estimacin de Parmetros por intervalos de confianza
Este procedimiento nos lleva a elegir un conjunto de posibles valores del
parmetro, lo ms pequeo posible, de modo que la probabilidad de que este
conjunto contenga el verdadero valor del parmetro sea grande. Una
es un intervalo de la forma
donde
20
Los valores que no estn en esta tabla se pueden calcular de la curva normal.
Nivel de
confianza
99.73%
99%
98%
96%
95.45%
95%
90%
88%
68.27%
50%
Coeficiente
confianza
3.00
2.58
2.33
2.05
2.00
1.96
1.645
1.28
1.00
0.6745
Z=
Ejemplo:
Supongamos que = 0,05 , encontrar el intervalo de confianza para estimar
Solucin:
P ( 1,96 Z 1,96 ) = 1
y como = 0,05 , entonces se tiene que:
21
P 1,96
6
1.96 = 0,95
5
Desp
pejando
se tiene
e:
P x 1,996
x + 1,966
= 0,95
n
n
Diremos que:
1.96
,
x
+
1.
.96
n
n
Es un
u intervalo
o de confia
anza del 95
5% para es
stimar el pa
armetro
Nte
ese que el limite inferrior y el lim
mite superio
or son funcciones de
, por tan
nto,
son ellos mism
mos variables aleatorias. La situ
uacin graffica es la ssiguiente:
Por lo tanto, s
lo el 5% de
d las mue
estras tendrn probab
bilidades q
que estn fuera
f
de estos
e
lmite
es
22
Si
< < x + z / 2
P x z / 2
= (1 ) 100%
n
n
Ejemplo:
Si una muestra aleatoria de tamao 20 tomada de una poblacin normal con
varianza 225 tiene media de 64.3, construir un intervalo de confianza del 95%
para estimar la media de la poblacin
Solucin:
Como = 0,05 , entonces, se tiene que Z / 2 = 1.96 (ver tabla de la
Normal). Por lo tanto el intervalo de confianza del 95% para estimar la media
poblacional es:
64,3 1,96
15
15
< < 64,3 + 1,96
20
20
Grficamente corresponde a:
23
5.2 Estimaci
E
n por inte
ervalo de un
u valor medio
m
poblacional c
con poblac
cin
norm
mal y varia
anza desc
conocida
Cuando el tam
mao de la muestra es menor que 30 o cu
uando la va
arianza
e desconocce correspo
onde utiliza
ar la distribucin t, cconocida co
omo
poblacional se
la disstribucin t de Stude
ent.
Prevviamente sabamos
s
q
que
x
d
n normal re
educida (0,1) si
tendra distribucin
a poblacional, Gosse
et demostr que esa variable
se desconoce la varianza
n t de parrmetros v = n 1. Donde
D
a v sse le
aleatoria tiene distribuci
deno
omina grad
dos de lib
bertad.
Disttribucin t de Stude
ent: Esta distribucin es Platic
rtica en co
omparacin
con la distribuccin norma
al.
La distribucin
d
n t es aprop
piada para
a realizar in
nferencias sobre med
dias cuand
do
se desconoce
d
e la varian
nza poblac
cional y la poblacin
n tiene un
na
distrribucin normal.
n
Sin embargo
o al aumen
ntar el tama
ao de la m
muestra y los
grad
dos de liberrtad, la disstribucin t se aproxim
ma a la forrma de la d
distribucin
n
norm
mal. La disttribucin t se puede aproximarr a la norm
mal cuando
o n 30 parra
una sola muesstra.
Enviista de su importancia esta disttribucin se
e encuentrra tabulada
a donde t , v
es ta
al que el rrea a su de
erecha, situada deba
ajo de la cu
urva de la d
distribucin t
con v grados de
d libertad es igual a . Esto es tal que::
P (t t ,v ) =
24
= t , v .
abilidades relacionad
das con la distribuci
n t suelen
Cuando v 300 , las proba
apro
oximarse co
on el uso de
d distribucciones norrmales.
Para
a la distribu
ucin t tene
emos que::
a) Promed
dio
= 0
b) Varianzza
2 =
v
;v>2
v2
Ejem
mplo:
La distribucin
d
n t con 10 grados
g
de libertad se
e puede rep
presentar g
grficamen
nte
como el grafico
o anterior. Esto ocurrre porque la distribucin t es ssimtrica.
Ejem
mplo: Halla
a el valor de
e t1 para el
e cual
a) El rea som
mbreada a la
l derecha
a es 0,05. Utiliza
U
la ta
abla n 2 de
el apndice
e
ucin: Si el rea sombreada a la
a derecha es 0,05, entonces,
e
e
el rea de la
l
Solu
izquierda de t1 es 1 0,0
05 = 0,95, por lo tanto
o se tiene que
t.95,100 = 1,81
25
desconocida
para estimar
s
s
P x t1 / 2, n 1
< < x + t1 / 2, n 1
= (1 ) 100%
n
n
9.93
9.67
9.92
9.95
9.75
9.94
9.74
9.93
9.77
9.85
9.99
9.92
9.67
9.75
9.88
9.89
26
x = 9,852
s = 0, 0965
x =
0, 0965
= 0, 0216
20
z / 2
< < x + z / 2
es:
E z / 2
z / 2
=E
27
Definicin:
Si x se utiliza como estimacin de , entonces puede tenerse una confianza
de (1 ) 100% de que el error x no ser mayor que una cantidad
especfica de E cuando el tamao de la muestra sea:
Z
n0 = / 2
E
i)
Si n0 < 0, 05 N
Donde N es el tamao de la poblacin
Entonces, se tiene que el tamao de la muestra es:
n = n0
ii)
Si n0 0, 05 N
Donde N es el tamao de la poblacin.
Entonces, se tiene que el tamao de la muestra es:
n0
n=
n
1+ 0
N
28
Ejemplo:
Supngase que se desea que el error en la estimacin del promedio de edad
sea menor que 0,5 con una confianza del 95% y si = 3.5 . Cul es el
tamao de muestra requerido si N = 2000?
Solucin:
Como
Z / 2 = 1,96 ;
1,96 3,5
n0 =
= 188, 2 189
0,5
Como
n0 0, 05 N
n=
n0
189
=
= 173
n0
189
1+
1+
2000
N
a) Media
x1 x 2
x x = 1 2
1
b) Varianza
c) Z =
(x
x1 x 2
21
n1
x 2 ) (1 2 )
2 x x
1
22
n2
29
con 1 y 2
En virtud del teorema del lmite central, este resultado puede usarse con
muestras aleatorias independientes de poblaciones normales con las
varianzas conocidas 21 y 2 2 , siempre que n1 y n2 sean lo
suficientemente grandes.
Ejemplo:
Construir un intervalo de confianza del 94% para estimar la diferencia real entre
los tiempos promedios de lectura de dos textos, dado que una muestra tomada
al azar de 40 individuos demor en promedio 10 horas y otra muestra de 50
individuos tiene una demora en promedio de 8 horas. Las desviaciones
estndar de las poblaciones son 1 y 0,72 respectivamente.
Solucin:
Para = 0,06 se tiene que Z / 2 = 1.88 Por lo tanto el intervalo de confianza
del 94% de 1 2 es:
12 0.72 2
(10 8) 1.88 +
50
40
12 0.72 2
+
50
40
Es decir:
30
z
n0 = / 2 ( 21 + 2 2 )
E
Luego, tendramos que:
i)
Si n0 < 0, 05 N
Donde N es el tamao de la poblacin
Entonces, se tiene que el tamao de la muestra es:
n = n0
ii)
Si n0 0, 05 N
Donde N es el tamao de la poblacin
Entonces, se tiene que el tamao de la muestra es:
31
n0
n=
n
1+ 0
N
Teorema 9: Intervalo de confianza para estimar 1 2 con 1 = 2 y
desconocidas
Si x1 y x2 son los valores de las medias de muestras aleatorias
x1 x 2 t1 / 2,v l
1 1
+
n1 n2
Con
Ejemplo:
Se ha realizado un estudio para comparar el contenido de nicotina de dos
marcas de cigarrillos: 10 cigarrillos de la marca A tuvieron un promedio de
nicotina de 3,1 miligramos con una desviacin estndar de 0,5 miligramos,
mientras que ocho cigarrillos de la marca B tuvieron un contenido de nicotina
promedio de 2,7 miligramos con una desviacin estndar de 0,7 miligramos.
Suponiendo que los conjuntos de datos son muestras tomadas al azar de
poblaciones normales con varianzas iguales, construyamos un intervalo de
confianza del 95% para estimar la diferencia real en el contenido promedio de
nicotina de las dos marcas de cigarrillos:
Solucin: Para = 0.05 y como
n1 + n2 2 = 16
grados de libertad, de la
= 2,12
32
y el valor de
9 0, 25 + 7 0, 49
= 0,596
16
1 1
+
10 8
33
(x
x 2 t1 / 2, f
S12 S22
+
n
1 n2
con
S12 S22
+
n
n2
1
f =
2
S12 S22
n1 + n2
n1 + 1 n2 + 1
Ejemplo:
Un granjero dispone de dos explotaciones diferentes A y B con varias granjas
cada una para la cra de pollos. Con el objeto de estudiar la mortalidad de los
pollos en las dos explotaciones observa el nmero de pollos muertos tomando
una muestra de 4 granjas en la explotacin A y otras cuatro en la explotacin B
obteniendo los siguientes resultados
N pollos
muertos en A
N pollos
muertos en B
16
14
13
17
18
21
18
19
34
(x x ) ( ) f
2
S12 S22
+
n1 n2
Con
2
S12 S22
+
n
n2
1
2
f =
2
2
2
2
S1
S2
n1 + n2
n1 + 1 n2 + 1
Donde
S12 =
(x x )
i
n1 1
y S22 =
( x x )
i
n2 1
(x x )t
1
Los valores de
1 / 2, f
f y t1 / 2 , f
S12 S 22
+
n1 n2
35
3,3333 2
+
4
4
2 7 t1 / 2, f = t.975,7 = 2.36
f =
2
2
3,3333
2
4 + 4
5
5
El intervalo de confianza ser entonces:
(15 19 ) 2,36
3,3333 2
+ = [ 1, 27 y 6, 73]
4
4
x1 x 2 t1 ,v l
1 1
+
n1 n2
Con
36
El valor de 2 =
2,49997 ( 4 1) + 1,4999 ( 4 1)
4+42
= 1,99994
(15 19 ) 2,45
1 1
1,99994 + = [ 6,44996 y 1,55004 ]
4 4
37