You are on page 1of 8

Omar Radhames Urqudez Calvo

Metodos Estadsticos - Intervalos de Conanza


Viernes 13 de Junio de 2014
Problema 1. En un estudio por muestreo se entrevistaron a 200,000 due nos de botes. En este estudio se
encontro que el 12 % de los botes recreativos tiene el nombre de Serenity. Calcular un intervalo de conanza
del 95 % para la proporcion de botes con nombre Serenity. Se sugiere utilizar el metodo de construccion de
intervalos de conanza para muestras grandes.
Primero probaremos el siguiente lema:
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
Lema. Sea x
1
, x
2
, ..., x
n
una muestra i.i.d. como una Bernoulli de parametro p. Para n sucientemente
grande, si denimos a p =

xi
n
y q = 1 p entonces p z

2
_
p q
n
es un intervalo de conanza para p, de
1 ,
_
0,
1
2

, donde z

es el n umero tal que P[Z > z

] = , para una Z N(0, 1).


A z

2
_
p q
n
tambien es conocido como error maximo de estimaci on y suele denotarse como E.
Demostracion. Denotemos por X =
n

i=0
X
i
, entonces X Binomial(n, p). Por el teorema del Lmite Central
sabemos que es posible aproximar a X como una Normal de parametros (np, np(1p)). Luego, si denimos
a p =
X
n
podemos ver que
E[ p] =
1
n
E[X] =
1
n
pn = p, y tambien
V ar( p) = V ar
_
X
n
_
=
1
n
2
V ar(X) =
1
n
2
np(1 p) =
p(1 p)
n
.
por lo que de igual manera podemos calcular un estimado para p =
X
n
como una N
_
p,
p(1p)
n
_
.
La desviacion estandar de p podemos estimarla mediante de
_
p(1 p)
n
, que nos permitira normalizar para
todo parametro k de la siguiente manera:

A :=
p k
_
p(1 p)
n
N(0, 1).
Luego, si denimos a q = 1 p tenemos
P
_
p z

2
_
p q
n
k p +z

2
_
p q
n
_
= P
_
z

2
_
p q
n
k p z

2
_
p q
n
_
,
= P
_
_
z

k p
_
p q
n
z

2
_
_
= P
_
z


A z

2
_
,
= P
_

A z

2
_
P
_

A z

2
_
=
_
1 P
_

A > z

2
__

_
1 P
_

A > z

2
__
,
=
_
1 P
_

A > z

2
__

_
1
_
1 P
_

A > z

2
___
,
=
_
1

2
_

_
1
_
1

2
__
= 1 .
Por lo que, en efecto, p z

2
_
p q
n
nos brinda un intervalo de conanza para p, de nivel (1 ).
- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
1
Omar Radhames Urqudez Calvo
Metodos Estadsticos - Intervalos de Conanza
Viernes 13 de Junio de 2014
Sean X el n umero de botes en el estudio cuyo nombre es Serenity, y a n = 200000 como el tama no de
la muestra. Tomemos entonces p =
X
n
= 0.12 como la proporcion de la muestra y denamos q =
nX
n
= 0.88.
Para construir el intervalo de conanza sobre la muestra dada debemos de considerar el error maximo de
estimacion E, denido como E = z

2
_
p q
n
. Sabemos entonces que, al ser n sucientemente grande obtenemos
que el intervalo de conanza para p estara dado por:
p z

2
_
p q
n
< p < p +z

2
_
p q
n
Luego, como buscamo un intervalo de conanza del 95 %, sabemos que z

2
= 1.96.
z

2
_
p q
n
= (1.96)
_
(0.12)(0.88)
200000
0.0014242, i.e.,
p z

2
_
p q
n
< p < p +z

2
_
p q
n
,
0.12 0.0014242 < p < 0.12 + 0.0014242,
0.1185753 < p < 0.1214242.
Por lo que podemos armar, con un 95 % de conanza, que el porcentaje de botes recreativos cuyo nombre
es Serenity esta entre el 11.858 % y 12.142 %.
2
Omar Radhames Urqudez Calvo
Metodos Estadsticos - Intervalos de Conanza
Viernes 13 de Junio de 2014
Problema 2. En una muestra de estaciones de esquiar se registro el precio por da, en dolares, para utilizar
precisamente la zona de esquiar. Los precios registrados fueron: 59, 54, 53, 52, 51, 39, 49, 46, 49 y 48.
Construir un intervalo de conanza del 90 % para la varianza, suponiendo que estos datos se pueden modelar
con variables aleatorias independientes e identicamente distribuidas como una normal.
Sean X
1
, X
2
, ..., X
10
las variables aleatorias i.i.d. como normales de media cero y varianza uno de los datos
brindados. Sabemos entonces que podemos escribir a Z = X
2
1
+X
2
2
+... +X
2
10
como una variable aleatoria
tal que Z
2
9
.
Sabemos que un estimador para es s
2
=

(xi

Z)
2
n1
, donde n 1 son los grados de libertad de la v.a. con
distribucion
2
(nueve, para este problema), obtenemos que
s
2
=
n(

x
2
i
) (

x
i
)
2
n(n 1)
=
10(

x
2
i
) (

x
i
)
2
90
.
Entonces
s
2
=
10(59
2
+ 54
2
+ 53
2
+ 52
2
+ 51
2
+ 39
2
+ 49
2
+ 46
2
+ 49
2
+ 48
2
) (59 + 54 + 53 + 52 + 51 + 39 + 49 + 46 + 49 + 48)
2
90
,
=
10(25254) (500)
2
90
=
252540 250000
90
=
254
9
Dado que nuestro nivel de signicancia deseado es de 90 %, si denimos a

2
=
10.9
2
= 0.05, sabemos que
buscamos encontrar los puntos z

2
y z

2
tales que:
P(Z z

2) = P(Z z

2) =

2
= 0.05,
como indica la siguiente gura:
Por lo tanto, como la funcion de densidad de la distribucion
2
es
f(x; k) =
x
(k/2)1
e
x/2
2
k/2
(k/2)
para toda x 0, donde k = n 1 son los grados de libertad. Integrando tal funcion, encontramos que
z

2
= 3.325 y z

2
= 16.919.
3
Omar Radhames Urqudez Calvo
Metodos Estadsticos - Intervalos de Conanza
Viernes 13 de Junio de 2014
Ya obtenidos estos puntos sabemos que un intervalo de conanza del 90 % para la varianza
2
es:
(n 1)s
2
z

2
<
2
<
(n 1)s
2
z

2
,
(9)(
254
9
)
16.919
<
2
<
(9)(
254
9
)
3.325
,
15.0127076 <
2
< 76.3909774.
Ahora podemos encontrar un intervalo para la desviacion estandar (), tomando la raz cuadrada de las
desigualdades anteriores, i.e.

15.0127076 <

2
<

76.3909774,
3.87462354 < < 8.74019321.
Por lo que podemos concluir, con una seguridad del 90 %, que la desviacion estandar del precio por da para
utilizar la zona de esquiar esta entre los $3.87 y $8.74 dolares, basado en la muestra de 10 das.
4
Omar Radhames Urqudez Calvo
Metodos Estadsticos - Intervalos de Conanza
Viernes 13 de Junio de 2014
Problema 3. En una muestra de 69 industrias de alimentos se encontro que 43 de estas hacen sus propios
estudios de mercado. En una muestra independiente, a la anterior, de 70 industrias de muebles para el hogar
se encontro que 30 de estas realizan estudios de mercado por su cuenta. Construir un intervalo de conanza
de nivel 0.95 para la diferencia de las proporciones de estos dos tipos de industrias que hacen sus propios
estudios de mercado.
Sean X y Y el n umero de industrias de alimentos que realizan sus propios estudios de mercado y el de
industrias de muebles que hacen lo mismo, respectivamente. As tambien consideremos a n = 69, m = 70
como los tama nos de las muestras. Tomemos entonces p
x
, p
y
como las proporciones de cada muestra y
denamos q
i
= 1 p
i
, i {x, y}. Entonces
p
x
=
X
n
=
43
69
q
x
= 1 p
x
=
26
69
p
y
=
Y
m
=
3
7
q
y
= 1 p
y
=
4
7
Para construir el intervalo de conanza sobre las muestras dadas, analogo al problema 1, procedemos
a calcular E que, al ser X y Y independientes, esta denido como E = z

2
_
px qx
n
+
py qy
m
. Entonces el
intervalo de conanza estara dado por:
( p
x
p
y
) z

2
_
p
x
q
x
n
+
p
y
q
y
m
< p
x
p
y
< ( p
x
p
y
) +z

2
_
p
x
q
x
n
+
p
y
q
y
m
Luego, como buscamos un intervalo de conanza del 95 %, sabemos por el problema 1 que z

2
= 1.96.
z

2
_
p
x
q
x
n
+
p
y
q
y
m
= (1.96)
_
(43/69)(26/69)
69
+
(3/7)(4/7)
70
0.1628310339, i.e.,
( p
x
p
y
) z

2
_
p
x
q
x
n
+
p
y
q
y
m
< p
x
p
y
< ( p
x
p
y
) +z

2
_
p
x
q
x
n
+
p
y
q
y
m
,
_
94
483
_
0.1628310339 < p
x
p
y
<
_
94
483
_
+ 0.1628310339,
0.0317859433 < p
x
p
y
< 0.3574480112.
Por lo que podemos armar, con un 95 % de conanza, que la diferencia de las proporciones de estos dos
tipos de industrias que hacen sus propios estudios de mercado esta en
[0.0317859433, 0.3574480112] .
5
Omar Radhames Urqudez Calvo
Metodos Estadsticos - Intervalos de Conanza
Viernes 13 de Junio de 2014
Problema 4. Si L(x
1
, ..., x
n
) y U(x
1
, ..., x
n
) satisfacen L(x
1
, ..., x
n
) U(x
1
, ..., x
n
), para todo posible valor
(x
1
, ..., x
n
) de las variables aleatorias (X
1
, ..., X
n
), P

((L(x
1
, ..., x
n
) ) = 1
1
y P

(U(x
1
, ..., x
n
) ) =
1
2
, mostrar que P

((L(x
1
, ..., x
n
) U(x
1
, ..., x
n
)) = 1
1

2
Denamos A, B como los eventos {L(x
1
, ..., x
n
) } y {U(x
1
, ..., x
n
) }, respectivamente.
Consideremos la union de eventos (A B) y notemos que (A B)
c
= , pues de existir un elemento fuera
de la union obtendramos que ese elemento (x

1
, x

2
, ..., x

n
) A
c
B
c
, i.e., U(x

1
, ..., x

n
) < < L(x

1
, ..., x

n
),
mas sabemos que L(x
1
, ..., x
n
) U(x
1
, ..., x
n
) para todos los posibles valores (x
1
, ..., x
n
). Entonces, como
(A B)
c
= obtenemos que P

(A B) = 1.
Sabemos por nuestros cursos anteriores de probabilidad que la probabilidad P

(A B) esta dada como


sigue:
1 = P

(A B) = P

(A) +P

(B) P

(A B),
= P

(L(x
1
, ..., x
n
) ) +P

(U(x
1
, ..., x
n
) ) P

((L(x
1
, ..., x
n
) U(x
1
, ..., x
n
)),
= (1
1
) + (1
2
) P

((L(x
1
, ..., x
n
) U(x
1
, ..., x
n
)), por las hipotesis.
Luego, realizando el despeje necesario vemos que
P

((L(x
1
, ..., x
n
) U(x
1
, ..., x
n
)) = (1
1
) + (1
2
) 1 = 1
1

2
.
6
Omar Radhames Urqudez Calvo
Metodos Estadsticos - Intervalos de Conanza
Viernes 13 de Junio de 2014
Problema 5. Las variables aleatorias independientes X
1
, ..., X
n
tienen funcion de distribucion com un
G(t) =
_

_
0 si t 0
_
t

si 0 < t <
1 si t
Si > 0 es conocida, encontrar un lmite superior de la conanza para con el nivel de conanza de 0.95.
Denamos a X := max{X
1
, X
2
, ..., X
n
} y notemos que
P
_
X

t
_
= P[X t], pues > 0.
Ahora, como X X
i
, i [1, 2, ..., n] , sabemos que P[X t] = P[X
1
t, ..., X
n
t]. Luego, notemos
que
P
_
X

t
_
= P[X
1
t, ..., X
n
t],
= P[X
1
t]P[X
2
t] P[X
n
t], dado que son variables independientes.
Como todas comparten la funcion de distribucion G(t), podemos ver que si t 0, entonces P[X
i
t] = 0
para toda i [1, 2, ..., n]. De manera analoga, si 0 < t < , tenemos que P[X
i
t] =
_
t

y si t
entonces P[X
i
t] = 1, para toda i [1, 2, ..., n]. Entonces
P
_
X

t
_
= P[X
1
t]P[X
2
t] P[X
n
t] =
_

_
0 si t 0,
_
t

_
n
= t
n
si 0 < t < ,
1 si t .
=
_

_
0 si t 0,
t
n
si 0 < t < 1,
1 si t 1.
Como la distribucion de
X

no depende de , esta es una cantidad pivotal para . Luego


P
_
X
(0.05)
1
n

_
= P
_
X

(0.05)
1
n
_
,
= 1 P
_
X

< (0.05)
1
n
_
, y como 0 < 0.05 < 1 entonces
= 1 ((0.05)
1
n
)
n
= 1 (0.05) = 0.95.
Por lo tanto un lmite superior de conanza para , con un nivel de conanza del 95 % es
X
(0.05)
1
n
=
max{X
1
, X
2
, ..., X
n
}
(0.05)
1
n
7
Omar Radhames Urqudez Calvo
Metodos Estadsticos - Intervalos de Conanza
Viernes 13 de Junio de 2014
Problema 6. Sean X
1
, ..., X
n
variables aleatorias independientes e identicamente distribuidas como una
Exponencial(). Sea S
n
= X
1
+... +X
n
. Mostrar que S
n
es una cantidad pivotal y construir con esta un
intervalo de conanza del 90 % para cuando n = 20.
Notemos que S
n
= X
1
+ X
2
+ ... + X
n
. Ahora, consideremos una X
i
, con i [1, 2, ..., n] y notemos
que, como > 0 por ser X
i
Exp(), tenemos que
x

0, x 0 y
x

< 0, x < 0. Por lo que


P[X
i
x] = P
_
X
i

x

_
=
_
0 si x < 0,
_ x

0
e
s
ds si x 0.
Luego, como
_ x

0
e
s
ds =
_
x
0
e

ds =
_
x
0
e
s
ds
podemos concluir que X
i
tambien es una variable aleatoria con distribucion exponencial de parametro 1,
i [1, 2, ..., n]. Tenemos entonces que S
n
=
n

i=1
X
i
, al ser una suma de n v.a. i.i.d. como exponenciales,
S
n
Gamma(n, 1). Ademas, como su distribucion no depende de , S
n
es una cantidad pivotal para
que, para (x
1
, x
2
, ..., x
n
) jos, es estrictamente con respecto a este parametro.
Por lo anterior, podemos usar la funcion de densidad de S
n
para construir un intervalo de conanza.
Recordemos que, si f

(x) es la funcion de densidad de una distribucion Gamma, entonces


f

(x) =
_
0 si x < 0
x
n1
e
x
(n)
si x 0
Y, para el caso particular de n = 20, si x 0, f

(x) =
x
19
e
x
19!
. Luego, notemos que
_
13.254657
0
f

(t) dt =
_
13.254657
0
t
19
e
t
19!
dt 0.0500001 0.05,
_
27.87916
0
f

(t) dt =
_
27.87916
0
t
19
e
t
19!
dt 0.9499998 0.95.
Por lo que
P[13.254657 S
n
27.87916] =
_
27.87916
13.254657
f

(t) dt =
_
27.87916
13.254657
t
19
e
t
19!
dt,
=
_
27.87916
0
t
19
e
t
19!
dt
_
13.254657
0
t
19
e
t
19!
dt,
0.9499998 0.0500001 0.90
Entonces
_
13.254657
Sn
,
27.87916
Sn
_
es un intervalo de conanza del 90 % para con n = 20.
8

You might also like