You are on page 1of 27

Estadstica Inferencial 2016 Arturo Caldern G.

Captulo 2

Distribuciones importantes
La aplicacin a situaciones reales de los conceptos hasta ahora estudiados, requiere modelos mediana o
profundamente complejos para que sean tiles. Sin embargo, por complejo que pueda ser un modelo, siempre cabe
la posibilidad de trabajar con l, descomponindolo en partes ms simples.

Por ejemplo, si quisiramos describir el comportamiento del precio de un determinado bien a lo largo del tiempo,
bajo condiciones de competencia pura, pero con fluctuaciones aleatorias, podramos expresar dicho precio
mediante:
X t = X t 1 + t t = 1,2,3,L

Donde:
X t representa el precio de equilibrio en el periodo t (a partir de un equilibrio inicial X 0 );
X t 1 representa el precio de equilibrio en el periodo inmediato anterior;
t es el efecto de un ligero desequilibrio aleatorio.
> 0 es una constante (parmetro) que refleja una cierta proporcionalidad en la respuesta del precio en el
periodo t al precio del periodo anterior.

Razonablemente, podemos asumir adems que:


E[ t ] = 0 , que es la manera formal de decir que el azar no tiene favoritos, esto es, a veces los desequilibrios
transitorios y fortuitos sobrevalan el equilibrio, otras veces lo subvalan; pero a la larga o en promedio,
respetan las fuerzas del mercado.
V [ t ] = 2 . El segundo supuesto se puede ver como la contrapartida formal de la idea de que la variabilidad
de los desequilibrios fortuitos y transitorios no tiene por que ser constante; que el azar, aunque justo, es
voluble en sus restricciones y excesos, pudiendo variar stos de periodo en periodo, lo que implica una
varianza no constante, o sea una volatilidad cambiante.

En el modelo anterior, las propiedades bsicas residen en la variable t , pues reemplazando sucesivamente en la
ecuacin se llega a:
X t = t X 0 + t 11 + t 2 2 + t 3 3 + L + t 1 + t
esto es, conocer la distribucin de t nos pone en capacidad de explicar y predecir -en trminos
probabilsticos- el comportamiento del precio X t .

Ntese que, en lo que a Estadstica se refiere, la complejidad del modelo se atena bastante si hallamos la
distribucin del error aleatorio t .
Una manera de facilitar el trabajo futuro, es dedicar algo de tiempo a recolectar informacin acerca de variables
aleatorias tipo mejor dicho, de distribuciones tipo- que sirvan como ladrillos en la construccin de modelos
complejos. Estas distribuciones, que por otra parte, no por simples menos realistas, tienen fundamentos racionales
bien claros y entenderlos provee herramientas para anlisis ms profundos.

En las secciones que siguen pasaremos revista a un conjunto mnimo de distribuciones tipo, estudiando sus
orgenes y parmetros caractersticos.
Para unificar trminos, si X representa una variable aleatoria con funcin f X (x) de probabilidad o de densidad,

1
Estadstica Inferencial 2016 Arturo Caldern G.
llamaremos Distribucin de X al conjunto {( x, f X ( x )) | x RX } y escribiremos X ~ f X ( x ) para resaltar el
hecho de ser f X (x) la funcin de distribucin de X .

2.1 Distribucin Binomial

2.1.1 Uso
Esta es la distribucin que se presenta cuando contamos el nmero X de veces que ocurre un determinado evento
A sobre un total fijo de n repeticiones u observaciones independientes de un experimento.

Ejemplos:
(1) Se enva n = 60 cuestionarios a empresas para que los llenen con datos sobre empleo y se cuenta el
nmero X de cuestionarios devueltos llenos.
(2) Una persona contesta totalmente al azar una prueba con n = 20 preguntas de opcin mtiple y registramos
el nmero X de aciertos obtenidos por la persona.

2.1.2 Orgenes y Parmetros


Formalmente esta distribucin se presenta cuando hay un cierto evento A , que puede presentarse o no, como
resultado de un experimento aleatorio , y cuando este experimento se repite independientemente, una cantidad
fija de veces (digamos n veces) de modo que la probabilidad de p = P( A) se mantiene constante, contndose el
nmero de veces que ocurre A en el total de n repeticiones.

Proposicin
Sea A un evento que puede ocurrir con probabilidad p (o sea p = P( A) ) o puede no ocurrir con probabilidad
q = 1 p (esto es q = P( AC ) ). Si se repite n veces de forma independiente, el experimento de cuyo espacio
muestral es A un evento, y se define la variable aleatoria X = Nmero de veces que ocurre A en las n
repeticiones, entonces la funcin de probabilidad de X es:

PX ( x) = P( X = x) = Cxn p x q n x donde x = 0,1,2,L, n

Demostracin:
RX = {0,1,2,L, n} , ya que puede ocurrir que nunca se presente A , en cuyo caso X ser 0, o puede ocurrir A una
sola vez, y as hasta el otro caso extremo en que A se presenta siempre, en cuyo caso X ser n .
Ahora bien, que el evento A se presente en x veces especficas y que AC ocurra en las (n x) veces restantes,
tiene probabilidad:
x veces ( n x ) veces
64 748 6 474 8
( p. p.L. p )(q.q.L q) = p x q n x ;
y en total hay C xn casos de este tipo, por lo que podemos escribir:
P( X = x) = C p q n
x
x n x
, donde x es cualquier valor de R X = {0,1,2,L, n}

Observaciones:
n
Recordando el Binomio de Newton: (a + b )n = C nj a jb n j y aplicndolo a PX (x ) :
j =0
n n

PX ( x) = Cxn p x q n x = ( p + q ) = 1n = 1 . Como obviamente PX ( x) > 0 , hemos probado que PX (x) es


n

x =0 x=0
una funcin de probabilidad.

Parmetros
Esta distribucin est totalmente determinada si se conocen n y p , por lo que estas cantidades se consideran sus
"parmetros" (estructurales) caractersticos.

2
Estadstica Inferencial 2016 Arturo Caldern G.
Valores Esperados
Se puede probar que:

E ( X ) = X = np y V ( X ) = X2 = npq pues la funcin generatriz de momentos M X (t ) es:


M X (t ) = ( pet + q ) n < t <

Probemos la ltima afirmacin:

Aplicando la definicin de Funcin Generatriz:


n n n
M X (t ) = E (e tX ) = etx C x p x q n x = C x etx p x q n x = C (pet )x q n x ; Si aplicamos ahora el Binomio de
n n n
x
x=0 x=0 x =0
n

C (pet )x q n x obtenemos:
n
Newton a x
x =0
n
M X (t ) = C x ( pet ) x q n x = ( pet + q ) n que se cumple para todo t real. Es decir:
n

x =0

M X (t ) = ( pet + q ) n < t <

Observaciones:
(1) Derivando M X (t ) y evaluando en t = 0 obtenemos E ( X ) = np . Derivando por segunda vez y
evaluando en cero obtenemos E ( X 2 ) = np (q + np ) , que nos conduce a V ( X ) = npq
(2) La variable aleatoria X es llamada variable binomial, y su distribucin de probabilidades la llamaremos
Distribucin Binomial.
(3) El que la distribucin de X sea una binomial de parmetros n y p , se
denota as: X~B( x;n,p)
(4) El parmetro n determina la extensin del rango y p la forma de la distribucin: si p = 0.5 la
distribucin es simtrica, y conforme p se aleja de 0.5 la distribucin se hace asimtrica. Un grfico
donde representamos mediante barras centradas en los distintos valores de X , las probabilidades que
asigna B( x;n,p) ilustra lo que decimos:

.4 .3 .4

.3 .3

.2
b(x;n=10,p=.02 )

b(x;n=10,p=0.5)

b(x;n=10,p=0.8)

.2 .2

.1

.1 .1

0.0 0.0 0.0


0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10

x x x

p = 0.2 p = 0.5 p = 0.8

Ejemplo 2.1
Una petrolera efecta perforaciones en una concesin del gobierno, en donde, segn sus clculos, tiene un 25% de
probabilidad de dar con un pozo rentable al hacer una perforacin.

a) Si la compaa asigna un presupuesto de 12 millones de unidades monetarias (u.m.) para exploraciones,


sabiendo que necesita un mnimo de 4 cuatro pozos en explotacin para tener retorno positivo en la inversin
3
Estadstica Inferencial 2016 Arturo Caldern G.
(ganancias), y calcula un gasto de 2 millones de u.m. por perforacin. Con qu probabilidad tendr
ganancias?

b) En a) asuma que cada pozo rentable hace que las acciones de la compaa suban en 100r%. Si al inicio del
perodo un ttulo de esta compaa se cotizaba en M u.m. Cul es la Cotizacin Esperada despus de las
perforaciones? Considere que no hay baja en la cotizacin, por ningn concepto.

Solucin:
Sea el experimento consistente en realizar la perforacin de un pozo y sea A el evento 'La perforacin resulta en
un pozo rentable'. Entonces p = P( A) = 0.25 y q = 1 p = 0.75

Si la compaa hace n perforaciones y definimos la v.a.d. X = # de pozos rentables encontrados en las n


perforaciones, asumiendo independencia entre las perforaciones, tenemos que X se ajusta al modelo binomial,
esto es:
X~B( x;n,p = 0.25) PX ( x) = P( X = x) = Cxn (0.25) x (0.75) n x x = 0,1,2,L, n
12
a) En esta parte y dados los costos, la compaa puede realizar n = = 6 perforaciones y para que haya
2
ganancias, se necesita que X 4 . Evaluando esta probabilidad:
6
P(Ganancia) = C
x =4
6
x (0.25) x (0.75) 6 x = C46 (0.25) 4 (0.75) 2 + C56 (0.25)5 (0.75)1 + C66 (0.25) 6 (0.75) 0 = 0.033 y
se puede decir que con 3.3% de probabilidad, la compaa tendr ganancias. Se deduce que casi con seguridad, no
se lograr la rentabilidad suficiente.

b) Sea V el valor de la accin despus de las 6 perforaciones. Se cumple que V = M (1 + r ) x


( )
E (V ) = E M (1 + r ) x = ME (1 + r ) x . ( )
Aplicando la definicin de valor esperado:

( )
6 6
ME (1 + r ) = (1 + r ) C (0.25) (0.75)
x x 6
x
x 6 x
= C x6 [(1 + r )(0.25)]x (0.75)6 x = ([(1 + r )(0.25)] + 0.75) 6
x =0 x =0

= (1 + 0.25r ) y por tanto E (V ) = M (1 + 0.25r )


6 6

Ejemplo 2.2
Una prueba de aptitud tiene n = 20 preguntas de opcin mltiple, siendo cinco las opciones (una correcta y el
resto no) por pregunta. Si una persona marca todo al azar y se define X = # total de aciertos, calcule la pro-
babilidad de que la persona acierte en :
a) Dos preguntas
b) Al menos en una pregunta
c) Entre 4 y 5 preguntas

Solucin:
Identificando datos, tenemos:

A = "La persona acierta en la pregunta"; p = P( A) = 1 / 5 ; n = 20 . Entonces, asumiendo independencia entre


preguntas, se est en el contexto de la proposicin y se puede decir que X tiene distribucin binomial, i.e.

X~B( x;n = 20,p = 0.20) y PX ( x) = P( X = x) = C x20 (0.20) x (0.80) 20 x x = 0,1,2,...,20 .


a) P( X = 2) = 0 . 2 2 0 . 8 18 = 0 . 1369
20
C 2

b) P( X 1) = 1 P( X = 0) = 1 0 . 2 0 0 . 8 20 = 1 0 . 0115 = 0 . 9884
20
C 0

c) P( 4 X 5) =
20
0 . 2 4 0 . 8 16 + C 5 0 . 2 5 0 . 8 15 = 0 . 1145
20
C 4

4
Estadstica Inferencial 2016 Arturo Caldern G.
Observacin:
Como E ( X ) = X = np = 20(0.2) = 4 y V ( X ) = X2 = npq = 20(0.2)(0.8) = 3.2 ( por tanto X = 1.78 ),
podemos decir que si una persona contesta las 20 preguntas al azar, entonces ella puede tener entre 2 y 6 aciertos.

Ejemplo 2.3
En el ejemplo anterior, si cada acierto vale 4 puntos y cada error cuesta N puntos y se quiere que las personas que
contesten al azar, en promedio reciban puntaje 0 Cunto debe descontarse por cada error?

Solucin:
Si T es el puntaje total, entonces T = 4 X ( 20 X ) N y deseamos hallar N tal que E (T ) = 0 .

Aplicando propiedades del valor esperado:

E (T ) = E (4 X ( 20 X ) N ) = E (( 4 + N ) X 20 N ) = ( 4 + N ) E ( X ) 20 N . Pero E ( X ) = np = 4 , de modo
que E (T ) = ( 4 + N ) 4 20 N = 16 16 N . Igualando a 0 resulta N = 1 , esto es, se debe descontar un punto por
cada error.

2.2 Distribucin Geomtrica

2.2.1 Definicin y Parmetros

Definicin.
Sea X v.a. discreta, con rango R X = {1,2,L} . Sean p ]0,1[ y q = 1 p de valores dados. Diremos que X tiene
distribucin geomtrica de parmetro p , si su funcin de probabilidad es:

PX ( x) = P( X = x) = pq x 1 x = 1,2,3,L

Notacin.
Denotaremos el hecho de tener X distribucin geomtrica, escribiendo X G( x; p)

Parmetro.
El nico parmetro es p .

Observacin:

q x = pq 1(1 q ) = 1 q = p = 1 . Es decir, en efecto,
q p p
G ( x; p ) = pq x 1 = p q x 1 = pq 1
x =1 x =1 x =1 x =1
G( x; p) es una funcin de probabilidad.

Valores Esperados y Funcin Generatriz de Momentos


Se puede verificar que:
E ( X ) = X = 1 / p y V ( X ) = X2 = q / p 2 . Lo anterior se obtiene a partir de la funcin generatriz respectiva,
pet
que es M X (t ) = t < ln q . En efecto:
1 qet

qet pet
M X (t ) = E[etX ] =
x =1
etx pq x 1 = pq1 (et q) x = pq1(
x =1 1 qet
) = (
1 qet
) si tomamos t < ln q .

Como en la Binomial, en la Geomtrica la grfica depende de p :

5
Estadstica Inferencial 2016 Arturo Caldern G.
0.8
0.8 0.8

0.6
0.6 0.6

G(x;p=0.5)

G(x;p=0.8)
G(x;p=0.2)

0.4 0.4
0.4

0.2 0.2
0.2

0.0 0.0
0.0
1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10
1 2 3 4 5 6 7 8 9 10
X X
X
p
= 0.2 p = 0.5 p = 0.8

2.2.2 Origen

Origen.
La Distribucin Geomtrica aparece como resultado de contar cuntas veces se debe repetir un experimento hasta
lograr que ocurra un determinado suceso A por primera vez.

Proposicin
Sea A un evento con probabilidad p = P( A) > 0 . Supongamos que el experimento asociado al evento, se repite
sucesivas veces hasta que ocurra A por primera vez. Sea X := # total de repeticiones de . Entonces X G( x; p)
.

Demostracin
Es claro que R X = {1,2,L} . Sea x un elemento dado de R X :
( X = x) ocurre si y slo si en las ( x 1) primeras repeticiones ocurre AC y en
la repeticin x -sima ocurre A .

Sean los eventos Ai = En la repeticin i ocurre A , i=1,2,3,... entonces tenemos:


( x 1) veces x 1) veces
6444 474444 8 6(4 74 8
P( X = x) = P( A1 A2 A3 ... Ax 1 Ax ) = q.q.q K.q p = q x 1 p que se obtiene aplicando la regla del
C C C C

producto. Luego X G( x; p) .

Observacin: (Distribucin de Pascal o Binomial Negativa)

Es una generalizacin de la Geomtrica, que surge cuando se repite el experimento hasta que ocurre A por r -
sima vez, donde r es un entero positivo de valor fijo.

En este contexto, si X = # total de repeticiones, la f. de probabilidad de X es:


PX ( x) = P( X = x) = C rx11 p r q x r x = r , r + 1, r + 2,L

y sus valores esperados son E ( X ) = X = r / p y V ( X ) = X2 = rq / p 2 .

6
Estadstica Inferencial 2016 Arturo Caldern G.
Ejemplo 2.4
Si la compaa del Ejemplo 2.1 de la seccin 2.1.2 anterior asigna seis millones de u.m. para exploraciones y
calcula un gasto 2 millones de u.m. por perforacin, pero decide operar solamente un pozo. Con qu probabilidad
empezar a operar sin antes ver agotado su presupuesto?

Solucin:
En este caso la compaa har perforaciones hasta dar con el primer pozo y adems slo puede perforar hasta tres
pozos.

Sea X = # de perforaciones hasta dar con el primer pozo rentable; se ve que X se ajusta al modelo Geomtrico,
i.e. X G( x; p = 0.25) y tenemos que hallar P( X < 3) = P( X 2) = 0.25 + 0.25 * 0.75 = 0.4375 .
Finalmente, si se decide operar dos pozos y X es el nmero de perforaciones hasta dar con el segundo pozo,
entonces X tiene distribucin de Pascal de parmetros p = 0.25 y r = 2 .

Ejemplo 2.5
Un consumidor est en un mercado con infinitos productores del mismo bien que le ofrecen el producto a similar
precio pero con distintas modalidades de propaganda y trato al cliente, de modo que la eleccin del consumidor no
es inmediata sino aleatoria, con una probabilidad p de que se decida por el productor al cual est consultando
sobre el bien. Sea X el nmero de productores visitados por el consumidor. Cuntas consultas se espera que haga
esta persona? Con qu probabilidad har ms consultas de lo esperado?

Solucin:
Sea el experimento El consumidor consulta acerca del bien con un productor del mercado y sea A el evento
El consumidor decide comprar el producto al hacer la consulta con el productor. Por dato, p = P( A) > 0 es la
misma en cualquier consulta y as tenemos que X puede verse como # total de repeticiones de hasta que ocurre
A por primera vez, y se ve que la v.a. se ajusta al modelo Geomtrico, esto es X G( x; p) sera un modelo de
datos apropiado.

En el contexto anterior tenemos que E ( X ) = X = 1 / p y por tanto:


1
1 1 [| |] 1
P( X > E ( X )) = P( X > X ) = P( X > ) = P ( X [| |] + 1) = q p , donde [| |] denota el mximo entero
p p p
1 1
no mayor que . Por ejemplo, si p = 0.3 , entonces = 3.3 y as
p p
1
P( X > ) = P( X > 3.3) = P( X 4) = 0.73 = 0.343
p

2.3 Distribucin Hipergeomtrica

2.3.1 Definicin y Parmetros

Definicin
Sea X v.a. discreta, con rango R X = {1,2,L , n} . Sean N y M enteros positivos de valores dados, tales que
M < N . Diremos que X tiene Distribucin Hipergeomtrica de parmetros N , M y n si su funcin de
probabilidad es:
C xM CnNxM
PX ( x ) = P ( X = x ) = x = 1,2,L , n
CnN

Notacin.
Denotaremos el hecho de tener X distribucin Hipergeomtrica escribiendo X H ( x; N , M , n) . Adems
asumimos que n < M y n < N M .

7
Estadstica Inferencial 2016 Arturo Caldern G.
Parmetros.
Los parmetros son N , M y n .

Valores Esperados y Funcin Generatriz de Momentos.


M M N M N n
E( X ) = X = n y V ( X ) = X = n( )(
2
)( ) . En cuanto a M X (t ) , existe pero su expresin es
N N N N 1
muy complicada y resulta poco til.

2.3.2 Origen
Es la distribucin natural del muestreo simple de poblaciones finitas, cuando mediante una muestra aleatoria de
casos, pretendemos inferir el valor de alguna constante poblacional (una proporcin o una media). Los modelos
ms complejos de encuestas por muestreo usan, como unidad de base, este modelo.

Proposicin
Sea una poblacin compuesta de N elementos, M de los cuales poseen una cierta caracterstica A . Si se toma
una muestra al azar y sin reemplazo de n de los N elementos, y se cuenta el nmero X de casos en la muestra,
que tienen la caracterstica A , entonces X es variable aleatoria con distribucin H ( x; N , M , n ) .

Demostracin
Se ve que R X = {0,1,2,L, n} (asumiendo que n < M y n < N M , pues de lo contrario, X no podra ser 0 o n
).

Sea x un elemento cualquiera de R X , entonces ( X = x) ocurre si y slo si en la muestra x elementos poseen A


y n x poseen A C . Apliquemos la definicin clsica de probabilidad:

n ( S ) = C nN (pues una muestra equivale a subconjunto). Por otra parte:


n ( X = x ) = C xM C nNxM (pues en la muestra, debemos tener x de los M elementos que tienen A y n x de
C xM CnNxM
los N M que tienen A ). Luego es inmediato que
C
P ( X = x ) = , con lo que termina nuestra
CnN
deduccin.

Observacin
Si el muestreo es con reemplazo, cambian tanto el numerador como el denominador, y la distribucin de X ya no
es hipergeomtrica, sino binomial B( x;n,p = M / N ) . Es por esto que si n es pequea en relacin a N (y M ) se
puede aproximar H ( x; N , M , n ) mediante B( x;n,p = M / N ) . Esta aproximacin suele usarse cuando n < 0.1N .
En cualquier caso, la grfica de H ( x; N , M , n ) es similar a la de la distribucin binomial.

Ejemplo 2.6
En una encuesta en el sector informal, la poblacin consta de N empresas, de las cuales M de ellas son
Unipersonales. Se toma una muestra aleatoria de n empresas, y se cuenta el nmero X de empresas unipersonales
en la muestra, optndose por aproximar la proporcin M/N poblacional y desconocida, mediante la proporcin
muestral X/n, denotada (i.e. :=X/n). Asumiendo muestreo sin reposicin, calcule el valor esperado de .

Solucin:
Es claro que X se ajusta bien al modelo hipergeomtrico, i.e. X H ( x; N , M , n) y por tanto
X 1 1 M M
E ( ) = E ( ) = E( X ) = n = . Es decir, aunque la proporcin variar de muestra en muestra, la
n n n N N
M
tendencia es a coincidir con la verdadera proporcin poblacional .
N

8
Estadstica Inferencial 2016 Arturo Caldern G.
2.4 Distribucin de Poisson

2.4.1 Definicin y Parmetro

Definicin.
Sea X v.a. discreta, con rango R X = {0,1,2,3,L} . Sea > 0 una constante conocida. Diremos que X tiene
distribucin de Poisson de parmetro , lo que se denotar X ~ P(x; ) , si su funcin de probabilidad es:
e x
PX ( x) = x = 0,1,2,3,L
x!
Notacin.
Como ya se dijo, la distribucin se denotar P( x; ) .

Parmetros:
El nico parmetro es que determina la posicin de la distribucin y su forma: conforme crece la grfica se
desplaza a la derecha y se va haciendo simtrica con un mximo alrededor de

.3 .14 .10

.12
.08
.10
.2
.06
P(X;2)

.08
P(X;10)

P(X;18)
.06
.04
.1
.04
.02
.02

0.0 0.00 0.00


0 4 8 12 16 20 24 0 4 8 12 16 20 24 0 4 8 12 16 20 24
X X X

=2 = 10 = 18

Observaciones:
(1) Recordemos que una definicin alternativa de la funcin exponencial o una propiedad de ella (aplicando

Zk
desarrollo de Taylor-McLauren) es e = Z
que se cumple para todo nmero real z
k = 0 k!

e x x
(2) Aplicando lo anterior a P( x; ) , P ( x; ) = x!
= e x! = e e = 1 . Es decir, P( x; ) es una
x =0 x =0 x =0
funcin de probabilidad.

Valores Esperados y Funcin Generatriz de Momentos.


t
E( X ) = X = y V ( X ) = X2 = . Los esperados anteriores salen de M X (t ) , que es M X (t ) = e ( e 1)
<t <

Veamos:

x
x
(e t ) x et t
M X (t ) = E (e tX ) = e tx e = e e tx = e =e e = e ( e 1) , que se cumple para todo t
x =0 x! x =0 x! x =0 x!
real.

9
Estadstica Inferencial 2016 Arturo Caldern G.
2.4.2 Orgenes

P( x; ) tiene dos orgenes, ambos relacionados, aunque uno de ellos es poco actual. La distribucin surge como
aproximacin a la distribucin binomial (cuando n es grande y p tiende a 0) y tambin como modelo de un
proceso aleatorio.

Proposicin 1 (Aproximacin de la Binomial a la Poisson)


Sea una v.a. X ~ B( x;n,p) , sean n y p tales que n tiende a , p tiende a 0, de modo que el producto np
tiende a un valor fijo . Entonces se cumple que:
B(x;n,p) P( x; )
Nota:
Aunque se dice que la aproximacin es vlida si n es grande y p es pequeo, no hay regla fija (todo depende
del grado de aproximacin que se desee); una muy usada es considerar que n es grande y p pequeo si ocurre
np < 5 .

Este uso de la distribucin fue importante antiguamente, cuando no se tena a mano calculadoras, pero s tablas de
la funcin exponencial.

Proposicin 2 (Proceso de Poisson)


Sea E un evento que se presenta en puntos aleatorios del tiempo (o del espacio), de modo que son satisfechos los
siguientes supuestos:

(1) Para todo intervalo de longitud dt suficientemente pequea, la probabilidad de observar una vez E es
proporcional a dt , i.e.:
P( E ocurre una vez en [t , t + dt[ ) = wdt t real ( w > 0 )

(2) Para todo intervalo de longitud dt suficientemente pequea, la probabilidad de observar ms de una vez E es
nula i.e.: P ( E ocurre ms de una vez en [t , t + dt[) = 0

(3) Intervalos disjuntos son independientes en relacin a la ocurrencia de E .

Si t > 0 es un valor dado y definimos X = # de veces que ocurre E en el intervalo [0, t [ .

Entonces X tiene distribucin de Poisson de parmetro = wt , esto es X ~ P( x; = wt )

Nota:
E[ X ] X
Como E ( X ) = wt , entonces w = = E[ ] , de modo que podemos considerar a w como el Nmero
t t
promedio de veces que ocurre E por unidad de tiempo.

El proceso descrito en el enunciado anterior, se conoce como Proceso Aleatorio de Poisson y aunque se ha
enunciado en el tiempo, puede presentarse en el espacio. Como ejemplos de procesos que se pueden modelar con el
de Poisson, tenemos: La llegada de aviones a un aeropuerto; la llegada de clientes a una ventanilla en un banco; La
presencia de partculas de polvo en el aire; La presencia de burbujas en una superficie recin pulida o barnizada;
etc. Es el modelo ms simple de un conjunto mucho ms general de modelos que describen ingresos y salidas de
elementos a un sistema (pagos y rdenes de pago, solicitudes y prestaciones) en el tiempo.

Ejemplo 2.7
Suponga que la cantidad de buques-tanque que llega a un puerto por da, se presenta de acuerdo a un Proceso de
Poisson, a una tasa de 2 buques-tanque, en promedio, por da.

a) Cul es la probabilidad de que en un da, el nmero de buques-tanque que llega al puerto sea menor de lo
esperado?

10
Estadstica Inferencial 2016 Arturo Caldern G.
b) El puerto slo puede atender a 2 buques-tanque por da, y cualquier otro buque excedente, se enva a un puerto
vecino: Qu porcentaje de los das, se enviarn buques al puerto vecino?
c) Cul sera la probabilidad de que Ud. llegue al puerto a medio da y encuentre que ya se llen el puerto?
d) Si N es el nmero de buques atendidos por da en el puerto, halle E (N )

Solucin:
De las condiciones dadas, tenemos que la tasa de llegada es w = 2 . Sea t > 0 valor dado y definamos E =Llegada
de un buque-tanque al puerto. En este contexto, la v.a. X = Nmero de buques tanque que llegan entre 0 y t tiene
distribucin de Poisson de parmetro = wt = 2t . Entonces:

a) En este caso t = 1 y = wt = 2 , luego X ~ P( x; = wt = 2) y E ( X ) = 2 , as que la probabilidad pedida es


20 22 2
1
P( X < 2) = P( X 1) = PX (0) + PX (1) = e +e = 3e 2 = 0.41
0! 1!

b) Nos piden P( X > 2) = 1 P( X 2) y como P ( X 2) = PX (0) + PX (1) + PX ( 2) , slo necesitamos calcular


22
PX ( 2) = e 2 = 2e 2 . Por tanto P( X 2) = 3e 2 + 2e 2 = 5e 2 = 0.68 y entonces
2!
P( X > 2) = 1 P( X 2) = 0.32 : El 32% de los das se enviar buques al puerto vecino.

c) Si llegamos en t = 1 / 2 da, para que ya est lleno el puerto, debe de haber ocurrido que en el intervalo ]0,1 / 2]
(o sea la primera mitad del da) llegaron dos o ms buques tanque. En este caso t = 1 / 2 X ~ P( x; = wt = 1)
y nos piden P ( X 2) = 1 P ( X 1) = 1 {PX (0) + PX (1)} = 1 2e1 = 0.26

d) Es claro que N = 2 X si X = 0,1 y N = 2 si X 2 , donde X = Nmero de buques tanque que llegan en


t = 1 da. Luego E ( N ) = 0 PX (0) + 1 PX (1) + 2 P ( X 2) =
0 e 2 + 1 2e 2 + 2 (1 3e 2 ) = 2 4e 2 = 1.46 buques.

11
Estadstica Inferencial 2016 Arturo Caldern G.
2.5 Distribucin Exponencial

2.5.1 Definicin y Parmetro

Definicin
Sea X v.a.c. con rango RX = ]0, [ y sea > 0 una constante de valor dado. Diremos que X tiene distribucin
exponencial de parmetro si la funcin de densidad de X es:
f X ( x ) = e X x>0
Observacin

x
f X ( x)dx = e x dx = e = 1 , de modo que se verifica que Exp( x; ) es funcin de densidad.
0
0 0

Parmetro.
El nico parmetro es , que determina la grfica de la distribucin y escribiremos X Exp( x; ) para denotar
el hecho que X tiene distribucin exponencial.

Distribucin Exponencial Distribucin Exponencial Distribucin Exponencial


y=exp(x,1) y=expon(x,2) y=expon(x,4)
2.0 2.0 5.0

4.5

4.0
1.5 1.5
3.5

3.0

1.0 1.0 2.5

2.0

1.5
0.5 0.5
1.0

0.5

0.0 0.0 0.0


0.748 1.495 2.243 2.990 0.748 1.495 2.243 2.990 0.748 1.495

=1 =2 =4

Valores Esperados y Funcin Generatriz de Momentos.



E( X ) = X = 1 / y V ( X ) = X2 = 1 / 2 , pues M X (t ) = ( ) t < . Calculemos M X (t ) :
t


( t ) x e ( t ) x
M X (t ) = E ( e ) = e e = ( t ) si t < .
x
tX tx
dx = e dx =
0 0 ( t ) 0
Derivando M X (t ) con respecto a t sucesivas veces y evaluando en t = 0 , se obtiene E ( X ) , E ( X 2 ) y de ah X y
X2 .

Ejemplo 2.8
Si el ingreso empresarial en un pas, es una v.a. X con distribucin exponencial de parmetro y se dispone un
tributo nuevo de 15% para los ingresos superiores al promedio poblacional Qu % de la poblacin pagar el im-
puesto?

Solucin:
En este caso, se nos pide hallar P( X > 1 / ) ), donde X es el ingreso de una empresa y X Exp( x; ) .
Integrando directamente obtenemos:

12
Estadstica Inferencial 2016 Arturo Caldern G.

x
P ( X > 1 / ) = e dx = e [
x
]
1

= e 1 = 0.38
1

1.5.2 Orgenes
La distribucin Exponencial aparece de modo muy natural en un proceso de Poisson, como la distribucin de un
Tiempo de Espera.

Proposicin
Si en un proceso de Poisson, definimos T := Tiempo que transcurre hasta que ocurre E por primera vez, entonces
T Exp(t; = w) , donde w es la tasa de ocurrencias de E por unidad.

Demostracin
Es claro que RT = [0, [ . Sea t valor dado aunque arbitrario de RT y sea GT (t ) = P(T t ) la distribucin
acumulativa de T , evaluada en t .

Como el evento (T t ) equivale a En [0, t [ , E ocurre 1 o ms veces, si definimos X = # de ocurrencias de E


en [0, t [ , ya sabemos que X P( x; = wt ) .
Por tanto: GT (t ) = P(T t ) = P( X > 1) = 1 P( X = 0) = 1 e wt y derivando tenemos:
g T (t ) = GT' (t ) = we wt , es decir T Exp(t; = w)

Observaciones:
(1) Como el punto cero es arbitrario, tambin podemos ver a T como el tiempo que transcurre entre dos
ocurrencias sucesivas de E.
(2) Por la deduccin hecha antes, se entiende que la distribucin exponencial sea muy usada como modelo para
los tiempos de espera o tiempos de vida. Generalizando la distribucin exponencial obtenemos la Distribucin
Gamma.

Por lo anterior, esta distribucin es muy usada para construir modelos relativos a Tiempos de Espera o tambin
Tiempos de Vida, y puede generalizarse y en ese caso se tiene la Distribucin Gamma.

2.6 Distribucin Gamma

2.6.1 Funcin Gamma

Denotada ( p) , la funcin matemtica Gamma (evaluada en p), se define mediante:



( p ) = y p 1e y dy p > 0
0
Se puede probar que la integral anterior existe para todo p positivo.

Propiedades
(1) (p) = (p-1) (p-1) para p > 1. (Usando integracin por partes)
(2) (k) = (k-1)! si k es entero positivo. (Aplicando (1))
(3)
1
( ) = (aplicando cambio de variable y sustitucin trigonomtrica)
2

2.6.2 Funcin de Densidad Gamma y Parmetros

Definicin
Sea X v.a.c. con R X = [0, [ y sean > 0 y > 0 , constantes de valores dados. Diremos que X tiene
distribucin Gamma, de parmetros y , lo que se denotar X ( x; , ) , si su funcin de densidad es:

13
Estadstica Inferencial 2016 Arturo Caldern G.
1 x /
x e
f X ( x) =
x>0
( )
Parmetros
Los parmetros son y . La grfica es asimtrica a la derecha, pero conforme crece , la asimetra se atena:

Distribucin Gamma Distribucin Gamma Distribucin Gamma


y=Gamma(x,2,4) y=gamma(x,10,2) y=gamma(x,16,2)
0.50 0.30 0.30

0.25 0.25

0.20 0.20

0.25 0.15 0.15

0.10 0.10

0.05 0.05

0.00 0.00 0.00


0.0 2.5 5.0 7.5 10.0 0.0 2.5 5.0 7.5 10.0 0.0 2.5 5.0 7.5 10.0 12.5 15.0 17.5 20.0

=2,=2 =10,=2 =16,=2

Valores Esperados y Funcin Generatriz de Momentos.


1
E ( X ) = X = y V ( X ) = X2 = 2 , que se deducen de M X (t ) = (1 t ) si t <

Observaciones:
(1) La distribucin exponencial es un caso particular de la Gamma.
(2) Otro caso particular e importante de la Gamma ocurre cuando =2 y =k/2, donde k es entero positivo dado.
Esta distribucin se presenta cuando medimos la varianza en muestras aleatorias y se conoce como Distribu-
cin Ji-Cuadrado, denotndose mediante 2(k). El nico parmetro de esta distribucin es k y es llamado
"Grados de Libertad. En esta distribucin se cumple que X =k; 2X = 2k; Mx(t)=(12t)-k/2 si t < 1/2.
(3) Tanto la distribucin Exponencial como la Gamma se usan como modelos tericos para distribuciones
asimtricas como Ingresos, Tiempos de Vida, Edades, etc.

2.6.3 Origen

La Gamma se presenta de modo natural en un proceso de Poisson, cuando medimos el tiempo entre varias
ocurrencias del evento E. Formalmente:

Proposicin.
En un proceso de Poisson, sea Tk el tiempo que transcurre hasta que ocurre E por k -sima vez. Entonces Tk
tiene distribucin Gamma de parmetros = k y = 1 / w

Demostracin:
La demostracin es similar a la del origen de la distribucin exponencial:
Lo principal es darse cuenta que los eventos (Tk t ) y ( X k ) , donde X es el nmero de ocurrencias de E en
el intervalo ]0, t ] , son equivalentes y por tanto:
k 1
(t ) x
GTK (t ) = P[Tk t ] = P ( X k ) = 1 P ( X k 1) = 1 e (t ) x!
x =0
Derivando con respecto a t, se obtiene:

14
Estadstica Inferencial 2016 Arturo Caldern G.
1 1
t /( ) t /( )
(t ) k 1 k k 1 (t ) k 1 k 1
e (t ) ( ) t e t e t e
g TK (t ) = = = = t>0
(k 1)! ( k 1)! 1 1
( ) ( k 1)!
k
( ) ( k )k

que corresponde a una distribucin Gamma de parmetros = k y = 1 / w

Ejemplo 2.9
El nmero de unidades de transporte que circula por una avenida de la ciudad se presenta a razn de W
vehculos/cuadra aproximadamente. Un economista de transporte est formulando un modelo al respecto y en un
muestreo, encuentra sobre 10 cuadras consecutivas, un total de 50 unidades.

a) Cul es el valor de w?
b) Con qu probabilidad encontraramos que entre dos unidades de transporte median menos de 0.25 cuadras?
c) Un micro entra a la avenida y le informan que dos unidades de la misma lnea le preceden. Qu distancia
esperara que medie entre el micro entrante y el ms cercano de los que lo preceden? Del ms alejado? Con
qu probabilidad sern las distancias mayores que lo esperado? Mida la distancia en cuadras y asuma que el
nmero de vehculos de esta lnea en la avenida tiene una tasa igual a la cuarta parte de la general

Solucin:
a) Si X = # de vehculos en t = 10 cuadras (tomamos como unidad la cuadra), entonces
E[ X ] X
X ~ P( x; = wt = 10w) . Sabemos que E ( X ) = wt y w = = E[ ] que define a w como el
t t
Nmero promedio de veces que ocurre E por unidad y de los datos tenemos
10 w = 50 w = 5 vehculos / cuadra .

b) Sea T=Distancia entre dos vehculos, entonces T ~ Exp(t; = 5) de acuerdo a la proposicin demostrada
lneas arriba.
0.25
Luego P (T 0.25) = 5e
5t
dt = 1 e 1.25 = 1 0.29 = 0.71
0
c) En este caso la tasa w = 5 / 4 = 1.25 y podemos aplicar sucesivamente las proposiciones relativas al origen de
las distribuciones exponencial y gamma.
Si definimos T1 = Distancia entre el micro que entra a la avenida y el ms cercano de los que lo preceden,
podemos ver que T1 ~ Exp ( t; = 5 / 4) y adems E (T1 ) = 1 / = 4 / 5 = 0.8
Anlogamente si T2 = Distancia hasta el micro ms alejado, podemos ver que T2 ~ (t ; = 2, = 4 / 5) (no
confundir este parmetro con el de la exponencial). De lo anterior resulta E (T2 ) = = 8 / 5 = 1.6


1.25t 1 te t /( 0.8)
Finalmente P (T1 > 0.8) = 1.25e dt = e = 0.37 y P(T2 > 1.6) = (0.8) 2
dt =0.41
0.8 1.6

2.7 Distribucin Normal

Es el modelo ms usado de variable continua. Se presenta de modo natural cuando se trabaja con la distribucin de
variables que son ellas mismas, sumas de un nmero muy grande de variables aleatorias, como es el caso de
muchas variables econmicas que son "agregados", como la demanda global por ejemplo.

2.7.1 Definicin y Parmetros


Sea X v.a. continua y sean y > 0 constantes reales de valor conocido. Diremos que X tiene distribucin
normal de media y varianza 2 , si la funcin de densidad de X es de la forma:

15
Estadstica Inferencial 2016 Arturo Caldern G.
e ( x ) / 2
2 2

f X ( x; , 2 ) = < x < +
2
Parmetros
Los parmetros caractersticos de esta funcin de densidad son y , pues
2

se puede demostrar que E ( X ) = X = y V ( X ) = X2 = 2

Observaciones
La distribucin normal de parmetros y se denota N ( , 2 ) y el que
2

X tenga o siga esta funcin de densidad, se denota mediante X ~ N ( , 2 ) .

Aunque el rango terico es < x < + , en la prctica se observa que el intervalo 3 x + 3


contiene al 99.9% de los casos.

La Grfica de la distribucin es simtrica con respecto a , con puntos de inflexin en y asintticamente se


"pega" al eje X .

X ~ N (10,9)
Relacin de la grfica de f X ( x ) con y 2

Si se mantiene fija y 2 crece, la distribucin se "aplana"; en cambio si 2 disminuye, la distribucin se


"angosta". Esto se debe a que 2 mide la dispersin o variabilidad de X alrededor de la media .

Cambios en la forma de f X ( x ) cuando 2 vara, mantenindose constante

= 0 2 =1 =0 2 =4 = 0 2 = 1/ 4

16
Estadstica Inferencial 2016 Arturo Caldern G.
Si se mantiene fija y cambia, la distribucin se "traslada" en la misma direccin que . Esto se debe a
2

que indica la posicin promedio de X , es el valor ms frecuente y representativo de la distribucin.

Cambios en la posicin de f X ( x ) cuando vara, mantenindose constante


2

=4 2 =9 =6 2 =9 =8 2 =9

Valores Esperados y Funcin Generatriz de Momentos.


t2 2
t +
Como ya se dijo, se cumple que E ( X ) = X = y V ( X ) = 2
X = , que se deducen de M X (t ) = e
2 2

<t <

El clculo de probabilidades con distribuciones normales, se simplifica gracias a una propiedad interesante de la
distribucin normal y su corolario. Esta propiedad dice que funciones lineales de variables normales tambin
tienen distribucin normal. Esta propiedad es una de las llamadas Propiedades reproductivas, aplicables a
funciones lineales.

2.7.2 Distribucin Normal Estndar

Propiedad
Si X ~ N ( , 2 ) y se define Y = a + bX , donde a y b 0 son constantes o no aleatorias, entonces se cumple
Y ~ N ( a + b , b 2 2 ) .

Esta propiedad nos dice que funciones lineales de variables normales, tambin tienen distribucin normal

Demostracin
Basta aplicar la tcnica de cambio de variable en la distribucin acumulativa de Y . Veamos, supongamos que
b > 0 , entonces:

d
GY ( y ) = P (Y y ) = P ( a + bX ) y ) = P ( X ( y a ) / b) = FX (( y a ) / b) y g Y ( y ) = FX (( y a ) / b))
dy
y a y a b 2
( ) 2 / 2 2 ( ) / 2 2
e ( y a b ) / 2 (b )
2
( y a) 1 e
2
b b
1 e
= fX ( ) = = =
2 (b )
que corresponde a una
b b 2 b 2 b
funcin de densidad normal de media Y = a + b y varianza Y2 = b 2 2 . El caso en que b < 0 se resuelve de
manera anloga.

Corolario
( X )
En el contexto anterior, si definimos Z = , entonces se cumple que Z ~ N (0,1) .

Este corolario permite reducir el clculo de una probabilidad en una distribucin general, al calculo
equivalente en una distribucin N (0,1) .

17
Estadstica Inferencial 2016 Arturo Caldern G.

El proceso se puede describir formalmente as:


X t t
P( X t ) = P ( X t ) = P ( ) = P( Z )

X 10 15 10
Por ejemplo, si X ~ N (10,9) P( X 15) = P( ) = P( Z 1.67)
3 3

P( X 15) = P( Z 1.67)

Dada esta propiedad, la distribucin N (0,1) adquiere singular importancia, as como la variable Z , razn por la
cual, esta distribucin recibe el nombre de Distribucin Normal Estndar y la variable Z se llama Variable
Normal Estndar. La distribucin acumulativa de la variable Z ha sido tabulada y permite calcular
probabilidades relativas a cualquier variable normal.

Uso de la Tabla Normal Estndar


La tabla de probabilidades acumuladas de la distribucin N (0,1) tiene las reas acumuladas o probabilidades, para
distintos valores de Z definidos hasta el nivel de las centsimas. La lectura de las probabilidades es directa: basta
con "entrar" a la tabla con el valor de Z al nivel de las dcimas en la lnea horizontal correspondiente y en el cruce
con la columna de las centsimas correspondientes, ubicar la probabilidad acumulada:

Ejemplo 2.10
1. Si Z ~ N(0,1) hallar
(a) P[ Z 1.96 ]
(b) P[ Z > 1.96 ]
(c) P[ Z 1.00 ]
(d) P[ 1.00< Z 1.96 ]

Solucin:
(a) P[ Z 1.96 ] = 0.975

(b) P[ Z > 1.96 ] = 1 - P[ Z 1.96 ] = 1 - 0.975 = 0.025

(c) P[ Z 1.00 ] = 0.8413

(d) P[ 1.00< Z 1.96 ] = P[ Z 1.96 ] - P[ Z 1.00 ] = 0.975 - 0.8313 = 0.1437

2. Si Z ~ N(0,1) hallar Z0 tal que:


(a) P[ Z Z0 ] = 0.8508
(b) P[ 0 < Z Z0 ] = 0.40

Solucin:
(a) Por lectura "inversa" de la Tabla, esto es entrando con la probabilidad acumulada y despus de ubicar sta,
yendo a los bordes, se tiene que: Z0 = 1.04

18
Estadstica Inferencial 2016 Arturo Caldern G.

(b) Como P[ 0 < Z Z0 ] = P[ Z Z0 ] - P[ Z 0 ] = P[ Z Z0 ] - 0.5 y esta diferencia vale 0.4 por dato, podemos
escribir:

P[ Z Z0 ] = 0.4 + 0.5 = 0.9 Entrando a la Tabla con una probabilidad acumulada 0.9, encontramos que no hay un
valor exacto, pero si podemos ubicar las dos probabilidades acumuladas ms cercanas (una por defecto y la otra por
exceso) que son 0.8997 y 0.9015, cuyos valores Z son 1.28 y 1.29 respectivamente. Por tanto, tomamos como valor
aproximado de Z0, el promedio simple de ambos, esto es Z 0 (1.28 + 1.29) / 2 = 1.285

Ejemplo 2.11
Si X ~ N(10,9) calcular P[ X 15 ] y X0 tal que P[ X > X0 ] = 0.95

Solucin:
Aqu tenemos que =10 y 2 =9. Es decir =3, por tanto, estandarizando
15 10
P( X 15) = P( Z ) = P( Z 1.67) = 0.9525 .
3
X 0 10
Finalmente P ( X > X 0 ) = 0.95 P ( X X 0 ) = 0.05 P( X X 0 ) = 0.05 = P( Z ).
3
Buscando en la tabla Z con 0.05 de probabilidad acumulada tenemos
X 0 10
1.645 de donde X 0 10 3 1.645 = 5.065
3

Ejemplo 2.12
En una regin del pas, el ingreso familiar es una v.a.c. X con distribucin normal de parmetros =300 y 2=1002

a) En la regin slo el 2.5% de las familias se considera de altos ingresos Cul ingreso X0 define a una familia
como de altos ingresos?
b) Si se considera que el costo de una Canasta Familiar mnima es 350 u.m. y el gobierno asegura que con su plan
de reactivacin, en cinco aos slo el 30% de las familias estar en Pobreza: Cunto dinero adicional tendra
que ganar cada familia para que lo anterior sucediera?

Solucin:
X 0 300
a) Por dato P ( X X 0 ) = 0.025 P ( X X 0 ) = 0.975 P ( Z ) = 0.975 as que
100
X 0 300
= 1.96 X 0 300 = 196 X 0 = 496
100

b) Sea Y el ingreso luego del plan de reactivacin, entonces Y = X + c donde c es el dinero adicional en el
ingreso de cada familia. Si el % de pobreza es 30%, entonces se cumplira P (Y < 350) = 0.3 o equivalente-
350 c 300
mente P( X + c < 350) = 0.3 0.3 = P( X < 350 c) = P( Z < ) y de la tabla Z tenemos
100
350 c 300 50 c
= 0.525 = 0.525 c = 102.5
100 100

19
Estadstica Inferencial 2016 Arturo Caldern G.
2.7.3 Origen de la Distribucin Normal

Proposicin (Teorema del Lmite Central)


Sean X 1 , X 2 ,L , X n ,L variables aleatorias independientes con medias 1 , 2 ,L, n ,L y varianzas
12 , 22 ,L, n2 ,L
n
Sea T = X
j =1
j . Si el nmero n de sumandos es grande ( n 30) , entonces

n n
T ~ N ( T , T2 ) , donde T = j y T2= 2j
j =1 j =1
Observaciones:
Este teorema es el que permite atribuir normalidad de datos cuando la o las variables bajo estudio, se pueden
considerar como la suma de un nmero grande de variables. En Economa, variables como el producto nacional y la
demanda agregada se asumen con distribucin normal gracias al teorema anterior. La misma razn hace que la
distribucin normal sea tomada como un patrn para procesos de diversa naturaleza.

Ntese que no es requisito que las variables X j tengan ellas mismas distribucin normal, es suficiente que la
cantidad n de sumandos sea grande.
El teorema es vlido incluso si las variables no son independientes.

Un caso muy frecuente ocurre cuando j = y 2j = 2 , de modo que se tiene T ~ N ( n , n 2 )

La cantidad ( n 30) es un promedio; si las variables X j originales tienen distribucin simtrica, es posible que el
teorema se cumpla con un n menor; en cambio si las distribuciones son asimtricas, n tendr que ser bastante
mayor que 30 para que tenga vigencia el teorema.

Proposicin (Aproximacin de la Distribucin Binomial a la Normal)


k np
Si X ~ B( x;n,p) y n es "grande", entonces se cumple que P( X k ) P( Z )
npq
n
Esta propiedad es consecuencia del Teorema del Lmite Central, si recordamos que X = X
j =1
j donde X j = 1 si

ocurre A en la j-sima repeticin del experimento y X j = 0 si A no ocurre en la j-sima repeticin del


experimento.

No hay un criterio nico para decidir si n es "grande", pero nosotros usaremos el siguiente: Si np > 5 y nq > 5 ,
consideraremos que n es "grande".

Ejemplo 2.13
Una prueba tiene 40 preguntas o "items", y se calcula que en promedio, una persona demora una media de = 1.5
minutos por tem, con una desviacin estndar de = 0.50 minutos. Si se desea poner un tiempo lmite para la
prueba, de modo que el 90% de personas complete la prueba Cul sera el tiempo T* que debiera fijarse?

Solucin:
40
Si definimos T = Tj =1
j , donde T j es el tiempo usado en el j-simo tem, como son n=40 tems, asumiendo
independencia entre tiempos, podemos aplicar el Teorema del Lmite Central y decir que
T ~ N ( T = 40 = 60, T2 = 40 2 = 10)

En este contexto, T * satisface la condicin P (T T * ) = 0.90 o equivalentemente

20
Estadstica Inferencial 2016 Arturo Caldern G.
T 60 T 60
*
T 60 *
0.90 = P (T T * ) = P ( ) = P( Z )
10 10 10

De la Tabla Z obtenemos

T * 60
= 1.285 T * = 60 + 1.285 10 = 64.06 Concluimos que el tiempo para la prueba debiera fijarse en
10
unos 64 minutos.

2.8 Distribucion Lognormal

Esta distribucin aparece como una consecuencia del Teorema del Lmite Central cuando los efectos del azar no
son aditivos sino multiplicativos.

2.8.1 Definicin y Parmetros

Definicin
Sea X variable aleatoria continua con rango R X = [0 , [ y sean y 2 > 0 constantes reales de valor
conocido. Diremos que X tiene distribucin Lognormal de parmetros y 2 , si Y = ln X tiene distribucin
normal N ( , 2 )
Lo anterior se denota escribiendo X ~ LogN ( , 2 ) .

Parmetros
Los parmetros son y 2 . Aunque la grfica es asimtrica, la forma va cambiando con

Distribucin Lognormal
Distribucin Lognormal Distribucin Lognormal y=lognorm(x,3,1)
y=lognorm(x,0,1) y=lognorm(x,1,1)
0.05
0.8 0.30

0.25 0.04

0.6
0.20 0.03

0.4 0.15
0.02

0.10
0.2 0.01
0.05

0.00
0.0 0.00 0 5 10 15 20 25 30 35 40 45 50 55 60
0 5 10 15 20 0 5 10 15 20

=0, 2=1 =1, 2=1 =3, 2=1

Observaciones
(1) Sea FX ( x ) = P ( X x ) la distribucin acumulativa de X . Entonces se cumple
FX ( x ) = P ( X x ) = P (ln X ln x ) = P (Y ln x ) , donde Y ~ N ( , 2 ).

(2) De lo anterior, al calcular probabilidades de una distribucin Lognormal, basta convertir el problema en uno
de clculo de probabilidades en una distribucin N ( , 2 ). En efecto:
ln x ln x
FX ( x ) = P( X x ) = P(ln X ln x ) = P(Y ln x ) = FY (ln x ) = P( Z ) = FZ ( )

(3) Como FX ( x ) = FY (ln x ) Derivando con respecto a x tenemos:
1 1 e (ln x ) / 2
2 2

f X ( x ) = F (ln x ) = f Y (ln x ) =
'

2
Y
x x
21
Estadstica Inferencial 2016 Arturo Caldern G.

Proposicin
La funcin de densidad de X es
e (ln x ) / 2
2 2

f X ( x) = x>0
x 2
2.8.2 Valores esperados
t2 2
t +
Como Y = ln X ~ N ( , ) M Y (t ) = e 2 2
. Pero tambin sabemos que M Y (t ) = E ( etY )
t2 2
t +
E (e t ln X
) = E (e ln X t
) = E ( X ) . Es decir, E ( X ) = e
t t 2
t.
1
+ 2
Evaluando en t = 1 obtenemos X = E ( X ) = e y en t = 2 obtenemos E ( X 2 ) = e 2 + 2
2
2

Proposicin
1
+ 2
Si X ~ LogN ( , ) entonces X = E ( X ) = e y X2 = V ( X ) = e 2 + 2 e 2 +
2 2
2 2

Observacin:
Ntese que E ( X ) y 2 V ( X ) en esta distribucin.

Origen (Teorema del Lmite Central para productos)


Sean W1 ,W2 ,L,Wn ,L variables aleatorias positivas e independientes con medias y varianzas finitas. Sea T el
n
producto de estas variables, i.e. T = W
j =1
j . Si el nmero n de factores es grande ( n 30 ), entonces se cumple

n n
T ~ LogN ( , ) , donde = j y = 2j , siendo j = E ( LnW j ) y 2j = V ( Ln(W j ))
2 2

j =1 j =1

Ejemplo 2.14
La cotizacin de una accin en la bolsa, despus de cierto tiempo en el mercado de valores, es una v.a.c. X con
distribucin LogNormal de parmetros y 2

a) Si =5 y =1 Con qu probabilidad la cotizacin ser menor que 190 u.m.?


b) Un inversionista espera que el ttulo se cotice a 1,100 u.m. aunque sabe que con 94% de probabilidad el ttulo
no pasar de 3,200 u.m. Cules son los parmetros de la distribucin?

Solucin:
a) P( X < 190) = P(ln X < ln 190) = P(ln X < 5.25) = P( Z < 0.25) = 0.5987
1
+ 2
1
b) X = E ( X ) = e = 1,100 + 2 = 7 (I) y
2
2
8.1 8.1
P( X < 3,200) = P(ln X < 8.1) = P( Z < ) = 0.94 = 1.55 8.1 = 1.55 (II)

Resolviendo (I) y (II) se obtienen y : 2

1 1 1
De (I) + = 7 = 7 y en (II) 8.1 7 + 2 = 1.55 2 3.1 + 2.2 = 0
2 2

2 2 2
3.1 9.61 4 2.2 3 .1 0 .9 1.1 6.5
= = = = y =
2 2 2 5

Ejemplo 2.15
22
Estadstica Inferencial 2016 Arturo Caldern G.
El Ingreso Familiar X (medido en cientos de unidades monetarias) en una regin es una v.a.c. con distribucin
lognormal de parmetros = 3 y 2 = 1
a) Si se considera que el costo de una canasta familiar mnima es 33.2 cientos de u.m. En esta regin con qu
probabilidad una familia estar en condicin de pobreza?
b) Si se considera que el costo de una canasta familiar mnima es 33.2 cientos de u.m. y el gobierno asegura que
con su plan de lucha contra la pobreza, en cinco aos slo el 30% de las familias estar en Pobreza. Cunto
dinero adicional tendra que ganar cada familia para que la afirmacin del gobierno se realizara?

Solucin:
a) En condicin de pobreza equivale a Ingreso no cubre el costo de la canasta familiar . y se pide
.
33.2 33.2 3.5 0.5 0.6915; es decir
un 69.15% de la poblacin de esta regin est en pobreza.

b) Sea ! el ingreso luego del plan del gobierno, donde c es el ingreso adicional. En cinco aos, c ser tal
que:

33.2 0.3 0.3 ! 33.2 " 33.2 # ! $ 33.2 # !


" 33.2 # ! $ # 3 " 33.2 # ! $ # 3
% & 0.3 #0.525 33.2 # ! 2.475
1 1
33.2 # ! * +.,- 11.88 ! 33.2 # 11.88 21.32 cientos de unidades monetarias.

2.9 Distribucin Uniforme.

2.9.1 Definicin y Parmetros

Definicin
Sea X v.a. continua, con rango RX = [ , ] . Diremos que X tiene distribucin uniforme en [ , ] , que se
1
denota X ~ U ( x; , ) si su f. de densidad es f X ( x ) = U ( x;;) = si x

Parmetros. Los parmetros son y

=0,=1 =0,=2 =0,=5

Valores Esperados y Funcin Generatriz de Momentos.


Aplicando la definicin de valor esperado se obtiene que
= X = ( + ) / 2 y 2 = X2 = ( )2 / 12
En cuanto a M X (t ) , aunque existe M X (t ) no es diferenciable en t = 0 y por lo mismo no es de mayor inters.

2.9.2 Origen
23
Estadstica Inferencial 2016 Arturo Caldern G.

Tiene un origen relativamente simple, en el contexto de probabilidad geomtrica, cuando se toma un punto al azar
de un intervalo de longitud finita.

Proposicin
Sea [ , ] un intervalo de extremos dados. Si se toma un punto al azar del intervalo y se define X =Valor
obtenido, entonces X ~ U ( x; , ) .

Demostracin
Es claro que RX = [ , ] . Sea ahora x RX , entonces aplicando probabilidad geomtrica tenemos:
x
FX ( x ) = P( X x ) =

Derivando FX (x ) ) con respecto a x se obtiene el resultado.

Observacin
Si el intervalo es abierto, el resultado no cambia, salvo que el rango de X es RX = ] , [

Ejemplo 2.15
Sea X v.a.c. tal que fX(x) > 0 para todo x y sea Y = FX(x). Demuestre que Y U(y;0,1).

Solucin:
Es claro que Ry=]0,1[. Sea Gy(y) la distribucin acumulativa de Y. Por definicin GY(y)=P[Y y] = P[FX(X)<y].

Pero como X es continua FX es no decreciente y siendo fX(x)> 0, podemos decir que FX es estrictamente creciente.

Luego, existe la inversa FX-1 y aplicndola dentro de Gy(y):

Gy(y)=P[FX(X)<y] = P[X < Fx-1(y)] = FX [FX-1(y)] = y y ]0,1[

Es decir gY(y)= 1 0 < y < 1 o equivalentemente Y U(y;0,1)

Observacin
El ejercicio muestra que en cierto sentido, una variable aleatoria X continua puede transformarse en una variable
con distribucin uniforme en el intervalo ]0,1[, de modo que para cada x RX existe una correspondiente y ]0,1[

La propiedad anterior usar la distribucin uniforme en la simulacin de variables en modelos economtricos. Por
ejemplo, si X Exp (x;1), entonces Y=0.7 equivale 1e-X = 0.7 de donde obtenemos que X=1.204.

24
Estadstica Inferencial 2016 Arturo Caldern G.
2.10 Ejercicios y distribuciones adicionales

Ejercicio 1
Un comerciante mayorista suele comprar S unidades de un bien a precio unitario de 4 soles, para revenderlo luego
a 6 soles la unidad, durante la temporada de ventas. Pasada la poca de ventas, el sobrante debe ser desechado. La
cantidad de producto que le pueden demandar a este mayorista es una v.a. continua X con funcin de densidad
exponencial X ~ Exp ( = 0 .05 ) . El comerciante desea saber cul es el stock ptimo S de producto que debiera
comprar para su negocio. Qu valor de S le recomendara?

Solucin:
Sea / la utilidad, entonces / depende de 1 y de :

Si 1 durante la temporada vende slo unidades de las 1 que tiene para vender y el sobrante (1 )
se pierde y as / = /( , 1) = 6 41
Si > 1 durante la temporada vende todo su stock y genera todo su ingreso posible, con una utilidad
/ = /( , 1) = 61 41 = 21
6 41 67 1
/ = /( , 1) = 5
21 67 > 1

/ tiene una componente aleatoria y otra no aleatoria 1. Desde el punto de vista econmico lo racional es
maximizar utilidades, pero la componente aleatoria impide una maximizacin clsica, pues por definicin no
es directamente controlable. Tenemos que imponer un control indirecto: En el valor esperado de 89/( , 1):,
ya no figura porque se promedia sobre todos sus valores ponderados por sus probabilidades asociadas, lo que
queda es una funcin ;(1) 89/( , 1): que slo depende de 1. Por tanto, si luego calculamos 1 de modo que se
maximice ;(1), lo que estamos haciendo es determinar una tendencia ptima para la utilidad /.
AB C B
;(1) = 89/( , 1): = = B
/(>, 1)? (>)@> = =D /(>, 1)? (>)@> + =C /(>, 1)? (>)@> =
C B C C B C
=D (6> 41)? (>)@> + =C 21? (>)@> = =D 6>? (>)@> 41 = EF ? (>)@> + 21 =
D FGFFH
? (>)@>
EFFGFFH
C
= 6 =D >? (>)@>
IJ (C) IJ (C)
C
41K (1) + 21"1 K (1)$ = 6 =D >? (>)@> 61K (1) + 21.
Llegamos a
C
;(1) 89/( , 1): = 6 =D >? (>)@> 61K (1) + 21 es explcitamente una funcin diferenciable de S que
podemos maximizar mediante derivacin:
L (1) MN(C)
; = MO = 61? (1) 6K (1) 61 K L
EGH (1) + 2 = 61? (1) 6K (1) 61? (1) + 2 = 6K (1) + 2 y
PJ (C)
L (1) MN(C) +
; = = 0 equivale a K (1) = y como ;LL (1) = 6? (1) > 0, se trata de un mximo.
MO Q
C
Finalmente, como ? (>) = 0.05* D.D R
0 < > < K (1) = =D 0.05* D.D R
@> = 1 * D.D C
= * D.D C
=
1 = 21.97 es el valor ptimo del stock S (u stock ptimo)

Ejercicio 2
a) En una regin el valor total Y de la produccin de la regin es funcin de la inversin X del gobierno regional
va = 100 + 0.7 + T, donde X e Y estn medidas en millones de unidades monetarias y T es una variacin
aleatoria con distribucin normal T~V(0, W + ). Se sabe que si la inversin es de = 300 millones de unidades
monetarias, entonces el valor de la produccin ser inferior a 340 millones con 67% de probabilidad. Cul
es el valor de W? Para una inversin de 500 millones Cul sera el valor del percentil Y75?

Solucin:
Si = 300 = 100 + 0.7 300 + T = 310 + T y como T~V(0, W + ) entonces ~V"8( ), Y( )$,
pues funciones lineales de variables normales, tambin tienen distribucin
normal (ver Cap. 2)
+
8( ) = 8(310 + T) = 8(310) + 8(T) = 310 + 0 = 310; Y( ) = 8 " 8( )$ = 8((310 + T

25
Estadstica Inferencial 2016 Arturo Caldern G.
+
310)+ ) = 8(T + ) = W + , ya que W + = 8(T + ) Z8(T)
[ \ = 8(T + ).
D
( ,D D D
En resumen, ~V(310, W + ) y se tiene el dato que ( < 340) = 0.67 = < = 0.44
] ]
W = 68.18
Finalmente, si = 500 = 100 + 0.7 500 + T = 450 + T ~V(450, 68.18+ ) y si ^_` es el percentil 75,
(^ , D) (^ , D)
entonces ( < ^_` ) = 0.75 = < _` Qa. a
_`Qa. a
0.675 ^_` = 450 + 0.675 68.18 =
496.02

b) Estudiando inversiones en mercados emergentes, un economista encuentra que la rentabilidad de una


inversin (X medida en porcentaje) es una v.a. con distribucin normal V(c, W + = 2+ ) y estima que hay una
probabilidad de 15.87% de tener una rentabilidad mayor que 7.
1. Halle el valor de c y la probabilidad de tener una rentabilidad inferior a la mitad de lo esperado.
2. El economista sabe que el ingreso (en unidades monetarias) obtenido con la inversin, tiene distribucin
LogNormal ~defV(c, W + ) donde originalmente c y W + son los mismos parmetros de a) pero especula
que la rentabilidad media c puede aumentar (aunque no la varianza) y desea saber en cuntos puntos
porcentuales tendra que aumentar la rentabilidad media c para que tener un ingreso que supere las 4,200
unidades monetarias con una probabilidad de 12.1%. Halle este aumento.

Solucin:
- h
1. ( > 7) = 0.1587 ( 7) = 0.8413 ( 7) = 0.8413 = 0.8413
+
- h
= 1 c = 7 2 = 5.
+
h
Finalmente: < + = ( < 2.5) = ( < 1.25) = 0.1056
2. Si ci es la nueva media del ingreso y 0.121 = ( > 4,200) ( 4,200) = 0.879
8.34 ci
( 4,200) = 0.879 ( 8.34) = 0.879 j k = 0.879
2
a. , hl
+
= 1.17 ci = 8.34 2.34 = 6, luego el aumento debe ser (ci c) = 6 5 = 1

Ejercicio 3
a) El nmero de consumidores que entra a una tienda a comprar un bien, por da, se presenta de acuerdo a un
Proceso de Poisson a una tasa de = 2/da. Cada consumidor slo puede comprar una unidad y slo va una vez
a la tienda. La tienda tiene un stock de 3 unidades Con qu probabilidad ocurrir que en un da se venda una
unidad pero al siguiente la tienda deba pedir unidades adicionales a su proveedor para satisfacer la demanda?

Solucin:
De = 2/da y si = # de consumidores que entran a la tienda en t =1 da, entonces ~ (>; n = op = 2).
Se pregunta por ( = 1 * * qr7s*r @u) ( > 2 u 67fw7* p* @u) y en el contexto de un Proceso de
Poisson, estos eventos son independientes, por tanto:
"( = 1 * * qr7s*r @u) ( > 2 u 67fw7* p* @u)$ = ( = 1) ( > 2);
x
++
( = 1) = * = 2* +
= 0.271 y ( > 2) = 1 z ( = 0) + ( = 1) + ( = 2){ =
!
+|
1 5* +
+ 2* +
+* +
} = 1 5* +
= 0.323; luego:
+!
"( = 1 * * qr7s*r @u) ( > 2 u 67fw7* p* @u)$ = ( = 1) ( > 2) = 0.271 0.32 = 0.087

b) Un consumidor puede decidirse a comprar un bien a un productor con una probabilidad p = 0.4 y en un mo-
mento dado, cinco consumidores van donde el productor en busca del bien. Cada consumidor toma su decisin
independientemente. El productor slo tiene en stock cuatro unidades del bien para la venta. Con qu
probabilidad vendera slo la mitad de su stock? Vender todo su stock el productor?

Solucin:
=Nmero de consumidores que deciden comprar el bien, entonces ~~(>; = 5, q = 0.4) y se pregunta por:

( = 2) = + 0.4+ 0.6 = 0.3456 y P(Vender todo el stock). Si cuatro clientes deciden comprar el producto se
vendern las cuatro unidades del stock y si cinco clientes deciden comprar el bien, tambin se vender el stock y lo
que pasa es que uno de los cinco se queda si poder comprar, es decir:
26
Estadstica Inferencial 2016 Arturo Caldern G.
(Vender todo el stock) = ( 4) = , 0.4 0.6 + 0.4 0.6 = 0.01024 < 0.5 y pronosticamos que No se
, D

vender todo el stock.

Ejercicio 4
En una regin el Ingreso Familiar X es una v.a.c. con distribucin normal N(,2) con c = 400 y W + = 50+ y el
costo de una canasta alimentaria mnima es 425. Hay dos alternativas de inversin estatal para la regin: con la
primera el ingreso de todas las familias subir en 50 unidades monetarias mientras que con la segunda habr un
incremento de 3% en el ingreso de cada familia Con cul alternativa habr menos porcentaje de familias pobres en
la regin? Asuma que no cambia el costo de la canasta.

Solucin:
Con la primera alternativa, si Y = Nuevo ingreso, entonces Y=X+50 y la proporcin de familias pobres sera igual
( - ,DD)
a ( 425) = ( + 50 425) = ( 375) = D
= ( 0.5)) = 0.3085
Con la segunda alternativa, si W = Nuevo ingreso, entonces W=X+0.03X=1.03X y la proporcin de familias
(, +.Q ,DD)
pobres sera igual a ( 425) = (1.03 425) = ( 412.6) = = ( 0.25) =
D
0.5987
Con la primera alternativa habr menos porcentaje de familias en condicin de pobreza.

Ejercicio 5
En un sector industrial, el nmero de trabajadores en la empresa es una v.a. discreta cuya distribucin de
probabilidades depende de si la empresa es formal o informal:
Si la empresa es formal, tiene distribucin geomtrica ~(>; q = ). En cambio, dado que la empresa es
R
informal, la funcin de probabilidad de es (>) = ! > = 1,2,3,
Un economista genera una variable indicadora de informalidad que toma valor 1 si la empresa es informal y 0 si
1
() =
9 1
la empresa es formal, de modo que = 0,1.
10 10

a) Hallar el valor de !.
b) Halle la probabilidad de que una empresa del sector tenga 4 trabajadores.
c) Es cierto que, en promedio, una empresa informal genera tres veces ms empleo que una empresa formal en
este sector?
d) En promedio Cuntos trabajadores tiene una empresa de este sector?

Solucin:
x
R R a
a) 1 = B
R !
= ! B
R
= !
x = !9 a = ! a ! =

b) ( = 4) = 9( = 4) ( = 0): + 9( = 4) ( = 1):
1 2 , 9 D 1 D
1 2 1
9( = 4) ( = 0): = ( = 4| = 0) ( = 0) = j k j k j k j k = j k j k j k = 0.010
3 3 10 10 3 3 10
8 1 , 9 1 8 1 9
9( = 4) ( = 1): = ( = 4| = 1) ( = 1) = j k j k j k j k = j k j k j k = 0.001
9 9 10 10 9 9 10
( = 4) = 0.010 + 0.001 = 0.011
c) En promedio significa en valor esperado, es decir, se pregunta si es cierto que 89 | = 1: = 389 | = 0:.
En el caso de las empresas formales ( = 0): ~(>; q = ) cuya media es = 3 89 | = 0: = 3.
En el caso de las empresas informales ( = 1): se reconoce que la distribucin de corresponde a una
a
distribucin geomtrica ~(>; q = ) cuya media es = a 89 | = 1: = 1.125: No es cierta la
afirmacin.
d) Se pregunta por 8( ). Como sabemos 8( ) = 8"8( | )$ = D 8( | = ) () y como ya tenemos

89 | = 0: y 89 | = 1: 8( ) = 8"8( | )$ = 8( | = 0) (0) + 8( | = 1) (1) = 3 + = 1.3125
D a D

27

You might also like