You are on page 1of 5

Universidad de Chile

Facultad de Ciencias Fsicas y Matemticas


Departamento de Ingeniera Matemtica
MA34B-02: Estadstica
Profesor Rodrigo Abt B.
Semestre Primavera, 2008
DISTRIBUCIN MULTINOMIAL
HCTOR OLIVERO Q. - VCTOR RIQUELME F.
1. Introduccin
Considere una poblacin con artculos pertenecientes a k categorias distintas. Supongase que se extrae un artculo
de dicha poblacin, y se quiere ver de que tipo es. Podemos modelar lo anterior por una variable aleatoria X, que
indica a que categora pertenece el artculo. Llamemos y
1
, . . . , y
k
a las distintas categorias. Entonces X toma valores
en el conjunto {y
1
, . . . , y
k
}, y denimos las probabilidades p
i
= P(X = y
i
). Es claro que

k
i=1
p
i
= 1.
Supongase ahora que se toma una MAS de tamao n con reposicin (o si el tamao de la poblacin es grande se
puede considerar sin reposicin). Denamos el vector aleatorio

N = (N
1
, . . . , N
k
) que indica en cada componente
isima la frecuencia de ocurrencia del tipo y
i
en la MAS. Entonces la distribucion de

N es una multinomial de
parametros n y p = (p
1
, . . . , p
k
):
P(N
1
= n
1
, . . . , N
k
= n
k
) =
_
n
n
1
, . . . , n
k
_
p
1
n1
. . . p
k
n
k
1
{

k
i=1
ni=n}
(n
1
, . . . , n
k
)
con
_
n
n
1
, . . . , n
k
_
=
n!
n
1
!n
2
! . . . n
k
!
2. De donde viene?
La deduccin tiene dos patas:
La parte de las probabilidades
El coeciente que acompaa, asociado a (n
1
, . . . , n
k
), que llamaremos
n1,...,n
k
.
Primero, la parte de las probabilidades es relativamente facil. Es convencerse que la probabilidad de obtener una
conguracin de n
1
objetos de tipo y
1
, n
2
objetos de tipo y
2
,. . . , n
k
objetos de tipo y
k
(si no importara el orden en
que salen con respecto al total) es p
1
n1
. . . p
k
n
k
.
La segunda parte tiene que ver con la cantidad de las conguraciones anteriores posibles. Para ello, denamos:

1
={numero de formas de elegir n
1
art. de tipo y
1
entre los n disponibles}
=
n!
(n n
1
)!n
1
!

2
={numero de formas de elegir n
2
art. de tipo y
2
entre los n n
1
restantes disponibles}
=
(n n
1
)!
(n n
1
n
2
)!n
2
!
.
.
.

k1
={numero de formas de elegir n
k1
art. de tipo y
k1
entre los nn
1
n
k2
restantes disponibles}
=
(n n
1
n
k2
)!
(n n
1
n
k2
n
k1
)!n
k1
!

k
={numero de formas de elegir n
k
art. de tipo y
k
entre los n n
1
n
k2
n
k1
= n
k
disponibles}
= 1 =
(n n
1
n
k1
)!
(n n
1
n
k1
n
k
)!n
k
!
Es relativamente facil convencerse de que
n1,...,n
k
=
1
. . .
k
, y desarrollando un poco la expresion de la derecha
se obtiene el coeciente multinomial.
1
DISTRIBUCIN MULTINOMIAL 2
3. Relaciones entre Multinomial y Binomial
Para el caso en que k = 2, uno puede ver que la distribucin multinomial coincide con la binomial: interpretando que
si no se est en la categora y
1
, se est fuera de la categora y
1
(llamamos y
2
a esa otra categora). Como p
1
+p
2
= 1,
q p
2
= 1 p
1
y denimos p = p
1
. De igual forma, n
2
= n n
1
. Reemplazando en la distribucin multinomial los
valores anteriores, se obtiene que P(N
1
= n
1
, N
2
= n
2
) = P(N
1
= n
1
), donde N
1
se distribuye como una binomial
de parmetros n y p = p
1
.
Para el caso en que se tienen k categoras nos interesar la distribucin marginal de N
i
. Primero, si seguimos el
razonamiento anterior, el hecho que no se seleccione un elemento de la categora y
i
signica que se selecciona un
elemento de el resto de categoras. Esto se hace con probabilidad 1 p
i
, por lo que la distribucin marginal de N
i
debiera ser una binomial de parmetros n y p
i
.
Hacendo el clculo:
P(N
i
= n
i
) =

{n
1
,...,n
k
}\{n
i
}

k
j=1
n
i
=n
P(N
1
= n
1
, . . . , N
i
= n
i
, . . . , N
k
= n
k
)
=

{n
1
,...,n
k
}\{n
i
}

j=i
n
j
=nn
i
_
n
n
1
, . . . , n
k
_
p
1
n1
. . . p
i1
ni1
p
i
ni
p
i+1
ni+1
. . . p
k
n
k
= p
i
ni

{n
1
,...,n
k
}\{n
i
}

j=i
n
j
=nn
i
n!
n
1
! . . . n
i1
!n
i
!n
i+1
! . . . n
k
!
p
1
n1
. . . p
i1
ni1
p
i+1
ni+1
. . . p
k
n
k
=
n!
(n n
i
)!n
i
!
p
i
ni

{n
1
,...,n
k
}\{n
i
}

j=i
n
j
=nn
i
(n n
i
)!
n
1
! . . . n
i1
!n
i+1
! . . . n
k
!
p
1
n1
. . . p
i1
ni1
p
i+1
ni+1
. . . p
k
n
k
=
n!
(n n
i
)!n
i
!
p
i
ni
(p
1
+ + p
i1
+ p
i+1
+ + p
k
)
nni
de la frmula multinomial
=
n!
(n n
i
)!n
i
!
p
i
ni
(1 p
i
)
nni
=
_
n
n
i
_
p
i
ni
(1 p
i
)
nni
Observacion: Como se dijo, la interpretacion es como si hubieran dos clases (categorias): x
1
= y
i
, y x
2
=

j=i
y
j
.
Entonces (M
1
, M
2
) = (N
i
,

j=i
N
j
) es un vector de frecuencias para las categoras x
1
y x
2
, y la distribucin del
vector es Multinomial de parametros n y q
1
= p
i
, q
2
=

j=i
p
j
. La distribucin marginal de M
2
es una binomial
de parmetros n y q
2
.
4. Esperanza, Varianza, Covarianza
Como se dijo anteriormente, la distribucion de N
i
es Binom(n, p
i
). Por lo tanto, se tiene que
E(N
i
) = np
i
Var(N
i
) = np
i
(1 p
i
)
Como ya se vio, N
i
+ N
j
Binom(n, p
i
+ p
j
), por lo que
Var(N
i
+ N
j
) = Var(N
i
) +Var(N
j
) + 2Cov(N
i
, N
j
)
n(p
i
+ p
j
)(1 p
i
p
j
) = np
i
(1 p
i
) + np
j
(1 p
j
) + 2Cov(N
i
, N
j
)
Cov(N
i
, N
j
) = np
i
p
j
5. Ejemplo sencillo
Supongase que el 23 % de las personas que asisten a cierto partido de baseball viven a menos de 10 millas del
estadio, el 59 % de ellas viven a entre 10 y 50 millas del estadio, y el 18 % vive a mas de 50 millas. Se seleccionan
DISTRIBUCIN MULTINOMIAL 3
al azar 20 personas entre los asistentes al partido (que son miles). Calcular la probabilidad de que siete de los
seleccionados vivan a menos de 10 millas, ocho vivan entre 10 y 50 millas, y cinco vivan a mas de 50 millas del
estadio.
Solucin Comenzamos por identicar todos los elementos del problema:
n = 20 (nmero de personas seleccionadas), k = 3 (cantidad de grupos de clasicacin de las personas); y
1
={Personas
que viven a menos de 10 millas del estadio}, y
2
={Personas que viven a entre 10 y 50 millas del estadio},
y
3
={Personas que viven a ms de 50 millas del estadio};
p
1
= 0.23, p
2
= 0.59, p
3
= 0.18
Deniendo (N
1
, N
2
, N
3
) el vector correspondiente a las frecuencias, se pide calcular
P(N
1
= 7, N
2
= 8, N
3
= 5) =
_
20
7, 8, 5
_
0.23
7
0.59
8
0.18
5
=
20!
7!8!5!
0.23
7
0.59
8
0.18
5
= 0.0094
6. Problemas
Problema 1: (a) Suponga que las variables aleatorias (X
i
)
k
i=1
son independientes y que X
i
Poisson(
i
) i
{1, . . . , k}. Demuestre que para todo n N la distribucin del vector aleatorio (X
i
)
k
i=1
condicional a que

k
i=1
X
i
= n, es una multinomial de parametros n y p = (p
i
)
k
i=1
, con
p
i
=

i

k
j=1

j
(b) A una heladeria llegan clientes de tres tipos distintos: normal, golozo y premium, y el nmero de clientes
de cada tipo (que llega en una hora) son Poisson con tasas
n
= 100,
g
= 50 y
p
= 20 respect. Si se sabe
que el nmero total de clientes que lleg en una hora es de 500 personas, calcular la probabilidad de que
hayan llegado al menos 200 clientes premium.
Problema 2:
Se lanzan cinco dados equilibrados. Cual es la probabilidad de que el nmero 1 y el nmero 4 aparezcan el mismo
nmero de veces?
Problema 3: (a) Supongase que el 16 % de los estudiantes de un colegio son alumnos de primero medio, el
14 % de segundo, el 38 % de tercero, y el 32 % de cuarto. Si se seleccionan al azar 15 estudiantes, cual es la
probabilidad de que al menos 8 estudiantes sean de primero o segundo?
(b) Sea X
3
el nmero de estudiantes de tercero y X
4
el nmero de estudiantes de cuarto. Calcule el nmero
esperado de alumnos de cada curso (en la muestra), y la esperanza y varianza de X
3
X
4
DISTRIBUCIN MULTINOMIAL 4
7. Resolucin de problemas
Solucin (Problema 1): (a) Sea n N. Denamos =

k
j=1

j
, n = (n
1
, . . . , n
k
). Una primera observacion
es que Y =

k
j=1
X
j
es una variable aleatoria que se distribuye Poisson(), pues las X
j
son Poissones
independientes ().
P
_
_
X
1
= n
1
, . . . , X
k
= n
k
k

j=1
X
j
= n
_
_
=
P
_
_
X
1
= n
1
, . . . , X
k
= n
k
,
k

j=1
X
j
= n
_
_
P
_
_
k

j=1
X
j
= n
_
_
=
P(X
1
= n
1
, . . . , X
k
= n
k
)
P
_
_
k

j=1
X
j
= n
_
_
1
{

k
j=1
nj=n}
(n
1
, . . . , n
k
)
=
P(X
1
= n
1
) . . . P(X
k
= n
k
)
P(Y = n)
1
{

k
j=1
nj=n}
(n)
. .
(n)
()
=
e
1

1
n1
/n
1
! . . . e

k
n
k
/n
k
!
e

n
/n!
(n)
=
e

k
j=1
j
e

1
n1
. . .
k
n
k

n1
. . .
n
k
n!
n
1
! . . . n
k
!
(n)
=
n!
n
1
! . . . n
k
!
_

_
n1
. . .
_

_
n
k
(n)
=
_
n
n
1
, . . . , n
k
_
p
1
n1
. . . p
k
n
k
1
{

k
j=1
nj=n}
(n
1
, . . . , n
k
)
(b) Si suponemos que las llegadas de los distintos tipos de clientes son independientes, tendriamos aplicando la
parte anterior n = 500, p
n
=
100
170
, p
p
=
20
170
, p
g
=
50
170
. Deniendo (X
n
, X
p
, X
g
) el vector de llegadas, entonces
este vector, dado que su suma es 500, se distribuye Multin(500, (p
n
, p
p
, p
g
)).Luego X
p
|X
n
+ X
p
+ X
g
=
500 Binom(n, p
p
)
P(X
p
200 X
n
+ X
p
+ X
g
= 500) =
500

j=200
_
500
j
__
20
170
_
j
_
100
170
+
50
170
_
500j
Solucin (Problema 2):
En este caso n = 5, k = 6; y
i
= {i}, p
i
=
1
6
i {1, . . . , 6}. Lo que se pide es P(N
1
= N
4
)
P(N
1
= N
4
) =

j=0
P(N
1
= j, N
4
= j)
=
2

j=0
P(N
1
= j, N
4
= j)
Para resolver lo anterior habra que condicionar sobre los posibles valores de las otras frecuencias, y quedara algo
monstruoso. La forma inteligente de resolver el problema es colapsar ciertas clases. denamos entonces las clases
x
1
= y
1
, x
4
= y
4
, x
resto
= y
2
y
3
y
5
y
6
, donde se tiene que p
1
= 1/6 = p
4
, p
resto
= 4/6 ( p
j
es la probabilidad
asociada a x
j
); y sea (M
1
, M
4
, M
resto
) el vector de frecuencias asociado a (x
1
, x
4
, x
resto
). Asi, y con la observacin
DISTRIBUCIN MULTINOMIAL 5
de que este vector tambin tiene una distribucin Multinomial(5, (1/6, 1/6, 4/6)), calculemos P(N
1
= j, N
4
= j).
P(N
1
= j, N
4
= j) = P(M
1
= j, M
4
= j, M
resto
= 5 2j)
=
_
5
j, j, 5 2j
__
1
6
_
j
_
1
6
_
j
_
4
6
_
52j
Asi,
P(N
1
= N
4
) =
2

j=0
_
5
j, j, 5 2j
__
1
6
_
j
_
1
6
_
j
_
4
6
_
52j
=
5!
0!0!5!
_
1
6
_
0
_
1
6
_
0
_
4
6
_
5
+
5!
1!1!3!
_
1
6
_
1
_
1
6
_
1
_
4
6
_
3
+
5!
2!2!1!
_
1
6
_
2
_
1
6
_
2
_
4
6
_
1
= . . .
=
2424
6
5
Solucin (Problema 3): (a) Denamos las clases x
1
={Estudiantes de primero o segundo}, x
2
={Estudiantes
de tercero o cuarto}, com probabilidades q
1
= 0.3, q
1
= 0.7. Sea (M
1
, M
2
) el vector de frecuencias de dichos
grupos, con n = 15. Entonces N
1
Binomial(15, 0.3).
P(N
1
8) =
15

j=8
P(N
1
= j)
=
15

j=8
_
15
j
_
(0.3)
j
(0.7)
15j
= 0.05
(b) Recordemos que N
3
Binom(15, 0.38), N
4
Binom(15, 0.32). Entonces
E(N
3
N
4
) = E(N
3
) E(N
4
)
= 15 0.38 15 0.32
= 15 0.06
= 0.9
La varianza la calculamos
Var(N
3
N
4
) = Var(N
3
) +Var(N
4
) 2Cov(N
3
, N
4
)
= 15 0.38 0.62 + 15 0.32 0.68 2 15 0.38 0.32
= 3.534 + 3.264 3.648
= 3.15

You might also like