You are on page 1of 55

Probabilidad y

Vectores Aleatorios
Reconocimiento de Patrones
Julián Quiroga S., PhD.

1
Variables aleatorias

2
Definición
Una variable aleatoria es un número 𝐱(𝜉) asignado a cada posible
resultado, 𝜉 ∈ Ω, de un experimento.

Ejemplo. En el lanzamiento de un dado, es posible asignar a cada uno


de los 𝑖 posibles resultados, 𝑖 ∈ {1,2,3,4,5,6} el número 𝐱 𝑖 = 10𝑖.
Ejemplo. En el lanzamiento de una moneda es posible asignar “1” a
cara y “-1” a sello:
𝐱 c = 1 y 𝐱 𝑠 = −1.

Una variable aleatoria es una función cuyo dominio es Ω y cuyo rango


es cualquier conjunto numérico:
conjunto
V.A. 𝐱∶Ω→ numérico
3
Definición (cont.)
Eventos generados por variables aleatorias

La formulación de condiciones sobre 𝐱 permite generar eventos en Ω:


• {𝐱 ≤ 𝑥}: subconjunto de Ω que contiene todos los
resultados 𝜉 tales que 𝐱 𝜉 ≤ 𝑥.
• {𝑥1 ≤ 𝐱 ≤ 𝑥2 }: subconjunto de Ω que contiene todos los
resultados 𝜉 tales que 𝑥1 ≤ 𝐱 𝜉 ≤ 𝑥2 .
• {𝐱 = 𝑥}: subconjunto de Ω que contiene todos los
resultados 𝜉 tales que 𝐱 𝜉 = 𝑥.

Ejemplo. Para el lanzamiento de un dado se define la V.A: 𝐱 𝑖 = 10𝑖.


Determine los siguientes eventos y calcule su probabilidad:
⊛ {𝐱 ≤ 35} ⊛ {𝐱 = 50}
⊛ {20 ≤ 𝐱 ≤ 40} ⊛ {𝐱 = 70}
4
Interpretación
Una variable aleatoria puede verse como una función que toma
valores numéricos con cierta probabilidad. La función resultante debe
satisfacer las dos siguientes propiedades:

i. El conjunto 𝐱 ≤ 𝑥 es un evento para todo 𝑥 ∈ ℝ.


ii. P 𝐱 = ∞ = P 𝐱 = −∞ = 0

5
Variables aleatorias
continuas y discretas
Un variable aleatoria es continua si puede asumir cualquier valor en
uno o más intervalos de los reales (conjunto no contable).
Ejemplo. Una llamada ocurre aleatoriamente en el intervalo 0, 𝑇 .

Ω = {0 ≤ 𝜉 ≤ 𝑇} “conjunto no contable”

𝑇 2
− 𝜉−2
Si se define la variable aleatoria 𝐱 𝜉 = 𝑒 , esta corresponde a
una variable aleatoria continua.

Observación. Si 𝐱 es continua, la probabilidad de que asuma un valor


especifico es cero, i.e., 𝑃 𝐱 = 𝑥 = 0.

6
Variables aleatorias
continuas y discretas (cont.)
Un variable aleatoria es discreta si sólo puede asumir valores sobre un
conjunto finito o uno infinito contable.
Ejemplo. Una llamada ocurre aleatoriamente en el intervalo 0, 𝑇 .

Ω = {0 ≤ 𝜉 ≤ 𝑇} “conjunto no contable”

Si se define la variable aleatoria:


𝑇
0 <𝜉≤𝑇
2
𝐱 𝜉 = si 𝑇 ,
1 0≤𝜉≤
2

esta corresponde a una variable aleatoria discreta.


7
Función de distribución de
probabilidad
Definición. La función de distribución 𝐹𝐱 (𝑥) de una variable aleatoria 𝐱
está dada como:
𝐹𝐱 𝑥 = 𝑃(𝐱 ≤ 𝑥) , −∞ < 𝑥 < ∞

Ejemplo. Para el lanzamiento de una moneda se define la var. aleatoria


𝐱 como 𝐱 𝑐 = 1 y 𝐱 𝑠 = 0. Determine su función de distribución.
Ejemplo. Para el lanzamiento de una dado sea 𝐱 𝑖 = 10𝑖, encuentre
𝐹𝐱 (100) , 𝐹𝐱 (35) , 𝐹𝐱 (30) y 𝐹𝐱 29.99 .
Ejemplo. Una llamada ocurre aleatoriamente en un tiempo 𝑡 en el
intervalo 0,1 . Si se define la variable aleatoria 𝐱 𝑡 = 𝑡, determine su
función de distribución.

8
Función de distribución de
probabilidad (cont.)
Propiedades
1. 𝐹 −∞ =0 y 𝐹 ∞ = 1.
2. 𝐹(𝑥) es una función (monótona) creciente:
si 𝑥2 > 𝑥1 entonces 𝐹(𝑥2 ) ≥ 𝐹(𝑥1 ).
3. Si 𝐹 𝑥0 = 0 entonces 𝐹 𝑥 = 0 para todo 𝑥 ≤ 𝑥0 .
4. 𝑃 𝐱 > 𝑥 = 1 − 𝐹 𝑥 .
5. 𝑃 𝑥1 < 𝐱 ≤ 𝑥2 = 𝐹 𝑥2 − 𝐹(𝑥1 ).
6. 𝑃 𝐱 = 𝑥 = 𝐹 𝑥 − 𝐹(𝑥 − ).
Observación. Si 𝐱 es una V.A. continua entonces 𝐹 𝑥 es una función continua
por lo que 𝐹 𝑥 = 𝐹 𝑥 − y 𝑃 𝐱 = 𝑥 = 0. Si 𝐱 es una V.A. discreta entonces
𝐹 𝑥 es una función continua con un conjunto contable de discontinuidades.

9
Función de densidad de probabilidad
La derivada de la función de distribución 𝐹𝐱 𝑥 se define como la función de
densidad, 𝑓𝐱 𝑥 , de la variable aleatoria 𝐱:
d𝐹𝐱 𝑥
𝑓𝐱 𝑥 ≜
d𝑥
Ejemplo. Una llamada ocurre aleatoriamente en un tiempo 𝑡 en el intervalo
0,1 . Determine la función de densidad de la V.A. 𝐱 𝑡 = 𝑡.

Observación. La función de densidad siempre es positiva pues:


d𝐹𝐱 𝑥 𝐹 𝑥 +△ 𝑥 − 𝐹(𝑥)
𝑓𝐱 𝑥 = = lim ≥0
d𝑥 △𝑥→0 △𝑥

Propiedad. Si 𝐱 es una V.A. continua ⟹ 𝑓𝐱 𝑥 es una función continua, con


un conjunto contable de discontinuidades (continua a trozos).

10
Función de densidad de
probabilidad (cont.)
Propiedad. Si 𝐱 es una V.A. discreta ⟹ 𝐹𝐱 𝑥 es una función continua
a trozos y 𝑓𝐱 𝑥 es un con un conjunto contable de impulsos.
Por otro lado, si 𝐱 es una variable aleatoria discreta entonces su
función de densidad de probabilidad tiene la forma:

𝑓𝐱 𝑥 = 𝑃𝐱 (𝑥𝑖 )𝛿(𝑥 − 𝑥𝑖 )
𝑖

Ejemplo. Para el lanzamiento de un dado, se define la variable aleatoria


𝐱 𝑖 = 10𝑖, determine su función de densidad 𝑓𝐱 𝑥 .
Observación. Si 𝐱 es discreta ⟹ 𝑓𝐱 𝑥 es también discreta (conjunto
de impulsos) y se conoce como función de masa de probabilidad.

11
Función de densidad de
probabilidad (cont.)
Propiedades
𝑥
1. 𝐹 𝑥 = −∞
𝑓 𝑥 𝑑𝑥 .

2. −∞
𝑓 𝑥 𝑑𝑥 = 1.
𝑥2
3. 𝑃 𝑥1 < 𝐱 ≤ 𝑥2 = 𝑥1
𝑓 𝑥 𝑑𝑥 .

4. 𝑃 𝐱 = 𝑥0 = 0. * (Válido para un V.A. continua)

Observación. El área total de toda función de densidad es 1. El área de


𝑓 𝑥 en un intervalo 𝑥1 , 𝑥2 indica la probabilidad de que 𝐱 tome
valor dentro de ese intervalo.

12
Función de densidad de
probabilidad (cont.)
Ejemplo. Considere una V.A. 𝐱 con función de distribución dada por:
1 − 𝑒 −𝑥 𝑥≥0
𝐹 𝑥 =
0 𝑥<0
a) Encuentre la función de densidad 𝑓 𝑥 .
b) Verifique que 𝑓 𝑥 es una función de densidad.
c) Calcule: 𝑃 𝐱 ≤ 5 , 𝑃 1 ≤ 𝐱 ≤ 5 y 𝑃 𝐱 > 2 .

Ejemplo. Determine la función de distribución asociada a la siguiente


función de densidad:
𝑥+1 −1 ≤ 𝑥 < 0
𝑓 𝑥 = 1 0 ≤ 𝑥 < 0.5
0 ~
13
Función de densidad de
probabilidad (cont.)
Si 𝐱 es una variable aleatoria discreta entonces 𝑓 𝑥 es una función de
probabilidad de masa y por lo cual:
𝑥 𝑥
𝐹 𝑥 = 𝑓 𝑥 𝑑𝑥 = 𝑃𝐱 (𝑥𝑖 )𝛿(𝑥 − 𝑥𝑖 ) 𝑑𝑥
−∞ −∞ 𝑖

𝑥
= 𝑃𝐱 (𝑥𝑖 ) 𝛿 𝑥 − 𝑥𝑖 𝑑𝑥 = 𝑃𝐱 (𝑥𝑖 )
𝑖 −∞ 𝑥𝑖 ≤𝑥
Adicionalmente,
i. 𝑖 𝑃𝐱 (𝑥𝑖 ) =1

ii. 𝑃 𝑥1 ≤ 𝐱 ≤ 𝑥2 = 𝑥1 ≤𝑥𝑖 ≤𝑥2 𝑃𝐱 (𝑥𝑖 )

iii. 𝑃 𝐱 = 𝑥0 = 𝑃𝐱 (𝑥0 ) * (Válido para un V.A. discreta)


14
Función de densidad de
probabilidad (cont.)
Ejemplo. Considere una V.A. con la siguiente función de distribución:

a) Encuentre 𝑓 𝑥 .
b) Verifique que es una función de masa de probabilidad.
c) Encuentre 𝑃(𝐱 ≤ 2), 𝑃 𝐱 > 3 , 𝑃 1 ≤ 𝐱 ≤ 2 y 𝑃(𝐱 = 2).

Ejemplo. Considere la función de densidad dada por:

a) Encuentre el valor de 𝐴 para obtener una función de masa de probabilidad.


b) Determine la función de distribución.
15
Medidas de unas distribución de
Probabilidad

16
Media de una distribución de
probabilidad
La media es una medida del centro de una distribución de probabilidad,
dada como la suma ponderada de los posible valores de la V.A.
Definición. La media o valor esperado de una variable aleatoria
continua 𝐱 se denota como 𝜇 o 𝐸[𝐱], y está dada como:

𝜇=𝐸 𝐱 = 𝑥 𝑓 𝑥 𝑑𝑥
−∞

Definición. La media o valor esperado de una variable aleatoria


continua 𝐱 se denota como 𝜇 o 𝐸[𝐱], y está dada como:

𝜇=𝐸 𝐱 = 𝑥𝑖 𝑃𝐱 (𝑥𝑖 )
𝑖

17
Media de una distribución de
probabilidad (cont.)

18
Varianza de una distribución de
probabilidad
La varianza es una medida de la dispersión o variabilidad de una
distribución de probabilidad.
Definición. La varianza de una variable aleatoria continua 𝐱 se denota
como 𝜎 2 o 𝑉[𝐱], y está dada como:

𝜎2 = 𝑉 𝐱 = (𝑥 − 𝜇)2 𝑓 𝑥 𝑑𝑥 = 𝐸[(𝐱 − 𝜇)2 ]
−∞

Definición. La varianza de una variable aleatoria continua 𝐱 se denota


como 𝜎 2 o 𝑉[𝐱], y está dada como:

𝜎2 = 𝑉 𝐱 = (𝑥𝑖 − 𝜇)2 𝑃𝐱 (𝑥𝑖 )


𝑖

Definición. La desviación estándar se define como 𝜎 = 𝑉[𝐱].


19
Varianza de una distribución de
probabilidad (cont.)

20
Media y varianza de una distribución
Ejemplo. Sea 𝐱 la V.A. que denota la corriente en mA que circula por un alambre de
cobre, si la corriente sigue la función de densidad:
0,05 0 ≤ 𝑥 ≤ 20
𝑓 𝑥 =
0 ~
a) Cuál es la probabilidad de una medición de corriente menor a 10 mA?
b) Cuál es el valor esperado de 𝐱?
c) Calcule la varianza y desviación estándar de 𝐱.

Ejemplo. Sea 𝐱 la V.A. que denota el diámetro de un agujero en un componente de


metal. El diámetro objetivo es 12.5 mm, sin embargo perturbaciones en le proceso de
fabricación generar diámetros más grandes. Datos históricos muestran que 𝐱 puede
ser modelado por la función:
𝑓 𝑥 = 20𝑒 −20 𝑥−12.5 𝑢(𝑥 − 12.5)

a) Si los componentes con diámetro superior a 12.6 mm son descartados, qué


porcentaje de los componentes son descartados?
b) Cuál es el valor esperado y la desviación estándar de 𝐱?

21
Media y varianza de una distribución
(cont.)
Ejemplo. En la transmisión de un bit a través de un canal de comunicación digital
existe la posibilidad de error. Sea 𝐱 el número de bits recibidos con error de una
secuencia de 4 bits enviados. Los posibles valores para 𝐱 son {0,1,2,3,4}, con las
siguientes probabilidades:

𝑃 𝐱 = 0 = 0.6561 𝑃 𝐱 = 1 = 0.2916 𝑃 𝐱 = 2 = 0.0486


𝑃 𝐱 = 3 = 0.0036 𝑃 𝐱 = 4 = 0.0001

a) Encuentre la función de masa de probabilidad.


b) Cuál es la probabilidad de más de un error en una secuencia?
c) Cuál es el valor esperado de 𝐱?
d) Calcule la varianza 𝐱.

22
Ejemplos de distribuciones de
Probabilidad

23
Distribución de Bernoulli
Si 𝐱 es una V.A. que toma el valor 1 con probabilidad 𝑝 y el valor 0 con
probabilidad 1 − 𝑝, entonces 𝐱 sigue una distribución de Bernoulli con
parámetro 𝑝, 𝐱~Ber(𝑝).

Si 𝐱~Ber 𝑝 entonces:
𝑝 𝑥=1 0 𝑥<0
𝑃𝐱 𝑥 = 1 − 𝑝 𝑥=0 𝐹 𝑥 = 1−𝑝 0≤𝑥<1
0 ~ 1 𝑥≥1
Media y varianza

𝐸 𝐱 =𝑝 𝑉 𝐱 = 𝑝(1 − 𝑝)2

24
Distribución Uniforme Discreta
Una variable aleatoria 𝐱 que toma 𝑛 posibles valores todos equiprobables
sigue una distribución uniforme discreta con parámetro 𝑛, 𝑥~UD(𝑛).
Si 𝑥~UD(𝑛) entonces 𝐱 toma los valores 𝑥1 , … , 𝑥𝑛 con probabilidad:

𝑃 𝐱 = 𝑥𝑖 = 1 𝑛 , 𝑖 ∈ 1,2, … , 𝑛
Por tal motivo, la distribución está dada por:
1 𝑥 ∈ 𝑥1 , … , 𝑥𝑛 1
𝑃𝐱 𝑥 = 𝑛 𝐹 𝑥 =
0 ~ 𝑛
𝑥𝑖 ≤𝑥
Media y varianza

1 1
𝐸𝐱 = 𝑥𝑖 𝑉𝐱 = (𝑥𝑖 −𝜇)2
𝑛 𝑛

25
Distribución Uniforme
Una variable aleatoria continua con función de densidad dada por:

1
𝑎≤𝑥≤𝑏
𝑏−𝑎
𝑓 𝑥 = ,
0 ~

sigue una distribución uniforme con parámetros 𝑎 y 𝑏, 𝐱~U 𝑎, 𝑏 .

Si 𝐱~U 𝑎, 𝑏 entonces
0 𝑥<𝑎
𝑥−𝑎 𝑎+𝑏 (𝑏 − 𝑎)2
𝐹 𝑥 = 𝑎≤𝑥<𝑏 , 𝐸𝐱 = , 𝑉𝐱 =
𝑏−𝑎 2 12
1 𝑥≥𝑏

26
Distribución Normal (Gaussiana)
Una variable aleatoria continua con función de densidad dada por:

(𝑥−𝜇)2
1 −
𝑓 𝑥 = 𝑒 2𝜎2 ,
𝜎 2𝜋

sigue una distribución normal con parámetros 𝜇 y 𝜎 2 , 𝐱~N 𝜇, 𝜎 2 .

Si 𝐱~N 𝜇, 𝜎 2 entonces 𝐸 𝐱 = 𝜇 y 𝑉 𝐱 = 𝜎 2 .

𝑓(𝑥)

𝑥
27
Distribución Normal (cont.)

Observación. La función de distribución −∞ 𝑓 𝑥 𝑑𝑥 no es integrable
en forma cerrada y su valor se encuentra por tablas:

1 𝑥−𝜇
𝐹 𝑥 = 1 + erf
2 𝜎 2

𝐱−𝜇
Estandarización. Sea 𝐱~N 𝜇, 𝜎 2 , si 𝐳 = entonces 𝐳~N 0,1 .
𝜎
Propiedad. Si 𝐱~N 𝜇, 𝜎 2 y 𝐳~N 0,1 entonces:
𝑃 𝐱 ≤ 𝑥0 = 𝑃 𝐳 ≤ 𝑧0
𝑥0 −𝜇
con 𝑧0 = .
𝜎

28
Distribución Normal (cont.)
Ejemplo. Suponga que la corriente en un circuito sigue una distribución
normal con media 10mA y varianza 4mA2 . Cuál es la probabilidad de
que la corriente exceda los 13mA?

Ejemplo. Un mensaje binario es transmitido como una señal que toma


valores -1 y +1, con igual probabilidad. El canal de transmisión
corrompe la señal con ruido normal aditivo con 𝜇 = 0 y 𝜎 2 = 1. El
receptor interpreta un valor negativo como -1 y uno positivo como +1,
cuál es la probabilidad de error?

29
Probabilidad Condicional

30
Probabilidad condicional
La probabilidad de ocurrencia de un evento A puede verse afectada o
no por la ocurrencia o no de otro evento B.
𝑃 𝐴 = 𝑃[𝐴ǀ𝐵]?
Un evento A es dependiente de B si la probabilidad de A dado que
ocurrió B es diferente a la probabilidad absoluta de A.
𝑷[𝑨 ∩ 𝑩]
𝑷 𝑨ǀ𝑩 =
𝑷[𝑩]

Ejercicio. Suponga que la prob. de lluvia en Bogotá en un día normal es 0,5 y que la
prob. de que la temperatura en la tarde sea menor a 12 ℃ es 0,3. Además se sabe que
ambos eventos ocurren simultáneamente con probabilidad 0,2. Calcule la probabilidad
de que la temperatura en la tarde sea menor a 12 ℃ si se sabe que va a llover.

31
Eventos independientes
Si dos eventos no están relacionados, la medida de la probabilidad del
uno no se altera por la ocurrencia o no del otro.
Dos eventos A y B son independientes si:
𝑃 𝐴 ∩ 𝐵 = 𝑃 𝐴 𝑃[𝐵]

Ejemplo. Si A y B son independientes entonces:


𝑃[𝐴 ∩ 𝐵] 𝑃 𝐴 𝑃[𝐵]
𝑃 𝐴ǀ𝐵 = = = 𝑃[𝐴]
𝑃[𝐵] 𝑃[𝐵]

Ejercicio. La probabilidad de que un componente salga defectuoso por forma es 0,4 y


de que salga defectuoso por peso es 0,3. Cuál es la probabilidad de que tenga ambos
defectos si los eventos son independientes.

32
Teorema de Bayes
𝑃 𝐵 𝐴 𝑃[𝐴]
𝑃 𝐴ǀ𝐵 =
𝑃[𝐵]

donde A y B son eventos y 𝑃[𝐵] ≠ 0.

• 𝑃[𝐴] es la probabilidad de observar A, sin considerar B (a priori)


• 𝑃[𝐵] es la probabilidad de observar B, sin considerar A.
• 𝑃 𝐴 𝐵 , es una probabilidad condicional, es la probabilidad de observar A
dado que ocurre B (a posteriori).
• 𝑃 𝐵 𝐴 es la probabilidad de observar B dado que ocurre A.

𝑃 𝐴ǀ𝐵 𝑃[𝐵] = 𝑃 𝐵 𝐴 𝑃[𝐴]


33
Distribuciones conjuntas de
Probabilidad

34
Densidades Conjuntas
Sean 𝐱 y 𝐲 dos variables aleatorias, entonces el par (𝐱, 𝐲) se conoce
como una V.A. bidimensional y la función de distribución de
probabilidad conjunta se define como:
𝐹𝐱𝐲 𝑥, 𝑦 = 𝑃 𝐱 ≤ 𝑥 ∩ 𝐲 ≤ 𝑦 = 𝑃(𝐱 ≤ 𝑥, 𝐲 ≤ 𝑦)

Propiedades de 𝐹𝐱𝐲 𝑥, 𝑦
i. 𝐹𝐱𝐲 = (−∞, 𝑦) = 0 , 𝐹𝐱𝐲 = (𝑥, −∞) = 0 , 𝐹𝐱𝐲 = (∞, ∞) = 1

ii. 𝑃 𝑥1 ≤ 𝐱 ≤ 𝑥2 , 𝐲 ≤ 𝑦 = 𝐹𝐱𝐲 𝑥2 , 𝑦 − 𝐹𝐱𝐲 𝑥1 , 𝑦

iii. 𝑃 𝑥1 ≤ 𝐱 ≤ 𝑥2 , 𝑦1 ≤ 𝐲 ≤ 𝑦2 = 𝐹𝐱𝐲 𝑥2 , 𝑦2 − 𝐹𝐱𝐲 𝑥1 , 𝑦2


−𝐹𝐱𝐲 𝑥2 , 𝑦1 + 𝐹𝐱𝐲 𝑥1 , 𝑦1

35
Densidades Conjuntas (cont.)
Función de densidad conjunta
𝜕 2 𝐹𝐱𝐲 𝑥, 𝑦
𝑓𝐱𝐲 𝑥, 𝑦 =
𝜕𝑥 𝜕𝑦
Propiedades de 𝑓𝐱𝐲 𝑥, 𝑦
∞ ∞
i. −∞ −∞
𝑓 𝑥, 𝑦 𝑑𝑥𝑑𝑦 = 1

𝑦2 𝑥2
ii. 𝑃 𝑥1 ≤ 𝐱 ≤ 𝑥2 , 𝑦1 ≤ 𝐲 ≤ 𝑦2 = 𝑦1 𝑥1
𝑓 𝑥, 𝑦 𝑑𝑥𝑑𝑦

iii. Si 𝐱 y 𝐲 son V.A. continuas entonces 𝑃 𝐱 = 𝑥0 ∪ 𝐲 = 𝑦0 = 0.

36
Densidades Conjuntas (cont.)

𝑓𝐱𝐲 𝑥, 𝑦

37
Distribuciones marginales
Las distribuciones para cada una de las variables aleatorias se conocen
como distribuciones marginales, las cuales pueden obtenerse como:


𝐹𝐱 𝑥 = 𝐹𝐱𝐲 𝑥, ∞ → 𝑓𝐱 𝑥 = 𝑓𝐱𝐲 𝑥, 𝑦 𝑑𝑦
−∞


𝐹𝒚 𝑦 = 𝐹𝐱𝐲 ∞, 𝑦 → 𝑓𝐲 𝑦 = 𝑓𝐱𝐲 𝑥, 𝑦 𝑑𝑥
−∞

38
Distribuciones marginales (cont.)
Ejemplo. Suponga que en un centro de vigilancia se reciben llamadas
de 2 puestos de control que pueden ocurrir en el intervalo [0,2]. Sea 𝐱
el tiempo de entrada de la llamada del puesto A y sea 𝐲 el tiempo de la
llamada del puesto B. Si 𝐱 y 𝐲 siguen la función de densidad conjunta:
𝑘(𝑥 + 𝑦) 0 < 𝑥 < 2, 0 < 𝑦 < 2
𝑓𝐱𝐲 𝑥, 𝑦 =
0 ~
a) Encuentre el valor de 𝑘.
b) Encuentre la probabilidad de que la llamada de A ocurran entre 0 y
1, y la llamada de B entre 1 y 2.
c) Encuentre las funciones de densidad marginal.
d) Encuentre la probabilidad de que la llamada de A ocurra en el
último cuarto del intervalo.

39
Distribuciones conjuntas discretas
𝑓𝐱𝐲 𝑥, 𝑦 = 𝑃𝐱𝐲 𝑥𝑖 , 𝑦𝑖 𝛿(𝑥 − 𝑥𝑖 , 𝑦 − 𝑦𝑖 )
𝑖 𝑗
Propiedades
i. 𝑖 𝑗 𝑃𝐱𝐲 𝑥𝑖 , 𝑦𝑖 = 1

ii. 𝑃 𝑥1 ≤ 𝐱 ≤ 𝑥2 , 𝑦1 ≤ 𝐲 ≤ 𝑦2 = 𝑥1 ≤𝑥𝑖 ≤𝑥2 𝑦1 ≤𝑦𝑖 ≤𝑦2 𝑃𝐱𝐲 𝑥𝑖 , 𝑦𝑖

iii. 𝑃 𝐱 = 𝑥0 ∩ 𝐲 = 𝑦0 = 𝑃𝐱𝐲 𝑥0 , 𝑦0

Marginales

𝑃𝐱 𝑥 = 𝑗 𝑃𝐱𝐲 𝑥, 𝑦𝑗 , 𝑃𝐲 𝑦 = 𝑖 𝑃𝐱𝐲 𝑥𝑖 , 𝑦

40
Distribuciones conjuntas discretas
(cont.)
Ejemplo. En una planta de tornillos se realizan dos tareas: soldar y apretar
tornillos. Sea 𝐱 el número de soldaduras defectuosas y 𝐲 el número de tornillos
mal apretados. Si la función de densidad conjunta 𝑓𝐱𝐲 𝑥, 𝑦 es:

𝑥\y 0 1 2 3
0 0,840 0,030 0,020 0,010
1 0,060 0,010 0,008 0,002
2 0,010 0,005 0,004 0,001

a) Encuentre la probabilidad de que no haya error.


b) Encuentre la probabilidad de que haya más de un tornillo mal apretado y
menos de dos soldaduras defectuosas.
c) Encuentre las funciones de densidad marginal.
d) Encuentre la probabilidad de que todos los tornillos queden bien apretados.
e) Encuentre la probabilidad de que ocurra una soldadura defectuosa.

41
Probabilidad condicional e
Independencia
Cuando dos variables aleatorias son definidas en un experimento, el
conocimiento de una de ellas puede cambiar la probabilidad a la otra.
𝑃(𝐱=𝑥∩𝐲=𝑦)
𝑃 𝐱 = 𝑥|𝐲 = 𝑦 = : Probabilidad condicional
𝑃(𝐲=𝑦)

Ejemplo. Para la planta automotriz, calcule la probabilidad de que


todas las soldaduras queden bien, dado que todos los tornillos fueron
bien apretados.

Ejemplo. Para el ejemplo del centro de vigilancia, calcule la


probabilidad de que la llamada de A ocurra en el intervalo [0,1] dado
que la llamada de B ocurre en [1,2].

42
Probabilidad condicional e
Independencia (cont.)
Función de densidad condicional
Dado que las probabilidades sobre 𝐲 (o 𝐱) pueden variar al conocer 𝐱 (o 𝐲), es
útil definir la función de densidad condicional:
𝑓𝐱𝐲 (𝑥, 𝑦) 𝑓𝐱𝐲 (𝑥, 𝑦)
𝑓𝐲|𝐱 𝑦𝑥 = , 𝑓𝐱 (𝑥) > 0 𝑓𝐱|𝐲 𝑥𝑦 = , 𝑓𝐲 𝑦 > 0
𝑓𝐱 (𝑥) 𝑓𝐲 (𝑦)

Las funciones 𝑓 𝑦 𝑥 y 𝑓 𝑥 𝑦 son usadas para inferir probabilidades sobre


𝐲 y 𝐱, respectivamente, dado un valor de 𝐱 y 𝐲, respectivamente.
Ejemplo. Para el caso del centro de vigilancia encuentre 𝑓 𝑥 𝑦 y calcule
𝑃(1.5 ≤ 𝐱 ≤ 2|𝐲 = 0.5).
Ejemplo. Para el caso de la planta automotriz, determine 𝑓 𝑦 𝑥 y calcule
𝑃(𝐲 = 0|𝐱 = 1).

43
Probabilidad condicional e
Independencia (cont.)
Independencia
Dos variables aleatorias 𝐱 y 𝐲 son independientes si
𝑓𝐱𝐲 𝑥, 𝑦 = 𝑓𝐱 𝑥 𝑓𝐲 𝑦

De acuerdo a esto, las probabilidades condicionales corresponden a:


𝑓𝐱𝐲 (𝑥, 𝑦) 𝑓𝐱𝐲 (𝑥, 𝑦)
𝑓𝐲|𝐱 𝑦𝑥 = = 𝑓𝐲 𝑦 y 𝑓𝐱|𝐲 𝑥𝑦 = , = 𝑓𝐱 (𝑥)
𝑓𝐱 (𝑥) 𝑓𝐲 (𝑦)

Además,
𝑦2 𝑥2 𝑦2 𝑥2
𝑃 𝑥1 ≤ 𝐱 ≤ 𝑥2 , 𝑦1 ≤ 𝐲 ≤ 𝑦2 = 𝑓𝐱𝐲 𝑥, 𝑦 𝑑𝑥𝑑𝑦 = 𝑓𝐱 𝑥)𝑓𝐲 (𝑦 𝑑𝑥𝑑𝑦
𝑦1 𝑥1 𝑦1 𝑥1
𝑥2 𝑦2
= 𝑓𝐱 (𝑥)𝑑𝑥 𝑓𝐲 𝑦 𝑑𝑦 = 𝑃 𝑥1 ≤ 𝐱 ≤ 𝑥2 )𝑃(𝑦1 ≤ 𝐲 ≤ 𝑦2
𝑥1 𝑦1

44
Probabilidad condicional e
Independencia (cont.)
Ejemplo. Sean 𝐱 y 𝐲 variables aleatorias con función de densidad de
probabilidad conjunta dada por:

𝑓 𝑥, 𝑦 = 2 × 10−6 𝑒 −0.001𝑥−0.002𝑦

para 𝑥 ≥ 0 y 𝑦 ≥ 0.

a) Demuestre que 𝐱 y 𝐲 son independientes.


b) Determine 𝑃(𝐱 ≥ 1000, 𝐲 < 1000).

45
Momentos conjuntos
El 𝑖𝑗-ésimo momento conjunto de las V.A. 𝐱 y 𝐲 se define como:
∞ ∞

𝑚𝑖𝑗 ≜ 𝐸 𝐱 𝑖 𝐲𝑗 = 𝑥 𝑖 𝑦 𝑗 𝑓𝐱𝐲 𝑥, 𝑦 𝑑𝑥𝑑𝑦 para 𝑖, 𝑗 = 0,1,2, …


−∞ −∞

Observación. 𝑚00 = 1, 𝑚10 = 𝜇𝐱 y 𝑚01 = 𝜇𝐲 .

Si 𝐱 y 𝐲 son variables aleatorias discretas, entonces:

𝑚𝑖𝑗 ≜ 𝐸 𝐱 𝑖 𝐲𝑗 = 𝑥 𝑖 𝑦 𝑗 𝑃𝐱 𝑥𝑘 𝑃𝐲 𝑦𝑙 para 𝑖, 𝑗 = 0,1,2, …


𝑥𝑘 𝑦𝑙

El orden de un momento conjunto está dado por 𝑖 + 𝑗

Momentos de orden 2: 𝑚20 = 𝐸[𝐱 2 ], 𝑚02 = 𝐸[𝐲 2 ] y 𝑚11 = 𝐸 𝐱𝐲 = Corr 𝐱, 𝐲 .

46
Momentos centrales conjuntos
El 𝑖𝑗-ésimo momento central conjunto de las V.A. 𝐱 y 𝐲 se define como:
∞ ∞

𝑐𝑖𝑗 ≜ 𝐸 (𝐱 − 𝜇𝐱 )𝑖 (𝐲 − 𝜇𝐲 )𝑗 = (𝑥 − 𝜇𝐱 )𝑖 (𝑦 − 𝜇𝐲 )𝑗 𝑓𝐱𝐲 𝑥, 𝑦 𝑑𝑥𝑑𝑦


−∞ −∞

Ejemplo. Momentos centrales de orden 2:

𝑐20 = 𝑉[𝐱], 𝑐02 = 𝑉[𝐲] y 𝑐11 = Cov(𝐱, 𝐲).

Si 𝐱 y 𝐲 son variables aleatorias discretas, entonces:

𝑐𝑖𝑗 ≜ 𝐸 (𝐱 − 𝜇𝐱 )𝑖 (𝐲 − 𝜇𝐲 )𝑗 = (𝐱 − 𝜇𝐱 )𝑖 (𝐲 − 𝜇𝐲 )𝑗 𝑃𝐱 𝑥𝑘 𝑃𝐲 𝑦𝑙
𝑥𝑘 𝑦𝑙

47
Covarianza
𝑐11 ≜ cov 𝐱, 𝐲 = 𝐸 (𝐱 − 𝜇𝐱 )(𝐲 − 𝜇𝐲 )
∞ ∞

= 𝑥 − 𝜇𝐱 𝑦 − 𝜇𝐲 𝑓 𝑥, 𝑦 𝑑𝑥𝑑𝑦
−∞ −∞
La covarianza puede expresarse como:
cov 𝐱, 𝐲 = 𝐸 𝐱𝐲 − 𝜇𝐱 𝜇𝐲

Observación. Si cov 𝐱, 𝐲 = 0 entonces 𝐱 y 𝐲 son no correlacionadas.


Observación. Si cov 𝐱, 𝐲 = 0 entonces 𝐸 𝐱𝐲 = 𝜇𝐱 𝜇𝐲 = 𝐸 𝐱]𝐸[𝐲 .
Observación. Si 𝐱 y 𝐲 son independientes entonces son no correlacionadas.
(No correlacionadas no implica independencia)
cov(𝐱,𝐲)
Coeficiente de correlación 𝜌= −1 ≤ 𝜌 ≤ 1
𝑉 𝐱 𝑉(𝐲)

48
Vectores aleatorios

49
Vectores Aleatorios
Un vector aleatorio es un vector:
𝐗 = (𝐱 𝟏 , … , 𝐱 𝒏 )
cuyos elementos 𝐱 𝑖 son variables aleatorias.
La función de distribución conjunta se define como:
𝐹𝐗 𝑋 = 𝐹 𝑥1 , … , 𝑥𝑛 = 𝑃 𝐱 𝟏 ≤ 𝑥1 , … , 𝐱 𝒏 ≤ 𝑥𝑛 ,
y la función de densidad conjunta se encuentra dada como:
𝜕𝑛
𝑓𝐗 𝑋 = 𝐹 𝑥1 , … , 𝑥𝑛 .
𝜕𝑥1 … 𝜕𝑥𝑛
Densidades marginales:
∞ ∞
𝑓𝐱𝑖 𝑥 = … 𝑓𝐗 𝑋 𝑑𝑥1 … 𝑑𝑥𝑖−1 𝑑𝑥𝑖+1 … 𝑑𝑥𝑛
−∞ −∞

50
Vectores esperados

El valor esperado del vector (columna) 𝐗 = (𝐱 𝟏 , … , 𝐱 𝒏 )𝑻 es el vector


𝝁 = (𝜇1 , … , 𝜇𝑛 )𝑇 , cuyos elementos 𝜇1 , … , 𝜇𝑛 están dados como:

∞ ∞
𝜇𝑖 ≜ … 𝑥𝑖 𝑓𝐗 𝑋 𝑑𝑥1 … 𝑑𝑥𝑛
−∞ −∞


= 𝑥𝑖 𝑓𝐱𝑖 𝑋 𝑑𝑥𝑖
−∞

51
Matriz de covarianza
La matriz de covarianza 𝐊 (de 𝑛 × 𝑛) asociada al vector aleatorio
𝐗 = (𝐱 𝟏 , … , 𝐱 𝒏 )𝑻 está dada como:
𝐊 ≜ 𝐸[(𝐗 − 𝝁)(𝐗 − 𝝁)𝑇 ]

donde el componente (𝑖, 𝑗) puede encontrarse de acuerdo a:


𝐾𝑖𝑗 = 𝐸[(𝐱 𝑖 − 𝜇𝑖 )(𝐱𝑗 − 𝜇𝑗 )]
= 𝐸 𝐱𝑗 − 𝜇𝑗 𝐱 𝑖 − 𝜇𝑖 = 𝐾𝑗𝑖

cov(𝐱1 , 𝐱1 ) ⋯ cov(𝐱1 , 𝐱 𝑛 ) 𝑉(𝐱1 ) ⋯ 𝐾1𝑛


𝐊= ⋮ ⋱ ⋮ = ⋮ ⋱ ⋮
cov(𝐱 𝑛 , 𝐱1 ) ⋯ cov(𝐱 𝑛 , 𝐱 𝑛 ) 𝐾𝑛1 ⋯ 𝑉(𝐱 𝑛 )

52
Matriz de covarianza (cont.)
Ejemplo. Sea 𝐗 = (𝐱1 , 𝐱 2 ) un vector de variables aleatorias, si se
conoce que 𝐱 2 = 𝑎𝐱1 + 𝑏, determine la matriz de covarianza de 𝐗 y el
coeficiente de correlación entre las dos variables aleatorias.

Ejemplo. Considere dos variables aleatorias 𝐗 = (𝐱1 , 𝐱 2 ) con función


de densidad conjunta 𝑓 𝑥1 , 𝑥2 = 𝑥1 + 𝑥2 para 0 < 𝑥1 ≤ 1,0 < 𝑥1 ≤ 1.
Demuestre que 𝐱1 , 𝐱 2 no son independientes pero son prácticamente
no correlacionadas. Escriba la matriz de covarianza.

53
Matriz de covarianza (cont.)
Propiedades
1. 𝐊 es una matriz real simétrica.
2. 𝐊 es una matriz semi-positiva definida:

𝑧 𝑇 𝑲𝑧 ≥ 0, ∀𝑧 ≠ 0

Si 𝐊 tiene rango completo entonces es positiva definida.

3. Valores propios (𝜆) y vectores propios (𝑽 = (𝑉1 , … , 𝑉2 )).

𝐊𝑽 = 𝑽𝚲 ⟹ 𝐊𝑉𝑖 = 𝜆𝑖 𝑉𝑖

4. Los auto-vectores de 𝐊 son mutuamente ortogonales.


5. La matriz de covarianza puede expresarse como:

𝐊 = 𝐑 − 𝝁𝝁𝑻 , con 𝐑 = 𝐸[𝐗𝐗 𝑻 ] (matriz de correlación)

54
Matriz de covarianza (cont.)
6. Decorrelación de variables aleatorias:
𝜆1 ⋯ 0
𝑽𝑇 𝐊𝑽 = 𝚲, 𝚲= ⋮ ⋱ ⋮
0 ⋯ 𝜆𝑛

Ejemplo. El vector aleatorio 𝐗 = (𝐱1 , 𝐱 2 , 𝐱 3 ) tiene la matriz de covarianza:

2 −1 1
𝐊 = −1 2 0
1 0 2

55

You might also like