You are on page 1of 15

Distribución de probabilidades multivariantes

Guía de estudio

1. Introducción
• Variable aleatoria discreta
• Variable aleatoria continua

2. Vector aleatorio

3. Distribuciones de probabilidad
• Función de probabilidad conjunta
• Función de densidad conjunta
• Función de distribución conjunta

4. Distribuciones marginales
• Función de probabilidad marginal
• Función de densidad marginal

5. Distribuciones condicionales
• Función de probabilidad condicional
• Función de densidad condicional

6. Valor esperado
• Valor esperado
• Valor esperado condicional
• Independencia

7. Covarianza
• Covarianza de dos variables
• Matriz de covarianza

Holger Benalcázar Paladines


holger.benalcazar@ epn.edu.ec
holgerben@hotmail.com
abril-2016
1. Introducción

En estadística básica empleamos una variable aleatoria (va) para representar los resultados
de un experimento, era variable porque podía tomar distintos valores y aleatoria porque los
valores ocurrían al azar; así la probabilidad de un evento se traducía en calcular la
probabilidad de que la va tome ciertos valores.

Las va tomaban valores numéricos en R y distinguíamos dos tipos de va, las variables
aleatorias discretas y las variables aleatorias continuas. Recordemos los principales
resultados acerca de ellas.

Variable aleatoria discreta

Una variable aleatoria discreta (vad) es aquella que toma un número contable de valores,
esto es, el experimento aleatorio asociado tiene un número finito o infinitamente numerable
de resultados.

Una vad X está completamente determinada si conocemos los valores que toma: x1, x2 ...,
y la probabilidad con que los toma. La probabilidad de que X tome exactamente el valor xk,
se denota por:

pk = P(X= xk) k= 1,2, …. (3.1)

Todos los valores pk, se denominan función de probabilidad de X.

Para asegurarnos que la función de probabilidad de una vad X está bien definida, debemos
verificar que cumple con:

1. La probabilidad asignada a cualquier valor xk de X debe pertenecer al intervalo [0,1]:

0 pk 1 para cualquier k (3.2)

2. Como la unión de todos los eventos simples reconstruye el conjunto muestral, la suma de
las probabilidades asignadas a los valores de X, debe ser uno:

p1 + p2 + p3 +...... = 1 (3.3)

La función de acumulación o de distribución de la vad X evaluada en cualquier número


real w, es la probabilidad de que la vad X tome valores menores o iguales a w:

F(w) = P( X  w )= p
xk w
k (3.4)

Como los valores que toma la vad X representan eventos simples, los cuales a su vez son
disjuntos, se tiene que la función de distribución evaluada en w no es más que la acumulación
de las probabilidades correspondientes a todos los valores de X que son menores o iguales a

Holger Benalcázar Paladines probabilidades multivariantes 2


w. Además, los valores de la función de distribución, por ser una probabilidad, siempre se
encontrarán en el intervalo [0,1].

El valor esperado o esperanza de X es la suma de los productos entre los valores que toma
la vad y la probabilidad de que los tome. La esperanza de X, se asimila como el promedio
de los valores de X que se obtendría al repetir muchas veces el experimento respectivo. La
manera de calcularla, es:

 = E(X) = x1p1 + x2p2 + x3p3 + ........ (3.5)

La varianza de X es el valor esperado de (X-)2, es decir, el valor esperado de la distancia


entre X y su esperanza  elevada al cuadrado. La varianza es una medida de la dispersión de
los valores de X respecto a su esperanza . Su cálculo se realiza por:

2 = V(X) = E[(X-)2] (3.6)


= (x1-)2p1 +(x2-)2p2 +(x3-)2p3 +...
= E(X2) - 2
= ( (x1)2p1 +(x2)2p2 +... ) - 2

La raíz no negativa  de la varianza, se denomina desviación estándar o típica.

El número de vad es infinito y algunas de ellas, por sus características, tienen nombres, tales
como: Bernoulli, binomial, uniforme discreta, Poisson, geométrica, hipergeométrica,
binomial negativa, etc.

Variable aleatoria continua

Una variable aleatoria continua (vac) toma sus valores en un intervalo real, por lo que el
número de posibles valores de una vac es infinito. Una vac X está determinada si se conoce
el intervalo real (a,b) donde toma sus valores y su función de densidad f(x), la cual cumple:

1- Si x se encuentra en el intervalo (a,b), entonces f(x) 0; caso contrario, f(x)=0.

2- El área bajo la curva de f(x) entre los valores a y b, vale siempre 1. Esto es equivalente a
decir que, la integral de f(x) entre a y b, siempre toma el valor de 1, así:

 f (x)dx  1
a
(3.7)

Si (c,d) es subconjunto de (a,b), la probabilidad de que la vac X tome valores en ese intervalo,
está dada por el área bajo la curva de f(x) entre estos dos puntos:

d
P (c  X  d )   f (x)dx (3.8)
c

A diferencia de una va discreta, la probabilidad de que una va continua X tome exactamente


un valor es siempre cero.

holger.benalcazar@epn.edu.ec probabilidades multivariantes 3


La función de distribución o de acumulación de la va continua X se define por:

F(w)= P(X  w) (3.9)

esto es, al igual que en el caso discreto, la función de distribución evaluada en el valor w es
igual a la probabilidad de que la vac X tome valores menores o iguales a w. Se tiene:

F(w)= 0 si w < a (3.10)


w
F(w)=  f (u )du
a
si a  w  b

F(w)= 1 si w  b.

El valor esperado de una vac X, se calcula mediante:

b
= E(X) =  xf (x)dx
a
(3.11)

La varianza de una vac X, es igual a:

b
 = V(X)= E[(X-) ] =  (x   )
2 2 2
f (x)dx (3.12)
a

= E(X2) - 2

Igual que en el caso discreto, el número de vac es infinito. Entre las conocidas están:
uniforme, triangular, normal, t-Student, F, exponencial, gamma, beta, Weibull, etc.

2. Vector aleatorio

Si nos interesa medir varias características de un elemento al mismo tiempo necesitaremos


un vector donde cada componente se encargue de una característica; y si los resultados de
cada característica son aleatorios, cada componente es una va y el vector será un vector
aleatorio (va). En general, vamos a denotar un va en Rp, por:

X´=(X1, …, Xp) (3.13)

donde cada componente Xk es una va univariante.

Los valores que toman las vad Xk componentes del vector aleatorio discreto (vad) X son de
la forma:

Valores de X1: D1= x11, x21, x31, …. (3.14)


Valores de X2: D2= x12, x22, x32, ….
….
Valores de Xp: Dp= x1p, x2p, x3p, ….

Holger Benalcázar Paladines probabilidades multivariantes 4


a los que nos referiremos de forma rápida como: los valores x1 de X1, los valores x2 de X2,
etc. Así, los valores del vad X serán los vectores x= (x1, x2,…, xp)´, donde (x1, x2,…, xp) es
elemento del producto cartesiano D = D1 x D2 x … x Dp, subconjunto discreto de Rp.

En cambio, los valores x= (x1, x2,…, xp)´ que toma un vector aleatorio continuo (vac) X
estarán en una región continua C de Rp. Así, si cada componente toma valores en un
intervalo real, finito o infinito:

Valores de X1: C1= (c1, d1) (3.15)


Valores de X2: C2= (c2, d2)
….
Valores de Xp: Cp= (cp, dp)

Entonces el vac X tomará valores en la región C= C1 x C2 x … x Cp, subconjunto continuo


de Rp.

3. Distribuciones de probabilidad

Para determinar un vad necesitamos conocer los valores que toma (la región D) y su función
de probabilidad conjunta; o en el caso de un vac, la región C de Rp donde toma valores y su
función de densidad conjunta.

Función de probabilidad conjunta

La función de probabilidad conjunta del vad X se define para todo xD, por:

p(x)= p(x1, x2,…, xp) = P(X1=x1, X2=x2,…, Xp=xp) (3.16)

siempre que cumpla con:

1. p(x1, x2,…, xp)  0 para todos los posibles valores de X

2.  p(x1, x2,…, xp) = 1 para todos los posibles valores de X

-------- Ejemplo 3.1 <Probabilidades multivariantes.xlsx/3A> Supongamos que tenemos 8 estudiantes de


economía, 6 estudiantes de matemática y 5 estudiantes de física. Se desea seleccionar al azar 4
estudiantes de los 19 estudiantes. Sean las va:

X: número de estudiantes de economía seleccionados


Y: número de estudiantes de matemática seleccionados

Este enunciado será utilizado a través de todo el capítulo para aplicar las definiciones relacionadas
con los vad. En el archivo se calculan las probabilidades conjuntas:

(𝑥8)(𝑦
6 5
)(4−𝑥−𝑦 )
P(X=x, Y=y)= para 0 x+y  4
(19
4)

holger.benalcazar@epn.edu.ec probabilidades multivariantes 5


donde el razonamiento para el cálculo de la probabilidad es casos favorables sobre casos posibles.
Para los casos favorables se aplica el primer principio de conteo: primero, contamos las formas de
obtener x estudiantes de 8 de economía; luego, contamos la forma de obtener y estudiantes de 6 de
matemática; para luego, contar las formas de obtener 4-x-y estudiantes de 5 de física; los casos
favorables es el producto de los 3 resultados anteriores. Los casos posibles son el número de
maneras de obtener 4 estudiantes de un grupo de 19. La tabla con las probabilidades conjuntas es:

X/Y 0 1 2 3 4
0 0.001 0.015 0.039 0.026 0.004
1 0.021 0.124 0.155 0.041
2 0.072 0.217 0.108
3 0.072 0.087
4 0.018

Así, la probabilidad de seleccionar 1 estudiante de economía y 2 de matemática es 0.155


(implícitamente hay 1 estudiante de física seleccionado).

Función de densidad conjunta

La función de densidad conjunta del vac X es un campo escalar en Rp, tal que:

1. f(x)  0 para xC (3.17)

2. ∬C f(x)dx = 1 (3.18)

-------- Ejemplo 3.2 Sea Y la proporción de la capacidad de una cisterna de gasolina de una compañía de
transporte que está disponible después de que se surte a inicios de semana. Sea X la proporción de
la cisterna que ocupan los carros de la compañía durante la semana. Notemos que X e Y por ser
proporciones tomarán valores en el intervalo [0,1]. Este enunciado será utilizado a través de todo el
capítulo para aplicar las definiciones relacionadas con los vac.

Verifiquemos que f(x,y)= 2(2y-x), para 0 x  y  1, cumple con los requerimientos de una función de
densidad conjunta.

Comprobemos que la probabilidad de que se llene la cisterna con más de ¾ de su capacidad y se


ocupe más de media cisterna es 13/64.

Función de distribución conjunta

La función de distribución conjunta, o función de acumulación conjunta, para las p variables


Xk, está dada por:

F(w)= F(w1, w2,…, wp) = P(X1 w1, X2 w2,…, Xp wp) (3.19)

Holger Benalcázar Paladines probabilidades multivariantes 6


Si las variables Xk son discretas tendremos:

F(w)= F(w1, w2,…, wp) = P(X1 w1, X2 w2,…, Xp wp) (3.20)

= ∑ p(x1 ,x2 ,…,xp )

donde la suma es sobre todos los valores xD que cumplen con x1 w1, x2 w2,…, xp wp.

-------- Ejemplo 3.3 <Probabilidades multivariantes.xlsx/3A> Veamos algunos valores de la función de


distribución conjunta para la selección de los estudiantes:

F(1,2)= P(X 1, Y 2)
= P(X=0, Y=0) + P(X=0, Y=1) + P(X=0, Y=2) + P(X=1, Y=0) + P(X=1, Y=1) + P(X=1, Y=2)
= p(0,0) + p(0,1) + p(0,2) + p(1,0) + p(1,1) + p(1,2) = 0.355

F(5,6)= P(X 5, Y 6) = P(X 4, Y 4) = 1

F(5,-1)= P(X 5, Y -1) = 0

En cambio, la función de distribución conjunta si las variables Xk son continuas, es:

F(w)= F(w1, w2,…, wp) = P(X1 w1, X2 w2,…, Xp wp) (3.21)

= ∬ f(x1 ,x2 ,…,xp )dx

donde la integral es sobre la región subconjunto de C, donde x1 w1, x2 w2,…, xp wp.

-------- Ejemplo 3.4 Calculemos algunos valores de la función de distribución conjunta para la cisterna de
gasolina:

F(0.5, 0.75)= P(X 0.5, Y 0.75) = 0.375

F(0.75, 0.5)= P(X 0.75, Y 0.5) = P(X 0.5, Y 0.5) = F(0.5, 0.5) = 1/8

F(1.5, 2.75)= P(X 1.5, Y 2.75) = P(X 1, Y 1) = 1

F(-0.5, 0.75)= P(X -0.5, Y 0.75) = 0

holger.benalcazar@epn.edu.ec probabilidades multivariantes 7


4. Distribuciones marginales

Función de probabilidad marginal

La función de probabilidad marginal de la componente Xk del vad X es la función de


probabilidad univariante de Xk y la podemos hallar a partir de la función de probabilidad
conjunta p(x1, x2,…, xp) del vad X, mediante:

pk(xk) = P(Xk = xk) = ∑ p(x1 ,x2 ,…,xp ) (3.22)

donde la suma es sobre todos los valores de x1,…, xk-1, xk+1, …, xp. Es decir sumamos las
probabilidades conjuntas para todos los valores posibles de las vad X1,…, Xk-1, Xk+1, …, Xp,
manteniendo el mismo valor xk para Xk.

-------- Ejemplo 3.5 <Probabilidades multivariantes.xlsx/3B> Si empleamos la función de probabilidad


conjunta del ejemplo 3.1, tenemos que la función de probabilidad marginal de X, es:

P(X=0) = P(X=0, Y=0) + P(X=0, Y=1) + P(X=0, Y=2) + P(X=0, Y=3) + P(X=0, Y=4) = 0.085
P(X=1) =P(X=1, Y=0) + P(X=1, Y=1) + P(X=1, Y=2) + P(X=1, Y=3) = 0.341
P(X=2) =P(X=2, Y=0) + P(X=2, Y=1) + P(X=2, Y=2) = 0.397
P(X=3) =P(X=3, Y=0) + P(X=3, Y=1) = 0.159
P(X=4) =P(X=4, Y=0) = 0.018

donde P(X=k) es la probabilidad de que se seleccione k estudiantes de economía. Así, podemos


realizar cálculos sobre la vad X, tales como:

p0 + p1 + p2 + p3 + p4 = 1
P(X 1) = 0.574
E(X) = 1.684
V(X) = 0.813

De manera similar, conseguimos la función de probabilidad marginal de Y, donde P(Y=k) es la


probabilidad de que se seleccione k estudiantes de matemática:

P(Y=0)=0.184, P(Y=1)=0.443, P(Y=2)=0.302, P(Y=3)=0.067, P(Y=4) = 0.004

Con lo que es fácil verificar que E(Y)= 1.263 y V(Y)= 0.720

Función de densidad marginal

La función de probabilidad marginal de la componente Xk del vac X es la función de


probabilidad univariante de Xk y se la obtiene mediante:

fk(xk) = ∬ f(x1 ,x2 ,…,xp )dx1 ...dxk-1 dxk+1 …dxp (3.23)

donde la región la región de integración es el subconjunto de C cuando Xk=xk.

Holger Benalcázar Paladines probabilidades multivariantes 8


-------- Ejemplo 3.6 Las funciones de densidad marginales de X e Y para el ejemplo de la cisterna de gasolina
son:

1
fX (x)= ∫y=x 2(2y-x) dy=2(1-x) para 0 x  1

y
fY (y)= ∫x=0 2(2y-x) dx=3𝑦 2 para 0 y  1

De donde podemos calcular, por ejemplos: E(X)= 1/3, V(X)=1/18, E(Y)=3/4, V(Y)=3/80

5. Distribuciones condicionales

Función de probabilidad condicional

En el caso discreto, la función de probabilidad condicional de X1,…, Xk-1, Xk+1, …, Xp dado


que Xk=xk, viene dada por:

p(x1,.., xk-1, xk+1,.., xp/xk) = P(X1=x1,.., Xk-1=xk-1, Xk+1=xk+1,.., Xp=xp / Xk=xk) (3.24)
= P(X1=x1, .., Xk=xk,…, Xp=xp) / P(Xk = xk)
= p(x1,.., xk,…, xp) / pk(xk)
= p(x /xk)

donde p(x1,.., xk,…, xp) es la función de probabilidad conjunta del vad X y pk(xk) es la
función de probabilidad marginal de Xk evaluada en xk, la cuál debe ser mayor a 0.

-------- Ejemplo 3.7 <Probabilidades multivariantes.xlsx/3B> Si empleamos la función de probabilidad


conjunta del ejemplo 3.1, tenemos los siguientes resultados:

P(X=0/Y=3) = P(X=0, Y=3) / P(Y=3) = 0.026/0.067 = 0.385


P(X=1/Y=3) = P(X=1, Y=3) / P(Y=3) = 0.041/0.067 = 0.615
P(X=2/Y=3) = 0

El condicionante de que Y=3 se interpreta como un evento cierto, entonces los únicos valores
posibles para X son 0 y 1; además si ha ocurrido Y=3, tenemos que P(X=0/Y=3)  P(X=0) y que
P(X=1/Y=3) P(X=1).

holger.benalcazar@epn.edu.ec probabilidades multivariantes 9


Función de densidad condicional

Si estamos en el caso continuo, la función de densidad condicional de X1,.., Xk-1, Xk+1,.., Xp


dado que Xk=xk, viene dada por:

f(x1,.., xk-1, xk+1,…, xp/xk) = f(X1=x1,.., Xk-1=xk-1, Xk+1=xk+1,.., Xp=xp / Xk=xk) (3.25)
= f(x1,.., xk,…, xp) / fk(xk)
= f(x /xk)

donde f(x1,.., xk,…, xp) es la función de densidad conjunta del vac X y fk(xk) >0.

-------- Ejemplo 3.8 Para el ejemplo de la cisterna de gasolina, la función de densidad condicional de Y
dado que X=x, es:

f(y/x) = f(Y=y/X=x) = f(x,y) / fX(x) = (2y-x)/ (1-x) para 0  x < 1, x  y  1

así, la función de densidad condicional de Y dado que X=1/4, es:

f(y/0.25) = f(Y=y/X=0.25) = f(0.25,y) / fX(0.25) = (2y-0.25)/ 0.75 para 0.25 y  1

Ahora, la función de densidad condicional de X dado que Y=y, es:

f(x/y) = f(X=x/Y=y) = f(x,y) / fY(y) = 2(2y-x)/ (3y2) para 0 < y  1, 0  x  y

de donde, la función de densidad condicional de X dado que Y=3/4, es:

f(x/0.75) = f(X=x/Y=0.75) = f(x,0.75) / fY(0.75) = 32(1.5-x)/ 27 para 0  x  0.75

6. Valor esperado

Valor esperado

El valor esperado del va X, discreto o continuo, es el vector constante:

 = E(X) = (1, 2,…, p)´ (3.26)

donde k es el valor esperado de la va Xk, para k=1,…,p.

Sea g(X)= g(X1, …, Xp) un campo escalar del vad X, el valor esperado de g(X) es:

E(g(X)) = ∑D 𝑔(𝐱)p(x) (3.27)


= ∑D 𝑔(x1 ,x2 ,…,xp )p(x1 ,x2 ,…,xp )

donde la suma se realiza sobre la región D de todos los valores de X.

Holger Benalcázar Paladines probabilidades multivariantes 10


Si g(X)= g(X1, …, Xp) es un campo escalar del vac X, el valor esperado de g(X) es:

E(g(X)) = ∬C g(x)f(x)dx (3.28)

donde la integral múltiple se realiza sobre la región C de todos los valores de X.

En particular, si g(X) es una combinación lineal de las componentes Xk del va X, discreto o


continuo, se tiene que:

g(X)= g(X1, …, Xp) = a1 X1 + a2 X2 + …+ ap Xp = a´X

donde a´= (a1, a2, …, ap) es un vector de valores constantes, entonces por la linealidad del
valor esperado:

E(g(X)) = E(a´X) (3.29)


= a1 1 + a2 2 + …+ ap p
= a´

En general, si se tienen m campos escalares g1(X), g2(X),…, gm(X), el valor esperado de una
combinación lineal de ellos, donde las bk son constante, es:

E( b1 g1(X) + b2 g2(X)+…+ bm gm(X) ) = b1 E(g1(X)) + (3.30)

+ b2 E(g2(X)) +…+ bm E(gm(X))

-------- Ejemplo 3.9 <Probabilidades multivariantes.xlsx/3C > Para los datos del ejemplo 3.1, el valor
esperado del vad X=(X,Y)´ es:

 = (E(X), E(Y))´ = (x , y)´ = (1.684, 1.263)’

Ahora supongamos que queremos calcular el valor esperado de g(X,Y)= X2 – Y2. Entonces:

E(g(X,Y)) = (02-02) P(X=0,Y=0) + (02-12) P(X=0,Y=1) + …. + (42-02) P(X=4,Y=0)= 1.333

También podemos usar (3.30) y aprovechar lo que sabemos de las vad X e Y:

E(g(X,Y)) = E( X2 – Y2) = E( X2) – E(Y2)


= ( V(X) + μ2X ) − ( V(Y) + μ2Y )
= (0.813 + 1.6842) – (0.720 + 1.2632) = 1.333

Hagamos un supuesto adicional, los 4 estudiantes seleccionados al azar, serán enviados a un


congreso de su respectiva área; donde, el costo del congreso de economía es 4, el de matemática es
3, y el de física es 7. Calculemos el costo esperado de enviar a los 4 estudiantes. La función costo es:

C(X,Y)= 4X + 3Y + 7(4-X-Y) = 28 – 3X – 4Y para 0  X+Y  4

luego el costo esperado es E(C(X,Y)) = 28 – 3E(X) – 4E(Y) = 17.895.

holger.benalcazar@epn.edu.ec probabilidades multivariantes 11


-------- Ejemplo 3.10 En el ejemplo de la cisterna de gasolina, el valor esperado del vac X=(X,Y)´ es:

 = (E(X), E(Y))´ = (x , y)´ = (1/3, 3/4)’

El valor esperado de la proporción de gasolina disponible g(X,Y)= Y – X, es:

E(g(X)) = E(Y-X) = y - x = 5/12

Si el costo semanal de comprar y mantener la gasolina en la cisterna es:

C(X,Y)= 2,000 Y + 100(Y-X) + 150

El costo semanal esperado es E(C(X,Y)) = 1,691.67

Valor esperado condicional

El valor esperado condicional del vad X dado que la componente Xk toma el valor xk, es el
vector:

E(X/Xk=xk) = ∑ 𝐱 P(X=x/X k =xk ) (3.31)


= ∑ 𝐱 p(𝐱/xk )

donde la sumatoria es sobre todos los valores x del vad X cuando Xk toma el valor xk.

El valor esperado condicional de la vac Xr dado que la vac Xk toma el valor xk, es:

E(Xr / Xk= xk) =  xr f(xr / xk) dxr (3.32)

donde la integral es sobre el rango de Xr cuando Xk toma el valor xk.

-------- Ejemplo 3.11 <Probabilidades multivariantes.xlsx/3C > Para los datos del ejemplo 3.1, el número
de estudiantes de economía seleccionados dado que hay 2 estudiantes de matemática
seleccionados, es:

E(X/Y=2)= 0*P(X=0/Y=2) + 1* P(X=1/Y=2) + 2* P(X=2/Y=2) = 1.231

Mientras que el número esperado de estudiantes de matemáticas seleccionado dado que hay 3
estudiantes de economía seleccionados, es:

E(Y/X=3)= 0*P(Y=0/X=3) + 1* P(Y=1/X=3) = 0.545

-------- Ejemplo 3.12 En el ejemplo de la cisterna de gasolina, el consumo esperado cuando la cisterna se
llena en un 75%, es igual a:
y
E(X/Y=0.75)= ∫x=0 x f(x/0.75) dx=1/3

Holger Benalcázar Paladines probabilidades multivariantes 12


En cambio, la proporción disponible esperada a inicios de semana cuando el consumo es del 25%
es igual a:

1
E(Y/X=0.25)= ∫y=0.25 y f(y/0.25) dx=0.719

Independencia

Las va X1, X2, …, Xp se dicen independientes, si la función de distribución conjunta es igual


al producto de las funciones de distribución univariantes, para todos los valores x1, x2,…, xp:

F(x)= F(x1, x2,…, xp) = F1(x1) F2(x2) … Fp(xp) (3.33)

En el caso discreto, las vad X1, X2, …, Xp son independientes si la función de probabilidad
conjunta es igual al producto de las funciones de probabilidad univariantes, para todos los
valores x1, x2,…, xp:

p(x)= p(x1, x2,…, xp) = p1(x1) p2(x2) … pp(xp) (3.34)

En cambio, en el caso continuo, las vac X1, X2, …, Xp son independientes si la función de
densidad conjunta es igual al producto de las funciones de densidad univariantes, para todos
los valores x1, x2,…, xp:

f(x)= f(x1, x2,…, xp) = f1(x1) f2(x2) … fp(xp) (3.35)

-------- Ejemplo 3.13 En el caso del ejemplo 3.1, no tenemos independencia, ya que por ejemplo:

P(X=2, Y=3) = 0
P(X=2) P(Y=3) = 0.397*0.302 = 0.120

y no hay igualdad entre P(X=2, Y=3) y P(X=2) P(Y=3).

Para el ejemplo de la cisterna de gasolina tampoco se tiene independencia ya que no se cumple la


igualdad de f(x,y) con el producto de fX(x) y fY(y).

holger.benalcazar@epn.edu.ec probabilidades multivariantes 13


7. Covarianza

Covarianza de dos variables

Si X e Y son dos va, la covarianza de X e Y, se define por:

Cov(X,Y) = XY = E[(X-X) (Y-Y)] (3.36)


= E(XY) -X Y

donde X es el valor esperado de X y Y el valor esperado de Y. Observemos que la


covarianza de X consigo mismo es igual a su varianza:

Cov(X,X) = XX = σ2X = E[(X-X)2] = E(X2) - μ2X (3.37)

Si X e Y son dos va independientes, entonces:

Cov(X,Y) = 0 (3.38)
E(XY) = X Y = E(X) E(Y)

La covarianza es una medida de la dependencia lineal entre las dos variables; sin embargo,
es difícil utilizarla como medida absoluta ya que depende de la escala de medición. Para
evitar lo anterior, se suele estandarizar la covarianza por las desviaciones típicas, lo que
genera el coeficiente de correlación lineal entre X e Y, cuya fórmula es:

Cov(X,Y) σ
ρXY= = σ XY (3.39)
σX σY σ
X Y

El coeficiente de correlación lineal cae en el intervalo [-1,1]. Cuando es positivo, los valores
de las variables tienden a crecer o decrecer al mismo tiempo; si es negativo, mientras los
valores de una variable crecen los valores de la otra variable tienden a decrecer. Si XY=1 se
tendrá una correlación positiva perfecta; y si XY=-1, la correlación negativa será perfecta.
Cuando XY=0, se tendrá que las variables no están correlacionadas linealmente, aunque
podrían estar relacionadas de otra manera.

-------- Ejemplo 3.14 <Probabilidades multivariantes.xlsx/3D> Para el ejemplo de la selección de


estudiantes, tenemos:

Cov(X,Y)= E(XY) - X Y = 1.684 – 1.684*1.263 = -0.443


XY= -0.443/ (0.901*0.849)= -0.579

En cambio, para el ejemplo continuo de la cisterna de gasolina:

Cov(X,Y)= E(XY) - X Y = 4/15 – (1/3)(3/4) = 1/60 = 0.017


XY= 0.017/ (0.236*0.194)= -0.365

Holger Benalcázar Paladines probabilidades multivariantes 14


Matriz de covarianza

La matriz de covarianza de un va X, es la matriz simétrica p*p:

 = ( kr ) (3.40)

donde kr es la covarianza entre Xk y Xr.

Si U es una va combinación lineal de las componentes Xk del va X:

U = a1 X1 + a2 X2 + …+ ap Xp = a´X

donde a´= (a1, a2, …, ap) es un vector de valores constantes, entonces la varianza de U es:

p
V(U) = ∑k=1 a2k σkk+2 ∑k<r ak ar σkr (3.41)

= a´  a

holger.benalcazar@epn.edu.ec probabilidades multivariantes 15

You might also like