Professional Documents
Culture Documents
Guía de estudio
1. Introducción
• Variable aleatoria discreta
• Variable aleatoria continua
2. Vector aleatorio
3. Distribuciones de probabilidad
• Función de probabilidad conjunta
• Función de densidad conjunta
• Función de distribución conjunta
4. Distribuciones marginales
• Función de probabilidad marginal
• Función de densidad marginal
5. Distribuciones condicionales
• Función de probabilidad condicional
• Función de densidad condicional
6. Valor esperado
• Valor esperado
• Valor esperado condicional
• Independencia
7. Covarianza
• Covarianza de dos variables
• Matriz de covarianza
En estadística básica empleamos una variable aleatoria (va) para representar los resultados
de un experimento, era variable porque podía tomar distintos valores y aleatoria porque los
valores ocurrían al azar; así la probabilidad de un evento se traducía en calcular la
probabilidad de que la va tome ciertos valores.
Las va tomaban valores numéricos en R y distinguíamos dos tipos de va, las variables
aleatorias discretas y las variables aleatorias continuas. Recordemos los principales
resultados acerca de ellas.
Una variable aleatoria discreta (vad) es aquella que toma un número contable de valores,
esto es, el experimento aleatorio asociado tiene un número finito o infinitamente numerable
de resultados.
Una vad X está completamente determinada si conocemos los valores que toma: x1, x2 ...,
y la probabilidad con que los toma. La probabilidad de que X tome exactamente el valor xk,
se denota por:
Para asegurarnos que la función de probabilidad de una vad X está bien definida, debemos
verificar que cumple con:
2. Como la unión de todos los eventos simples reconstruye el conjunto muestral, la suma de
las probabilidades asignadas a los valores de X, debe ser uno:
p1 + p2 + p3 +...... = 1 (3.3)
F(w) = P( X w )= p
xk w
k (3.4)
Como los valores que toma la vad X representan eventos simples, los cuales a su vez son
disjuntos, se tiene que la función de distribución evaluada en w no es más que la acumulación
de las probabilidades correspondientes a todos los valores de X que son menores o iguales a
El valor esperado o esperanza de X es la suma de los productos entre los valores que toma
la vad y la probabilidad de que los tome. La esperanza de X, se asimila como el promedio
de los valores de X que se obtendría al repetir muchas veces el experimento respectivo. La
manera de calcularla, es:
El número de vad es infinito y algunas de ellas, por sus características, tienen nombres, tales
como: Bernoulli, binomial, uniforme discreta, Poisson, geométrica, hipergeométrica,
binomial negativa, etc.
Una variable aleatoria continua (vac) toma sus valores en un intervalo real, por lo que el
número de posibles valores de una vac es infinito. Una vac X está determinada si se conoce
el intervalo real (a,b) donde toma sus valores y su función de densidad f(x), la cual cumple:
2- El área bajo la curva de f(x) entre los valores a y b, vale siempre 1. Esto es equivalente a
decir que, la integral de f(x) entre a y b, siempre toma el valor de 1, así:
f (x)dx 1
a
(3.7)
Si (c,d) es subconjunto de (a,b), la probabilidad de que la vac X tome valores en ese intervalo,
está dada por el área bajo la curva de f(x) entre estos dos puntos:
d
P (c X d ) f (x)dx (3.8)
c
esto es, al igual que en el caso discreto, la función de distribución evaluada en el valor w es
igual a la probabilidad de que la vac X tome valores menores o iguales a w. Se tiene:
F(w)= 1 si w b.
b
= E(X) = xf (x)dx
a
(3.11)
b
= V(X)= E[(X-) ] = (x )
2 2 2
f (x)dx (3.12)
a
= E(X2) - 2
Igual que en el caso discreto, el número de vac es infinito. Entre las conocidas están:
uniforme, triangular, normal, t-Student, F, exponencial, gamma, beta, Weibull, etc.
2. Vector aleatorio
Los valores que toman las vad Xk componentes del vector aleatorio discreto (vad) X son de
la forma:
En cambio, los valores x= (x1, x2,…, xp)´ que toma un vector aleatorio continuo (vac) X
estarán en una región continua C de Rp. Así, si cada componente toma valores en un
intervalo real, finito o infinito:
3. Distribuciones de probabilidad
Para determinar un vad necesitamos conocer los valores que toma (la región D) y su función
de probabilidad conjunta; o en el caso de un vac, la región C de Rp donde toma valores y su
función de densidad conjunta.
La función de probabilidad conjunta del vad X se define para todo xD, por:
Este enunciado será utilizado a través de todo el capítulo para aplicar las definiciones relacionadas
con los vad. En el archivo se calculan las probabilidades conjuntas:
(𝑥8)(𝑦
6 5
)(4−𝑥−𝑦 )
P(X=x, Y=y)= para 0 x+y 4
(19
4)
X/Y 0 1 2 3 4
0 0.001 0.015 0.039 0.026 0.004
1 0.021 0.124 0.155 0.041
2 0.072 0.217 0.108
3 0.072 0.087
4 0.018
La función de densidad conjunta del vac X es un campo escalar en Rp, tal que:
2. ∬C f(x)dx = 1 (3.18)
-------- Ejemplo 3.2 Sea Y la proporción de la capacidad de una cisterna de gasolina de una compañía de
transporte que está disponible después de que se surte a inicios de semana. Sea X la proporción de
la cisterna que ocupan los carros de la compañía durante la semana. Notemos que X e Y por ser
proporciones tomarán valores en el intervalo [0,1]. Este enunciado será utilizado a través de todo el
capítulo para aplicar las definiciones relacionadas con los vac.
Verifiquemos que f(x,y)= 2(2y-x), para 0 x y 1, cumple con los requerimientos de una función de
densidad conjunta.
F(w)= F(w1, w2,…, wp) = P(X1 w1, X2 w2,…, Xp wp) (3.19)
F(w)= F(w1, w2,…, wp) = P(X1 w1, X2 w2,…, Xp wp) (3.20)
donde la suma es sobre todos los valores xD que cumplen con x1 w1, x2 w2,…, xp wp.
F(1,2)= P(X 1, Y 2)
= P(X=0, Y=0) + P(X=0, Y=1) + P(X=0, Y=2) + P(X=1, Y=0) + P(X=1, Y=1) + P(X=1, Y=2)
= p(0,0) + p(0,1) + p(0,2) + p(1,0) + p(1,1) + p(1,2) = 0.355
F(w)= F(w1, w2,…, wp) = P(X1 w1, X2 w2,…, Xp wp) (3.21)
donde la integral es sobre la región subconjunto de C, donde x1 w1, x2 w2,…, xp wp.
-------- Ejemplo 3.4 Calculemos algunos valores de la función de distribución conjunta para la cisterna de
gasolina:
F(0.75, 0.5)= P(X 0.75, Y 0.5) = P(X 0.5, Y 0.5) = F(0.5, 0.5) = 1/8
donde la suma es sobre todos los valores de x1,…, xk-1, xk+1, …, xp. Es decir sumamos las
probabilidades conjuntas para todos los valores posibles de las vad X1,…, Xk-1, Xk+1, …, Xp,
manteniendo el mismo valor xk para Xk.
P(X=0) = P(X=0, Y=0) + P(X=0, Y=1) + P(X=0, Y=2) + P(X=0, Y=3) + P(X=0, Y=4) = 0.085
P(X=1) =P(X=1, Y=0) + P(X=1, Y=1) + P(X=1, Y=2) + P(X=1, Y=3) = 0.341
P(X=2) =P(X=2, Y=0) + P(X=2, Y=1) + P(X=2, Y=2) = 0.397
P(X=3) =P(X=3, Y=0) + P(X=3, Y=1) = 0.159
P(X=4) =P(X=4, Y=0) = 0.018
p0 + p1 + p2 + p3 + p4 = 1
P(X 1) = 0.574
E(X) = 1.684
V(X) = 0.813
1
fX (x)= ∫y=x 2(2y-x) dy=2(1-x) para 0 x 1
y
fY (y)= ∫x=0 2(2y-x) dx=3𝑦 2 para 0 y 1
De donde podemos calcular, por ejemplos: E(X)= 1/3, V(X)=1/18, E(Y)=3/4, V(Y)=3/80
5. Distribuciones condicionales
p(x1,.., xk-1, xk+1,.., xp/xk) = P(X1=x1,.., Xk-1=xk-1, Xk+1=xk+1,.., Xp=xp / Xk=xk) (3.24)
= P(X1=x1, .., Xk=xk,…, Xp=xp) / P(Xk = xk)
= p(x1,.., xk,…, xp) / pk(xk)
= p(x /xk)
donde p(x1,.., xk,…, xp) es la función de probabilidad conjunta del vad X y pk(xk) es la
función de probabilidad marginal de Xk evaluada en xk, la cuál debe ser mayor a 0.
El condicionante de que Y=3 se interpreta como un evento cierto, entonces los únicos valores
posibles para X son 0 y 1; además si ha ocurrido Y=3, tenemos que P(X=0/Y=3) P(X=0) y que
P(X=1/Y=3) P(X=1).
f(x1,.., xk-1, xk+1,…, xp/xk) = f(X1=x1,.., Xk-1=xk-1, Xk+1=xk+1,.., Xp=xp / Xk=xk) (3.25)
= f(x1,.., xk,…, xp) / fk(xk)
= f(x /xk)
donde f(x1,.., xk,…, xp) es la función de densidad conjunta del vac X y fk(xk) >0.
-------- Ejemplo 3.8 Para el ejemplo de la cisterna de gasolina, la función de densidad condicional de Y
dado que X=x, es:
6. Valor esperado
Valor esperado
Sea g(X)= g(X1, …, Xp) un campo escalar del vad X, el valor esperado de g(X) es:
donde a´= (a1, a2, …, ap) es un vector de valores constantes, entonces por la linealidad del
valor esperado:
En general, si se tienen m campos escalares g1(X), g2(X),…, gm(X), el valor esperado de una
combinación lineal de ellos, donde las bk son constante, es:
-------- Ejemplo 3.9 <Probabilidades multivariantes.xlsx/3C > Para los datos del ejemplo 3.1, el valor
esperado del vad X=(X,Y)´ es:
Ahora supongamos que queremos calcular el valor esperado de g(X,Y)= X2 – Y2. Entonces:
El valor esperado condicional del vad X dado que la componente Xk toma el valor xk, es el
vector:
donde la sumatoria es sobre todos los valores x del vad X cuando Xk toma el valor xk.
El valor esperado condicional de la vac Xr dado que la vac Xk toma el valor xk, es:
-------- Ejemplo 3.11 <Probabilidades multivariantes.xlsx/3C > Para los datos del ejemplo 3.1, el número
de estudiantes de economía seleccionados dado que hay 2 estudiantes de matemática
seleccionados, es:
Mientras que el número esperado de estudiantes de matemáticas seleccionado dado que hay 3
estudiantes de economía seleccionados, es:
-------- Ejemplo 3.12 En el ejemplo de la cisterna de gasolina, el consumo esperado cuando la cisterna se
llena en un 75%, es igual a:
y
E(X/Y=0.75)= ∫x=0 x f(x/0.75) dx=1/3
1
E(Y/X=0.25)= ∫y=0.25 y f(y/0.25) dx=0.719
Independencia
En el caso discreto, las vad X1, X2, …, Xp son independientes si la función de probabilidad
conjunta es igual al producto de las funciones de probabilidad univariantes, para todos los
valores x1, x2,…, xp:
En cambio, en el caso continuo, las vac X1, X2, …, Xp son independientes si la función de
densidad conjunta es igual al producto de las funciones de densidad univariantes, para todos
los valores x1, x2,…, xp:
-------- Ejemplo 3.13 En el caso del ejemplo 3.1, no tenemos independencia, ya que por ejemplo:
P(X=2, Y=3) = 0
P(X=2) P(Y=3) = 0.397*0.302 = 0.120
Cov(X,Y) = 0 (3.38)
E(XY) = X Y = E(X) E(Y)
La covarianza es una medida de la dependencia lineal entre las dos variables; sin embargo,
es difícil utilizarla como medida absoluta ya que depende de la escala de medición. Para
evitar lo anterior, se suele estandarizar la covarianza por las desviaciones típicas, lo que
genera el coeficiente de correlación lineal entre X e Y, cuya fórmula es:
Cov(X,Y) σ
ρXY= = σ XY (3.39)
σX σY σ
X Y
El coeficiente de correlación lineal cae en el intervalo [-1,1]. Cuando es positivo, los valores
de las variables tienden a crecer o decrecer al mismo tiempo; si es negativo, mientras los
valores de una variable crecen los valores de la otra variable tienden a decrecer. Si XY=1 se
tendrá una correlación positiva perfecta; y si XY=-1, la correlación negativa será perfecta.
Cuando XY=0, se tendrá que las variables no están correlacionadas linealmente, aunque
podrían estar relacionadas de otra manera.
= ( kr ) (3.40)
U = a1 X1 + a2 X2 + …+ ap Xp = a´X
donde a´= (a1, a2, …, ap) es un vector de valores constantes, entonces la varianza de U es:
p
V(U) = ∑k=1 a2k σkk+2 ∑k<r ak ar σkr (3.41)
= a´ a