You are on page 1of 15

202 Estadística

Capítulo 6

VARIABLES ALEATORIAS Y
DISTRIBUCIONES DE PROBABILIDAD

6.1 Variable aleatoria


Una variable estadística es una característica (cualitativa o cuantitativa) que se
mide u observa en una población. Si la población es aleatoria y la característica es
cuantitativa la variable estadística es denominada variable aleatoria. Las variables
aleatorias se clasifican en discretas y continuas.
Definición. Se denomina variable aleatoria, a una variable estadística
cuantitativa definida en un espacio muestral  .
Esto es, una variable aleatoria X es una función definida en  tal que a cada
elemento w   le asocia el número real x  X ( w) , (figura 6.1).

X
w

Reales
RX x = X(w)

Fig. 6.1
El dominio de la variable aleatoria X es el espacio muestral  y el rango es un
subconjunto de los números reales que denotaremos por RX, siendo,
203 Estadística

R X  {x   / x  X ( w), w  } .
EJEMPLO 6.1.
Sea  el espacio muestral que se obtiene al lanzar al aire una moneda tres
veces consecutivas, esto es,
  {SSS, SSC, SCS, CSS, SCC, CSC, CCS, CCC}.
Si X se define en  como "el número de caras obtenidas", entonces, X es una
variable aleatoria cuyo rango es el conjunto: R X  {0,1,2,3}. En efecto,

X  0, corresponde al evento elemental {SSS}.


X  1, corresponde a los eventos elementales {SSC}, {SCS} y {CSS}.
X  2, corresponde a los eventos elementales {SCC}, {CSC} y {CCS}.
X  3, corresponde al evento elemental {CCC}.

EJEMPLO 6.2.
Sea  , el espacio muestral que resulta de lanzar un dado sucesivamente veces
hasta obtener el primer dos, esto es, .
  {E, FE, FFE, FFFE,...etc...}
donde E(éxito)“sale dos”, y F(fracaso)"No sale dos" , en cada prueba. La
función Y definida en  , como "el número de lanzamientos realizados", es una
variable aleatoria, cuyo rango es el conjunto: RY  {1,2,,etc..}. Esta variable
ejecuta las siguientes asignaciones:
Y(E) = 1, Y(FE) = 2, Y(FFE) = 3,... etc..
En algunos casos el resultado w de un experimento aleatorio es ya la
característica numérica que queremos anotar, en este caso se define la variable
aleatoria X como la función identidad, esto es, X(w) = w.

EJEMPLO 6.3.
Sea  el espacio muestral que consiste del tiempo de duración de un artefacto
electrodoméstico obtenido al azar de un lote, entonces,
  {w   / w  0} . Si la variable aleatoria X se define también como el
tiempo de duración del artefacto, entonces X es la función identidad cuyo rango es
el conjunto:
R X  {x   / x  0}.
Distribuciones de probabilidad 204

NOTA. La variable aleatoria es pues, una función que atribuye a cada evento
elemental un número que no es aleatorio o imprevisible si no fijo y
predeterminado.
Lo que es aleatorio es el experimento sobre cuyo espacio muestral se define la
variable aleatoria.
Esta función puede estar definida por una ley o regla o por un conjunto de
números reales atribuidos mediante dicha ley o regla.
En la mayoría de las aplicaciones, se está más interesado en los valores que
toma la variable, ignorando completamente el espacio muestral en el que se define.
El rango de la variable aleatoria es un espacio muestral inducido por la variable.

Clasificación.
Las variables aleatorias se clasifican en general en discretas y continuas.
Una variable aleatoria discreta es aquella cuyo rango es un conjunto finito o
infinito numerable de valores (ejemplos 6.1 y 6.2).
Si la variable aleatoria X es discreta, su rango se expresará en general por:
R X  {x1 , x 2 ,...., x n ,...} .

Una variable aleatoria continua es aquella cuyo rango es un intervalo en  o


conjunto infinito no numerable de valores reales (ejemplo 6.3).
En general las variables aleatorias discretas representan datos que provienen del
conteo del número de elementos, mientras que, las variables aleatorias continuas
representan mediciones, por ejemplo, tiempo, peso, longitud, etc..

6.2. Variable aleatoria discreta: Función de


probabilidad y función de distribución
acumulada.

6.2.1. Probabilidad en el rango RX.


Una variable aleatoria discreta asume cada uno de sus valores con cierta
probabilidad que denotaremos por PX (probabilidad inducida por X).
205 Estadística

En efecto, si el rango de la variable aleatoria X es el conjunto finito de números,


R X  {1,2,..., x n } y si B  {x i } es un evento en R X , entonces,

PX ({x i })  P({w   / X ( w)  x i }) ,

o PX ({x i })  P ( A) , donde, A  {w   / X ( w)  B} .

Con frecuencia, se utiliza la expresión P[ X  xi ] para denotar la


probabilidad PX ({ x i }) , esto es,

P[ X  x i ]  P({w   / X ( w)  x i }) .
Por ejemplo, si la variable aleatoria X es el número de caras que resultan al
tirar una moneda 3 veces, el rango de X es R X  {0,1,2,3}, entonces,

P[X  0]  P({SSS})  1/8.


P[X  1]  P({SSC o SCS o CSS})  3/8.
P[X  2]  P({SCC o CSC o CCS})  3/8.
P[X  3]  P({CCC})  1/8.
En general, sea P una probabilidad definida en un espacio muestral  , y X una
variable aleatoria definida en  cuyo rango es el conjunto de números R X , la
probabilidad PX del evento B en R X se define por:

PX ( B )  P ( A)

siendo A en  un evento equivalente a B (figura 6.2), esto es,


A  {w   / X ( w)  B}.
Distribuciones de probabilidad 206


X
A
RX

B
P
PX

P(A) = PX (B)
Fig. 6.2

NOTAS.
1. El conjunto de pares ( x i , P[ X  x i ]) es la distribución de
probabilidades de la variable aleatoria X .
Esta distribución es similar a una distribución de frecuencias relativas,
por tanto, se pueden calcular, por ejemplo, medidas de tendencia central y de
dispersión mediante un proceso similar al que se hizo con la distribución de
frecuencias relativas.
Sólo habrá que cambiar las notaciones por tratarse ahora de una población.
2. Las probabilidades p i  P[ X  x i ] , xi  RX satisfacen las propiedades:

a) p i  0, para cada x i  R X , b) p
xi R X
i  1.

3. Por extensión para todo número real x  x i , siendo x i  R X , se define:

P[ X  x ]  P ()  0

En consecuencia, queda definida la probabilidad

P[ X  x ] para todo número real x.


207 Estadística

6.2.2 Función de probabilidad


Definición. Sea X una variable aleatoria discreta. Se denomina función (ley o
modelo o distribución) de probabilidad de X a la función f (x ) definida por
f ( x )  P[ X  x ] para todo x número real y que satisface las siguientes
condiciones:

i) f ( x)  0 x  , y ii)  f (x )  1
xi R X
i

La condición ii)
n
Es:  f ( x )  1 , si R X
i 1
i  {x1 , x 2 ,..., x n } es finito.


Es :  f (x
i 1
i )  1, si R X  {x1 , x 2 ,..., etc.} es infinito,

NOTAS.
1. Si A  R X , entonces, la probabilidad de A es el número:

P ( A)   P[ X  x ]   f ( x ).
xi A
i
xi  A
i

El lector debería verificar que P ( A) es una probabilidad, esto es, satisface


los axiomas de probabilidad.
2. La función de probabilidad de una variable aleatoria X se puede expresar: por
una ecuación : f ( x)  P[ X  x ]  expresión de x , o por el conjunto de
pares {( x i , p i ) / p i  f ( x i ), x i  R X } o por una tabla, como 6.1 (si RX es
finito).
Tabla 6-1: Distribución de probabilidad de v. a. discreta
Valores x de X x x x ... xn
i 1 2 3

Probabilidad p i  P[ X  x i ] p1 p2 p3 ... pn
La gráfica de una distribución de probabilidades discreta es la gráfica de
bastones que consiste de segmentos verticales continuos o punteados de
longitud proporcional a la probabilidad respectiva en cada valor x i de la
variable (figura. 6.3).

EJEMPLO 6.4.
Distribuciones de probabilidad 208

Sea X la variable aleatoria definida como el número de caras que ocurren al


lanzar una moneda 4 veces.
a) Determinar la distribución de probabilidades de X . Graficarla.
b) Calcular la probabilidad P[0  X  2] .
c) Determine la distribución de probabilidades de X si la moneda se lanza n veces (
n  2 ).
SOLUCION.
a) El rango de la variable aleatoria X, es el conjunto R X  {0,1,2,3,4} .
Suponiendo que los dieciséis sucesos elementales del espacio muestral son
equiprobables, la función de probabilidad, es descrita por:
f (0)  P[ X  0]  P ( SSSS )  1 16

f (1)  P[ X  1]  P ( SSSC ó SSCS ó SCSS ó CSSS )  4 16

f ( 2)  P[ X  2]  P ( SSCC ó SCSCó SCCS ó CSSC ó CSCS ó CCSS )  6

f (3)  P[ X  3]  P ( SCCC ó CCSC ó CSCC ó CCCS )  4 16

f (4)  P[ X  4]  P(CCCC )  1 16 
Observar que si k  R X , entonces, X  k , si y sólo si, en las 4 tiradas de la
moneda aparecen k caras y 4  k sellos. Esto ocurre de C 4 formas. Cada una
k
de esas formas tiene probabilidad:
(1 2) k (1 2) 4 k  (1 2) 4  1 16

siendo k = 0, 1, 2, 3, 4. Luego, la función de probabilidad del número de caras se


puede describir como tabla 6.2 ó como la ecuación:

C k4
f (k )  , k = 0, 1, 2, 3, 4 .
16
Cuya gráfica es la figura 6.3.
2
4 6 10
b) P[0  X  2]   f (k )  f (1)  f (2)  16  16  16 
k 1
C xn
c) f ( x)  C nx (1 2) x (1 2) n  x  , x  0,1,2,...,n
2n
209 Estadística

6/16 ^ f(x)

4/16

1/16

>X
0 1 2 3 4
Figura 6.3

xi f ( xi )
0 1/16
1 4/16
2 6/16
3 4/16
4 1/16
Tabla 6.2

NOTA. Si pi  f ( xi ) , la media de X se calcula por   p x i i , y la varianza


2
por    p i x i2 2
  . En el ejemplo 6.4, el número de caras al lanzar una
moneda 4 veces, tiene media   2 caras, y varianza 
2
 1 cara2. (¡verificar!).

6.2.3 Función de distribución acumulada de variable


aleatoria discreta
Definición. La función de distribución acumulada (f.d.a.) de probabilidades o
simplemente función de distribución, F ( x ) , de la variable aleatoria discreta X,
cuya función de probabilidad es f ( x ) , se define por:

F ( x)  P[ X  x]   P[ X  k ]   f (k ),
kx kx
para    x   
Distribuciones de probabilidad 210

EJEMPLO 6.5.
Sea X la variable aleatoria definida como el número de caras que resultan al
lanzar una moneda 4 veces.
a) Hallar la función de distribución F(x) de la variable aleatoria X y graficarla.
b) Usando F(x), calcular P[0  X  2] .
SOLUCION.
a) La función de probabilidades f(x) de la variable aleatoria X está descrita en el
ejemplo 6.4, por:
f (0)  1 16 , f (1)  4 16 , f ( 2)  6 16 , f (3)  4 16 y f ( 4)  1 16 .

Entonces, F (0)  f (0)  1 16 .


F (1)  f (0)  f (1)  1 16  4 16  5 16

F ( 2)  f (0)  f (1)  f ( 2)  1 16  4 16  6 16  11 16

F (3)  f (0)  f (1)  f ( 2)  f (3)  1 16  4 16  6 16  4 16  15 16

F ( 4)  f (0)  f (1)  f ( 2)  f (3)  f ( 4)  1 16  4 16  6 16  4 16  1 16  1

Por tanto,
 0, x<0
 1 16 , 0  x <1

5 16 ,
 1 x < 2
F ( x)  
11 16 , 2 x<3
15 16 , 3 x < 4

 1,
 x4

La gráfica de esta función de distribución está dada en la figura 6.4.


211 Estadística

Fig. 6.4. Distribución de frecuencias acumuladas del número de caras

Observar que F ( x ) da "saltos" en los valores de x0,1,2,3,4. Por ejemplo,


F ( 2.99)  F ( 2)  11 16 , F (3)  F (3.99)  15 16 , etc..

b)
11 1 10
P[0  X  2]  P[ X  2]  P[ X  0]  F (2)  F (0)    
16 16 16
NOTA. En general si X tiene rango finito R X  {x1 , x 2 ,..., x n } , y función de
probabilidad f ( x i ) , la función de distribución acumulada de X es:

 0,   < x < x1

F ( x)   
 1,
f ( xi ), xi  x < xi +1 , i  1,2,...n  1
 x n  x  

EJEMPLO 6.6.
Un lote de 10 artículos contiene 4 defectuosos. Si se obtiene una muestra al azar
de cinco artículos, determine la distribución de probabilidades del número de
artículos defectuosos en la muestra, si se escogen
a) Los cinco a la vez
b) Uno por uno con reposición
SOLUCION.
Sea X el número de artículos defectuosos en la muestra de cinco.
a) Si se escogen los 5 a la vez, el rango de X es el conjunto R X  {0,1,2,3,4} .
Si k  R X , el evento X  k significa que de los 5 escogidos a la vez, k son
defectuosos y 5  k son no defectuosos y esto ocurre de C k4 C 56 k . Por otro
lado, se escogen 5 artículos a la vez de 10, de C 510 formas. Entonces, la función
de probabilidad f(x) de X es

C k4 C 56 k
f ( x)  P[ X  k ]  , k  0,1,2,3,4.
C 510
El lector debería verificar que la suma de probabilidades es igual a 1.
Distribuciones de probabilidad 212

También debería verificar que la misma distribución se obtiene si los cinco


artículos se escogen uno por uno sin reposición.
b) Si se escogen los 5 uno por uno con reposición, el rango de X es el conjunto
R X  {0,1,2,3,4,5} . Si k  R X , X  k significa que de los 5 artículos, k
defectuosos ocurren independientemente con probabilidad p  4 / 10 cada
uno, y 5  k no defectuosos ocurren independientemente con probabilidad
q  6 / 10 cada uno. Estos eventos ocurren de C 5 formas. Entonces, la
k
función de probabilidad f(x) de X es

f ( x )  P[ X  k ]  C k5 p k q 5 k , k  0,1,2,3,4,5.

donde p  4 / 10 y q  6 / 10.
El lector debe verificar que la suma de probabilidades es igual a 1.

EJEMPLO 6.7.
Una urna contiene 3 fichas de color rojo y una de color azul. Un experimento
aleatorio consiste en extraer fichas al azar de la urna uno a uno sucesivamente.
a) Determinar la distribución de probabilidades del número de intentos que se
realizan hasta que aparezca la primera ficha azul.
a1) sin reposición, a2) con reposición.
b) Si dos personas A y B juegan sacando alternativamente una ficha con reposición
de la urna y si gana el que obtiene la primera ficha azul, ¿cuál es la probabilidad
de que A gane el juego si el juega primero?.
SOLUCION.

a) Sea X la variable aleatoria que denota el número de intentos hasta que ocurra la
primera ficha azul.
a1) Si la extracción es sin reposición, el rango de X es el conjunto
R X  {1,2,3,4} . Entonces,
1
f (1)  P[ X  1] 
4
3 1 1
f ( 2)  P[ X  2]   
4 3 4
3 2 1 1
f (3)  P[ X  3]    
4 3 2 4
3 2 1 1 1
f (4)  P[ X  4]     
4 3 2 1 4
213 Estadística

Esta distribución de probabilidades iguales es conocida como


distribución uniforme.
a2) Si la extracción es con reposición, el rango de X es el conjunto
R X  {1,2,3,..., etc} . Si k  R X entonces, X  k sólo si ocurre la
ficha azul en la k-ésima extracción con probabilidad 1 / 4 y no azul en las
anteriores extracciones independientes con probabilidad 3 / 4 . Luego, la
probabilidad de X  k está dada por:
k 1
 1  3 
f ( k )  P[ X  k ]     , k  1,2,3,..., etc.
 4  4 
Se verifica que:

 f (k )  1
k 1

En efecto, utilizando la suma:



1
r
k 0
k
 1  r  r 2  r 3  ... 
1 r
, si r  1

1  3  3   3  
  k 1 2 3
1 3 14
 f (k ) 
4   
4
k 1  
 1         ... 
4  4  4   4   1  (3 4)
1 
k 1 
b) Si A sale primero, entonces, juega las veces impares. Luego,
P[A gane el juego] = P[X  1 ó X  3 ó X  5 ó X  7, etc..]
2 4 6
 1   1  3   1  3   1  3 
                ...
 4   4  4   4  4   4  4 
 1  
2 3
9  9   9 
   1       ...
 4   16  16   16  

 1  1  4
P[A gane el juego]      .
 4  1  (9 16)  7

EJEMPLO 6.8.
En el ejemplo 6.7 determinar la distribución de probabilidades del número de
intentos hasta que ocurra la segunda roja
a) Una por una sin reposición.
Distribuciones de probabilidad 214

b) Una por una con reposición.


SOLUCION.
Sea X la variable aleatoria que denota el número de intentos hasta que ocurra la
segunda ficha roja.
a) Si se escogen uno por uno sin reposición, el rango de X es el conjunto
R X  {2,3} . Entonces,
3 2 1
f (2)  P[ X  2]  P( RR)   
4 3 2
3 1 2 1 3 2 1
f (3)  P[ X  3]  P ( RAR o ARR )       
4 3 2 4 3 2 2
b) Si se escogen uno por uno con reposición el rango de X es el conjunto
R X  {2,3,4,..., etc} . Si k  R X , entonces, X  k sólo si sale la
segunda ficha roja en la k-ésima extracción con probabilidad 3 / 4 . En las
k  1 extracciones restantes ocurre la otra roja con probabilidad 3 / 4 y
ocurren k  2 azules independientemente con probabilidad 1 / 4 . Luego, la
probabilidad de X  k está dada por:

f (k )  P[ X  k ]  (C1k 1 q k  2 p) p  C1k 1 q k  2 p 2 k  2,3,.., etc.

donde p  3 / 4, q  1 / 4 .

EJEMPLO 6.9.
En el ejemplo 6.7 si X es la variable aleatoria definida como el número de
intentos que se realizan con reposición hasta que ocurra la primera ficha azul
a) Hallar la función de distribución acumulada F(x) de X.
b) Utilizando F(x) calcular P[ 2  X  20] .
SOLUCION.
a) La función de distribución acumulada F(x) de X está dada por la expresión:

0, si   < x < 1



F (x)   x  1  3 t 1 , k = 1,2,3,...

  4  4  , si k  x < k  1,
 t 1   
215 Estadística

x t 1 x
 1  3  3
Observar que :   4  4 
t 1
 1  
4
2 20
3 3
b) P[ 2  X  20]  F ( 20)  F ( 2)        0.559
4 4

EJEMPLO 6.10.
Determinar el valor de la constante c para que la función f(x) definida por:

c3 x
f ( x )  P[ X  x]  , x  0,1,2,...etc...
x!
sea función de probabilidad de la variable aleatoria X, cuyos valores posibles son: 0,
1, 2,...,etc.. Hallar, además, la función de distribución acumulada de X y calcular
P[ X  3] .
SOLUCION.
Cada probabilidad f(x) debe ser mayor o igual que cero. Además, la suma de
todas las probabilidades debe ser igual a uno.

zk
Para encontrar la constante c utilizaremos la suma: 
k 0
k!
 ez.


c3 x   3x 
Luego, 
x 0
x!
 c
 
 x 0 x!
  ce 3  1 , de donde resulta


c  e 3 .

e 3 3 x
Entonces, f ( x)  , x  0,1,2,...etc...
x!
La función de distribución acumulada F(x) de esta variable aleatoria es:

0, si   < x < 0



F ( x )   x 3 k e 3 , t = 0,1,2,3,. .

 k! , si t  x < t  1,
 k 0
Por otra parte, P[ X  3]  1  P[0  X  2]  1  [ f (0)  f (1)  f (2)]
Distribuciones de probabilidad 216

 
 1  e 3  3e 3  4.5e 3  1  0.42319  0.57681
EJEMPLO 6.11
Un inversionista puede participar en un negocio 4 veces y de manera
independiente. Cada vez que participa gana o pierde $5000 con la misma
probabilidad. La persona comienza con $10000 y dejará de participar en el negocio
si pierde todo su dinero o gana $15000 (o sea si termina con $25000). Hallar la
función de probabilidad de la utilidad del inversionista
SOLUCION
Sean: U la variable que representa la utilidad.
P  pierde con probabilidad  1/2
G  pierde con probabilidad  1/2
Entonces, los valores de U (montos finales menos capital) son:
10,000, en los casos: PP o PGPP o GPPP con probabilidad6/16
0, en los casos: PGPG o PGGP o GPPG o GPGP o GGPP
con probabilidad 5/16
10,000, en los casos: GGPG o GPGG o PGGG con probabilidad3/16
15,000, en los casos: GGG con probabilidad2/16

6.3. Variable aleatoria continua: Función de


densidad y función de distribución acumulada.

6.3.1 Función de densidad de probabilidad


Definición. Se dice que la función f ( x ) es función de densidad (ley o
distribución) de probabilidad de la variable aleatoria continua X si satisface las
siguientes condiciones:
i) f ( x)  0 para todo x   (  es el conjunto de los números reales).

ii)  
f ( x )dx  1

iii) P ( A)  P[ x  A]   A
f ( x ) dx , para cualquier intervalo A

You might also like