You are on page 1of 87

Universidad T

ecnica Federico Santa Mara


Departamento de Matematica/ Campus Vitacura

Recopilaci
on Evaluaciones
Ejercicios resueltos del curso:

Probabilidad y Estadstica 2009-2010

Recopilado por: Francisca Gonzalez Lopez

Santiago, April 8, 2011


Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

1 Estadstica Descriptiva
1. La tabla presentada a continuacion representa el consumo de energa electrica de 80 usuarios:

Consumo (Kwh) N
umero de usuarios
05 - 25 04
25 - 45 06
45 - 65 14
65 - 85 26
85 - 105 14
105 - 125 08
125 - 145 06
145 - 165 02
Total 80

(a) Determine la media y la mediana de la variable consumo.


(b) Calcule el percentil 25 y 75 para la variable consumo.
(c) Calcule la desviacion estandar de la variable consumo.
(d) Que porcentaje de usuarios consumen mas de 90 Kwh ?

Solucion:

Ya que los datos estan agrupados los calculos son como sigue:

(a) La media del consumo de energa es


1X
x= M C i ni
n
1
= (15 4 + 35 6 + 55 14 + 75 26 + 95 14 + 115 8 + 135 6 + 155 2)
80
= 79.5

La mediana debe ubicarse en la clase 4, 65-85, ya que esta clase es la primera en obtener
una frecuencia relativa acumalada mayor al 50% (62.5%) y su valor se calcula:

n/2 NM e
M e = lM e + I
nM e
80/2 24
= 65 + 20
26
= 77.3

(b) Calculamos P25 y P75 . La clase 3 acumula un 30% por lo que en ella se encunetra el
primer cuartil.

Probabilidad y Estadstica 1
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

n q/100 Nq
P25 = lq + I
nq
80 25/100 10
= 45 + 20
14
= 45 + 14.28
= 59.28
y el tercer cuartil esta en la clase 5, 85-105, por lo tanto
n q/100 Nq
P75 = lq + I
nq
80 75/100 50
= 85 + 20
6
= 85 + 14.28
= 99.28
(c) Calculamos la varianza:
1X
s2 = ni M Ci2 x2
n
1 2 ) 79.52
= (4 152 + 6 352 + 14 552 + 26 752 + 14 952 + 8 1152 + 6 1352 + 2155
n
= 7330 6320.25
= 1009.75
Por lo tanto la desviacion estandar es 31.77.
(d) Lo que queremos es el valor tal que Pq = 90, por lo tanto en la ecuacion
n q/100 Nq
Pq = 90 = lq + I
nq

debemos encontrar el valor de q. La clase a la que corresponde es la C5 , por lo tanto

80 q/100 50
Pq = 85 + 20 = 90
14
80 q/100 50 90 85
=
14 20
80 q/100 50 = 0.25 14
100
q = (3.5 + 50)
80
q = 66.87
Es decir, alrededor del 67% consume menos de 90 Kwh, y por lo tanto, el 33% consume
mas de 90 Kwh.

Probabilidad y Estadstica 2
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

2. El departamento de personal de una cierta firma realizo un estudio sobre los salarios, en
unidades monetarias(u.m.) de 120 funcionarios del sector administrativo, con los siguientes
resultados :

Salario / Salario Mnimo Frecuencia Relativa


0-2 0.25
2-4 0.40
4-6 0.20
6-10 0.15

(a) Calcule la media, mediana, varianza y desviacion estandar.


(b) Que ocurre con la media si se aumentan los salarios en 100%?, y con la varianza?.
Justifique.
(c) Que ocurre con la varianza si se aumentan los salarios en 0.8 u.m.? Justifique.

Solucion:

(a) Completamos la tabla


Salario / Salario Mnimo M Ci ni fi Ni Fi
0-2 1 30 0.25 30 0.25
2-4 3 48 0.40 78 0.65
4-6 5 24 0.20 102 0.85
6-10 8 18 0.15 120 1
Aplicando las formulas tenemos que:
k
1X
X= ni M Ci = 3.65
n i=1

n 120
2
NM e 2
30
Me = lMe + I =2+ 2 = 4.5
nMe 48
Pk
2 i=1 ni (M Ci X)2
s = = 5.12
n
Por lo tanto, s = 2.264
(b) Si los salarios aumentan en un 100% quiere decir que el salario se aumenta al doble, por

Probabilidad y Estadstica 3
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

lo que ahora en vez de contar con M Ci contamos con M Ci = 2M Ci . As, la media sera
k
1X
x = ni M Ci
n i=1
k
1X
= ni 2M Ci
n i=1
k
1X
=2 ni M Ci
n i=1
=2x
= 2 3.65
= 7.3

Por lo tanto la media aumenta al doble.

Para la varianza,
k
1X
s2T = ni (M Ci X )2
n i=1
k
1X
= ni (2 M Ci 2 X)2
n i=1
k
1X
= ni 4 (M Ci X)2
n i=1
k
1X
=4 ni (M Ci X)2
n i=1
= 4 s2

Por lo tanto, si los sueldos se duplican, el sueldo promedio se duplica y la varianza se


cuadriplica.
(c) El el punto anterior vimos que si multiplicamos todas las observaciones por una con-
stante a, entonces, la media aumenta a veces y la varianza de los datos transformados
es T2 = a2 2 , donde 2 es la varianza de los datos originales.
En este caso, lo que hacemos es sumar a todas las observaciones una constante, con esto

Probabilidad y Estadstica 4
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

media y varianza quedan de la siguiente manera:


k
1X
x = ni (M Ci + a)
n i=1
k k
1 X X
= ( ni M C i + ni a)
n i=1 i=1
k
1 X na
= ( ni M C i + )
n i=1 n
=x+a

k
1X
s2T = ni (M Ci + a (X + a))2
n i=1
k
1X
= ni (M Ci X)2
n i=1
= s2

Por lo tanto, si aumentamos en 0.8 u.m. los sueldos, la varianza media aumentara en
(0.8) u.m con respecto al valor original, mientras que la varianza se mantendra igual a
la de los datos originales.

3. Demuestre que:

a) El valor que minimiza la funcion


n
1X
f (a) = (xi a)2
n i=1

es a = x
b) La varianza s2 satisface:
n
1X 2
s2 = x x2
n i=1 i

Solucion:

a) Sea la funcion:
n
1X
f (a) = (xi a)2
n i=1

Probabilidad y Estadstica 5
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

Si minimizamos esta funcion para a


n
df (a) 1X
= 2(xi a) (1) = 0
da n i=1
X X
(xi ) a=0
X
xi = n a
x=a

Para comprobar que es mnimo calculamos la segunda derivada:


n
d2 f (a) d 1X
= 2(xi a) (1)
da2 da n i=1
 
d 2X 2X
= xi + a
da n n
=2>0

Por lo tanto, la varianza se minimiza con a = x


b) Desarrollamos el cuadrado
1X 1X 2
(xi x)2 = (xi 2xi x + x2 )
n n
1X 2 1 X 1X 2
= xi 2x xi + x
n n n
1X 2 1X 1
= xi 2x xi + n x2
n n n
1X 2
= xi 2x x + x2
n
1X 2
= xi 2x2 + x2
n
1X 2
= xi x2
n
4. Que ocurre con la mediana, media y desviacion estandar de una secuencia de datos , cuando:

i) cada observacion es multiplicada por 2?


ii) se le suma 10 a cada observacion?

Solucion:

i) Supongamos que nuestros datos son x1 , x2 , . . . , xn . Si multiplicamos todos los datos por
2, la nueva secuencia sera 2x1 , 2x2 , . . . , 2xn . La mediana sera el doble del valor anterior,
y la media:

Probabilidad y Estadstica 6
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

n
1X
x = 2 xi
n i=1
n
1 X
= 2 xi
n i=1
n
1X
=2 xi
n i=1
=2x

Por lo tanto la mediana y la media aumentaran al doble, mientras que la varianza s2


aumentara 4 veces s2T = 4 s2 , esto ya que

n
1X
s2T = (2 xi + 2 x)2
n i=1
n
1X
= 4 (xi x)2
n i=1
= 4 s2

Si multiplicamos todas las observaciones por una constante, la media y la mediana


aumentaran en la misma magnitud de la constante, mientras que la varianza aumentara
en el cuadrado de la constante utilizada.
ii) Si sumamos 10 unidades a cada observacion, la nueva secuencia sera (x1 + 10), (x2 +
10), . . . , (xn + 10). Al aumentar todos los valores en la misma magnitud, la nueva me-
diana sera la mediana anterior mas 10 unidades.

n
1X
x = (xi + 10)
n i=1
n n
1X 1X
= xi + 10
n i=1 n i=1
= x + 10

La media y la mediana aumentaran en 10 unidades.

Probabilidad y Estadstica 7
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

La varianza
n
1X
s2T = [(xi + 10) (x + 10)]2
n i=1
n
1X
= (xi x)2
n i=1
= s2

por lo que la varianza no cambiara.

Si sumamos igual cantidad a todas las observaciones, las medidas de localizacion (media,
mediana) se veran alteradas, aumentando en la misma cantidad sumada, mientras que
la dispersion se mantendra.

5. Se quiere explicar la respuesta a un estmulo a lo largo del tiempo. Sean X, el tiempo de


respuesta e Y , el estmulo entregado. A continuacion se muestran medidas de resumen para
las 14 observaciones:
X X X
xi = 82 yi = 20.97 log(yi ) = 3.72
X X X
x2i = 662.5 yi2 = 64.26 (log yi )2 = 22.70
X X
xi yi = 54.43 xi log(yi ) = 82.48
X X
ei = 7.187 e0i = 1.523
En clases vimos graficamente que el ajuste exponencial era mejor que el ajuste lineal.

Calcule correlacion entre X e Y y entre X y log(Y ). Calcule ademas el coeficiente de de-


terminacion de ambos ajustes. Son consistentes estos resultados con lo comentado en clases?

Solucion:

De las cantidades entregadas calculamos los siguientes estadsticos:

x = 5.857 s2x = 13.015


y = 1.497 s2y = 2.347
log(y) = 0.266 s2log(y) = 1.551
Cov(x, y) = 4.885 Cov(x, log(y)) = 4.332

Con esto,

Probabilidad y Estadstica 8
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

4.885
Corr(x, y) = = 0.883
13.015 2.347
y
4.332
Corr(x, log(y)) = = 0.964
13.015 1.551

El modelo lineal ajustado es


y = 3.70 0.375 x
y el R2 es

e2i
P
2
R =1 P
(y y)2
P 2i
ei
=1
n s2y
7.187
=1
14 2.347
= 1 0.218
= 0.781

Por lo que X explica un 78% de la variabilidad de Y .


El modelo exponencial ajustado es

log(y) = 1.684 0.332 x

El coeficiente R2 es
P 0 2
2 (ei )
R =1 P
(log(y ) log(y))2
P 0 2i
(ei )
=1
n s2log(y)
1.523
=1
14 1.551
= 1 0.070
= 0.929

y la variable X explica un 92.9% de la variabilidad de log(Y ), con lo que comprobamos que


el ajuste exponencial es mejor que el ajuste lineal.

6. Se ha encuestado a 100 familias en una ciudad sobre su gasto mensual en ocio, Y , y sus
ingresos mensuales, X. En la siguiente tabla se presentan los resultados obtenidos, donde
las variables vienen expresadas en euros:

Probabilidad y Estadstica 9
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

Y
X 0-100 100-200 200-800
600-1500 13 9 4
1500-2000 9 12 23
2000-5000 6 9 15

a) Calcule el gasto mensual promedio en ocio y el ingreso mensual promedio.

Consideramos n = 100 observaciones y construimos las tablas univariadas de frecuencia


para X e Y sumando por filas y columnas, respectivamente, y queda:
X Y
M Ci ni M Cj nj
1050 26 50 28
1750 30 150 30
3500 30 500 42
Con esto, aplicando la forumla para el calculo de la media para variables agrupadas
queda
1
x= (1050 26 + 1750 44 + 3500 30) = 2093
100
analogamente,
1
y= (50 28 + 150 30 + 500 42) = 269
100
b) Calcule la varianza de cada variable. Cual le parece mas homogenea?

Para X:
1
s2x = (10502 26 + 17502 44 + 35002 30) 20932 = 928501
100
Para Y :
1
s2y = (502 28 + 1502 30 + 5002 42) 2692 = 40089
100
La mas homogenea es X, ya que la desviacion estandar de Y , el gasto en ocio, es muy
similar a la media, lo que indica una mayor variabilidad.

(Tambien es posible concluir a partir del coeficiente de variacion y ver que el de X es


menor, CVx = 0.46, que el de Y , CVy = 0.74)
c) Quienes gastan mas en ocio: las familias con ingresos entre 1500 y 2000 o los que ganan
mas de 2000?

Es posible calcular la distribucion condicional del gasto en ocio para las familias de
ingresos mensuales entre 1500-2000 y 2000-5000 como se muestra en las siguientes tablas:

Probabilidad y Estadstica 10
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

M Cj fj/i=15002000 M Cj fj/i=20005000
50 20.5 50 20.0
150 27.3 150 30.0
500 52.3 500 50.0
Estos porcentajes son practicamente iguales, de hecho, al calcular el promedio para cada
nivel de ingreso mensual es 321.5 y 305, siendo levemente mayor, el gasto en ocio de las
familias que perciben ingresos mensuales entre 1500 y 2000 euros.
d) Calcule la mediana de gasto mensual en ocio.

Aplicamos la formula percentil para el percentil 50:



n q/100 NM e 50 28
M e = lM e + I = 100 + 100 = 173.3
nM e 30

El 50% de las familias tiene un gasto mensual en ocio menor o igual a 173.3 euros.
e) Calcule la covarianza entre las variables, que sugiere sobre la relacion entre ellas?

Para realizar este calculo debemos considerar una modificacion de la formula usual,
ya que no tenemos las observaciones, sino que la informacion tabulada. Para esto
consideremos, cada variable sera representada por su marca de clase, y cada una de las
combinaciones de estas (3 clases de X y 3 clases de Y , 9 en total) esta repetida nij
veces, con i,j=1,2,3. Entonces, la formula de covarianza queda

1X
Cov(X, Y ) = xi y i x y
n
1X
= nij M Cxi M Cyj x y
n
1
= (13 1050 50 + 9 1050 150 + . . . + 9 3500 150 + 15 3500 500)
100
2093 269
= 602875 563017
= 39858

Ya que esta cantidad es positiva, sugiere que las variables se relaicionan de manera
directa, es decir, en la medida que una crece, la otra tambien lo hara.
f) Calcule la correlacion lineal, confirma o desestima lo obtenido en (e)?

Para el calculo de este coeficiente, utilizamos los valores antes obtenidos y reemplazamos
Cov(X, Y ) 39858
= p 2 2 = = 0.2065
sx sy 928501 40089
Es concordante ya que es positivo, pero es un valor bajo como para asegurar que la
relacion entre las variables es lineal.

Probabilidad y Estadstica 11
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

g) Calcule los coeficientes del ajuste lineal e interpretelos.

Los coeficientes son

bb = Cov(X, Y ) = 39858 = 0.042


s2x 928501
a = y bb x = 269 0.085 2093 = 179.15
b

Por lo que el modelo queda


yb = 179.15 + 0.042 x
donde la interpretacion del intercepto no tiene sentido, ya que supone que el ingreso
mensual es cero, valor que no esta en nuestro analisis. El otro valor se interpreta como
el incremento en 0.042 euros el gasto en ocio que se produce al incrementar en un euro
el ingreso mensual por familia.
h) Le parece que este modelo es adecuado? Justifique.

No parece adecuado, por el bajo valor de la correlacion ( = 0.21) que implica que
R2 = 0.04, es decir, mas de un 90% de la variabilidad del gasto en ocio sera atribuido
al azar.

7. Un comerciante al detalle lleva a cabo un estudio para determinar la relacion entre los gastos
semanales por publicidad y las ventas. Sean

X: costos de publicidad($)
Y: ventas ($)

Se registran los siguientes datos:

X Y X2 Y2 XY Y Y
40 385 1600 148225 15400 -68.7
20 400 400 160000 8000 -53.7
25 395 625 156025 9875 -58.7
20 365 400 133225 7300 -88.7
30 475 900 225625 14250 21.2
50 440 2500 193600 22000 -13.7
40 490 1600 240100 19600 36.3
20 420 400 176400 8400 -33.8
50 560 2500 313600 28000 106.3
40 525 1600 275625 21000 71.3
25 480 625 230400 12000 26.3
50 510 2500 260100 25500 56.3

a) Calcule los valores estimados de a y b del modelo Y = a + bX.

Probabilidad y Estadstica 12
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

b) Estime las ventas semanales cuando los costos de publicidad son $20, $25, $30, $40 y
$50.
c) El coeficiente de determinacion R2 se puede calcular como
(yi ybi )2
P
2
R =1 P
(yi y)2
Calcule este valor y determine si el ajuste es confiable.
d) A que se debe que la estimacion sea o no fiable?

Solucion:
a) Calculamos

bb = Cov(X, Y )
s2x
1
P
x i yi x y
= n1P 2
n
xi x2
1
12
191325 15503.12
= 1
12
15650 1167.4
440.63
=
136.77
= 3.22
Con esto el valor ajustado de a es
a = y bbx
b
1 X 1 X
= yi 3.22 xi
12 12
1 1
= 5445 3.22 410
12 12
= 343.73

enta = 343.73 + 3.22 costo


Por lo que el modelo que da v\
b) Con el modelo antes calculado obtenemos
Costo V\enta
20 408.13
25 424.23
30 440.33
40 472.53
50 504.73
c) El coeficiente de determinacion R2 se puede calcular como
(yi yb)2
P
2
R = P
(yi y)2
Calcule este valor y determine si el ajuste es confiable.

Probabilidad y Estadstica 13
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

Y Yb Y Y Y Yb
385 472.53 -68.7 -87.5
400 408.13 -53.7 -8.12
395 424.23 -58.7 -29.22
365 408.13 -88.7 -43.12
475 440.33 21.2 34.67
440 504.73 -13.7 -64.74
490 472.53 36.3 17.46
420 408.13 -33.8 11.87
560 504.73 106.3 55.25
525 472.53 71.3 52.46
480 424.23 26.3 55.77
510 504.73 56.3 5.25
Por lo tanto
25226.21
R2 = 1
42256.25
= 1 0.596
= 0.403

d) Depende del valor del coeficiente de determinacion que en este caso es inferior al 70%
lo que genera un estimacion poco confiable.

8. Se desarrollo un experiemento para estudiar las propiedades de fragilidad del hidrogeno con
base en mediciones de presion electroltica de hidrogeno. Se controlo la densidad de corriente
de carga catodica y se vario en cuatro niveles. Se observo la presion efectiva del hidrogeno
como la respuesta. Sean

X: densidad de corriente de carga (mA/cm2 ),


Y: presion efectiva de hidrogeno (atm).

Los datos son los siguientes:

Probabilidad y Estadstica 14
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

Corrida X Y
1 1.65 86.1
2 1.65 92.1
3 1.65 64.7
4 1.65 74.7
5 1.65 223.6
6 4.48 202.1
7 4.48 132.9
8 4.48 413.5
9 12.2 231.5
10 12.2 466.7
11 12.2 365.3
12 12.2 493.7
13 33.1 382.3
14 33.1 447.2
15 33.1 563.8

a) Calcule media, mediana, varianza y desviacion estandar de Y. Que puede decir de la


distribucion de esta variable?
b) Calcule la correlacion entre X e Y. Cual es el R2 del modelo Y = a + bX?
c) Existe alguna transformacion de las variables que aumente el valor de la correlacion
antes caculada?
d) Determine cual es el mejor modelo de regresion lineal utlizando el valor del coeficiente
de determinacion.

Solucion:

a) Los valores pedidos son

x = 282.7
M e = 231.5
s2 = 29937.5
s = 173.02

La alta variabilidad s=173.02 respecto de la media y la diferencia de esta y la mediana


nos indican que los datos se encuentran altamente dispersos (respecto de la media).
b) Corr(X, Y ) = 0.84 lo que nos indica que el valor de R2 del modelo Y = a + bX es
R2 0.70
c) Si transformamos x0 = log(x) obtenemos que Corr(X 0 , Y ) = 0.93 y el R2 del modelo
Y = a0 + b0 X 0 es 0.85.
d) El mejor modelo es el que tiene mayor R2 , por lo tanto el mejor modelo es Y = a0 +
b0 log(X).

Probabilidad y Estadstica 15
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

9. El crecimiento de una colonia de abejas esta determinado por la siguiente ecuacion:


230
y=
1 + et
Donde y representa el n
umero de abejas y t el tiempo medido en meses. Se obtuvieron los
siguientes datos.

t 1 13 23 33 53 63
y 5,746 157,496 227,412 229,935 235,000 235,000

Determine una estimacion de y .

Solucion:

230
y= depejando en terminos de y
1 + et
230 y
et = aplicando logaritmo natural para linealizar
y
 
230 y
ln () t = ln que es una representacion lineal
y

Realizando el cambio de variable pertinente:

1 5,746 3,664
13 157,496 0,776
23 227,412 4,476
33 229,935 8,171
53 235,000 -3,850
63 235,000 -3,850

Se obtiene:

Estadsticas de prueba
Coeficiente de correlacion m
ultiple 0,602143
Coeficiente de determinacion R2 0,362576
R2 ajustado 0,203221
Error tpico 3,563255
Observaciones 6

Coeficientes
Intercepcion 0,238998
Variable X1 -0,101574

Probabilidad y Estadstica 16
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

= 0, 101574,
ln () = 0, 238998,
= 1, 269976

Por lo que el modelo a ajustar es:

230
y=
1 + 1, 269976 e0,101574t
10. Los datos a continuacion representan el tama
no y precio de 6 terrenos de una determinada
localidad.

Tamano, X (cien m2 ) 4.4 8.2 10.3 15.3 19 30.2


Precio, Y (millones) 0.3 0.57 0.93 1.48 2.42 4.07

El Principio de Parsimonia establece que si hay mas de una solucion posible a un problema,
se debe escoger la mas simple.
Bajo este criterio y el analisis de los estadsticos que se presentan, determine que modelo
representa mejor la relacion entre las variables. Interprete el modelo escogido.

corr(X,Y) a
b bb R2
Lineal 0.992 -0.583 0.151 0.985
Exponencial 0.958 -1.303 0.099 0.919
Polinomial 0.994 -3.363 1.401 0.989

Soluci
on:
Las variables y sus transformaciones presentan una correlacion mayor al 95%, lo que nos
indica que se justifica el ajuste de los tres modelos. De los tres, el de menor correlacion es el
modelo esponencial, por lo que decidiremos entre los otros dos modelos.

Tanto el modelo lineal como el modelo polinomial presentan un 99% de correlacion y un


R2 superior al 98%, siendo mayor el del modelo polinomial. Como ambos indicadores son
similares, y aun cuando el modelo polinomial parece mas adecuado, por parsimonia el mejor
ajuste sera el lineal, ya es mas simple y explica lo mismo que el modelo polinomial.

El modelo ajsutado es
ybi = 0.583 + 0.151 xi
lo que quiere decir que cuando el tama no del terreno aumenta en 100 m2 el precio aumenta
en 0.151 millones. El intercepto no tiene una interpretacion en el contexto de las variables.

Probabilidad y Estadstica 17
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

2 Probabilidades
1. Un banco debe elegir una directiva compuesta por 5 cargos: director, subdirector, interventor,
cajero y cobrador, entre 8 candidatos. Los candidatos son:

3 hombres: Felipe, Gonzalo y Joaqun.


5 mujeres: Alicia, Barbara, Evelyn, Claudia y Natalia.

Suponga que si una persona pertenece a esta directiva, esta persona puede ocupar solo un
cargo y suponga que todas las posibles directivas que pueden formarse tienen la misma
probabilidad de ocurrir.

(a) Determine el n
umero de directivas diferentes que es posible formar.
(b) Calcule la probabilidad que Felipe y Gonzalo NO esten simultaneamente en la directiva.
(c) Calcule la probabilidad que la directiva este compuesta por al menos 3 mujeres.

Solucion:

(a) Usando el Principio Multiplicativo, el n


umero de directivas diferentes que pueden for-
marse es: 8 7 6 5 4. )
(b) Defina el evento A : Gonzalo y Felipe no estan simultaneamente en la directiva.
Alternativa 1: Note que P(A) = 1 P(A{ ).
Para saber cuantos elementos tiene A{ , considere lo siguiente:
(i). Hay 52 2! = 20 formas de Felipe y Gonzalo ocupen un cargo en la directiva


(pues, cargos son diferentes).


(ii). Una vez asignados los cargos de Felipe y Gonzalo, hay 6 5 4 formas de llenar
los cargos restantes.
Luego, A{ tiene 20 6 5 4 elementos (Principio Multiplicativo).
Por tanto, dada la equiprobabilidad entre todas las directivas posibles, la probabil-
idad pedida es:
 
P (A) = 1 P A{
20 6 5 4
=1
87654
Alternativa 2: Defina los eventos:
G : Gonzalo esta en la directiva, pero Felipe no lo esta .
F : Felipe esta en la directiva, pero Gonzalo no lo esta .
N : Ni Gonzalo ni Felipe estan en la directiva.
Note que A = G F N y ademas los eventos G, F y N son disjuntos dos a dos.
Por tanto, P(A) = P(G) + P(F ) + P(N ).
Para saber cuantos elementos tiene G, considere lo siguiente:
(i). Hay 5 formas de elegir el cargo que ocupara Gonzalo (pues, cargos son difer-
entes).

Probabilidad y Estadstica 18
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

(ii). Una vez asignado el cargo de Gonzalo, hay 6 5 4 3 formas de llenar los cargos
restantes (pues, Felipe no debe estar en la directiva).
umero de elementos de G es: 5 6 5 4 3.
Luego, el n
Por tanto, dada la equiprobabilidad entre todas las directivas posibles,
56543 15
P (G) = =
87654 56
Analogamente, P(F ) = 15/56.
Para obtener el n umero de elementos de N , note que si Gonzalo y Felipe no deben
estar en la directiva, entonces N tiene 6 5 4 3 2 elementos.
Por tanto, dada la equiprobabilidad entre todas las directivas posibles,
65432 6
P (N ) = =
87654 56
Finalmente, la probabilidad pedida es: P(A) = P(G) + P(F ) + P(N ) = 36/56 =
9/14.
(c) Para cada j {3, 4, 5}, defina el evento Mj : En la directiva hay exactamente j
mujeres.
Para calcular el numero de elementos que tiene M3 considere lo siguiente:
5

(i). Hay 3 formas de elegir los cargos que ocuparan mujeres (pues los cargos son
diferentes).
(ii). Una vez hecho lo anterior, estos cargos pueden ser llenados de 5 4 3 formas.
(iii). Una vez hecho (i) y (ii), hay 3 2 formas de llenar los cargos compuestos por
hombres.
Luego, M3 tiene 53 5 4 3 3 2 = 3600 elementos (Principio Multiplicativo).


Usando argumentos similares, se tiene que:


M4 tiene 54 5 4 3 2 3 = 1800 elementos.


M5 tiene 5 4 3 2 1 = 120 elementos.


Por tanto, la probabilidad pedida en esta parte es:
3600 + 1800 + 120
P (M3 ) + P (M4 ) + P (M5 ) =
87654
2. Sea un espacio muestral y P() una medida de probabilidad. Sean A, B, C . Determine
si la siguiente proposicion es verdadera o falsa.

Si P(A | C) P(B | C) y P(A | C { ) P(B | C { ), entonces P(A) P(B).

Si la proposicion es verdadera, demuestrela. Si es falsa, provea un contraejemplo. Con-


traejemplos deben incluir: el espacio muestral , los eventos A, B y C, y la medida de
probabilidad P().
Solucion:

Probabilidad y Estadstica 19
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

La proposicion es verdadera.
Demostracion: Seg un la definicion de probabilidad condicional
P (A C) P (B C)
P (A | C) P (B | C)
P (C) P (C)
P (A C) P (B C)

 
    P A C{ P B C{
P A | C{ P B | C{  
P C{ P C{
   
{ {
P AC P BC

Luego,
   
P (A C) + P A C { P (B C) + P B C {
P (A) P (B)

lo que completa la demostracion.

3. Sean A, B y C tres eventos tales que A C = , demostrar que:

P ((A C) | B) = P (A | B) + P (C | B)

Solucion:

P ((A B) B)
P ((A C) | B) =
P (B)
P ((A B) (C B))
=
P (B)
P (A B) P (C B)
= +
P (B) P (B)
= P (A | B) + P (C | B)

Como A C = entonces A B y C B son disjuntos.

4. Sean A y B dos eventos tales que P(A) = 1/2, P(B | A) = 1/2, y P(A | B) = 1/4. Decir si
son ciertas o falsas las siguientes relaciones:

a) A B
b) A y B son independientes
c) A{ y B { son independientes.
d) A y B son disjuntos.

Probabilidad y Estadstica 20
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

e) P(A{ | B { ) = 1/2
f) P(A | B) + P(A{ | B { ) = 1
Solucion:
a) Si A B, entonces A B = A, y por lo tanto se cumplira que
P(A B) P(A) 1
P(B/A) = = = 1 6=
P(A) P(A) 2
Lo que nos dice que no se cumple A B
b) Si A y B son independientes se debe cumplir que
P(A | B) = P(A)
lo que en este caso se cumple, ya que ambas probabilidades son 1/4.
Tambien se cumple que
11 1
P(A B) = P(B | A) P(A) = = = P(A) P(B)
24 8
c) Basta probar que P(B { | A{ ) = P(B { ). Notemos por (b) que P(B) = P(B | A) = 1/2

Entonces,

P(A{ B { )
P(A{ | B { ) =
P(B { )
P((A B){ )
=
P(B { )
1 P(A B)
=
P(B { )
1 (P(A) + P(B) P(A B))
=
P(B { )
1 (P(A) + P(B) P(A) P(B))
=
1 P(B)
1 (1/4 + 1/2 1/4 1/2)
=
1 1/2
1 5/8
=
1/2
3/8
=
1/2
= 1/4 = P(A{ )

Por lo tanto, A{ y B { tambien son independientes.

Probabilidad y Estadstica 21
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

d) A y B no pueden ser disjuntos, ya que son independientes. En efecto, si son disjuntos,


A B = y como son independientes se tiene que

P(A B)
P(A | B) = , si son disjuntos
P(B)
P()
=
P(B)
= 0 6= P(A)

e) En (c) calculamos lo pedido, que es claramente distinto a 1/2.


f) Es claro que no se cumple, ya que

P(A/B) = 1/4 y P(A{ /B { ) = 1/4

entonces
P(A/B) + P(A{ | B { ) = 1/2 6= 1

5. Un ingeniero desea escoger, entre los dos dise


nos de circuitos que se muestran en la figura,
aquel que brinda una mayor probabilidad de que la corriente circule entre el punto A y el
punto B. Si las componentes (resistencias) funcionan de forma independiente y cada una
tiene una probabilidad q de fallar. Cual de los dos dise
nos debiera escoger el ingeniero?.
Justifique su respuesta.
Solucion:

Sean los eventos:

SD: La componente Superior Derecha funciona.


SI: La componente Superior Izquierda funciona.
ID: La componente Inferior Derecha funciona.
II: La componente Inferior Izquierda funciona.
Fi : El circuito i funciona (i = 1, 2).

Entonces de que cada componente funcione es p = 1 q y

P (F1 ) = P ((SI II) (SD ID))


= [P (SI II)]2 (por independencia e igualdad de las componentes)
= [P (SI) + P (II) P (SI II)]2
= [p + p p2 ]2
= p2 (2 p)2

Probabilidad y Estadstica 22
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

P (F2 ) = P ((SI SD) (II ID))


= P (SI SD) + P (II ID) P ((SI SD) (II ID))
= p2 + p2 p4 (por independencia e igualdad de las componentes)
2 2
= p (2 p )

Comparando, tenemos que (2 p)2 2 p2 ya que:


4 4p + p2 2 p2
2 4p + 2p2 0
1 2p + p2 0
(p 1)2 0 0p1
Por tanto, el primer dise
no debe ser el elegido pues tiene una mayor probabilidad de funcionar
cualquiera sea el valor de p.
6. Un banco revisa su poltica de tarjetas de credito, con el objetivo de cancelar algunas de ellas.
En el pasado, el 5% de los clientes con tarjeta ha pasado a ser moroso, esto es ha dejado de
pagar sin que el banco pudiera recuperar la deuda. Ademas, el banco ha comprobado que
la probabilidad de que un cliente normal se atrase en un pago es de 0,2. Naturalmente, la
probabilidad de que un cliente moroso se atrase en un pago es 1.
(a) Identifica y da nombre a los sucesos que aparecen en el enunciado.
(b) Elegido un cliente al azar, que probabilidad hay de que el cliente se atrase en un pago
mensual?
(c) Si un cliente se atrasa en un pago mensual, calcular la probabilidad de que el cliente se
convierta en moroso.
(d) Al banco le gustara cancelar la lnea de credito de un cliente si la probabilidad de que
este acabe convirtiendose en moroso es mayor de 0,25. De acuerdo con los resultados
anteriores, debe cancelar una lnea si un cliente se atrasa en un pago? Por que?
Solucion:

(a) Sean los eventos:


M : Clientes Morosos.
M { : Clientes no Morosos.
A: Clientes atrasado en un pago.

   
P (M ) = 0, 05 , P M { = 0, 95 , P (A | M ) = 1 , P A | M { = 0, 2

(b)
   
P (A) = P (A | M ) P (M ) + P A | M { P M { = 1 0, 05 + 0, 2 0, 95 = 0, 24

Probabilidad y Estadstica 23
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

(c)

P P (A | M ) P (M ) 1 0, 05
P (M | A) = = = 0, 2083
P (A) 0, 24

(d) Para cancelar la lnea de credito se debe cumplir que P (M | A) > 0, 25, dado que se
tiene que: 0, 2083 > 0, 25, entonces no exste posibilidad de cerrarla.

7. Los directivos de la agencia de viajes de Barcelona Cabarna S.A. quieren plantear una es-
trategia de expansion hacia el resto de comarcas, por lo que se plantea si fusionarse con la
empresa Sol S.A., compran la empresa de la competencia o bien ampliar sus instalaciones.
La decision se tomara en funcion de la evolucion futura de las ventas. El departamento
comercial preve que las ventas pueden ser altas, medias o bajas, con una probabilidad del
25%, 45% y 30% respectivamente. Por otra parte, las ganancias de acuerdo con la estrategia
seleccionada con las siguientes:

ALTERNATIVAS VENTAS ALTAS VENTAS MEDIAS VENTAS BAJAS


25% 45% 35%
FUSION 350000 140000 60000
COMPRAR 300000 180000 50000
AMPLIACION 275000 160000 80000

Determinar las ganancias esperadas y decidir por cual alternativa optar.

Solucion:

F = 350000 0, 25 + 140000 0, 45 + 60000 0, 3 = 168500


C = 300000 0, 25 + 180000 0, 45 + 50000 0, 3 = 171000
A = 275000 0, 25 + 160000 0, 45 + 80000 0, 3 = 164750

Por lo tanto la alternativa es comprar.

8. Se ha nominado a tres miembros de un club privado para ocupar la presidencia del mismo.
La probabilidad de que se elija al se
nor A es de 0.3; la que se haga lo propio con el se
nor B,
de 0.5, y la de que gane la se
nora C, de 0.2. En caso que se elija al se
nor A, la probabilidad
de que la cuota de ingreso incremente es de 0.8, si se elije al senor B o a la senora C, las
correspondientes probabilidades de que haya un incremento en la cuota son de 0.1 y 0.4.

(a) Cual es la probabilidad de que haya un incremento en la cuota de membresa?


(b) Dado que la cuota se ha incrementado, cual es el candidato con mayor probabilidad
de haber sido electo presidente?
Tena este candidato la mayor probabilidad de ser electo inicialmente? Comente.

Probabilidad y Estadstica 24
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

Solucion:
(a) Definamos los eventos de interes:
A: el se
nor A es elegido como presidente.
B: el se
nor B es elegido como presidente.
C: el se
nor C es elegido como presidente.
E: el candidato electo incrementa la cuota.
Para esto utilizamos probabilidades totales (equivalentemente, podemos definir un dia-
grama de arbol), ya que necesitamos P(E). Del enunciado tenemos que:
P(A) = 0.3 P(B) = 0.5 P(C) = 0.2
P(E | A) = 0.8 P(E | B) = 0.1 P(E | C) = 0.4

Por lo tanto,
P(E) = P(E | A)P(A) + P(E | B)P(B) + P(E | C)P(C)
= 0.3 0.8 + 0.5 0.1 + 0.2 0.4
= 0.37
La probabilidad de que la couta se incremente es de un 37%.
(b) Necesitamos utilizar el teorema de Bayes para calcular las probabilidades a posteriori
de aumentar la cuota.

As,
P(E | A)P(A)
P(A | E) =
P(E)
0.3 0.8
=
0.37
= 0.65

P(E | B)P(B)
P(B | E) =
P(E)
0.5 0.1
=
0.37
= 0.14

P(E | C)P(C)
P(C | E) =
P(E)
0.2 0.4
=
0.37
= 0.21
Dado que la cuota se incrementa, el candidato con mayor probabilidad de ser electo es
el se
nor A, aun cuando a priori sabamos que el se nor B tena mayor probabilidad de
ser electo, el aumento de cuota resulta ser un beneficio para la candidatura del se
nor A.

Probabilidad y Estadstica 25
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica


9. Un inversionista tiene tres opciones de inversion que le presenta el mercado, I1 , I2 e I3 . El
decide por una de estas y le presenta su propuesta al cliente, el cual puede cambiarla o
mantener la sugerida por el inversionista. Sean los eventos Di , el cliente decide la opcion de
inversion i, i = 1, 2, 3

La tabla adjunta presenta la probabilidad de que el cliente decida por la opcion Dj dado que
el inversionista le presenta la inversion Ik .

D1 D2 D3
I1 0.7 0.1 0.2
I2 0.1 0.8 0.1
I3 0.0 0.1 0.9

Suponga que la probabilidad de que el inversionista escoja cada una de las tres opciones es:
P(I1 ) = 0.10
P(I2 ) = 0.40
P(I3 ) = 0.50

a) Calcule la probabilidad de que el cliente decida por la segunda opcion de inversion D2 .


b) Dado que el cliente escogio la segunda opcion de inversion, calcule la probabilidad de
que el inversionista le sugirio esa opcion.
c) Para cada k por separado, calcule la probabilidad de que el inversionista decida por la
opcion k y el cliente la acepte.
d) En terminos de los eventos I y los eventos D defina el evento:
C: la decision del inversionista y el cliente es la misma.
e) Calcule la probabilidad del evento C.

Solucion:

a) Por teorema de probabilidad total,

P(D2 ) = P(D2 | I1 )P(I1 ) + P(D2 | I2 )P(I2 ) + P(D2 | I3 )P(I3 )

Con los datos de la tabla y las probabilidades de Ik , obtenemos

P(D2 ) = P(D2 | I1 )P(I1 ) + P(D2 | I2 )P(I2 ) + P(D2 | I3 )P(I3 )


= 0.1 0.1 + 0.8 0.4 + 0.1 0.5
= 0.38

Por lo tanto, la probabilidad de que el cliente escoja la segunda opcion de opcion de


inversion, sin importar lo que sugiere el inversionista es 0.38.

Probabilidad y Estadstica 26
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

b) Se pide calcular
P(I2 | D2 )
Aplicando el teorema de Bayes, nos queda
P(D2 | I2 ) P(I2 )
P(I2 | D2 ) =
P(D2 )
0.8 0.40
=
0.38
= 0.842

Por lo tanto, dado que el cliente escogio la segunda opcion, la probabilidad que el
inversionista la haya sugerido es 0.84.
c) Para cada k = 1,

P(D1 I1 ) = P(D1 | I1 )P(I1 ) = 0.7 0.1 = 0.07

Para cada k = 2,

P(D2 I2 ) = P(D2 | I2 )P(I2 ) = 0.8 0.4 = 0.32

Para cada k = 3,

P(D3 I3 ) = P(D3 | I3 )P(I3 ) = 0.9 0.5 = 0.45

d) Sea C: la decision del inversionista y el cliente es la misma. Entonces

C = (D1 I1 ) (D2 I2 ) (D3 I3 )

e) Como los eventos son independientes, entonces

P(C) = P((D1 I1 ) (D2 I2 ) (D3 I3 ))


= P(D1 I1 ) + P(D2 I2 ) + P(D3 I3 )
= 0.07 + 0.45 + 0.32
= 0.84

10. Sea X = n
umero de sustancias nocivas en un material de trabajo escogido al azar.

x 0 1 2 3 4
p(x) 0.3 0.2 0.1 0.05 0.05
p(x) 0.4 0.1 0.1 0.1 0.3
p(x) 0.4 0.2 -0.3 0.5 0.2

(a) Cual de las siguientes tres funciones de probabilidad es una funcion de probabilidad
legitima para X, Por que no se permiten las otras 2?
(b) Para la funcion de probabilidad legitima de la parte anterior. Calcule P(2 X 4),
P(X 2) y P(X 6= 0)

Probabilidad y Estadstica 27
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

(c) Escriba la funcion de probabilidad acumulada.

Solucion:

(a) Para que una funcion p(x) sea funcion distribucion de una variable aleatoria debe
cumplir que:
i)
p(x) 0 x R
ii) X
p(x) = 1
xR

Es claro que la primera funcion no cumple la condicion (i) y la tercera, no cumple la


primera (p(2) < 0). Por lo tanto la u
nica funcion de probabilidad legtima es la segunda.
(b)

P(2 X 4) = P(X = 2) + P(X = 3) + P(X = 4)


= 0.1 + 0.1 + 0.3
= 0.5

P(X 2) = P(X = 0) + P(X = 1) + P(X = 2)


= 0.4 + 0.1 + 0.1
= 0.6

P(X 6= 0) = P(X > 0)


= 1 P(X 0)
= 1 0.4
= 0.6

(c) Recordemos que la funcion distribucion acumulada (f.d.a) se define como

F (x) = P(X x), xR

Por lo tanto la f.d.a para la funcion elegida es


x 0 1 2 3 4
F(x) 0.4 0.5 0.6 0.7 1

Probabilidad y Estadstica 28
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

11. Si p(x) = c (5 x) para x = 0, 1, 2, 3. Cual es el valor de c?

Solucion:

P
Recordemos que la si p(x) es funcion de probabilidad debe cumplir que p(x) = 1, por lo
tanto para calcular c debemos verificar que cumpla esta propiedad. As,
3
X 3
X
p(x) = c (5 x)
i=0 i=0
= c (5 0) + c (5 1) + c (5 2) + c (5 3)
= c (5 + 4 + 3 + 2)
= c 14

1
Por lo tanto 14c = 1 y el valor de c que hace que p(x) sea funcion de probabilidad es c = 14
.

12. Una multinacional produce determinado artculo electronico que se emplea en el area medica,
y las especificaciones dicen que solo un 2% de los artculos producidos presentan fallas. Dos
ingenieros, expertos en control de calidad, realizan su propio plan de inspeccion: el ingeniero
A comienza a inspeccionar los artculos de uno a la vez hasta detectar el primer defectuoso
y acepta las especificaciones si realiza mas de dos extracciones; el ingeniero B toma una
muestra de tama no 5 y acepta las especificaciones del fabricante si no encuentra defectuosos.
Cual de los dos ingenieros tiene mayor probabilidad de rechazar las especificaciones dadas
por el fabricante?

Solucion:

Calculemos la probabilidad de rechazar las especificaciones de cada ingeniero, y noteos que


p = P(encontrar un artculo defectuoso) = 0.02.

Ingeniero A: el experimento que realiza es inspeccionar artculos de uno a la vez de manera


independiente hasta detectar el primer defectuoso, lo que corresponde a la realizacion de una
v.a. Geometrica de parametro p.
Acepta las especificaciones si realiza mas de dos extracciones (X > 2), por lo que las rechaza
cuando realiza a lo mas dos extracciones (X 2).

Entonces, sea
X: n
umero artculos inspeccionados hasta detectar el primero defectuoso,

X Geom(p = 0.02)

Probabilidad y Estadstica 29
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

y la probabilidad pedida es

P(X 2) = P(X = 1) + P(X = 2)


= (1 0.02)11 0.02 + (1 0.02)21 0.02
= 0.02 + 0.0196
= 0.0396

Ingeniero B: el experimento que realiza es tomar una muestra de tama no 5 e inspeccionarla.


Acepta las especificaciones del fabricante si no encuentra defectuosos, esto es, no encuentra
exitos en su muestra, lo que corresponde a una v.a. Binomial de parametros n y p.

Entonces, sea
Y: n
umero artculos defectuosos en la muestra de tama
no 5,

X Bin(n=5,p=0.02)

y la probabilidad pedida es

P(Y > 0) = 1 P(Y = 0)


 
5
=1 (1 0.02)50 (0.02)0
0
= 0.096

Como el ingeniero A rechaza las especificaciones el 4% de las veces, mientras que el ingeniero
B, un 9%, es este ingeniero quien tiene mayor probabilidad de rechazar las especificaciones.

13. El 70% de los aviones ligeros que desaparecen en vuelo en cierto pas son descubiertos pos-
teriormente. De las naves descubiertas, el 60% tiene localizador de emergencia, en tanto que
el 90% de las naves no descubiertas no tiene ese localizador.

a) Calcule la probabilidad que un avion ligero tenga localizador de emergencia.

En las partes (b), (c) y (d), suponga que la probabilidad que un avion ligero tenga localizador
de emergencia es del 45%.

b) Considere 10 aviones ligeros desaparecidos. Cual es la probabilidad que exactamente


2 de ellos tengan localizador de emergencia?
c) Ud. observa independientemente aviones ligeros hasta obtener el primer avion con
localizador de emergencia. Cual es la probabilidad que el proceso finalice en a lo mas
10 observaciones?
d) Ud. observa independientemente aviones ligeros hasta obtener el tercer avion con lo-
calizador de emergencia. Cual es la probabilidad que el proceso finalice al menos 4
observaciones?

Solucion:

Probabilidad y Estadstica 30
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

(a) Defina los siguientes eventos:


D : Avion ligero descubierto
L : Avion ligero tiene localizador de emergencia
un enunciado, P(L | D) = 6/10, P(L{ | D{ ) = 9/10 y P(D) = 7/10.
Seg
Usando la Ley de Probabilidades Totales, la probabilidad pedida es:

P(L) = P(L | D) P(D) + P(L | D{ ) P(D{ )


6 7 1 3 45
= + =
10 10 10 10 100
(b) Defina la variable aleatoria X : N umero de aviones con localizador de emergencia,
de entre los 10 aviones disponibles. Claramente, Rec(X) = {0, 1, . . . , 10} y ademas
X Bin(n = 10; p = 0.45). Por tanto, la probabilidad pedida es:
 
10
P(X = 2) = (0.45)2 (0.55)8
2

(c) Defina la variable aleatoria Y : N umero de aviones que es necesario observar hasta
obtener el primer avion con localizador de emergencia. Claramente, Rec(Y ) = {1, 2, 3, . . .}
y ademas Y Geom(p = 0.45). Por tanto, la probabilidad pedida es:
10
X
P(Y 10) = (1 0.45)y1 (0.45)
y=1

(d) Defina la variable aleatoria Z : N umero de aviones que es necesario observar hasta
obtener el tercer avion con localizador de emergencia. Claramente, Rec(Z) = {3, 4, 5, . . .}
y ademas Z BinNeg(r = 3; p = 0.45). Por tanto, la probabilidad pedida es:

P(Z 4) = 1 P(Z = 3)
 
31
=1 (0.45)3 (0.55)33
31

14. En una determinada region la distribucion de ingresos por familia en unidades monetarias
(u.m) es una variable aleatoria X con funcion de densidad de probabilidad dada por:
x 1

+ , si 0 x 2;
10 10

f (x) = 3x 9
+ , si 2 < x 6;
40 20




0, en otro caso.

(a) Verifique que f (x) es funcion densidad.


(b) Determine la funcion de distribucion acumulada de la variable aleatoria X.
(c) Se seleccionan familias al azar hasta encontrar 3 con ingreso superior a 3 u.m. Haciendo
los supuestos que sean necesarios, determine la probabilidad de que sea necesario entre-
vistar a mas de 5 familias.

Probabilidad y Estadstica 31
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

(d) Suponga que se seleccionan 50 familias. Haciendo los supuestos que sean necesarios
determine la probabilidad de que al menos 3 tengan ingreso inferior a 1 u.m.
Solucion:
(a) Para mostrar que es funcion densidad debemos mostrar dos propiedades:
(i) fX (x) 0 x R

x+1 183x
Es claro que f (x) = 10
0, cuando 0 x 2 y f (x) = 40
0 cuando
2 < x 6.
R
(ii) fX (x)dx = 1 x R.
Z 6 Z 2 Z 6
x+1 18 3x
fX (x)dx = dx + dx
0 0 10 2 40
 2  x=2   x=6
x x 18x 3x2
= + +
20 10 x=0 40 80 x=2
4 2 18 6 3 18 2 18 6
= + + +
20 10 40 40 40 40
=1
(b) Debemos hacerlo por tramos:
Si 0 x 2,
Z x
1
F (x) = (u + 1)du
10 u=0
x
1 u2

= +u
10 2 u=0
x2 x
= +
20 10
Si 2 < x 6,
Z 2 Z x
1 1
F (x) = (u + 1)du + (3u + 18) du
10
u=0 40 u=2
x
3u2
 
1
= F (2) + + 18u
40 2 u=2
2 3x2 9x 3
= +
5 80 20 4
Entonces la funcion de distribucion acumulada queda:


0, si x < 0;
2
x x


+ , si 0 x 2;



FX (x) = 20 10
2
3x 9x 7
, si 2 < x 6;


+



80 20 20
1, si x > 6.

Probabilidad y Estadstica 32
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

(c) Definir Y como el n


umero de familias seleccionadas hasta encontrar 3 con ingreso su-
perior a 3 u.m. Con esto, Y BN (3, P(X > 3)), donde

p = P (X > 3) = 1 P (X 3)
 
27 27 7
=1 +
80 20 20
0, 3375 .

Entonces,

P (Y > 5) = 1 P (Y 5)
5  
X y1
=1 (1 p)y3 p3 .
y=3
2

Notar que y = 3, 4, . . .
(d) Sea Z el n
umero de familias que tienen ingreso inferior a 1 u.m. de un total de 50. Con
esto, Z Bin (50, P(X < 1)), donde
1 1 3
q = P (X < 1) = + = = 0.15 .
20 10 20
Entonces,

P (Z 3) = 1 P (Z < 3)
2  
X 50 z
=1 q (1 q)50z .
z=0
z

15. Demuestre que si X es una variable aleatoria con distribucion geometrica, entonces cumple
que
P(X > n + k | X > n) = P(X > k)
Interprete esta propiedad.
Solucion:

Probabilidad y Estadstica 33
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

16.
P(X > n + k, X > n)
P(X > n + k | X > n) =
P(X > n)

P(X > n + k)
=
P(X > n)

X
X
= ( (1 p)x1 p)/( (1 p)x1 p)
x=n+k+1 x=n+1

(1 p)n+k+1
= ()
(1 p)n+1

= (1 p)k

= P(X > k)

Lo que se interpreta como que el n umero de ensayos Bernoulli que ya se han realizado bus-
cando el primer exito no influyen en que se realicen k ensayos mas.

(*) se deduce de

X
ax = ak + ak+1 + . . . (1)
x=k
X
a ax = ak+1 + ak+2 + . . . (2)
x=k

Restando (1) y (2)



X
(1 a)ax = ak , o bien
x=k

X ak
ax =
x=k
1a

17. La funcion distribucion acumulada de una variable aleatoria Rayleigh es

x2
 
F (x) = 1 exp 2 , x>0
2

a) Muestre que esta funcion es efectivamente una funcion de distribuci


on acumulada.

Mostramos cumpla dos propiedades:

Probabilidad y Estadstica 34
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

i) limx F (x) = 1

Calculamos dicho lmite:


x2 x2
    
lim 1 exp 2 = 1 lim exp 2
x 2 x 2
=10
=1

por lo tanto cumple esta propiedad.


ii) limx F (x) = 0

En este caso, calculamos el lmite de x tendiendo a cero, que es el menor valor


que puede tomar y a lo que hace referencia la expresion anterior (hacer tender x al
menor valor que puede tomar).

x2 x2
    
lim 1 exp 2 = 1 lim exp 2
x 2 x0 2
0
=1e =11
=0

Como tambien se cumple esta propiedad, F(x) es funcion distribucion acumulada.


b) Encuentre la funcion densidad Rayleigh.

Derivamos la f.d.a y queda


d
f (x) = F (x)
dx
x2
 
2x
= 0 exp 2 2
2 2
x2
 
x
f (x) = 2 exp 2 , x>0
2

c) Encuentre el percentil 25, de esta distribucion.

P25 corresponde al valor de x que satisface que F (x) = 0.25. despejamos esta ecuacion
y obtenemos

Probabilidad y Estadstica 35
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

x2
 
1 exp 2 = 0.25
2
2
 
x
exp 2 = 0.75
2
2
x
2 = ln(0.75)
2
x = 2 2 ln(0.75)
2

x = 0.575
x = 0.75

18. Los procesos de falla de cada una de 10 componentes se comportan de manera proba-
bilsticamente independientes y siguiendo un mismo modelo probabilstico. Sea Xi el tiempo
de falla de la i-esima componente, expresado en miles de horas. Suponga que su densidad de
probabilidad es

0.8ex + 0.4e2x , x 0;

f (x) =
0, e.o.c.

para cualquier i = 1, 2, . . . , 10

(a) Determine la funcion distribucion acumulada de X3


(b) Calcule la probabilidad de que a lo mas 3 componentes fallen antes de 1.5 horas.

Solucion:

(a) La funcion distribucion de la variable X3 viene dada por:



0,
si x 0
Z x
FX3 (x) =

0.8et + 0.4e2t dx, si x >0
0

0, Z
si x 0
x Z x
= t

0.8 e d + 0.4 e2t dx, si x >0
0 0

0, si x 0
=
0.8(1 ex ) 0.2e2x , si x >0

0, si x 0
= x 2x
1 0.8e 0.2e , si x >0

Probabilidad y Estadstica 36
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

(b) La probabilidad de que una componente cualquiera falle antes de las 1.5 horas, viene
dada por:
P(Xj < 1, 5) = FXj (1, 5) = 1 0, 8e1,5 0, 2e21,5
Denotemos esta probabilidad por p, o sea,

p = 1 0, 8e1,5 0, 2e21,5

Sea ahora
Y: n
umero de componentes que fallan antes de 1.5 horas.
Entonces, Y Bin(10, p) y lo que se pide es
3  
X 10
P(Y 3) = px (1 p)10x
x=0
x

19. Se efectuaron 10 mediciones independientes X1 , X2 , . . . , X10 en una poblacion donde cada


una de ellas sigue una distribucion N (, 2 ).

(a) Cual es la probabilidad que la tercera medicion realizada se encuentre entre ( ) y


( + )?
(b) Para cualquier distribucion de probabilidad se define el Rango intercuantil como la
distancia que hay entre los percentiles 25 y 75.
Calcule el Rango intercuantil para una distribucion N(, 2 ).

Solucion:

a) Se pide la probabilidad que la tercera medicion efectuada se encuentre entre ( ) y


( + ), luego se tiene que
 
X3
( < X3 < + ) = 1 < <1

= (1) (1)
= (1) (1 (1))
= 2(1) 1
= 2 0.8413 1
= 0.6826

b) Si X N(, ), se tiene entonces que el percentil 25, x25 , cumple con que

Probabilidad y Estadstica 37
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

(X x25 ) = 0.25
 
X x25
= 0.25

x25
( ) = 0.25

x25
1 ( ) = 1 0.25

x25
( ) = 0.75

x25
= 0.675

x25 = 0.675

Por otra parte el percentil 75, x75 , cumple con que

(X x75 ) = 0, 75
 
X x75
= 0.75

 
x75
= 0.75

x75
= 0.675

x75 = + 0.675

Luego, el Rango intercuantil (RI) es igual a:

RI = x75 x25 = + 0, 675 + 0, 675 = 1, 35

20. Un analista financiero senala que la rentabilidad Y de los bonos del gobierno a largo plazo,
tendra al cabo de un a
no una distribucion normal con valor esperado de 70 dolares y varianza
de 9.
(a) Si el gobierno destina un porcentaje extra a polticas p ublicas cuando cualquiera de
los bonos tiene rentabilidad entre 67 y 75, Cual es la probabilidad que se destine este
porcentaje extra?
(b) Si la rentabilidad aceptable de un bono es (70c; 70+c) Para que valores de c tendran
el 95% de los bonos con rentabilidad aceptable?
(c) Cual es la probabilidad de que a lo sumo ocho de diez bonos, seleccionados independi-
entemente, tengan una rentabilidad menor a 73.84?
Solucion:

Probabilidad y Estadstica 38
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

(a) Sea la variable aleatoria


Y : rentabilidad de los bonos del gobierno a largo plazo
donde Y N (70, 9)

Se pide calcular P(67 < Y < 75), por lo que debemos estandarizar.

P(67 < Y < 75) = P(Y < 75) P(Y < 67)
   
Y 70 75 70 Y 70 67 70
=P < P <
3 3 3 3
= P(Z < 1.66) P(Z < 1)
= P(Z < 1.66) (1 P(Z < 1))
(por simetra de la distribucion normal)
= (1.66) + (1) 1
= 0.9515 + 0.8413 1
= 0.7928

Por lo tanto, existe un 79% de probabilidad de que se destine el porcentaje extra.


(b) Al igual que en (a) debemos estandarizar.

0.95 = P(70 c < Y < 70 + c)


 
70 c 70 Y 70 70 + c 70
=P < <
3 3 3
= P(Z < c/3) P(Z < c/3)
= P(Z < c/3) (1 P(Z < c/3))
(por simetra de la distribucion normal)
= 2 P(Z < c/3) 1
(0.95 + 1)/2 = P(Z < c/3)
0.975 = P(Z < c/3)
1.96 = c/3

Por lo tanto con c = 5.88 se tendra el 95% de los bonos con rentabilidad aceptable.
(c) Sea la variable aleatoria
X: n
umero de bonos de un total de 10 con rentabilidad menor a 73.84 dolares
por lo que X Bin(10, P(Y < 73.84)), y se pide P(X 8)

Calculemos la probabilidad de exito utilizando la variable Y antes definida.

Probabilidad y Estadstica 39
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

 
Y 70 73.84 70
P(Y < 73.84) = P <
3 3
= P(Z < 1.28)
= 0.8997

As, la probabilidad pedida queda

P(X 8) = 1 P(X > 8)


10  
X 10
=1 (0.8997)x (1 0.8897)10x
x=9
x
= 0.7349

21. Se desean rodamientos de un centmetro de radio, con tolerancia de 0.05 centmetros. El


fabricante gana US$0.10 por cada rodamiento aceptado. Si el radio es menor de lo permi-
tido, el rodamiento se debe refundir, produciendo una perdida de US$0.05; por otra parte,
si el radio es mayor de lo aceptado, se debe rebajar el rodamiento, con una perdida de
US$0.03. Suponga que el radio de los rodamientos tiene una distribucion normal con media
1.01 centmetro y una varianza de 0.0009 cm2 . Cual es la ganancia esperada?
Solucion:

Sean los eventos:

A: el rodamiento es aceptado.
B: el rodamiento debe ser refundido.
C: el rodamiento debe ser rebajado.

Sea la variable aleatoria X : radio del rodamiento

X N (1.01; 0.032 )

Probabilidad y Estadstica 40
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

Luego

P(A) = P(1 0.05 < X < 1 + 0.05)


= (1.33) (2)
= 0.9082 0.0228
= 0.8854
P(B) = P(X < 1 0.05)
= (2)
= 0.0228
P(C) = P(X > 1 + 0.05)
= 1 (1.33)
= 1 0.9082
= 0.0918

Sea la variable aleatoria U : utilidad de un rodamiento. Esta variable es discreta, ya que solo
toma 3 valores y su funcion de cuanta esta dada por:

u 0.10 -0.05 -0.03


P(U = u) 0.8854 0.0228 0.0918

Luego, la utilidad esperada es

E(U ) = 0.1 0.8854 + (0.05) 0.0228 + (0.03) 0.0918


= 0.0846

22. Un fabricante de equipos electronicos somete cada unidad a una prueba muy rigurosa. De los
equipos recien ensamblados, el 84% pasa la prueba sin ninguna modificacion. Los que fallan
en la prueba inicial son reelaborados; de estos, el 75% pasa la prueba. Aquellos equipos que
fallan en la segunda prueba se rehacen por segunda vez y se vuelven a probar; el 90% de
ellos pasan la prueba y el resto se desarman. Defina Y como el n umero de veces que falla un
equipo seleccionado al azar.

a) Especifique los posibles valores de Y . Que tipo de variable es Y ?

Solucion:
Y : n
umero de veces que falla un equipo

Si el equipo pasa la primera prueba, entonces falla cero veces y Y = 0.


Si no pasa la primera prueba, entonces Y = 1, solo si pasa la segunda prueba. Si no,
entonces Y = 2 si pasa la tercera prueba. Si no pasa la tercera prueba, entonces Y = 3

Probabilidad y Estadstica 41
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

y no hay mas opciones de ue vuelva a fallar, ya que el equipo se desarma.

Y = {0, 1, 2, 3}.

= Y es una variable discreta

b) Calcule la distribucion de probabilidad de Y .


Puede serle u
til desarrollar un arbol de probabilidad.

Soluci
on:

P(Y =0) = P (F c ) = 0.84


P(Y =1) = P (F F c ) = 0.16 0.75 = 0.12
P(Y =2) = P (F F F c ) = 0.16 0.25 0.9 = 0.036
P(Y =3) = P (F F F ) = 0.16 0.25 0.1 = 0.004

y se cumple que
3
X
P (Y = y) = 1
y=0

c) Determine la funcion generadora de momentos de Y .

Soluci
on:
3
X
My (t) = eyt P (Y = y)
y=0

= e 0.84 + e1t 0.12 + e2t 0.036 + e3t 0.004


0t

= 0.84 + 0.12 et + 0.036 e2t + 0.004 e3t

d) (6 ptos) Determine esperanza y varianza de Y . Interprete estas cantidades.

Soluci
on:

My0 (t) = 0 + 0.12 et + 2 0.036 e2t + 3 0.004 e3t

entonces

E(Y ) = 0 0.84 + 1 0.12 + 2 0.036 + 3 0.004


= 0.204

Probabilidad y Estadstica 42
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica


My00 (t) t 2t 3t

= 0.12 e + 4 0.036 e + 9 0.004 e

t=0

V (Y ) = 0.12 0.12 + (2 0.204)2 0.036 + (3 0.204)2 0.004


= 0.258

e) (6 ptos) Cada falla de un equipo genera una perdida para el fabricante de 20 dolares, es
decir, si falla en la primera prueba, el fabricante pierde 20 dolares; si falla en la segunda
prueba, pierde 40 dolares, y as sucesivamente.
Determine la perdida esperada por falla en un equipo.

Soluci
on:

Sea X: perdida por fallas en un equipo.


Los posibles valores de X son:

Si Y =0 = X=0
Si Y =1 = X=20
Si Y =2 = X=40
Si Y =3 = X=60
Para calcular E(X) debemos calcular su distribucion de probabilidad, que corresponde
a las probabilidades de Y

x 0 20 40 60
P(X=x) 0 0.12 0.036 0.004

La perdida esperada por falla en un equipo esta dada por:

X
E(X) = x P (X = x)
x
= 0 + 20 0.12 + 40 0.036 + 60 0.004
= 4.08

23. Sea Y U (0, 1) y sea FX una funcion distribucion continua y estrictamente creciente.

Probabilidad y Estadstica 43
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

(a) Encontrar la funcion distribucion de Y .


(b) Demostrar que FX1 (Y ) tiene distribucion FX .
Solucion:
a) Si Y U (0, 1), entonces FY (t) = t.
b) Sea Z = FX1 (Y ), entonces,
FZ (z) = P(Z z)
= P(FX1 (Y ) z)
= P(Y FX (z))
= FY (FX (z))
= FX (z)
Luego Z tiene distribucion FX
24. Suponga que X tiene distribucion FX . Demostrar que si Y = FX , entonces
(a) 0 Y 1
(b) Y U (0, 1)
(Recuerde que F es creciente y por tanto invertible y F (F 1 (x)) = x)

Solucion:

a) Por definicion, sabemos que si F es funcion distribucion acumulada, debe cumplir que
0 FX 1,
por lo tanto, se cumple que 0 Y 1.
b) Por demostrar, f (y) = 1.
FY (y) = P(Y y)
= P(FX y), FX1
= P(X FX1 (y))
= FX (FX1 (y))
=y (ya que F es invertible)

Por lo tanto, para obtener la funcion densidad calculamos


d
fY (y) = FY (y)
dy
d
= y
dy
=1
As, Y U (0, 1)

Probabilidad y Estadstica 44
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

25. Una compa na de seguros recibe informes mensuales de agentes independientes. Sea X,
la variable aleatoria que modela la proporcion de informes que requieren un estudio de
actualizacion, con funcion densidad dada por
 2
1
f (x) = c x , 0<x<1
2

a) Determine varianza y curtosis de la variable aleatoria X.

Soluci
on:

Primero que todo, es necesario obtener el valor de c para luego proseguir con el resto
de calculos.
Sea X: proporcion de informes que requieren estudio
 2
1
f (x) = c x
2
La funcion en estudio se tiene que integrar en todo el recorrido de la variable y luego
igualarla a 1 para poder despejar el valor de c

Z 1
f (x)dx = 1
0
Z 1 2
1 1
x dx =
0 2 c
Z 1 
2 1 1
x x+ dx =
0 4 c
 3  1
x x2 x 1
+ =
3 2 4 0 c
1 1
=
12 c

= c = 12

Se sabe que V (X) = E(X 2 ) E 2 (X), por lo tanto se calcula cada uno de los terminos
de la varianza por separado

Probabilidad y Estadstica 45
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

Z 1  
2 1
E(X) = x 12 x x + dx
0 4
Z 1 
3 2 x
= 12 x x + dx
0 4
 4  1
x x3 x2
= 12 +
4 3 8 0
1
= E(X) =
2
1
= E 2 (X) =
4

Ahora se calcula el otro termino de la varianza

Z 1  
2 2 2 1
E(X ) = x 12 x x + dx
0 4
Z 1
x2

4 3
= 12 x x + dx
0 4
 5  1
x x4 x3
= 12 +
5 4 12 0
2
= E(X 2 ) =
5
Por lo tanto, la varianza de la variable X es:

2 1 85
=
V (X) =
5 4 20
3
= V (X) =
20
b) Encuentre la funcion distribucion acumulada de X.

Soluci
on:

Z x 
2 1
F (x) = 12 t t + dt
0 4
 3  x
t t2 t
= 12 +
3 2 4 0
x3 x2 x
= +
4 6 3

Probabilidad y Estadstica 46
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica



0 ; x1



x3 x2 x
F (x) = 4
6
+ 3
; 0<x<1




1 ; x>1

c) Calcule la probabilidad que mas de un 50% de los informes mensuales requieran estudio
de actualizacion.

Soluci
on:

P (X > 0.5) = 1 P (X 0.5)


= 1 F (0.5)
 
1 1 1 1
= 1 +
2 16 12 3
= 0.84375

d) Durante un a no (12 meses) se observa la proporcion de informes que requieren estudio


de actualizacion. Calule la probabilidad que en 6 meses del ano se requieran estudios
de actualizacion de mas del 50% de los informes.

Soluci
on:

Sea Y: n umero de meses donde mas del 50% de los informes requiere estudios de actu-
alizacion

Por lo tanto, Y Bin(12, p). El parametro p se obtiene del item anterior ya que se
cumple que p = P (X > 0.5)
Es decir, p = 0.84375
 
12
Se pide P (Y = 6) = p6 (1 p)6
6
26. Sea X una variable aleatoria con funcion de distribucion acumulada F (x) definida por:
 x
ae , x 0;
F (x) = 1 x
2 e + b, x > 0.

siendo a y b constantes.

a) Determine el(los) valor(es) de a y b para que X tenga funcion densidad.


b) Determine a traves de MX (t), E(X) y V(X)

Solucion:

Probabilidad y Estadstica 47
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

a) Como F (x) es f.d.a. debe cumplirse que


lim F (x) = 1
x

en este caso,
1 1
lim ex + b = lim ex + b = 0 + b = 1
x 2 2 x
Por lo tanto b = 1.

Por otro lado, podemos calcular f(x), derivando F (x)


 x
ae , x 0;
f (x) = 1 x
2
e , x > 0.
y debe cumplirse que Z
f (x) = 1

entonces Z 0 Z
x 1 x
ae + e =1
0 2
y de aqu se obtiene que a = 1/2.
y entonces las funciones distribucion y densidad, respectivamente, son,
1 x

2e ,

x 0;
F (x) = 1 x
e + 1, x > 0.


2

1 x

2 e , x 0;


f (x) =
1 ex , x > 0.

2

b) Se pide encontrar la funcion generadora de moemntos que queda


MX (t) = E(eXt )
Z
= ext f (x)d x

Z 0 Z
xt 1 x 1
= e e d x+ ext ex d x
2 0 2
Z 0 Z
1
= ex(t+1) d x + ex(1t) d x
2 0
1 1
=
2(t + 1) 2(t 1)
1
= , | t |6= 1
1 t2

Probabilidad y Estadstica 48
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

y entonces
1
0 d 1t2
MX (t) =
dx
1(t2 1) + 2t

=
(t2 1)2
t=0
=1

(2t 2)(t2 1)2 + (t2 2t 1)2(t2 1)2t



00
MX (t) =
(t2 1)4
t=0
=2

Entonces E(X) = 1 y V(X) = 2 12 = 1

27. Demuestre que si X es una variable aleatoria con funcion generadora de momentos MX (t), e
Y = aX + b entonces
MY (t) = ebt MX (at)

Ya que X puede ser continua o discreta, trabajamos con la definicon de funcion generadora
de momentos:

MY (t) = E(eY t )
= E(e(aX+b)t )
= E(eaXt ebt )
= ebt E(eXat ) (ya que la esperanza es un operador lineal)
= ebt MX (at) (por definicion de fgm)

28. Sea la funcion


pX (x) = ke|x| , < x <

(a) Determinar la constante k tal que pX sea funcion densidad.


(b) Si X tiene funcion densidad pX , determinar su f.g.m.
(c) Si X tiene funcion densidad pX e Y = 25X 2 , encontrar E(X) y V (X).

Solucion:

a) Z Z
|x|
1= ke dx = 2 kex dx
0
1
Luego k = 2

Probabilidad y Estadstica 49
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

b)
Z
1
MX (t) = ext e|x| dx
2
1 xt x
Z 0 Z
1 xt x
= e e dx + e e dx
2 2 0
1
=
1 t2

c) Utilizando lo obtenido en (b),



0 2t
E(X) = MX (0) = =0
(1 t2 )2 t=0
2 + 6t2

2
E(X ) = =2
(1 t2 )3 t=0
24t 24t3

3
E(X ) = =0
(1 t2 )4 t=0
E(X 4 ) = 24

Ademas,

E(Y ) = E(25X 2 ) = 25E(X 2 ) = 25 2 = 50


E(Y 2 ) = E(625X 4 ) = 625E(X 4 ) = 625 24 = 15000

Por lo tanto, V (X) = 15000 2500 = 12500.

29. Suponga que la duracion (medida en meses y fracciones) de un cierto reproductor MP3, es una
variable aleatoria con distribucion exponencial con parametro = 10. Si la duracion de dicho
reproductor supera los 10 meses, este es considerado aceptable, y es considerado inaceptable
en caso contrario. Durante un control de calidad, se realizan los siguientes experimentos:

I Se hacen funcionar 10 reproductores MP3 eligidos al azar, y se cuenta el n


umero (X) de
reproductores que fallaron antes de los 10 meses.
II Se hacen funcionar tantos reproductores como sea necesario hasta obtener 10 fallas, y se
cuenta el n
umero (Y) de reproductores que no fallaron.

Entonces

(a) Determine la distribucion de X e Y en (I) y (II), respectivamente, y calcule la proba-


bilidad de encontrar mas de 5 reproductores MP3 aceptables en cada experimento.
(b) Calcule la esperanza y la varianza de X e Y usando sus funciones generadoreas de
momentos.

Solucion:

Probabilidad y Estadstica 50
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

(a) Sea T la duracion del dispositivo. Entonces, la probabilidad de que el dispositivo se


considere aceptable es

P(T > 10) = 1 P(T 10)


Z 10
= 1 0.1e0.1t dt
0

= 1 (1 e0.110 )

= 0.368

Entonces X, es el n
umero de dispositivos que fallan de una muestra de 10 dispositivos,
con
p = P (T < 10) = 1 0.368 = 0.632
y por lo tanto X Bin(10, 0.632).

La probabilidad de encontrar mas de 5 dispositivos aceptables es equivalente a encontrar


5 o menos dispositivos que fallen,
5  
X 10
P(X 5) = 0.632x 0.36810x
x=0
x

Ahora, si Y es el n
umero de dispositvos que se utilizaron hasta obtener 10 fallas, siendo

q = P (T 10) = 0.632

se tiene que Y BN (10, 0.632).

La probabilidad de encontrar mas de 5 dispositivos aceptables se traduce como


 
X 9
P(Y 15) = 0.632y 0.36810y
y=10
y 1

(b) En el caso binomial se tiene que MX (t) = (1 p + pet )n . Entonces:


0
MX (t) = npet (1 p + pet )n1
00
MX (t) = npet (1 p + pet )n1 + n(n 1)p2 e2t (1 p + pet )n2

0 00
Evaluando en t=0, MX (0) = np y MX (0) = np + n(n 1)p2 , por lo tanto,

E(X) = np
V(X) = np + n(n 1)p2 n2 p2
= np(1 p)

Probabilidad y Estadstica 51
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

p
r
Para el caso Binomial Negativo, MX (t) = 1(1p)e t .

Luego,
 r
p
1(1p)et
0
MX (t) = r(1 p)et
1 + (p 1)et
 r
p
1(1p)et
00
MX (t) = r(1 p)(et r(p 1) 1)et
(1 + (p 1)et )2

0 r(1p) 00
Evaluando en t=0, MX (t) = p
) y MX (t) = r(r(p 1) 1) 1p
p2
). Por lo tanto:

r(1 p)
E(X) =
p
1p r2 (1 p)2
V(X) = r(r(p 1) 1) )
p2 p2
1p
= r
p2

30. Sea la variable aleatoria X Gama(, ), es decir,

1 x
f (x) = x e , x>0
()

a) Determine la f.g.m. de X.

Por definicion de f.g.m



1 x
Z
MX (t) = etx x e dx
0 ()

Que se puede resolver por partes, pero puede que se demore un poco mas de la
cuenta.
La otra opcion es identificar los parametros para completar una distribucion Gama

Probabilidad y Estadstica 52
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

dentro de la integral como sigue:


Z
tx 1 x
MX (t) = e x e dx
()
Z0

= x1 ex+tx dx
0 ()
Z

= x1 e(t)x dx
() 0
Z
( t)
=
x1 e(t)x dx
( t) () 0
Z
( t) 1 (t)x
= x e dx
( t) 0 ()
| {z }
Gama(, t)
| {z }
=1

Por lo tanto,
 

MX (t) = , 6= t
t
b) Determine E(X).

Utilizando la parte (a), calculamos su primera derivada:




d
MX (t) = 1
dt ( t)+1
t=0

=
( 0)+1

E(X) =

c) Determine V(X)

Buscamos la segunda derivada de la f.g.m.:


d2


MX (t) = ( + 1) 1
dt2 ( t)+2
t=0

= ( + 1)
( 0)+2
( + 1)
E(X 2 ) =
2
y con esto,
V(X) = E(X 2 ) E2 (X)
( + 1) 2
= 2
2 V(X) = 2

Probabilidad y Estadstica 53
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

d) Determine la f.g.m. de Y = X, e identifique su distribucion.

Recordando el teorema de clases: Si Y = cX + d, entonces MY (t) = etd MX (ct)

Con esto, haciendo c = y d = 0,

MY (t) = MX (t)
 

=
t
 
1
=
1t

Esta f.g.m. tiene la misma estructura de la f.g.m. de X en la parte (a), con = 1, por
lo tanto, Y Gama(, 1)

Probabilidad y Estadstica 54
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

31. Una partcula de masa m tiene velocidad aleatoria que se distribuye de forma normal, con
velocidad media 0 y desviacion estandar . Encuentre la funcion densidad de la energa
cinetica,
1
E = mV 2
2
Solucion:

Primero obtenemos la funcion distribucion acumulada de Y


 
1 2
P(Y y) = P mV y
2
 
2 y
= P V 2
m
 r 
y
= P |V | 2
m
 r r 
y y
= P 2 V 2
m m
 r  r 
y y
= P V 2 P(V 2
m m
 r 
y
= 2P 0 V 2 (ya que tiene media 0)
m
 p y
0 V 2m
= 2P

r 
y
= 2 2 1 (ya que V / N (0, 1))
m 2

dF x
Ademas sabemos que f (x) = dx
, por lo tanto

dP(Y y)
f (y) =
dy
r  r
y 1 1
= 2 2 2
2 2
y 1/2
m m 2
En resumen, r r 
2 y
f (y) = 2 , y0
my 2 m 2

32. Sea X una variable aleatoria con distribucion normal de parametros y 2 . Sea Y =| X |.
Determine:

Probabilidad y Estadstica 55
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

a) La funcion distribucion acumulada de Y .


b) La funcion densidad de Y .
Solucion:
a) Calculamos la f.d.a por definicion:
F (y) = P(Y y)
= P(| X | y)
= P(y X y)
= P(X y) P(X y)
Como X tiene distribucion normal, es simetrica y P(X y) = 1 P(X y)

Por lo tanto
F (y) = P(X y) (1 P(X y))
= 2P(X y) 1
= 2 FX (y) 1
b)
f (y) = 2 fX (y)
 
2 1 2
= exp 2 (y ) , y0
2 2 2
33. Considere una variable aleatoria Z con funcion distribucion densidad dada por:
 c
z +1
, z , >1, >0;
fZ (z) =
0, e.o.c.

(a) Calcule el valor de c.


(b) Calcule E(Z).
(c) Sea X = ln(Z), calcule fX (x).

Solucion:
(a) Por definicion se tiene que
Z
fZ (z)dz = 1

Z
c
dz = 1
z +1
 
1
c =1
z
1
c = 1

c=

Probabilidad y Estadstica 56
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

(b) Por definicion se tiene que


Z
E(Z) = zfZ (z)dz

Z

= z dz
z +1
Z

= dz
z
 
1
=
( 1)z 1
1
= 0
( 1)1

=
1

(c) Se tiene que X = ln(Z) Z = eX , luego por teorema de cambio de variable se tiene
que
x
x de

fX (x) = fZ (e )
dx

= x(1) |ex |, (x ln())
e
= ex , (x ln())

34. El tiempo T de CPU requerido para realizar un trabajo, elegido aleatoriamente entre los que
llegan a un centro de calculo siguen una distribucion hiperexponencial, dada por:

P (T > t) = aet + (1 a)et , t0

donde 0 a 1, , > 0.

La produccion G se determina por

G(T ) = ln(T )

a) Determine una expresion para la esperanza de la produccion.


b) Determine una expresion para la variablidad de la produccion.
c) Determine la f.g.m. de la variable aleatoria T .

35. Sean Z1 , Z2 , . . . , Zk variables aleatorias independientes tales que siguen una distribucion
N (0, 1). La variable aleatoria

Y = Z12 + Z22 + . . . + Zk2

Probabilidad y Estadstica 57
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

sigue una distribucion 2k donde k representa los grados de libertad de la distribucion Ji-
cuadrado, que tiene funcion densidad dada por

2k/2 (k/2)1 y/2


f (y) = y e , y>0
(k/2)

Para k = 1, demuestre que Y 21 , utilizando que (1/2) =

36. El n
umero de accidentes en una autoruta sigue una distribucion de Poisson cuyo parametro
depende de una variable aleatoria X que mide condiciones climaticas, cuya densidad esta
dada por
3
f (x) = 4 , x1
x
Mas precisamente, Y |X = x P oisson(ax)

(a) Calcule E(Y )


(b) Calcule V(Y )

Solucion

Recordemos que si X P oisson(), entonces E(X) = y V(X) = .

(a) Utilizando esperanza condicional tenemos que


E(Y ) = E(E(Y |X))
pero como E(Y |X = x) = ax E(Y |X) = aX

Luego, se tiene que

E(Y ) = E(E(Y |X))


= E(aX)
= aE(X)
Z
3
=a x 4 dx
x
Z1
3
=a dx
1 x3
 
3 1
=a
2 x2 1
3a
=
2
(b) Ocupando el mismo argumento que en (a), pero ahora bajo varianza condicional se tiene
que
V(Y ) = V(E(Y |X)) + E(V(Y |X))

Probabilidad y Estadstica 58
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

pero como V(Y |X = x) = ax V(Y |X) = aX

Luego tenemos

V(Y ) = V(E(Y |X)) + E(V(Y |X))


= V(aX) + E(aX)
= a2 V(X) + aE(X)

pero V(X) = E(X 2 ) E2 (X), donde


Z Z  
2 2 3 3 3
E(X ) = x 4 dx = dx = =3
1 x 1 x2 x 1

lo que implica que  2


3 3
V(X) = 3 =
2 4
luego, reemplazando se tiene que

3a2 3a
V(Y ) = + a
4 2
3a2 3a2
= +
4 2
9
= a2
4
37. Sea X e Y variables aleatorias independientes con funciones densidades marginales

f (x) = xex , x>0 y f (y) = ey y>0

Sean
X
Z = X + Y, y W =
X +Y
(a) Determine las respectivas densidades marginales de Z y W .
(b) Son Z y W variables aleatorias independientes?

Solucion:

(a) Por independencia se tiene que

fX,Y (x, y) = xe(x+y) , x > 0, y>0

Usando el cambio de variable propuesto


X
Z =X +Y W =
X +Y
X = ZW Y = Z(1 W )

Probabilidad y Estadstica 59
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

Calculamos el Jacobiano
 
(x, y) w z
|J| = = = | z| = z
(z, w) 1 w z

Luego, por el teorema de cambio de variables la funcion de distribucion densidad con-


junta de Z y W es:

fZ,W (z, w) = fX,Y (zw, z(1 w))|J|


= (zw)ez |z|
= z 2 ez w, z > 0, 0 < w < 1

Para obtener las marginales de Z y W procedemos de la siguiente manera:


Z 1
2 z
fZ (z) = z e wdw
0
z2
= ez , z>0
2

Z
fW (w) = w z 2 ez dz
0
= w(3)
= 2w, 0 < w < 1

(b) Como el producto de las marginales

z 2 z
fZ (z)fW (w) = e 2w
2
= z 2 ez w
= fZ,W (z, w)

es igual a la conjunta, se tiene entonces que Z y W son variables aleatorias independi-


entes.

38. Sea X1 , X2 , . . . , Xn una muestra aleatoria con funcion densidad f , es decir,


iid
Xi f (x), i = 1, . . . , n

Determine la densidad de X(1) = mn{X1 , . . . Xn }


Solucion:

Calculamos primero FX(1) (x)

Probabilidad y Estadstica 60
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

FX(1) (x) = P(X(1) x)

= 1 P(X(1) > x)

= 1 P(X1 > x, X2 > x, . . . , Xn > x)

= 1 P(X1 > x)P(X2 > x) P(Xn > x) (por independencia de las v.a.)

= 1 (1 P(X1 x))(1 P(X2 x)) (1 P(Xn x))


n
Y
= 1 (1 P(Xi x))
i=1
 n
= 1 1 FX (x) (ya que todas tienen la misma distribucion)

Por lo tanto, la funcion densidad de X(1) es

dFX(1) (x)
fX( 1) (x) =
dx
n1 d(1 F (x))
= 0 n[1 FX (x)
dx
n1
= n[1 FX (x) f (x)
n1
= n[1 FX (x) f (x)

39. Sea (X, Y ) un vector aleatorio con funcion de densidad conjunta

fX,Y (x, y) = c|y|ex , 0 x ; x y x

(a) Encuentre la densidad marginal de X en termino de la constante c. Demuestre que c =


1/2.
(b) Encuentre la densidad marginal de Y y obtenga E(Y ).
(c) Encuentre la densidad condicional de Y dado X = 1.

Solucion:

Probabilidad y Estadstica 61
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

(a) La densidad marginal de X se obtiene de la siguiente manera


Z x
fX (x) = c |y|ex dy, x > 0
x
Z x
x
= ce 2 ydy, x > 0
0
 x
x
= ce y2 , x > 0
0
2 x
= cx e , x>0

Para demostrar que c = 1/2, por comparacion con la densidad de Gamma(3,1) y por
definicion de (3) se deduce c = 1/2.
(b) La densidad de Y se obtiene de la siguiente manera
Z
1
fY (y) = |y| ex dx
2 |y|
1
= |y|e|y| , < y <
2
Luego, por simetra de la densidad se tiene que E(Y ) = 0.
(c)

fX,Y (x, y)
fY |X (y|x) =
fX (x)
|y|ex
= 2 x , x y x
xe
fY |X (y|1) = |y|, 1 y 1

40. Dada una variable aleatoria bidimensional (X, Y ) , con funcion densidad conjunta

f (x, y) = k (cos(x) + cos(y)) I[0, 2 ][0, 2 ] (x, y)

a) Determine k.
b) Encuentre la marginal de Y
c) Determine la distribucion condicional de X | Y = y
d) Son X e Y independientes?

41. Un grupo de empresas destina sus beneficios a una inversion y a pago de dividendos entre
accionistas. Sean X e Y variables aleatorias que representan porcentajes destinado a nuevas
inversiones y a pagos de dividendos respectivamente, con funcion densidad conjunta:

f (x, y) = k, 0 < x < 1, 0<y<x

a) Determinar la constante k, para que sea funcion desidad conjunta.

Probabilidad y Estadstica 62
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

b) Determinar las funciones densidad marginales.


c) Verificar si X e Y son independientes.
d) Supongamos que el porcentaje dedicado a dividendos sea de 45%. Cual sera la proba-
bilidad de que el porcentaje para nuevas inversiones sea superior al 50%?

Solucion:
a) Sean
X: porcentaje destinado a nuevas inversiones
Y: porcentaje destinado a pago de dividendos.

Para que sea funcion distribucion debe cumplirse que


Z Z
fXY (x, y)dydx = 1

El area de integracion es el area en gris


Entonces
Z 1Z x
1= k dy dx
0 0
Z 1 x

=k y dx
0
Z 1 0
=k x dx
0
1
x2
=k
2 0
k
=
2
Por lo tanto, k = 2 y f (x, y) = 2, 0 < y < x < 1.
b) Calculamos las distribuciones marginales a partir de la distribucion conjunta antes de-
terminada Z x
f (x) = 2 dy = 2x, 0 x 1
0
y Z 1
f (y) = 2 dx = 2(1 y), 0y1
y

c) Para verificar independencia se debe cumplir que

fXY (x, y) = fX (x)fY (y)

En este caso
fX (x)fY (y) = 2x 2(1 y) 6= 2
Por lo tanto, X e Y no son independientes.

Probabilidad y Estadstica 63
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

d) Debemos determinar fX|Y (x)

Por definicion
fXY (x, y)
fX|Y (x) =
fY (y)
2
=
2(1 y)
1
= , 0 x 1, 0 y x.
1y

As, con fX|Y =0.45 = 1/(1 0.45)


Z 1
1
P (X 0.5|Y = 0.45) = dx
0.5 1 0.45
1
20
= x
11 0.5
20 1
=
11 2
10
=
11
= 0.91

42. Una compa na que ofrece servicios telefonicos transoceanicos cree que los factores clave del
costo variable de una llamada son X, n umero de segundos que tarda el sistema en ingresar
la llamada e Y , numero de minutos que tarda una operadora en ingresar una llamada. La
estructura de las probabilidades puede representarse por medio de la siguiente densidad
conjunta:
f (x, y) = 0.0625 xe0.5yx/y , 0 < x < , 0 < y <

a) Encuentre la funcioRn de densidad de Y .



Puede asumir que 0 xekx = 1/k 2

Soluci
on:

Z
f (y) = 0.0625 x e0.5yx/y dx
0
Z
0.5y
= 0.0625 e x ex/y dx
0
= 0.0625 e0.5y y 2 ;y > 0

Probabilidad y Estadstica 64
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

b) Encuentre la densidad condicionada de X dado que Y = y.

Soluci
on:

f (x, y)
f (y) =
f (y)
0.0625 x e0.5yx/y
=
0.0625 e0.5y y 2
x ex/y
= ;x > 0 ;y > 0
y2

c) (8 ptos) Calcule la probabilidad de que dado que la operadora se demora 5 minutos


en ingresar la llamada, el sistema la ingrese en menos de 2 minutos.

Soluci
on:

Sea Y=5

2
x ex/y
Z
P (X < 2/Y = 5) = dx ;y = 5
0 y2
Z 2
1
= xex/5 dx
25 0

Integrando por partes con los cambios de variable se tiene:


x=u dv = ex/5 dx
dx = du v = 5ex/5

 2 Z 2 
1 x/5
x/5
= xe 5 + 5 xe dx
25 0 0
 
1 2/5 2/5 0
= 10e + 5 5e + 5 5e
25
 
1 2/5
= 35e + 25
25
 
1 2/5
= 7e +5
5

d) (8 ptos) En la practica, deberan ser independientes X e Y ?, lo son en esta densidad


conjunta?

Probabilidad y Estadstica 65
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

Soluci
on:

Para comprobar independencia se tiene que cumplir que f (x) f (y) = f (x, y)
En este caso no son independientes ya que es claro que el termino ex/y no es posible
descomponerlo como un producto entre funciones de x y de y.
e) (8 ptos) Calcule la distribucion de Z = eY .
Soluci
on:

Z = eY ln(Z) = Y 1
Z
=Y0

f (z) = fy (ln(z)) 1/z


= 0.0625 [ln(z)]2 e0.5ln(z) 1/z
0.5 )
= 0.0625 [ln(z)]2 eln(z 1/z ;z > 0

1
= f (z) = 0.0625 [ln(z)]2 ; z>0
z 3/2
43. Dos lneas de produccion manufacturan cierto tipo de artculos. Suponga que la capacidad
(en cualquier da dado) es dos artculos para la lnea I y 3 para la lnea II. Con base en la
tabla adjunta que muestra la distribucion de probabilidades conjunta:

X=I Y=II 0 1 2 3
0 0 0.04 0.12 0.09
1 0.02 0.14 0.21 0.14
2 0.07 0.06 0.06 0.05

(a) Obtener las funciones marginales de X e Y .


(b) Calcule P(1 <X 2, 0 <Y< 2).

Solucion:
P
(a) Recordemos que P(X = x) = y P(X = x, Y = y), por lo tanto

P(X = 0) = 0 + 0.04 + 0.12 + 0.09 = 0.25


P(X = 1) = 0.02 + 0.14 + 0.21 + 0.14 = 0.51
P(X = 2) = 0.07 + 0.06 + 0.06 + 0.05 = 0.24

As, la distribucion marginal de X esta dada por


x 0 1 2
P(X = x) 0.25 0.51 0.24

Probabilidad y Estadstica 66
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

Analogamente para Y

P(Y = 0) = 0 + 0.02 + 0.07 = 0.09


P(Y = 1) = 0.04 + 0.14 + 0.06 = 0.24
P(Y = 2) = 0.12 + 0.21 + 0.06 = 0.39
P(Y = 3) = 0.09 + 0.14 + 0.05 = 0.28

Por lo tanto,
y 0 1 2 3
P(Y = y) 0.09 0.24 0.39 0.28
(b)

P(1 < X 2, 0 < Y < 2) = P(X = 2, Y = 1)


= 0.06

44. El ministerio de economa estudia conjuntamente las tasas de crecimiento de las exportaciones
(X, en porcentajes) y del PIB (Y , en porcentajes). El servicio de estudios del ministerio ha
investigado el comportamiento de probabilstico de ambas variables, que viene dada por la
funcion densidad conjunta siguiente:

fXY (x, y) = k x y, , 5 < x < 20, 2<y<6

(a) Obtener el valor de k


(b) Obtener la probabilidad que las exportaciones crezcan por encima del 8%.
(c) Obtener el crecimiento esperado de las exportaciones.

Solucion:
RR
(a) Recordemos que fXY dxdy = 1

Entonces
20 6 20
6
y 2
Z Z Z
k x y dy dx = k x dx
5 2 5 2
Z 202
36 4
=k x dx
2 5
20
x2
= 16k
2 5
400 25
= 16k
2
= 3000k = 1

Por lo tanto, k = 1/3000

Probabilidad y Estadstica 67
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

(b) Debemos encontrar la distribucion marginal de X.


Z
fX (x) = k x y dy
y
Z 6
=kx y dy
2
2 6

y
=kx
2 2
36 4
=kx
2
16x
= , 5 < x < 20
3000
Con esto
Z 20
16x
P(X > 8) = dx
8 3000
20
16 x2
=
3000 2 8
16 400 64
=
3000 2
= 0.896

(c) Calculamos el valor esperado de X


Z 20
16x
E(X) = x dx
5 3000
20
16 x3
=
3000 3 5
16 203 53
=
3000 3
= 14

Por lo tanto, en promedio, el crecimiento de las exportaciones es de un 14%.

45. Considere una placa rectangular, cuyo largo (X) y ancho (Y) son variables aleatorias con
funcion de densidad conjunta:

k(x + y), 0 < x < 1 0 < y < 2;
f (x, y) =
0, e.o.c.

(a) Determine k para que f sea funcion densidad.


(b) Son el largo y el ancho variables aleatorias independientes? Justifique.
(c) Calcule la probabilidad de que el largo de la placa no exceda la mitad de su ancho.

Probabilidad y Estadstica 68
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

Solucion:
(a) Sabemos que Z Z
f (x, y) dx dy = 1
Entonces

Z 1 Z 2
1 = k(x + y) dy dx
0 0

1
2
y 2
Z
= k (xy + ) dx
0 2 0
Z 1
= k (2x + 2) dx
0
1
2
= k(x + 2x)
0

= k(1 + 2)
Por lo tanto k = 1/3.
(b) Las distribuciones marginales son:
Z 2
1
f (x) = (x + y) dy
0 3
2
1 y 2
= (xy + )
3 2 0

1 22
= (2x + )
3 2
2
= (x + 1), 0<x<1
3

Z 1
1
f (y) = (x + y) dx
0 3
1
1 x2
= (xy + )
3 2 0
1 1
= (y + )
3 2
y 1
= + , 0<y<2
3 6

Probabilidad y Estadstica 69
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

(c) Nos piden calcular P(X Y /2) que graficamente es


Por lo tanto,
Z 2 Z y/2
1
P(X Y /2) = (x + y) dx dy
0 0 3
2 y/2
x2
Z 
1
= + xy dy
3 0 2 0

1 2 y2 y2
Z  
= + dy
3 0 8 2
 2
1 y 3 y 3

= +
3 24 6 0

1 23 23
 
= +
3 24 6
5
=
9

Probabilidad y Estadstica 70
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

3 Inferencia Estadstica
1. Sea X1 , . . . , Xn una muestra aleatoria de la distribucion Pareto, con funcion densidad dada
por
fX (x) = x(+1) , x , 1.
Asuma que es conocido y encuentre el EMV de .

Solucion:

Siguiendo los pasos vistos en clases:

n
Y
L(x, ) = f (xi )
i=1
n
(+1)
Y
= xi
i=1
n
Y (+1)
n n
= xi
i=1

As, la log-verosimilitud queda


n
X
logL(x, ) = nlog + nlog ( + 1) logxi
i=1
n
n X
logL = + nlog logxi = 0
i=1 =b
n
b = Pn
i=1 logxi nlog

2. Sea X1 y X2 una muestra aleatoria de tama no 2 proveniente de una poblacion X con media
2
y varianza . Si disponemos de dos estimadores para ,
X1 + X2 X1 + 2X2

b1 = y
b2 =
2 3

Cual de los dos es el mejor?

Solucion:

Probabilidad y Estadstica 71
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

Calculemos el sesgo de los dos estimadores


 
X1 + X2
E(b
1 ) = E
2
1
= ( + )
2
=

 
X1 + 2X2
E(b
2 ) = E
3
1
= ( + 2)
3
=

Como los dos son insesgados, calculemos sus varianzas


 
X1 + X2
V(b1 ) = V
2
1 2
= ( + 2 )
4
1
= 2
2

 
X1 + 2X2
V(b
2 ) = V
3
1 2
= ( + 4 2 )
9
5
= 2
9

Dado que
b1 tiene menor varianza que
b2 , entonces
b1 es mejor estimador que
b2 .

3. Sea X una variable aleatoria con densidad


3 2 x
f (x) = xe , x>0
2
donde > 0 es desconocido.

a) Muestre que = 2/X es un estimador insesgado para


b) Encuentre la varianza de
c) Encuentre la Informacion de Fisher para el parametro .

Probabilidad y Estadstica 72
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

d) Alcanza el estimador la cota de Cramer- Rao?

Solucion:

a) Para mostrar que es insesgado debe cumplirse que E() = , por lo tanto
 
2
E() = E
X
Z
2 3 2 x
= xe dx
0 x2
Z
= 3 xex dx
0


2 21 x
Z
= (2) x e dx
0 (2)
= 1

Por lo tanto es insesgado para .


b) Para calcular la varianza, recordemos que

V(X) = E(X 2 ) E2 (X)

Entonces solo nos falta calcular E(2 )


 
2 4
E( ) = E
X2
Z
4 3 2 x
= xe dx
0 x2 2
Z
= 23 ex dx
0

1 x
= 23 e

= 22

y con esto
V() = 22 2 = 2
c) Sabemos que la Informacion de Fisher esta dada por
 2 
d logL(x, )
I() = E
d2

Probabilidad y Estadstica 73
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

En este caso, como solo contamos con una observacion, L(x, ) = f (x), por lo tanto
3 2 x
L(x, ) = xe
2
log(L) = 3 log() log(2) 2 log(x) x

d log(L) 3
= x
d
d2 log(L) 3
2
= 2
d
Por lo tanto
3 3
I() = E( 2
)= 2

1
d) Un estimador insesgado alcanza la cota si V() = I (). En este caso
2
V() = 2 > = I1 ()
3
por lo tanto, no alcanza la cota de Cramer- Rao.
4. Considere una muestra aleatoria X1 , . . . , Xn con funcion distribucion densidad dada por:
1 x


x exp{ }, x 0, >0, >0, conocido;


f (x) =


0, e.o.c.

(a) Demuestre la distribucion de Y = X es exponencial de parametro 1/. (Y exp(1/))


(b) Calcule el EMV de .
(c) Muestre que es insesgado y calcule su varianza.
(d) Calcule la cota de Cramer-Rao de b y determine si el estimador es eficiente.
Solucion:
(a) Usando teorema de cambio de variable,
dg 1 1
Y = g(X) = X , g 1 (y) = y 1/ |J| = = y 1/1
dy
as,

fY (y) = fX (y 1/ ) |J|
y 1
= (y 1/ )1 exp{ } y 1/1

11/ y 1 1/1
= y exp{ } y

1/ y/
= e

Probabilidad y Estadstica 74
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

Por lo tanto, Y exp(1/).


(b) Para encontrar el EMV:
n
Y 1 xi
L(x, ) = xi exp{ }
i=1

 n Y n P
1 xi
= xi exp{ }
i=1

n
X 1X
log L(x, ) = n log n log + ( 1) log xi xi
i=1


d log L n 1 X
= + 2 xi = 0
d =b

Por lo tanto,
n
1X
b = x
n i=1 i

(c) Para mostrar que es insesgado, debe cumplirse que E()


b = . Recordemos que si
Y exp(1/), entonces E(Y ) = y V(Y ) = 2 .

n
b = E( 1
X
E() xi )
n i=1
n
1X
= E(xi )
n i=1
n
1X
=
n i=1
=

Por lo tanto, el estimador encontrado es insesgado.

Probabilidad y Estadstica 75
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

Calculamos su varianza:
n
b = V( 1
X
V() xi )
n i=1
n
1 X
= V(xi )
n2 i=1
n
1 X 2
= 2
n i=1
2
=
n

(d) Calculamos la cota de Cramer- Rao I()1


 2 
d L(x, )
I() = E
d2
 n 
n 2 X
= E 2 3 x
i=1 i
2 X n
= 3 (E(xi ) ) 2

2 X n
= 3 () 2

2 n
= 3 n 2

n
= 2

Por lo tanto, la cota es I()1 = 2 /n, por lo tanto, como la varianza del estimador es
igual a la cota, el estimador es eficiente.
iid
5. (a) Sean X1 , X2 exp(). Determinar la funcion densidad de Y = X1 + X2
(b) Sea Y1 , . . . , Yn una muestra aleatoria con funcion densidad

fY (y) = 2 y ey , y > 0, >0

Determinar un estimador insesgado y eficiente para = 1/. Determinar la cota de


Cramer- Rao para el estimador encontrado.
x
(c) Verifique que Q = e es un pivote, es decir, su distribucion no depende de . Use lo
hecho en la parte anterior.
Solucion:

(a) Sea Y = X1 + X2 y Z = X1 . Con esto, las funciones inversas son X1 = Z y X2 = Y Z,


por lo que
1 0
|J| = =1
1 1

Probabilidad y Estadstica 76
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

Como 0 < X1 < X1 + X2 , entonces 0 < Z < Y


As, la distribucion conjunta de Y, Z queda

fY Z (y, z) = fX1 x2 (z, y z)|J|


= fX2 (z) fX1 (y z)|1| (por independencia de X1 y X2 )
= ez e(yz)
= 2 ey , 0<z<y

Por lo tanto, la funcion densidad marginal de Y es


Z y
fY (y) = 2 ey dz
0
y
= 2 ey z

0
= 2 yey , y>0

Es decir, Y Gamma(2, )
(b) Por maxima verosimilitud, determinemos un EMV para .

n
Y
L(y, ) = 2 yi eyi /
i=1
n
Y 
P
2n
= (yi )e yi / log
i=1

X X d
log(L) = 2n log() + log(yi ) yi /
d

d log(L) 2n 1 X
= + 2 yi = 0
d =b

Por lo tanto,
n
1 X

b= yi
2n i=1
Para comprobar que sea insesgado, recordemos que si Y Gamma(2, ) entonces,
E(Y ) = 2/ y V(Y ) = 2/2

Probabilidad y Estadstica 77
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

1 X
E(b
) = E( yi )
2n
1 X
= E(yi )
2n
1 X
= 2/
2n
1 X
= 2
2n
1
= n 2
2n
=

Por lo tanto,
b es insesgado.

Calculemos su varianza y comparemosla con la cota de Cramer-Rao.

1 X
V(b
) = V( yi )
2n
1 X
= V(yi )
4n2
1 X
= 2/2
4n2
1 X 2
= 2
4n2
1
= n 22
4n2
2
=
2n

La cota esta dada por I()1 donde

d2 L
I() = E( 2 )
d
2n 2 X
= E( 2 3 yi )

2 X 2n
= 3 E(yi ) 2

2 2n
= 3 2n 2

4n 2n
= 2 2

2n
= 2

Probabilidad y Estadstica 78
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

Entonces
2
I()1 = = V(b )
2n
Por lo tanto, el estimador alcanza la cota, por lo que es eficiente.
6. Sea X1 , . . . , Xn una muestra aleatoria de la distribucion Rayleigh, es decir,
x2
 
x
f (x) = 2 exp 2 , x > 0, > 0.
2
(a) Determine el estimador de maxima verosimilitud de 2 , b2 .
(b) Determine si b2 es insesgado
(c) Calcule la varianza de b2 .
(d) Determine si b2 es consistente en error cuadratico medio.
Hint: Si X Raileigh(), entonces X 2 exp(22 )

Solucion:
(a) Planteamos la funcion de verosimilitud para resolverla en funcion de b2 .

n
x2
 
Y xi
2
L(x, ) = exp i2
i=1
2 2
 P 2
Y 1 xi
= (xi ) 2n exp
22
P 2
X xi
log L = log(xi ) 2n log()
22
P 2
d log L 2n x
= + 3i =0
d
Por lo tanto
1 X 2
b2 = xi
2n
(b) Para ver si b2 es insesgado
 X 
b2 1
E( ) = E x2i
2n
1 X
= E(x2i )
2n
1 X 2
= 2
2n
= 2

Probabilidad y Estadstica 79
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

b2 es insesgado
(c) Calculamos su varianza
 
1 X 2
V(b2 ) = V xi
2n
1 X
= V(x2i )
4n2
1 X 4
= 4
4n2
4
=
n

(d) En este caso, ECM()


b = V(),
b ya que es insesgado. Como

4
lim ECM()
b = lim =0
n n n

entonces el estimador encontrado es consistente en error cuadratico medio.

7. En un estudio de mercado se desea analizar la preferencia del consumidor con respecto a dos
marcas de bebidas gaseosas. Se seleccionan al azar 50 personas, se dividen en dos grupos y se
les pide que clasifiquen la bebida que se les asigno mediante una nota (X) en el rango [1,10].
Los encargados del estudio suponen que la evaluacion de las bebidas es distinta, hipotesis
que quieren probar bajo dos criterios:

Criterio 1 La diferencia sera evaluada de acuerdo a la nota promedio que entreguen las
personas seleccionadas.
Criterio 2 La diferencia sera evaluada de acuerdo a la proporcion de personas que evaluo
la bebida con nota mayor a 4.

Los datos del estudio se presentan a continuacion:

n x s x>4
Bebida A 25 6.0 2.41 9
Bebida B 25 3.84 2.01 10

(a) Determine si hay diferencias entre las bebidas seg


un el Criterio 1, con un nivel de
significancia del 5%.
(b) Determine si hay diferencias entre las bebidas seg
un el Criterio 2, con un nivel de
significancia del 5%.
(c) Los investigadores concluiran a favor de su hipotesis solo si los dos criterios concluyen
que hay diferencias. De acuerdo a lo anterior, podemos afirmar que las bebidas obtienen
una evaluacion distinta?

Probabilidad y Estadstica 80
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

Solucion:

(a) Las hipotesis de interes son


H0 : 1 = 2
H1 : 1 6= 2
Pero primero debemos saber si las varianzas poblacionales son iguales o no. Planteamos
las hipotesis:
12
H0 : 22
=1
12
H1 : 22
6= 1
 
s21 2.412
El estadstico de prueba es s22
= 2.012
= 1.437

Los valores crticos son F24,24,0.025 = 0.44 y F24,24,0.975 = 2.269

En esta caso, no podemos rechazar H0 , por lo tanto, no podemos rechazar que las
varianzas poblacionales son iguales con 5% de significancia.
Como no podemos asumir que las varianzas poblacionales son distintas (ya que la evi-
dencia no nos permitio rechazar la igualdad), entonces realizaremos la comparacion de
medias utilizando varianzas poblacionales iguales. Usamos la prueba para diferencia de
medias con varianzas desconocidas pero iguales.

La regla es rechazar H0 si |T0 | > t,1/2 , donde = n1 + n2 2.


Para calcular T0 , primero calculamos s2p

(n1 1)s21 + (n2 1)s22 24 2.412 + 24 2.012


s2p = = = 4.92
n1 + n2 2 25 + 25 2
Entonces
6.0 3.84
T0 = q = 4.867
2
2.219 50
y la region crtica con = 0.05 es

t,1/2 = t25+252,10.025 = t48,0.975 = 2.01

Comparando el valor crtico con el estadstico de prueba vemos que los datos nos entre-
gan evidencia en contra de H0 (rechazamos H0 ), por lo que podemos afirmar con 5%
de significancia que las calificaciones de las bebidas son distintas.
(b) Bajo el segundo criterio, debemos realizar una comparacion de proporciones. Las
hipotesis son
H0 : p1 = p2
H1 : p1 6= p2

Probabilidad y Estadstica 81
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

La regla es rechazar H0 si |z0 | > z1/2

la region de rechazo con = 0.05 esta dada por

z1/2 = z10.025 = z0.975 = 1.96

y el estadstico de prueba
0.36 0.40
z0 = q = 0.291
0.360.64 0.40.6
25
+ 25

En consecuencia, y con una significancia del 5%, no podemos rechazar H0 , es decir, no


podemos afirmar que la cantidad de notas mayores a 4 sea distinta para cada bebida.
(c) Bajo el criterio 1, las bebidas obtienen una evaluacion distinta, mientras que bajo el
criterio 2 no podemos afirmar que la proporcion de notas mayores a 4 sea distinta
dependiendo de la bebida, por lo que para efectos de las hipotesis planteadas en este
estudio, no podemos concluir que las bebidas obtienen una evaluacion distinta.
8. Se toman dos muestras independientes para comparar las medias de dos poblaciones.

Muestra n X s
A 50 57.5 6.2
B 50 54.4 10.6

(a) Se puede concluir que, al nivel del 0.02, la media de la poblacion A ha de ser mayor
que la de B?
(b) Verifique con que valor de (1 )% tales valores de n son aceptables.

Solucion:

(a) Primero, necesitamos saber si las varianzas poblacionales son iguales o distintas. Para
eso, necesitamos testear las hipotesis
H0 : 12 = 22
H1 : 12 =
6 22
con = 0.05. El estadstico para la comparacion de varianzas es F0 = s11 /s22 el cual se
compara con los percentiles /2 y 1 /2 de la distribucion F de Fisher.
(6.2)2
F0 = = 0.34
(10.6)2
Rechazamos H0 si F0 < F( n1 1, n2 1, /2) o F0 > F( n1 1, n2 1, 1 /2), es decir,
basta que se cumpla una de las dos desigualdades para que rechazemos la hipotesis nula.
En este caso

F(49,59,0.01) = 0.52 > 0.34


F(49,59,0.99) = 1.88

Probabilidad y Estadstica 82
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

As, se rechaza H0 y las varianzas poblacionales son distintas.

Ahora testeamos las hipotesis de interes


H0 : A B A B 0
H1 : A > B A B > 0
Rechazamos H0 cuando
(xA xB ) 0
T0 = q 2 t
sA s2B
nA
+ nB

y rechazo H0 si T0 t,1 donde

s2A s2  2
nA
+ nBB
= (s2A /nA )2 (s2 /nB )2
nA 1
+ nBB 1

s2A (6.2)2 s2A (10.6)2


= = 0.768, = = 1.872
nA 50 nA 60
 2 2  2  2 2  2
sA (6.2)2 sA (10.6)2
= = 0.589, = = 3.506
nA 50 nA 60

As,

(0.768 + 1.872)2
=
0.589/49 + 3.506/59
6.969
=
0.0714
= 97.55

Con > 30, ocupamos la aproximacion al percentil normal.


As,

57.5 54.4
T0 =
0.768 + 1.872
= 1.907

El percentil es z1/2 = -2.326, y como T0 > z1/2 , no rechazamos H0 y no podemos


afirmar que la media de A sea mayor a la de B.
(b) Debemos encontrar el mnimo tal que

T0 = z1/2

Probabilidad y Estadstica 83
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

Entonces

P(Z < 1.907) = 0.9717

es decir, con (1 )% 0.9717 aceptamos la hipotesis nula. ( = 0.028)

9. Muchos estudiantes se han quejado de que la maquina vendedora de refrescos A despacha


menos bebidas que la maquina B. Los siguientes son los datos de las muestras:

Maquina A n1 = 10 x1 =4.38 s21 =1.59


Maquina B n1 = 12 x2 =5.92 s22 =0.83

(a) Construya un intervalo de confianza para la diferencia de despacho medio de cada


maquina, asumiendo que 12 = 22 .
(b) Con = 0.05, Respalda la evidencia la hipotesis de que la cantidad media despachada
por la maquina A es menor que la despachada por la maquina B? Asuma que las
varianzas poblacionales son iguales.
(c) Que sucedera con el intervalo de confianza en (a) si aumentamos la confianza con que
lo construimos?
Que sucedera si solo hubieramos tomado dos muestras de tamano 5? Comente
(d) Determine con 95% de confianza si las varianzas poblacionales son efectivamente iguales.

Solucion:

(a) Un IC para la diferencia de medias con 95% de confianza, suponiendo varianzas iguales
esta dado por
 r 
1 1
(A B ) (xA xB ) z1/2 sp +
nA nB

Entonces,

(nA 1)s2A + (nB 1)s2B


s2p =
nA + nB 2
9 1.59 + 11 0.83
=
10 + 12 2
23.44
=
20
= 1.172
sp = 1.082

Probabilidad y Estadstica 84
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

El IC queda
 r 
1 1
(4.38 5.92) z0.975 1.082 +
10 12
 
1.54 1.96 1.082 0.428
 
1.54 0.907
 
1.54 0.907
 
2.447; 0.633

(b) Planteamos las hipotesis de acuerdo a la pregunta


H0 : A B A B 0
H1 : A < B A B < 0
Rechazamos H0 si
x yB
T0 = pA t(nA +nB 2),1
sp 1/nA + 1/nB

Con = 0.05, t(nA +nB 2),1 = t20,0.95 = 1.724

y T0 = 1.54/(1.082 0.428) = 3.324, por lo tanto, rechazamos H0 y se respalda la


evidencia de que la maquina A despacha menos refrescos que la maquina B, con 95%
de confianza.
(c) Al aumentar la confianza, aumenta el ancho del intervalo, ya que cometemos un er-
ror menor en la estimacion. Por otro lado, si dismonuimos los tama nos muestrales,
aumentamos el error de estimacion y el intervalo tambien aumenta su ancho.
(d) Construyamos un IC de 95% para el cuociente entre las varianzas. Este intervalo esta
dado por

B2 B2
22 /12 ( F n 1,n 1,/2 , FnA 1,nB 1,1/2 )
A2 A B
A2
Entonces

22 /12 = 0.83/1.59 = 0.522


y

FnA 1,nB 1,/2 = F9,11,0.025 = 0.255

FnA 1,nB 1,1/2 = F9,11,0.975 = 3.587

Probabilidad y Estadstica 85
Universidad T
ecnica Federico Santa Mara
Departamento de Matematica

Por lo tanto,
22 /12 (1.915 0.255, 1.915 3.587)
Entonces el intervalo es (0.133, 3.587), por lo que concluimos que con 95% de confianza
las varianzas son iguales, ya que el 1 pertenece al intervalo.

Probabilidad y Estadstica 86

You might also like