You are on page 1of 75

PONTIFICIA UNIVERSIDAD CATOLICA

DEL PERU

ESTADISTICA
PARA INGENIERIA

Autor:
Dr. Cristian Bayes

Lima, Marzo 2014

Bayes, C.

ii

Indice general

1. Organizaci
on y resumen de datos

1.1. Conceptos b
asicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.2. Organizaci
on de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.3. Medidas de Tendencia Central

. . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.4. Medidas de Dispersi


on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.5. Medidas de Forma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.6. Graficos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.7. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2. Probabilidad

19

2.1. Conceptos b
asicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2. Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.3. Calculo de probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.4. Conteo de puntos muestrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.5. Probabilidad condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.6. Independencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.7. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3. Variable Aleatoria

35

3.1. Conceptos b
asicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.2. Variable Aleatoria Discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.3. Variable Aleatoria Continua . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.4. Otras propiedades de valor esperado . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.5. Funci
on de una variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
4. Distribuciones de probabilidad

51

4.1. Distribuciones Discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51


4.1.1. Distribuci
on Hipergeometrica . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.1.2. Distribuci
on de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.1.3. Distribuci
on Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.1.4. Distribuci
on Geometrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.1.5. Distribuci
on Binomial Negativa . . . . . . . . . . . . . . . . . . . . . . . . 56
4.1.6. Distribuci
on de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.2. Distribuciones Continuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

iii

INDICE GENERAL

Bayes, C.

4.2.1. Distribuci
on Exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.2.2. Distribuci
on Gama . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.2.3. Distribuci
on Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.2.4. Distribuci
on Beta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.2.5. Distribuci
on Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.2.6. Distribuci
on Log-Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.2.7. Distribuci
on Weibull . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.2.8. Distribuciones de Valor Extremo . . . . . . . . . . . . . . . . . . . . . . . 62
4.2.9. Distribuci
on de Valor Extremo tipo I . . . . . . . . . . . . . . . . . . . . . 63
4.2.10. Distribuci
on de Valor Extremo tipo II . . . . . . . . . . . . . . . . . . . . 63
4.3. Distribuciones Muestrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.3.1. Distribuci
on Chi-cuadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.3.2. Distribuci
on t de Student . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.3.3. Distribuci
on F . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
5. Inferencia Estadstica

67

5.1. Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
Bibliografa

71

iv

Captulo 1

Organizaci
on y resumen de datos
1.1.

Conceptos b
asicos

Estadstica
Es un conjunto de metodos cientficos para la recoleccion, organizacion, analisis e interpretacion
de datos con la finalidad de realizar conclusiones y toma de decisiones validas.
Usualmente se divide en:
Estadstica Descriptiva: El objetivo de la estadstica descriptiva es resumir las principales caractersticas de un conjunto de datos a traves de tablas, graficos y medidas
numericas.
Estadstica Inferencial: Se encarga del analisis de los datos con el proposito de realizar
conclusiones v
alidas acerca de la poblacion de donde originalmente se recolectaron estos
datos. La Estadstica inferencial esta basada en la teora de probabilidades.
Poblaci
on
Es un conjunto de elementos que poseen al menos un atributo en com
un, sobre los cuales se
desea investigar una o m
as caractersticas. El n
umero de elementos que conforman una poblacion
sera denotado por la letra N .
Ejemplo 1.1.
Son ejemplos de poblaci
on:
Las bolsas de cemento producidas en un da por una fabrica.
Los hogares de una regi
on.
Caudal de un ro.
Muestra
Es un subconjunto de la poblaci
on. El n
umero de elementos que conforman una muestra sera denotado por la letra n. Se dir
a que una muestra es aleatoria si sus elementos han sido seleccionados
mediante un procedimiento probabilstico.
Ejemplo 1.2.
Son ejemplos de una muestra:
50 bolsas de cemento seleccionadas de la produccion de un da de una fabrica.
1

Y RESUMEN DE DATOS
CAPITULO 1. ORGANIZACION

Bayes, C.

400 hogares seleccionados de una region.


20 mediciones del volumen anual de un ro.
Variable
Es el resultado de una medici
on o una caracterstica en los elementos de la poblacion. Una
variable suele ser denotada por una letra may
uscula, por ejemplo: X, Y , Z.
Ejemplo 1.3.
Son ejemplos de variable:
X = Peso de una bolsa de cemento de la produccion de un da de una fabrica.
Y = Ingreso mensual de un hogar de una region.
Z = Nivel socioecon
omico de un hogar de una region.
se denominar
a como dato al valor que toma una variable en un elemento de la poblacion. Un
conjunto de n datos de una variable X se suele denotar como x1 , x2 , ..., xn .
Ejemplo 1.4.
Considerando las variables dadas en el Ejemplo 1.3 son ejemplos de datos:
x1 = 42.5, x2 = 42.3, x3 = 42.7, x4 = 42.9, x5 = 41.9, tenemos n = 5 datos
y1 = 5400, y2 = 2300, y3 = 3000, y4 = 4370, tenemos n = 4 datos
z1 = B, z2 = A, z3 = B, z4 = B, z5 = B, z6 = C, tenemos n = 6 datos
Las variables se pueden clasificar en
Variables cuantitativas: Es una variable que toma valores numericos, por lo tanto se
pueden realizar operaciones aritmeticas con ella. Se dividen en
Discretas: son aquellas variables que pueden tomar un n
umero enumerable de valores que puede ser finito
o infinito. Usualmente se consideran n
umeros enteros.
Continuas: son aquellas variables que pueden asumir cualquier valor dentro de un
intervalo de valores, por lo que pueden tomar un n
umero no enumerable de valores.
Variables cualitativas: Es una variable que no toman valores numericos al contrario
son definidas por varias categoras que representan una clasificacion de los elementos de
una poblaci
on. Aun cuando estas categoras puedan ser representadas por n
umeros no es
posible realizar operaciones aritmeticas con ellos. Las variables cualitativas se denominan:
Nominal: cuando no existe ning
un orden entre las categoras.
Ordinal: cuando existe un orden entre las categoras.
Ejemplo 1.5.
Clasifique las variables dadas en el Ejemplo 1.3.

DE DATOS
1.2. ORGANIZACION

Bayes, C.
Par
ametro

Es una medida que describe a una poblacion. Un parametro resume la informacion de una poblacion por lo tanto su valor es u
nico y generalmente es desconocido, usualmente es un valor que
deseamos conocer. Un par
ametro suele ser denotado por una letra griega, por ejemplo: para
la media, 2 para la varianza, para una proporcion, no necesariamente se sigue esta notacion
para el mnimo y el m
aximo se suele usar Mn y Max.
Estadstica
Es una medida que describe a una muestra, se puede definir tambien como una funcion de las
observaciones de la muestra que no depende de ning
un parametro. Seguiremos la siguiente notacion para los siguientes estadsticas: X para la media muestral, S 2 para la variancia muestral,
p para la proporci
on muestral, mn para el valor mnimo y max para el valor maximo de una
muestra.
Estimador
Es una estadstica que es utilizada para estimar el valor de un parametro.
Estimaci
on
Es el valor que se obtiene para un estimador para una muestra dada.
Ejemplo 1.6.
Considerando como poblaci
on los hogares de una cierta region y como variable el ingreso de
estos hogares, podemos definir como parametro = ingreso promedio de un hogar de esta
region, como estimador de este par
ametro podemos utilizar a X la media muestral, que para
los datos del Ejemplo 1.4 nos da la siguiente estimacion X = 3767.5.

1.2.

Organizaci
on de datos

Tabla de frecuencias
Variable cualitativa
Cuando la variable en estudio es cualitativa, una tabla de frecuencias estara constituida por
una lista de las posibles categoras acompa
nadas por el n
umero de veces que ocurre cada una
de ellas. En este caso asumiremos que la variable tiene k categoras diferentes y consideraremos
la siguiente notaci
on
nj : la frecuencia
o n
umero de veces que ocurre la categora j.
fj : la frecuencia relativa de la categora j, calculada como fj = nj /n, siendo n el n
umero
total de datos.
pj : el porcentaje de la categora j, calculado como pj = 100 fj .
Es claro que se cumple que

k
X
j=1

nj = n,

k
X

fj = 1 y

j=1

k
X

pj = 100 %. La informacion contenida

j=1

en la tabla de frecuencias puede ser representada a traves de graficos como:

Y RESUMEN DE DATOS
CAPITULO 1. ORGANIZACION

Bayes, C.

Gr
afico de barras: a cada categora se la representa por una barra cuya altura es proporcional a la frecuencia con que ocurre. En este tipo de graficos se suele dejar un espacio entre
las barras para indicar que se esta presentando informacion de una variable cualitativa.
Gr
afico de sectores circulares: a cada categora se la representa por un sector del crculo
proporcional a la frecuencia con que ocurre.
Ejemplo 1.7.
Durante un mes se monitoreo el estado de la calidad del aire en una ciudad, estos fueron los
resultados:
Bueno

Moderado

Bueno

Malo

Moderado

Malo

Malo

Moderado

Malo

Malo

Malo

Moderado

Moderado

Moderado

Moderado

Malo

Muy Malo

Malo

Moderado

Moderado

Malo

Moderado

Moderado

Malo

Malo

Moderado

Moderado

Bueno

Moderado

Malo

La variable estado de la calidad del aire tiene las siguiente categoras: Bueno, Moderado, Malo
y Muy Malo. Una vez que hemos identificado las categoras pasamos a construir la tabla de
frecuencias:
j

Categoras

Frecuencia

Frecuencia relativa

Porcentaje

nj

fj

pj

Bueno

0.10

10

Moderado

14

0.47

47

Malo

12

0.40

40

Muy Malo

0.03

Total

30

1.00

100

La informaci
on contenida en esta tabla se presenta en forma grafica en la Figura 1.1.
Variable cuantitativa discreta
Cuando la variable en estudio es cuantitativa discreta, una tabla de frecuencias estara constituida por una lista de las posibles valores que puede tomar la variable acompa
nadas por el
n
umero de veces que ocurre cada uno de estos valores. En este caso asumiremos que la variable
X tiene k valores distintos x1 , ..., xk y consideraremos la siguiente notacion
nj : la frecuencia
o n
umero de veces que ocurre el valor xj .
fj : la frecuencia relativa del valor xj , calculada como fj = nj /n, siendo n el n
umero total
de datos.
pj : el porcentaje del valor xj , calculado como pj = 100 fj .
Esta tabla de frecuencias suele ser resumida a traves de:
Gr
afico de bastones: a cada valor posible xj se la representa por una lnea vertical cuya
altura es proporcional a la frecuencia con que ocurre.
4

DE DATOS
1.2. ORGANIZACION

0.4

Bayes, C.

0.3

Moderado
47%

Bueno
10%

0.1

0.2

Muy Malo
3%

0.0

Malo
40%

Bueno

Moderado

Malo

Muy Malo

Figura 1.1: Gr
afico de Barras y de Sectores circulares

Ejemplo 1.8.
En un cierto distrito durante un mes se registro el n
umero de accidentes de transito por da,
estos fueron los resultados:
1

La variable n
umero de accidentes de transito por da en un distrito puede tomar los siguientes
valores: 0, 1, 2, 3 y 4. A continuaci
on presentamos la tabla de frecuencias para este conjunto de
datos
N
umero de

Frecuencia

Frecuencia relativa

Porcentaje

accidentes

nj

fj

pj

0.27

27

11

0.37

37

0.23

23

0.07

0.07

Total

30

1.00

100

La informaci
on contenida en esta tabla se presenta en forma grafica en la Figura 1.2.
Variable cuantitativa continua
Cuando la variable en estudio es cuantitativa continua, para construir una tabla de frecuencias se
agrupan las observaciones en clases y se consideran las frecuencias en cada clase. Consideraremos
las clases como intervalos de igual amplitud, podemos seguir el siguiente procedimiento:
5

Y RESUMEN DE DATOS
CAPITULO 1. ORGANIZACION

Bayes, C.

0.3

0.2

0.1

Frecuencia relativa

0.0

2
Nmero de accidentes

Figura 1.2: Grafico de bastones

Establecer el n
umero de clases k, usualmente se consideran entre 5 y 10 intervalos, esta es una decisi
on subjetiva se puede escoger cualquier valor que consideremos permita
representar adecuadamente a los datos. Una sugerencia es seguir la regla de Sturges:
k = 1 + 3.3log10 (n).
Determinar la amplitud de los datos, A = max mn.
Determinar el tama
no de la clase, c =
decimales que tengan los datos.

A
. Se debe redondear por exceso al n
umero de
k

Usar c para construir los intervalos de cada clase, en este caso se considera que los intervalos
son cerrados por la izquierda y abiertos por la derecha, con excepcion del u
ltimo que es
cerrado en ambos lados.
Construir la tabla, calculando la frecuencia de cada clase.
Usualmente se considera la siguiente notacion
xj : marca de clase, el punto medio del intervalo de clase.
nj : la frecuencia de la clase j.
fj : la frecuencia relativa de la clase j, calculada como fj = nj /n, siendo n el n
umero total
de datos.
pj : el porcentaje de la clase j, calculado como pj = 100 fj .
6

DE DATOS
1.2. ORGANIZACION

Bayes, C.

j
X

Nj : la frecuencia acumulada de la clase j, calculada como Nj =

nh .

h=1

Fj : la frecuencia relativa acumulada de la clase j, calculada como Fj =

j
X

Fh .

h=1

Pj : el porcentaje acumulado de la clase j, calculada como Pj =

j
X

ph .

h=1

Esta tabla de frecuencias suele ser resumida a traves de:


Histograma: a cada clase se la representa por una barra cuya altura es proporcional a
la frecuencia con que ocurre. En este tipo de graficos no se debe dejar espacios entre
las barras para indicar que se esta presentando informacion de una variable cuantitativa
continua.
Polgono de frecuencias: Se unen los puntos medios de cada barra del histograma.
Gr
afico de frecuencias acumuladas: Se utiliza las frecuencias acumuladas y los limites
superiores de cada intervalo de clase para la construccion este grafico.
Ejemplo 1.9.
Se registro el consumo de electricidad en kW h de 50 hogares en un cierto distrito estos fueron
los resultados:
589

493

531

355

469

432

415

468

617

426

300

439

464

430

403

525

478

392

432

459

398

372

488

481

620

484

509

522

488

502

596

567

466

477

580

555

520

525

425

650

384

497

438

501

521

452

508

462

457

577

Considerando la regla de Sturges debemos considerar k = 1 + 3.3log10 (50) = 6.6 7 clases.


Luego, tenemos como valores mnimo 300 kW h y maximo 650 kW h, por la tanto la amplitud
es de A = 650 300 = 350 con lo que obtenemos que el ancho del intervalo de clase es de
c = 350/7 = 50. A partir de estos resultados obtenemos la siguiente tabla de frecuencias para
este conjunto de datos

Clase
j
1
2
3
4
5
6
7

Intervalo
de clase
[300, 350)
[350, 400)
[400, 450)
[450, 500)
[500, 550)
[550, 600)
[600, 650]
Total

Marca
de clase
xj
325
375
425
475
525
575
625

Frecuencia
nj
1
5
9
16
10
6
3
50

Frecuencia
relativa
fj
0.02
0.10
0.18
0.32
0.20
0.12
0.06
1.00

Porcentaje
pj
2
10
18
32
20
12
6
100

Frecuencia
acumulada
Nj
1
6
15
31
41
47
50

Frec. rel.
acumulada
Fj
0.02
0.12
0.30
0.62
0.82
0.94
1.00

Porcentaje
acumulado
Pj
2
12
30
62
82
94
100

Y RESUMEN DE DATOS
CAPITULO 1. ORGANIZACION

Bayes, C.

Se puede observar que las frecuencias, van cambiando a partir del valor 1 en el primer intervalo
hasta alcanzar los valores de 9, 16 y 10 en los intervalos 3, 4 y 5 para luego decrecer en los
intervalos 6 y 7. Esto sugiere que la mayora de los hogares tienen un consumo de electricidad
intermedio entre los intervalos 3, 4 y 5 (de 400 a 550 kW h). Que existen pocos hogares con
consumo de electricidad bajos
o altos. Estos resultados tambien se pueden observar si analizamos
las frecuencias relativas y los porcentajes. Otras posibles interpretaciones que podemos hacer
son: solamente el 1 % de los hogares tienen consumos por debajo de los 350 kW h; el 18 % de los
hogares tienen consumos mayores a los 550 kW h.

1.0

La informaci
on contenida en esta tabla se presenta tambien en forma grafica en la Figura 1.3.

15

0.6

0.4

Frecuencia relativa

10
5

Frecuencia

0.8

0.2

0.0

300

350

400

450

500

550

600

650

300

350

400

Consumo en kWh

450

500

550

600

650

Consumo en kWh

Figura 1.3: Histograma con polgono de frecuencias y grafico de frecuencias acumuladas

1.3.

Medidas de Tendencia Central

En esta secci
on estudiaremos estadsticas que son utilizadas para representar el centro de
un conjunto de datos. Consideraremos a partir de ahora en las definiciones que contamos con
una muestra de tama
no n denotada por x1 , x2 , ..., xn .
Media
La media muestral es la suma de todos los datos dividido por el n
umero de datos. Se suele
denotar por una letra con una barra encima (X). La media muestral estara en las mismas
unidades que los valores de la muestra x1 , x2 , ..., xn .
n
X

X=

i=1

xi
=

x1 + x2 + ... + xn
n

A continuaci
on presentamos algunas caractersticas de la media:
La media es calculada tomando en cuenta todos los valores de la muestra.
La media puede verse fuertemente afectada por la presencia de valores outlier (observaciones que son muy grandes o muy peque
nas con respecto al resto de observaciones).
8

Bayes, C.

1.3. MEDIDAS DE TENDENCIA CENTRAL

Es el valor de b que minimiza

n
X

(xi b)2

i=1

Ejemplo 1.10.
Una forma de evaluar la calidad del aire es medir la cantidad de material particulado menor de 10
micrometros (que pueden tener efectos nocivos en la salud), se tienen las siguientes mediciones
en g/m3 durante 6 das en una ciudad:
39.39 39.12 32.08 29.85 48.25 36.09
La media muestral ser
a
X=

39.39 + 39.12 + 32.08 + 29.85 + 48.25 + 36.09


= 37.46 g/m3
6

Consideremos ahora que el primer valor sea reemplazado por un valor outlier quedando ahora
el conjunto de datos como
89.39 39.12 32.08 29.85 48.25 36.09
ahora tenemos que X = 45.80, observamos que un u
nico valor outlier puede tener un fuerte
impacto en el valor de la media.
En algunas ocasiones se nos presentara el problema en que necesitamos calcular la media
de un conjunto de datos que se presenta como una tabla de frecuencias, en esos calcularemos la
media como
k
X

X=

xj nj

j=1

k
X

xj fj

j=1

donde la variable toma x1 , ..., xk valores distintos; nj es la frecuencia y fj es la frecuencia relativa


del valor xj . Este caso se suele denominar como media ponderada.
Ejemplo 1.11.
Si consideramos los datos del Ejemplo 1.8 tenemos que el n
umero de accidentes promedio por
da es
X=

0 8 + 1 11 + 2 7 + 3 2 + 4 2
= 1.3.
30

Mediana
La mediana es el valor que ocupa la posicion central en los datos ordenados. Si tenemos una
muestra x1 , x2 , ..., xn , para calcular la mediana primero ordenamos los datos como x(1) x(2)
... x(n) , luego la mediana es calculada como

Me =

x( n+1 )

, si n es impar

x( n2 ) + x( n2 +1)
2
9

, si n es par

Y RESUMEN DE DATOS
CAPITULO 1. ORGANIZACION

Bayes, C.

A continuaci
on presentamos algunas caractersticas de la mediana:
El 50 % de los datos es menor a la mediana y el 50 % son mayores.
La mediana es calculada tomando en cuenta solamente los valor(es) central(es).
La mediana no es fuertemente afectada por la presencia de valores outlier
Es el valor de b que minimiza

n
X

|xi b|.

i=1

Ejemplo 1.12.
Considerando los datos del Ejemplo 1.10, calculamos ahora la mediana, primero ordenamos los
datos
29.85 32.08 |36.09{z39.12} 39.39 48.25
Me

como el n
umero de datos n = 6 es par, la mediana sera el promedio de las observaciones centrales
Me =

x(3) + x(4)
36.09 + 39.12
=
= 37.605
2
2

como en el Ejemplo 1.10 consideramos que la observacion 39.39 es reemplazada por 89.39,
ordenamos los datos nuevamente
29.85 32.08 |36.09{z39.12} 48.25 89.39
Me

y calculamos la mediana M e = 37.605, observamos que en este caso la mediana no es influenciada


por el valor outlier.
Moda
Se define la moda como el valor que mas se repite en un conjunto de datos. Utilizaremos como
notacion M o.
Ejemplo 1.13.
Para los datos del Ejemplo 1.7 la moda del estado de la calidad del aire sera Moderado. En el
Ejemplo 1.8 la moda del n
umero de accidentes por dia sera 1. Como ning
un dato se repite en
el Ejemplo 1.10 la moda no existe en este caso.
Cuantiles
El p-esimo cuantil es el valor qp de modo que el 100p % de los valores es menor que este
valor y 100(1 p) % son mayores. Por ejemplo, el cuantil 50 % q0.50 sera la mediana. Una forma
sencilla de calcular los cuantiles es a traves de la siguiente aproximacion

qp =

x(k) + x(k+1)

, si k es entero

, si k no es entero

x(k )

donde k = np y k es el valor de k redondeado por exceso. Como casos particulares tenemos:


10


1.4. MEDIDAS DE DISPERSION

Bayes, C.

Cuartiles: dividen a los datos en 4 partes iguales, se denotan por Q1 , Q2 y Q3 que serian
los cuantiles 0.25, 0.50 y 0.75.
Deciles: dividen a los datos en 10 partes iguales, se denotan por D1 , D2 , .... y D9 que
serian los cuantiles 0.10, 0.20, ... y 0.90.
Percentiles: dividen a los datos en 100 partes iguales, se denotan por P1 , P2 , ... y P99 que
serian los cuantiles 0.01, 0.02, ... y 0.99.
Ejemplo 1.14.
Considerando los datos del Ejemplo 1.10, calculamos ahora los cuantiles q0.25 y q0.75 .
Para q0.25 tenemos que k = 6 0.25 = 1.5, as k = 2 entonces q0.25 = x(2) = 32.08.
Para q0.75 tenemos que k = 6 0.75 = 4.5, as k = 5 entonces q0.75 = x(5) = 39.39.
As tenemos que el 25 % de las observaciones es menor a 32.08 y el 75 % son mayores a este
valor. En forma similar podemos decir que el 75 % de las observaciones es menor a 39.39 y el
25 % son mayores.

1.4.

Medidas de Dispersi
on

Las medidas de dispersi


on representan la variabilidad de los valores de un conjunto de datos.
Variancia
La variancia muestral es definida como
n
X

S2 =

n
X

(xi X)2

i=1

n1

x2i nX 2

i=1

n1

Para ver como la variancia es una medida de variabilidad, consideremos las distancias de cada
observacion a la media xi X, podemos observar que entre mayor sea la variabilidad mayor
sera el el valor de algunas xi X. La variancia considera el promedio de estas distancias al
cuadrado.
Ejemplo 1.15.
Considerando los datos del Ejemplo 1.10, la variancia es dada por

S2 =

(39.392 + 39.122 + 32.082 + 29.852 + 48.252 + 36.092 ) 6 37.462


= 42.33
61

Desviaci
on est
andar
La variancia puede ser difcil de interpretar debido a que esta medida en unidades al cuadrado
de la variable original. Por esta raz
on se suele utilizar la desviacion estandar que es definida
como la raz cuadrada de la varianza

S=

S2

esta medida si estar


a en las mismas unidades que la variable en estudio.
11

Y RESUMEN DE DATOS
CAPITULO 1. ORGANIZACION

Bayes, C.
Ejemplo 1.16.

Considerando los datos del Ejemplo 1.10, la desviacion estandar es dada por
S=

42.33 = 6.51

Coeficiente de Variabilidad
El coeficiente de variabilidad es definido como la razon entre la desviacion estandar y la media,
CV = 100

S
X

como podemos observar es una medida relativa, por lo que no tiene unidades. Una de las principales aplicaciones de esta medida es para comparar conjuntos de datos medidos en diferentes
unidades.
Ejemplo 1.17.
Considerando los datos del Ejemplo 1.10, el coeficiente de variabilidad es dado por
CV = 100

6.51
= 17.37
37.46

Rango
Es la distancia entre el valor mnimo y el maximo
R = x(n) x(1)
Ejemplo 1.18.
Considerando los datos del Ejemplo 1.10, el rango es dado por
R = x(6) x(1) = 48.25 29.85 = 18.4
Rango intercuartlico
Es la distancia entre el primer y tercer cuartil
RIC = Q3 Q1
Entre el primer y tercer cuantil est
an contenidas el 50 % de las observaciones, donde hemos
descartado el 25 % de las observaciones mas grandes y el 25 % de las mas peque
nas. Esta es una
medida alternativa al rango que no es afectada por valores extremos.
Ejemplo 1.19.
Considerando los datos del Ejemplo 1.10 y los resultados del Ejemplo 1.14, el rango intercuartlico es dado por
RIC = 39.39 32.08 = 7.31

1.5.

Medidas de Forma

Las medidas presentadas en esta seccion son consideradas para conjuntos de datos unimodales.
12

Bayes, C.

1.5. MEDIDAS DE FORMA

Asimetra
Un conjunto de datos ser
a simetrico si se distribuyen con igual frecuencia alrededor de un
punto central, en este caso la media, mediana y moda coinciden (X = M e = M o). Se pueden
presentar dos tipos de asimetra:
Asimetra positiva o hacia la derecha: La mayor parte de los observaciones se concentran en valores bajos y pocos en valores altos. En este caso M o < M e < X.
Asimetra negativa o hacia la izquierda: La mayor parte de los observaciones se
concentran en valores altos y pocos en valores bajos. En este caso X < M e < M o.
Estos tipos de asimetria se encuentran ilustrados en la Figura 1.4. El coeficiente de asimetra
de Pearson es dado por
A1 =

X Mo
S

si A1 = 0 los datos son simetricos, si A1 < 0 los datos presentan asimetra negativa o a la
izquierda y si A1 > 0 los datos presentan asimetra positiva o hacia la derecha. Una definicion
alternativa de esta medida es dada por
A2 =

3(X M e)
S

que se basa en la siguiente relaci


on 3(X M e) X M o que se cumple cuando los datos
presentan poca asimetra. Una medida mas exacta de asimetra es dada por
n

3
1X
xi X
n
1 =

i=1

s3

que se interpreta de manera similar al coeficiente de asimetra de Pearson.

asimetra negativa
a la izquierda

Mediana

Moda

Density

Density

Media

asimetra positiva
a la derecha

simetra

Media
Mediana
Moda

Moda

Mediana

Media

Figura 1.4: Asimetra

Curtosis
Es una medida del apuntalamiento de la distribucion de frecuencias de un conjunto de datos
con referencia a la distribuci
on Normal. Se pueden presentar los siguientes tipos de curtosis:
Mesoc
urtica: Tiene el mismo apuntalamiento de la distribucion Normal.
13

Y RESUMEN DE DATOS
CAPITULO 1. ORGANIZACION

Bayes, C.

Leptoc
urtica: Es m
as apuntalada que la distribucion Normal, los datos se concentran en
los valores centrales y pocos en los valores extremos de la variable.
Platic
urtica: Es m
as achatada que la distribucion Normal, los datos se encuentran m
as
dispersos.
Estos tipos de curtosis se encuentran ilustrados en la Figura 1.5. El coeficiente de curtosis de
Pearson es dado por
=

0.5(Q3 Q1 )
D9 D1

si = 0.25 los datos son mesoc


urticos, si > 0.25 los datos son leptoc
urticos y si < 0.25 los
datos son mesoc
urticos. Una medida mas precisa para medir curtosis es dada por
n

1X
(xi x
)4
n
2 =

i=1

s4

en este caso 2 = 0 indica que los datos son mesoc


urticos, 2 > 0 indica que los datos son
leptoc
urticos y 2 < 0 indica que los datos son mesoc
urticos.
Platicrtica

Density

Mesocrtica

Density

Platicrtica

Figura 1.5: Curtosis

Ejemplo 1.20.
Calcule algunas medidas de asimetra y curtosis para los datos del Ejemplo 1.9.

1.6.

Gr
aficos

En esta secci
on presentamos algunos graficos adicionales para el analisis de datos.
Boxplot
Tambien denominado diagrama de cajas y bigotes, es un grafico que permite visualizar la tendencia central, dispersi
on, asimetra y la presencia de valores atpicos u outliers. Esta basado en
5 medidas estadsticas: el mnimo, el primer cuartil, la mediana, el tercer cuartil y el maximo,
a continuaci
on detallamos brevemente como se construye este tipo de grafico (ver Figura 1.6):
14


1.6. GRAFICOS

Bayes, C.
Dibujar una caja con limites el primer y tercer cuartil.
Dibujar una linea central en la posicion de la mediana.

Calcular las siguientes cantidades: LI = Q1 1.5RIC y LS = Q3 + 1.5RIC.


Dibujar los bigotes, una linea desde el Q1 hasta el menor valor de los datos que no sea
menor a LI y una linea desde el Q3 hasta el mayor valor de los datos que no sea mayor a
LS.
Marcar los valores menores a LI y mayores a LS con un , estos seran considerados valores
outlier.
Outlier

Q11.5 RIC

Q3+1.5 RIC

Outlier

Q1

Mediana

Q3
mayor valor antes de Q3+1.5 RIC

menor valor antes de Q11.5 RIC

Figura 1.6: Boxplot

La lnea central (mediana) nos da una medida de tendencia central, el ancho de la caja (rango
intercuartil) nos da una medida de dispersion y la posicion de la lnea central en la caja nos
indica el tipo de asimetra (ver Figura 1.7).

asimetra negativa

simetrica

asimetra positiva

Figura 1.7: Asimetra y Boxplot

Ejemplo 1.21.
Se registro el tiempo de duraci
on en horas de 10 componentes electronicos elegidos al azar
126

130

130

133

136

148

15

148

157

189

199

Y RESUMEN DE DATOS
CAPITULO 1. ORGANIZACION

Bayes, C.

presentaremos estos datos a traves un grafico de boxplot. Primero calculamos las siguientes
medidas
Mnimo: x(1) = 126
Maximo: x(10) = 199
Mediana: M e = 142
Primer cuartil: Q1 = 130
Tercer cuartil: Q3 = 157
Luego, el RIC = 27 con el cual obtenemos LI = 89.5 y LS = 197.5. As tenemos que el bigote
del lado izquierdo ir
a hasta 126 (el primer valor observado mayor a LI) y el bigote del lado
derecho ira hasta 189 (el primer valor observado menor a LS). Finalmente, la observacion 190
sera marcada como un valor outlier. El grafico obtenido se muestra en la Figura 1.8

140

160

180

200

Tiempo de duracin

Figura 1.8: Boxplot para los datos del ejemplo 1.21

Analizando directamente el gr
afico, podemos observar que los datos presentan asimetra positiva
y que existe un valor outlier.
Diagrama de tallos y hojas
Es un gr
afico similar al histograma pero que adicionalmente presenta el valor individual de
cada observaci
on. Para construir este grafico primero se divide cada observacion en dos partes:
el tallo y la hoja, usualmente el tallo seran los primeros dgitos y la hoja el u
ltimo dgito, por
ejemplo para el n
umero 37, 3 ser
a la parte del tallo y 7 la hoja. Luego, se listan los valores
posible para el tallo en forma vertical y se van colocando los valores de las hojas en la parte
derecha.

16


1.6. GRAFICOS

Bayes, C.
Ejemplo 1.22.

Consideremos los siguientes datos correspondientes al tiempo de vida medido en a


nos de un
cierto producto:
2.5

4.4

3.8

4.8

3.5

4.0

3.3

2.9

3.7

1.9

3.4

3.6

4.1

3.4

5.0

4.0

2.8

4.6

3.7

3.9

3.2

3.6

4.2

3.4

3.6

3.4

4.0

4.7

3.5

4.4

2.2

3.7

5.0

4.1

3.5

2.9

4.2

3.3

4.5

3.8

consideraremos como tallo el valor antes del punto decimal y como hoja el valor despues del
punto decimal, el diagrama de tallos y hojas se presenta en la Figura 1.9.
1
2
3
4
5

|
|
|
|
|

9
25899
2334444555666777889
0001122445678
00

Figura 1.9: Diagrama de tallos y hojas para los datos del Ejemplo 1.22

En caso consideremos que que se necesitan mas tallos para representar adecuadamente a los
datos, podemos subdividir cada tallo en 2, marcando con un punto . al tallo que tomara los
valores de hojas 0-4 y con un * al que tomara los valores de hojas de 5-9, este grafico se presenta
en la Figura 1.10.
1*|
2.|
2*|
3.|
3*|
4.|
4*|
5.|

9
2
5899
2334444
555666777889
000112244
5678
00

Figura 1.10: Diagrama de tallos y hojas para los datos del Ejemplo 1.22

El diagrama de tallos y hojas es de f


acil elaboracion y ademas nos permite observar directamente los valores de las observaciones, lo que no se puede hacer con el histograma. Sin embargo,
debemos tener en cuenta que los tallos son determinados por las unidades en que hayan sido
medidas las variables, y no como en el histograma en el que se divide la amplitud de los datos
en una serie de intervalos adecuadamente elegidos.

17

Y RESUMEN DE DATOS
CAPITULO 1. ORGANIZACION

Bayes, C.

1.7.

Ejercicios

1. Clasifique cada una de las siguientes variables e indique un grafico que se puede realizar
con la informaci
on de cada variable.
El tiempo que una persona debe espera en una fila en un banco.
El n
umero de multas en un mes de un distrito.
La temperatura medida en grados centgrados.
El estado civil de una persona.
2. El siguiente Boxplot recoge informacion de las notas de un examen de matematicas de un

10

12

14

16

18

aula de 60 alumnos.

(a) Indique cu
al es el valor de la mediana.
(b) Indique cu
ales son las notas mnima y maxima.
(c) Cu
antos alumnos tuvieron notas entre 14 y 17? (Indicar un n
umero no un porcentaje).
(d) Indique que tipo de asimetra presentan los datos.
3. Considere las siguientes variables obtenidas en 10 ensayos de un robot mecanico al recoger
un objeto
Papel

12.10

11.60

12.50

8.20

11.90

10.00

7.54

7.40

9.10

10.60

Tiza

17.50

16.00

19.00

15.90

15.80

13.60

12.90

14.20

15.40

14.20

(a) Compare los resultados obtenidos en ambas tareas utilizando medidas estadsticas.
(b) Realice un gr
afico de boxplot.

18

Captulo 2

Probabilidad
2.1.

Conceptos b
asicos

Experimento Aleatorio
Es un experimento que tiene las siguientes caractersticas:
No se conoce el resultado del experimento, pero si conocemos los posibles resultados del
experimento.
Es posible repetir el experimento bajo las mismas condiciones.
Cuando el experimento se repite un gran n
umero de veces, aparece un modelo definido de
regularidad
Ejemplo 2.1.
Son ejemplos de experimento aleatorio:
Lanzar una moneda.
Lanzar un dado.
Medir la cantidad de material particulado menor de 10 micrometros en una ciudad.
Medir el estado de la calidad del aire en una ciudad.
El n
umero de accidentes de tr
ansito por da en un distrito.
Tiempo de corrosi
on de una pieza de maquinaria
Espacio Muestral
El espacio muestral es el conjunto de todos los posible resultados de un experimento aleatorio,
utilizaremos la letra como notaci
on.
Ejemplo 2.2.
Para los experimentos aleatorios dados en el Ejemplo 2.1 presentamos sus espacios muestrales
= {cara, sello}
= {1, 2, 3, 4, 5, 6}
= [0, )
19

CAPITULO 2. PROBABILIDAD

Bayes, C.
= {Bueno, Moderado, Malo, Muy Malo}
= {1, 2, 3, 4, ...}
= [0, )
Los espacios muestrales los podemos clasificar como
Espacio muestral finito.
Espacio muestral infinito enumerable.
Espacio muestral infinito no enumerable.
Ejemplo 2.3.
Clasifique los espacios muestrales dados en el Ejemplo 2.2.
Evento

Es cualquier subconjunto del espacio muestral. Se dice que un evento ocurre si alguno de sus elementos es el resultado del esxperimento. Los eventos se suelen denotar por una letra may
uscula.
Ejemplo 2.4.
Si definimos como experimento aleatorio el lanzamiento de un dado, su espacio muestral sera
dado por = {1, 2, 3, 4, 5, 6}, seran ejemplos de eventos:

A = {el resultado es par}


A = {2, 4, 6}

B = {el resultado es menor a 3}


B = {1, 2}
A continuaci
on presentamos algunos tipos de eventos
Evento unitario o elemental si A contiene solamente un elemento de .
Evento compuesto si tienen m
as de un resultado del experimento aleatorio.
es el evento seguro o cierto
es el evento imposible
Se dice que dos eventos A y B son mutuamente excluyentes si no tienen elementos en
com
un, por lo tanto no pueden ocurrir al mismo tiempo, esto es A B = .
Algunas operaciones b
asicas con eventos son
Intersecci
on : A B = {w | w A w B}
Union : A B = {w | w A w B}
20

Bayes, C.

2.2. PROBABILIDAD

Complemento : AC = {w | w
/ A}
Diferencia: A B = {w | w A w
/ B} esto es A B = A B C
Producto Cartesiano: A B = {(w1 , w2 ) | w1 A w2 B}
Tenemos las siguientes propiedades
AA=A
AA=A
AB =BA
AB =BA
A AC =
A AC =
A=A
A=
A=
A=A
C =
C =
(AC )C = A
A (B C) = (A B) (A C)
A (B C) = (A B) (A C)
(A B)C = AC B C
(A B)C = AC B C
Cuando se trabaje con m
as de dos o tres eventos consideraremos la siguiente notacion
A1 A2 ... An =

n
[

Ai

i=1

A1 A2 ... An =

n
\

Ai

i=1

2.2.

Probabilidad

Definici
on Axiom
atica
Sea un experimento aleatorio y su espacio muestral. La probabilidad de cualquier evento
A se denota por P (A) y satisface:
(i) P (A) 0
(ii) P () = 1
21

CAPITULO 2. PROBABILIDAD

Bayes, C.

(iiia) Si A y B son eventos mutuamente excluyentes entonces


P (A B) = P (A) + P (B)
(iiib) Si A1 , A2 , ..., An , ... son eventos mutuamente excluyentes entre s, entonces
P

!
Ai

i=1

P (Ai )

i=1

Propiedades
A partir de los 3 axiomas podemos encontrar las siguientes propiedades

P () = 0
P (AC ) = 1 P (A)
Si A B P (A) P (B)
P (A B) = P (A) P (A B)
P (A B) = P (A) + P (B) P (A B)
P (A B C) = P (A) + P (B) + P (C) P (A B) P (A C) P (B C) + P (A B C)
Sean A1 , A2 , ..., An eventos entonces
P

n
[

!
Ai

i=1

n
X
i=1

X
X
P (Ai )
P (Ai Aj )+
P (Ai Aj Ak )...+(1)n1 P (A1 A2 ...An )
i<j

i<j<k

Como ejercicio, considerando los axiomas pruebe las propiedades presentadas.


Ejemplo 2.5.
Se va realizar un evento durante dos das, se sabe que el primer da puede tener nivel de
contaminaci
on del aire aceptable con probabilidad 0.40, el segundo da puede tener nivel de
contaminaci
on del aire aceptable con probabilidad 0.30. La probabilidad de que los dos das no
se tenga un nivel de contaminaci
on del aire aceptable es 0.35.
(a) Cual es la probabilidad de que al menos uno de los das se tenga un nivel de contaminacion
aceptable?
(b) Cual es la probabilidad de que los dos das se tenga un nivel de contaminacion aceptable?
Soluci
on:

Los eventos son:


A = {El primer da tiene un nivel de contaminacion del aire aceptable}
B = {El segundo da tiene un nivel de contaminacion del aire aceptable}
22


2.3. CALCULO
DE PROBABILIDADES

Bayes, C.

Sabemos que P (A) = 0.40, P (B) = 0.30 y P (AC B C ) = 0.35.


En la parte (a) nos piden P (A B) y en la parte (b) P (A B).
Por la ley de Morgan tenemos que

P (AC B C ) = P (A B)C = 0.35
por lo tanto P (A B) = 0.65
Sabemos que P (A B) = P (A) + P (B) P (A B) de donde podemos encontrar
P (A B) = P (A) + P (B) P (A B) = 0.40 + 0.30 0.65 = 0.05

2.3.

C
alculo de probabilidades

La definici
on axiom
atica de la probabilidad define las propiedades que debe tener una medida de probabilidad. Sin embargo, no nos indica como realizar el calculo de la probabilidad de
alg
un evento. Consideraremos las siguientes formas de asignar o calcular probabilidades.
Cl
asica
Si el espacio muestral es finito y asumimos que todos los resultados del experimento son
igualmente posibles de ocurrir, entonces la probabilidad de un evento A es definida como
P (A) =

n(A)
n()

donde n(A) es el n
umero de elementos de A.
Ejemplo 2.6.
Si consideramos el lanzamiento de un dado, asumiendo que cualquiera de las caras del dado
tienen las mismas posibilidades de ocurrir, calcule la probabilidad de que el resultado del experimento sea un n
umero par.
Soluci
on:
En este caso el espacio muestral sera dado por = {1, 2, 3, 4, 5, 6} y el evento A = {resultado sea par} =
{2, 4, 6} por lo que
P (A) =

n(A)
3
1
= =
n()
6
2

Frecuencia relativa
Si se repite n veces un experimento aleatorio y el evento A ocurre nA veces, entonces la probabilidad de A es definida como
P (A) =

nA
n

Formalmente esta probabilidad debe ser calculada en el lmite esto es P (A) = lm

Ejemplo 2.7.
Se recopilaron datos sobre el n
umero de accidentes en un distrito durante 30 das
23

nA
.
n

CAPITULO 2. PROBABILIDAD

Bayes, C.
N
umero de

Frecuencia

accidentes
0

11

calcule la probabilidad que en un da no haya accidentes de transito en el distrito.


Soluci
on:
Sea el evento A = {en un da no hay accidentes de transito en el distrito} entonces
P (A) =

8
nA
=
= 0.2667
n
30

Subjetiva
Es una probabilidad calculada a partir de una opinion personal acerca de que tan posible es
que un evento ocurra. La probabilidad subjetiva no presenta calculos formales y solamente
representa un opini
on personal basada en experiencias pasadas, informacion o creencias.
Ejemplo 2.8.
La probabilidad que la tasa de crecimiento del pas sea mayor al 6 % es de 0.25.
Geom
etrica
Si el espacio muestral es infinito y y asumimos que todos los resultados del experimento son
igualmente posibles de ocurrir, entonces la probabilidad de un evento A se puede definir como
P (A) =

m(A)
m()

donde m(A) es una medida del evento A.


Ejemplo 2.9.
Si consideramos como experimento aleatorio el tiempo en horas hasta que falle un circuito donde sabemos que su espacio muestral es dado por = [0, 200], asumiendo que cualquiera de los
resultados tienen la misma posibilidad de ocurrir, calcule la probabilidad de que el circuito dure
mas de 150 horas.
Soluci
on:
Sea el evento A = {el circuito dure m
as de 150 horas} = [150, 200] por lo que
P (A) =

2.4.

m(A)
50
=
= 0.25
m()
200

Conteo de puntos muestrales

Regla del producto


Si un primer experimento puede realizarse de n1 formas distintas, el segundo de n2 , ..., hasta
24

Bayes, C.

2.4. CONTEO DE PUNTOS MUESTRALES

el k-esimo que puede realizarse de nk formas distintas. Entonces los k experimentos pueden
realizarse de
n1 n2 . . . nk
formas distintas.
Regla de la adici
on
Sean A y B son dos eventos mutuamente excluyentes, entonces n(A B) = n(A) + n(B).
Adicionalmente, si tenemos 2 eventos A y B cualesquiera tenemos que n(A B) = n(A) +
n(B) n(A B)
Ejemplo 2.10.
Una contrase
na para acceder a un sistema debe tener 5 caracteres los cuales pueden ser letras
(27) o n
umeros (10).
(a) Cuantas contrase
nas diferentes se pueden formar?
(b) Cuantas contrase
nas diferentes se pueden formar de modo que tengan solo n
umeros?
(c) Cuantas contrase
nas diferentes se pueden formar si deben tener por lo menos una letra?
Soluci
on:
(a) 37 37 37 37 37 = 375 = 69, 343, 957
(b) 10 10 10 10 10 = 105 = 100, 000
(c) Por complemento, 375 105 = 69, 243, 957

Permutaci
on
Una permutaci
on es un arreglo de elementos en un orden en particular. Por ejemplo, las permutaciones posibles de los elementos A, B y C seleccionando 2 elementos cada vez son
AB, BA, AC, CA, BC, CB.
El n
umero de permutaciones de n elementos distintos seleccionando r cada vez es dado por:
Prn = n(n 1)...(n r + 1) =

n!
(n r)!

donde n! = 1 2 ... n y por convencion 0! = 1.


Ejemplo 2.11.
8 alumnos se han presentado a una competencia, de cuantas formas distintas se puede asignar
el primer y el segundo lugar?
Soluci
on:
En este caso de 8 elementos distintos estamos seleccionando 2 y el orden interesa, por lo tanto
nos estan preguntando
P28 =

8!
= 7 8 = 56.
(8 2)!
25

CAPITULO 2. PROBABILIDAD

Bayes, C.

Combinaci
on
Una combinaci
on es un arreglo de elementos donde el orden no interesa. Por ejemplo, las combinaciones posibles de los elementos A, B y C seleccionando 2 elementos cada vez son
AB, AC, BC.
El n
umero de combinaciones de n elementos distintos seleccionando r cada vez es dado por:
Crn

!
=

n!
Pn
= r
r!(n r)!
r!

Es facil ver que


n
n

!
=1

Ejemplo 2.12.
Una junta est
a conformada por 5 personas, 2 mujeres y 3 hombres, se va formar una comision
de 3 miembros, calcule
(a) de cuantas formas diferentes se puede conformar la comision.
(b) de cuantas formas diferentes se puede conformar la comision de modo que este conformada
por una mujer y dos hombres.
(c) la probabilidad de que este conformada solamente por hombres.
Soluci
on:

(a) En este caso el espacio muestral estara conformado por


= {formas diferentes en que se puede conformar la comision de 3 miembros de la junta}
como no importa el orden, tenemos que n() sera el n
umero de combinaciones que se puede
formar de 5 elementos seleccionando 3 cada vez
n() = C35 =

5!
= 10
3!(5 3)!

(b) Sea el evento A = {la comisi


on este conformada por una mujer y dos hombres}, en este
caso haremos uso del principio de la multiplicacion, considerando primera la seleccion de
una mujer y luego la selecci
on de los dos hombres que conformaran la comision,
n(A) = C12 C23 =

2!
3!

=13=3
1!(2 1)! 2!(3 2)!

26

Bayes, C.

2.5. PROBABILIDAD CONDICIONAL

(c) Sea el evento B = {la comisi


on este conformada por tres hombres}, en este caso tambien
haremos uso del principio de la multiplicacion,
n(B) = C02 C33 =

2!
3!

=11=1
0!(2 0)! 3!(3 3)!

finalmente la probabilidad pedida es dada por


P (B) =

n(B)
1
= .
n()
10

Permutaci
on con elementos repetidos
Se tienen n elementos, de los cuales n1 son del tipo 1, n2 del tipo 2,..., nk del tipo k, con
n = n1 + n2 + ... + nk . El n
umero de permutaciones distintas considerando los n elementos es
dado por
Pnn1 ,n2 ,...,nk =

n!
n1 !n2 !...nk !

Ejemplo 2.13. Si tenemos tenemos dos fichas rojas y una negra, las permutaciones posibles
serian RRN , RN R y N RR, usando permutacion con elementos repetidos obtenemos
3
P1,2
=

2.5.

3!
= 3.
1!2!

Probabilidad condicional

Sean A y B dos eventos de un mismo espacio muestral . La probabilidad condicional de A


dado que ha ocurrido B est
a dada por
P (A | B) =

P (A B)
P (B)

desde que P (A) > 0. Debemos notar, que en probabilidad condicional, estamos considerando
un espacio muestral restringido a que se conoce que el evento B ha ocurrido. En otras palabras,
el evento B est
a reemplazando al espacio muestral y la probabilidad condicional P (A | B) es
calculada como la probabilidad de A con respecto al nuevo espacio muestral.
Es importante resaltar que la probabilidad condicional tambien es una probabilidad y por lo
tanto, satisface los 3 axiomas de la probabilidad.

Ejemplo 2.14.
Considere como experimento el lanzamiento de un dado, calcule la probabilidad que se obtenga
un n
umero par si se sabe que el resultado fue menor o igual que 3.
Soluci
on:
Definimos los eventos:
A = {resultado es par}
27

CAPITULO 2. PROBABILIDAD

Bayes, C.
B = {resultado es menor o igual a 3}

Debemos calcular la probabilidad A dado que el evento B ha ocurrido esto es


P (A | B) =

P (A B)
1/6
1
=
=
P (B)
1/2
3

B1

Regla del producto


Dados dos eventos A y B en un espacio muestral , la probabilidad de que ambos ocurran esta
dado por:
P (A B) = P (B)P (A | B).
Para 3 eventos A, B y C tenemos que
P (A B C) = P (A)P (B | A)P (C | A B)
De manera similar podemos generalizar cuando se tienen n eventos, A1 , A2 , A3 ,..., An

P (A1 A2 A3 . . .An ) = P (A1 )P (A2 | A1 )P (A3 | A1 A2 ) . . . P (An | A1 A2 A3 . . .An1 )

Ejemplo 2.15.
En un proceso de manufactura consta de dos procesos. La probabilidad que un producto no tenga
fallas luego del primer proceso es de 0.95. Si el producto no tuvo fallas en el primer proceso la
probabilidad que no tenga fallas en el segundo proceso es de 0.97. Calcule la probabilidad que
el producto no tenga fallas en los dos procesos.
Soluci
on:
Definimos los eventos:
A = {el producto no tuvo fallas en el primer proceso}
B = {el producto no tuvo fallas en el segundo proceso}
Sabemos que P (A) = 0.95 y P (B | A) = 0.97,
Debemos calcular
P (A B) = P (A)P (B | A) = 0.95 0.97 = 0.9215
28

Bayes, C.

2.5. PROBABILIDAD CONDICIONAL

Teorema de Probabilidad total


Sea B1 , . . . , Bn una partici
on del espacio muestral , esto es

n
S

Bi = y para todo i 6= j

i=1

Bi Bj = . Sea A otro evento definido sobre entonces:


P (A) =

n
X

P (Bi )P (A | Bi )

i=1

Prueba:
Es facil ver que el evento A es la union de los eventos mutuamente excluyentes A B1 ,
A B2 ,..., A Bn (ver Figura 2.1) por lo tanto

P (A) =

n
X

P (A Bi )

i=1

Luego, aplicando la regla del producto tenemos que P (A Bi ) = P (Bi )P (A | Bi ) con lo


que queda probado el teorema.

Figura 2.1: Probabilidad Total

Ejemplo 2.16.
Si el nivel de contaminaci
on del aire es alto la probabilidad de que un equipo electronico falle
es de 0.05. La probabilidad de que falle si el nivel de contaminacion del aire es bajo es de 0.001.
Ademas se conoce que el 25 % de los das se tiene un alto nivel de contaminacion del aire.
Calcule la probabilidad de que el equipo falle en un cierto da.
Soluci
on:
Definimos los eventos:
B1 = {en un da el nivel de contaminacion del aire es alto}
B2 = {en un da el nivel de contaminacion del aire es bajo}
notemos que los eventos B1 y B2 son una particion del espacio muestral.
Al mismo tiempo ocurre el evento
A = {el equipo electr
onico fall
o}

29

CAPITULO 2. PROBABILIDAD

Bayes, C.

Sabemos que P (B1 ) = 0.25, P (B2 ) = 0.75, P (A | B1 ) = 0.05 y P (A | B2 ) = 0.001.


Debemos calcular P (A), utilizando el teorema de probabilidad total tenemos que
P (A) = P (B1 )P (A | B1 ) + P (B2 )P (A | B2 )
= 0.25 0.05 + 0.75 0.001
= 0.01325
Teorema de Bayes
Sea B1 , . . . , Bn una partici
on del espacio muestral , esto es

n
S

Bi = y para todo i 6= j

i=1

Bi Bj = . Sea A otro evento definido sobre entonces:


P (Bj | A) =

P (Bj )P (A | Bj )
n
P
P (Bi )P (A | Bi )
i=1

Prueba:
Por definici
on de probabilidad condicional tenemos que
P (Bj | A) =

P (A Bj )
P (A)

Por la regla del producto tenemos que P (A Bj ) = P (Bj )P (A | Bj ).


Por el teorema de la probabilidad total P (A) =

n
P

P (Bi )P (A | Bi ).

i=1

Reemplazando estos dos u


ltimos resultados en la definicion P (Bj | A) queda demostrado
el teorema.
Denominaremos a las probabilidades P (B1 ), . . . , P (Bn ) como probabilidad a priori, esto es las
probabilidades de los eventos B1 , . . . , Bn antes de tener ninguna otra informacion. El Teorema
de Bayes nos permite revisar estas probabilidades en base a la informacion que el evento A ha
ocurrido, esto es podemos calcular P (B1 | A), . . . , P (Bn | A) que son denominadas probabilidades a posteriori.
Ejemplo 2.17.
Cuando una m
aquina que produce circuitos esta funcionando correctamente, el 93 % de los
circuitos producidos satisface las especificaciones. Cuando la maquina no funciona correctamente
solamente el 55 % de los circuitos producidos satisfacen las especificaciones. La maquina esta en
buen estado el 92 % del tiempo. Si se selecciona un circuito y este cumple con las especificaciones
cual es la probabilidad de que la m
aquina no haya estado funcionando correctamente? Soluci
on:
Definimos los eventos:
B1 = {la m
aquina funciona correctamente}
B2 = {la m
aquina no funciona correctamente}
notemos que los eventos B1 y B2 son una particion del espacio muestral.
30

Bayes, C.

2.6. INDEPENDENCIA

Al mismo tiempo ocurre el evento


A = {el circuito seleccionado cumple con las especificaciones}
Sabemos que P (B1 ) = 0.92, P (B2 ) = 0.08, P (A | B1 ) = 0.93 y P (A | B2 ) = 0.55.
Debemos calcular P (B2 | A), utilizando el teorema de Bayes tenemos que
P (B2 )P (A | B2 )
P (B1 )P (A | B1 ) + P (B2 )P (A | B2 )
0.08 0.55
=
0.92 0.93 + 0.08 0.55

P (B2 | A) =

= 0.0489
Podemos representar la informacion sobre el problema a traves de un diagrama del arbol,
ver Figura 2.2.

Figura 2.2: Diagrama del arbol

2.6.

Independencia

Dos eventos A y B son independientes si la ocurrencia de uno de ellos no afecta la probabilidad de ocurrencia del otro, esto es:
P (A | B) = P (A) o P (B | A) = P (B).
Por la definici
on de probabilidad condicional obtenemos la siguiente definicion equivalente que
es u
til para verificar la independencia de eventos:
Dos eventos A y B son independientes si y solamente si P (A B) = P (A)P (B).
Propiedad:
Las siguientes situaciones son equivalentes:
Los eventos A y B son independientes.
31

CAPITULO 2. PROBABILIDAD

Bayes, C.
Los eventos A y B C son independientes.
Los eventos AC y B son independientes.
Los eventos AC y B C son independientes.

Si consideramos ahora que tenemos A1 , A2 ,..., An eventos mutuamente independientes (Ai es


independiente de Aj para todo i 6= j), entonces tenemos que
P (A1 A2 . . . An ) = P (A1 )P (A2 ) . . . P (An ).
Ejemplo 2.18.
Se va realizar un evento durante dos das, se sabe que el primer da puede tener nivel de
contaminaci
on del aire aceptable con probabilidad 0.40, el segundo da puede tener nivel de
contaminaci
on del aire aceptable con probabilidad 0.30. Se conoce que el nivel de contaminacion
del aire de un da es independiente del otro.
(a) Cual es la probabilidad de que los dos das se tenga un nivel de contaminacion aceptable?
(b) Cual es la probabilidad de que al menos uno de los das se tenga un nivel de contaminacion
aceptable?
(c) Cual es la probabilidad de que solamente uno de los das se tenga un nivel de contaminacion
aceptable?
(d) Cual es la probabilidad de que los dos das no se tenga un nivel de contaminacion aceptable?
Soluci
on:

Los eventos son:


A = {El primer da tiene un nivel de contaminacion del aire aceptable}
B = {El segundo da tiene un nivel de contaminacion del aire aceptable}
Sabemos que P (A) = 0.40, P (B) = 0.30 y que A y B son independientes. Usando las
propiedades de independencia tenemos que
(a) P (A B) = P (A)(B) = 0.40 0.30 = 0.12
(b) P (A B) = P (A) + (B) P (A B) = 0.40 + 0.30 0.40 0.30 = 0.58
(c) P (A B C ) + P (AC B) = 0.40 0.70 + 0.60 0.30 = 0.46
(d) P (AC B C ) = P (AC )(B C ) = 0.60 0.70 = 0.42

32

Bayes, C.

2.7.

2.7. EJERCICIOS

Ejercicios

1. Un aparato electr
onico consta de dos circuitos A y B. La probabilidad que falle el circuito
A es de 0.25, que fallen los dos circuitos es de 0.18 y que falle al menos uno de los circuitos
es de 0.56. Calcular la probabilidad que:
(a) Falle solamente el circuito B.
(b) Falle el circuito A si se sabe que el circuito B funciona correctamente
2. En una ciudad se publican tres revistas A, B y C. El 25 % de la poblacion lee A, 35 % lee
B y el 25 % lee C. Adem
as, el 10 % lee A y B, el 8 % lee A y C, el 12 % lee B y C, y el
3 % lee las tres revistas. Si se elige una persona aleatoriamente de esta ciudad, calcule la
probabilidad de que:
(a) Lea solamente una revista.
(b) Lea como m
aximo dos revistas.
(c) Lea la revista B si se sabe que lee las revistas A y C.
(d) Lea la revista A si sabe que lee al menos una de las otras dos revistas.
3. El precio de dos productos A y B se distribuye uniformemente entre 10 y 30 soles. Calcular
(a) La probabilidad de que el costo de los dos productos sea mayor a 24 soles.
(b) La probabilidad de que el producto A haya costado mas de 20 soles, si sabe que se
pag
o m
as de 24 soles por los dos productos.
4. En una empresa, produce circuitos en 3 fabricas, el 30 % de los circuitos se produce en la
fabrica 1, el 20 % en la f
abrica 2, y el resto en la fabrica 3. En la fabrica 1 se sabe que el
1 % de los circuitos producidos resultan defectuosos; el 3 % en la fabrica 2; y el 4 % en la
fabrica 3.
a) Cu
al es la probabilidad de producir un circuito defectuoso?.
b) Si un circuito elegido al azar resulta defectuoso, cual es la probabilidad de que se
haya fabricado en la f
abrica 3.
5. Un sistema consta de 10 componentes en serie. Por lo tanto, si cualquier componente
falla todo el sistema tambien fallara. Cualquier componente tiene probabilidad de fallar
de 0.01. Asuma independencia entre los componentes del sistema.
a) Cu
al es la probabilidad de falla del sistema?
b) Si se requiere que la probabilidad que el sistema funcione sea de 0.99 cual debera
ser la probabilidad de falla de cada componente?
6. Una empresa generadora de energa electrica tiene 3 plantas P1 , P2 y P3 que funcionan
de manera independiente las cuales pueden fallar con probabilidad 0.10, 0.09 y 0.12 respectivamente. La empresa es la u
nica que abastece de energa electrica a una ciudad, si
las tres plantas funcionan correctamente la probabilidad que haya un apagon es de 0.02,
33

CAPITULO 2. PROBABILIDAD

Bayes, C.

en caso que una de ellas falle la probabilidad que ocurra un apagon es 0.15, si dos fallan
la probabilidad que ocurra un apagon es 0.40.
(a) Calcule la probabilidad de que ocurra un apagon.
(b) Si no ocurri
o un apag
on, Cu
al es la probabilidad de que haya fallado solo una planta?
7. La probabilidad de que falle el motor de un avion es de 0.08 y cada uno funciona independientemente de los otros. Con cuantos motores debe estar equipado un avion para tener
una probabilidad mayor o igual a 0.999 de que el avion vuele? Suponga que es suficiente
que un motor funcione para que el avion se mantenga en vuelo.
8. Cuatro componentes que funcionan independientemente estan conectados en un sistema
como se muestra en la Figura 2.3. Si la probabilidad de fallar de los componentes C1 , C2 ,
C3 y C4 es de 0.30, 0.20, 0.10 y 0.25 respectivamente. Calcule la probabilidad de falla de
todo el sistema.
C1

C3

C2

C4

Figura 2.3: Figura para el Problema 8

34

Captulo 3

Variable Aleatoria
3.1.

Conceptos b
asicos

Variable Aleatoria
Usualmente cuando se realiza un experimento aleatorio, no siempre se esta interesado en
todos los detalles del resultado de un experimento sino solamente en alguna medida numerica determinada por este resultado. Por ejemplo, si lanzamos dos veces una moneda podemos
no estar interesados en el resultado que puede ser (cara, cara) o (cara, sello) o (sello, cara) o
(sello, sello) sino solamente en el n
umero de caras obtenidas en el experimento. Estas medidas
numericas son denominadas de variables aleatorias.
Formalmente una variable aleatoria es una funcion
X() : R
que asigna a cada punto del espacio muestral en un n
umero real R. El valor que pueda
tomar una variable aleatoria depende del resultado de un experimento, por lo tanto su valor
no es conocido antes que el experimento sea realizado y podemos asignar probabilidades a los
posibles valores que puede tomar. Usualmente se consideran letras may
usculas para denotar
una variable aleatoria, por ejemplo X, y letras min
usculas para denotar un valor particular que
pueda tomar, por ejemplo x. Los posibles valores que puede tomar una variable se denomina
rango, al rango de una variable aleatoria X se le denota como RX .
Ejemplo 3.1.
Se lanza dos veces una moneda y estamos interesados solamente en el n
umero de caras obtenidas
en el experimento. En este caso el espacio muestral esta dado por
= {SS, SC, CS, SS}
donde C denota que obtuvimos un cara y S un sello. Sobre este espacio muestral se define la
variable aleatoria X =n
umero de caras obtenidas en el experimento, s aplicamos X a cada

35

CAPITULO 3. VARIABLE ALEATORIA

Bayes, C.
punto del espacio muestral tenemos

X(SS) = 0
X(SC) = 1
X(CS) = 1
X(CC) = 2
Por lo tanto el rango de X es RX = {0, 1, 2}. Finalmente, podemos calcular probabilidades para
cada posible valor de X
P (X = 0) = P ({SS}) =

1
4

P (X = 1) = P ({SC, CS}) =
P (X = 2) = P ({CC}) =

1
2

1
4

Las variables aleatorias se pueden clasificar en


Discretas: si su rango es finito o infinito enumerable.
Continuas: si su rango es infinito no enumerable.
En la mayora de problemas pr
acticos, las variables aleatorias continuas representan medidas,
tales como alturas, pesos, temperaturas, tiempos de duracion o distancias, mientras que las
variables aleatorias discretas representan datos de conteo, como el n
umero de productos que
cumplen las especificaciones o el n
umero de accidentes en un da en un distrito.

3.2.

Variable Aleatoria Discreta

Una variable aleatoria que puede asumir un n


umero finito de valores o una cantidad enumerable de valores, cuyas probabilidades son conocidas es denominada de variable aleatoria
discreta.
Ejemplo 3.2.
Continuando con el Ejemplo 3.1, tenemos que X=n
umero de caras obtenidas en dos lanzamientos de una moneda es una variable aleatoria discreta. Los posibles valores x de X y sus
probabilidades son
x

P (X = x)

0.25

0.50

0.25

Notemos que los valores x presentados son todos los posibles casos y que las probabilidades
suman 1.

36

Bayes, C.

3.2. VARIABLE ALEATORIA DISCRETA

Funci
on de probabilidad
Sea X una variable aleatoria discreta con rango RX , definiremos f (x) como la funcion de
probabilidad de X por
f (x) = P (X = x)
esta debe cumplir:
f (x) 0, x RX
P

f (x) = 1

xRX

Cualquier funci
on en RX y que cumpla con los dos propiedades es una funcion de probabilidad
para X.

0.3

0.2
0.1

f(x)

0.0

2
x

Figura 3.1: Funci


on de probabilidad de una variable aleatoria discreta

Ejemplo 3.3.
Se tiene un lote de 10 artculos de los cuales 4 son defectuosos. Se van a seleccionar al azar una
muestra de 3 de estos artculos, la variable de interes es X = el n
umero de artculos defectuosos
en la muestra.
(a) Encuentre la funci
on de probabilidad X.
Soluci
on:
El rango de X es RX = {0, 1, 2, 3}.
f (0) = P (X = 0) =

C04 C36
1
=
10
6
C3

f (1) = P (X = 1) =

C14 C26
1
=
10
2
C3
37

CAPITULO 3. VARIABLE ALEATORIA

Bayes, C.

f (2) = P (X = 2) =

3
C24 C16
=
10
10
C3

f (3) = P (X = 3) =

C34 C06
1
=
30
C310

Por lo que la funci


on de probabilidad de X puede ser escrita como
x

f (x)

1
6

1
2

3
10

1
30

En forma equivalente podemos expresar f (x) como


f (x) =

6
Cx4 C3x
, x = 0, 1, 2, 3.
C310

Funci
on de distribuci
on acumulada
La funcion de distribuci
on acumulada de una variable aleatoria discreta X es dada por
F (x) = P (X x) =

f (t), x R

1.0

tx

0.8

0.4

F(x)

0.6

0.0

0.2

Figura 3.2: Funci


on de distribucion acumulada de una variable aleatoria discreta

Ejemplo 3.4.
Continuando con el Ejemplo 3.2, tenemos que la funcion de distribucion acumulada de X es
dada por

38

Bayes, C.

3.2. VARIABLE ALEATORIA DISCRETA

F (x) =

0,

6,

x<0
0x<1

2
3,
29
30 ,

1x<2

1,

x3

2x<3

Valor esperado y varianza


Sea X una variable aleatoria discreta con funcion de probabilidad f (x) y rango de valores
RX , entonces su media o valor esperado es dado:
X

= E(X) =

xf (x)

xRX

El valor esperado de g(X), donde g(.) es cualquier funcion, es dado por


E(g(X)) =

g(x)f (x)

xRX

La varianza de X se define por:


X

2 = V ar(X) = E (X )2 =
(x )2 f (x).
xRX

Usualmente para calcular la varianza se utiliza la siguiente formula



2 = E X 2 E(X)2 .
Ejemplo 3.5.
En el contexto del Ejemplo 3.2.
(a) Calcule el valor esperado y la varianza del n
umero de artculos defectuosos en la muestra.
(b) Si cada artculo se vende a 100 soles y por cada defectuoso se debe devolver 50 soles, calcule
la ganancia esperada por los tres artculos seleccionados.
Soluci
on:

El valor esperado de X es dado por


E(X) =

xf (x)

xRX

=0

1
1
3
1
+1 +2
+3
6
2
10
30

= 1.2

39

CAPITULO 3. VARIABLE ALEATORIA

Bayes, C.

Para calcular la varianza de X primero calculamos


E(X 2 ) =

x2 f (x)

xRX

= 02

1
1
3
1
+ 12 + 22
+ 32
6
2
10
30

=2
por lo tanto

V ar(X) = E X 2 E(X)2 = 2 1.22 = 0.56
Finalmente, la ganancia es dada por g(X) = 300 50X por lo que
E(g(X)) =

g(x)f (x)

xRX

1
3
1
1
+ g(1) + g(2)
+ g(3)
6
2
10
30
1
1
3
1
= 300 + 250 + 200
+ 150
6
2
10
30
= 240
= g(0)

3.3.

Variable Aleatoria Continua

Una variable aleatoria continua puede asumir un n


umero infinito no enumerable de valores,
por lo tanto no es posible asignar probabilidad a cada posible valor como en el caso de una variable aleatoria discreta. En este tipo de variable se calcula probabilidades utilizando la funcion
de densidad de probabilidad.
Funci
on de densidad de probabilidad
Sea X una variable aleatoria continua con rango RX , f (x) es una funcion de densidad
probabilidad de X si cumple:
f (x) 0, x RX
R
f (x)dx = 1
RX

P (a X b) =

Rb

f (x)dx

Notemos que una variable aleatoria continua tiene probabilidad 0 de asumir exactamente un
valor de su rango, esto es
P (X = x) = 0, x RX .

40

3.3. VARIABLE ALEATORIA CONTINUA

f(x)

Bayes, C.

b
x

Figura 3.3: Funci


on de probabilidad de una variable aleatoria continua

Ejemplo 3.6.
Suponga que el error en el llenado de una bebida, en mililitros, es una variable aleatoria continua
X con funci
on de densidad de probabilidad
f (x) = c(4 x2 ), 2 < x < 2
(a) Encuentre el valor de c de modo que f (x) sea una funcion de densidad.
(b) Calcule la probabilidad que el error se encuentre entre 1 y 1
Soluci
on:
Una funci
on de densidad debe cumplir que

f (x)dx = 1, entonces tenemos

RX

Z2

Z
f (x)dx =
RX

c(4 x2 )dx


 2
x3
= c 4x

3

32
= c
3
por lo tanto c =

3
.
32

41

CAPITULO 3. VARIABLE ALEATORIA

Bayes, C.
La probabilidad pedida es dada por

Z1
P (1 x 1) =

3
(4 x2 )dx
32

3
=
32

x3
4x
3

 1


22
=
32
Funci
on de distribuci
on acumulada
La funcion de distribuci
on acumulada de una variable aleatoria continua X es dada por
Zx
F (x) = P (X x) =

f (t)dt, x R

la cual tiene las siguientes propiedades


P (a x b) = F (b) F (a)
F (x) es no decreciente.
F () = 0 y F () = 1.
f (x) =

d
F (x)
dx

Como una variable aleatoria continua tiene probabilidad 0 de asumir exactamente un valor de
su rango, tenemos adem
as que P (a X b) = P (a < X < b) = P (a X < b) = P (a < X
b) = F (b) F (a)
Ejemplo 3.7.
En el contexto del Ejemplo 3.6.
(a) Encuentre la funci
on de distribuci
on acumulada.
(b) Calcule la probabilidad de que el error haya sido menor a 0 si se sabe que fue mayor a -1.
Soluci
on:
La funci
on de distribuci
on acumulada es dada por
Zx

3
(4 t2 )dt
32
2

 x
t3
3
=
4t

32
3

F (x) =

1
= (12x x3 + 16)
32
42

3.3. VARIABLE ALEATORIA CONTINUA

f(x)

Bayes, C.

Figura 3.4: Funci


on de distribucion acumulada de una variable aleatoria continua

La probabilidad pedida es dada por


P (X < 0 | X > 1) =

P (1 < X < 0)
P (X > 1)

F (0) F (1)
1 F (1)

0.5 0.15625
1 0.15625

= 0.4074
Valor esperado y varianza
Sea X una variable aleatoria continua con funcion de probabilidad f (x) y rango de valores
RX , entonces su media o valor esperado es dado:
Z
= E(X) =

xf (x)dx
RX

El valor esperado de g(X), donde g(.) es cualquier funcion, es dado por


Z
E(g(X)) =

g(x)f (x)dx
RX

43

CAPITULO 3. VARIABLE ALEATORIA

Bayes, C.
La varianza de X se define por:
2

= V ar(X) = E (X )

Z
=

(x )2 f (x)dx.

RX

Usualmente para calcular la varianza se utiliza la siguiente formula



2 = E X 2 E(X)2 .
Ejemplo 3.8.
En el contexto del Ejemplo 3.6.
(a) Calcule el valor esperado y la varianza del error de llenado de una bebida.
(b) Si cada mililitro errado genera un costo de 0.05 soles, as sea por exceso o por defecto,
calcule el costo esperado.
Soluci
on:

El valor esperado de X es dado por


Z
E(X) =

xf (x)dx
RX

Z2
=

3
(4 x2 )dx
32

3
=
32


 2
4
x

2x2

4

=0
Para calcular la varianza de X primero calculamos
2

E(X ) =

x2 f (x)dx

RX

3
=
32

4x3 x5

3
5

 2


= 0.8
por lo tanto

V ar(X) = E X 2 E(X)2 = 0.8 02 = 0.8

44

Bayes, C.

3.4. OTRAS PROPIEDADES DE VALOR ESPERADO

Finalmente, el costo es dado por g(X) = 0.05|X| por lo que


Z
E(g(X)) =

g(x)f (x)
RX

Z0

Z2
xf (x) +

=
2

Z0
=

xf (x)
0

3
x (4 x2 )dx +
32

Z2
x

3
(4 x2 )
32


 0

 2
3
x4
x4
3
2
2
=
2x
2x
+

32
4
32
4
2

= 0.75

3.4.

Otras propiedades de valor esperado


E(a) = a.
E(a + bX) = a + bE(X).
V ar(a) = 0.
V ar(a + bX) = b2 V ar(X).
E(aX + bY ) = aE(X) + bE(Y ) para cualesquiera v.a. X e Y .
V ar(aX + bY ) = a2 V ar(X) + b2 V ar(Y ) solamente si las v.a. X e Y son independientes.

Ejemplo 3.9.
La fabricaci
on de una pieza met
alica requiere de dos etapas independientes entre s, sean las
variables aleatorias X = tiempo de fabricacion requerido en la primera etapa e Y = tiempo
de fabricaci
on requerido en la segunda etapa, ambos medidos en minutos. Las funciones de
densidad de X e Y son dadas por
fX (x) = 2

x
1
, 2 < x < 4 y fY (y) = , 1 < y < 3
2
2

Cada minuto de fabricaci


on en la primera etapa por pieza cuesta 3 soles, cada minuto de la
segunda etapa por pieza cuesta 5 soles y ademas los materiales usados cuestan 10 soles por
pieza.
(a) Calcule el costo total esperado en la fabricacion de una pieza metalica.
(b) Calcule la varianza del costo total de fabricacion.

Soluci
on:

45

CAPITULO 3. VARIABLE ALEATORIA

Bayes, C.

Sea C el costo total por la fabricacion de una pieza metalica, entonces tenemos que
C = 3X + 5Y + 10
por lo tanto
E(C) = E(3X + 5Y + 10)
= 3E(X) + 5E(Y ) + 10
8
= 3 + 5 2 + 10
3
= 28
Como X e Y son independientes
V ar(C) = V ar(3X + 5Y + 10)
= 32 V ar(X) + 52 V ar(Y )
2
1
= 32 + 52
9
3
= 10.33

3.5.

Funci
on de una variable

Sea la funci
on Y = g(X) y asumimos que conocemos la funcion de probabilidad de X si es
discreta o la funci
on de densidad si X es continua, denotada por fX (x). Adicionalmente, consideraremos que y = g(x) es una funci
on inyectiva en RX , esto es a cada valor de x le corresponde
un u
nico valor de y.
As tenemos que si X es discreta, la funcion de probabilidad de Y es dada por
fY (y) = fX g 1 (y)

donde g 1 (y) es la funci


on inversa. En el caso que X sea continua, la funcion de densidad de Y
es dada por
fY (y) = fX g



 d 1
(y) g (y) .
dy

Ejemplo 3.10.
La temperatura medida en grados Fahrenheit de un da es una variable aleatoria X cuya funcion
de densidad es dada por
fX (x) =

1
, 50 < x < 86
36

Determine la funci
on de densidad de probabilidad de Y la temperatura medida en grados Celsius. Recuerde que Y = 5(X 32)/9.

46

DE UNA VARIABLE
3.5. FUNCION

Bayes, C.
Soluci
on:

Tenemos que Y = g(X), con g(X) = 5(X 32)/9 que es una funcion inyectiva.
9
La funci
on inversa es g 1 (y) = y + 32, luego
5


 d 1
fY (y) = fX g (y) g (y)

dy




9
9
= fX
y + 32
5
5
1

1
9

36 5
1
=
20
=

Como el rango de X es 50 < x < 86, tenemos que 10 < 5(x 32)/9 < 30 por lo que el
rango de Y es 10 < y < 30. Finalmente, la funcion de densidad de Y es dada por
fY (y) =

1
, 10 < y < 30.
20

47

CAPITULO 3. VARIABLE ALEATORIA

Bayes, C.

3.6.

Ejercicios

1. Considere el siguiente juego que consiste en lanzar tres veces una moneda, por cada cara
la persona que lanz
o la moneda recibe un sol y por cada sello la persona debe pagar un
sol. Se est
a interesado en la posible ganancia resultante de este juego.
(a) Describa el espacio muestral del experimento.
(b) Determine el rango de la ganancia.
(c) Considere que existe la misma posibilidad de obtener un sello o una cara en el lanzamiento de la moneda, asigne probabilidades a cada valor del rango encontrado en
(b).
2. El n
umero de artculos defectuosos por lote de 10 unidades es una variable aleatoria X
cuya funci
on de probabilidad es :
x

P (X = x)

1/16

6/16

4/16

1/16

(a) Calcular el valor de la constante k


(b) Si un lote tiene al menos dos artculos defectuosos, cual es la probabilidad de que
tenga exactamente 3?.
(c) Hallar E(X) y V ar(X).
(d) Un cliente inspecciona el lote, si este tiene menos de dos artculos artculos defectuosos
se pasa la inspecci
on y el cliente compra el lote a 1000 soles, si encuentra al menos
dos defectuosos tambien compra el lote al mismo precio pero se le debera devolver 50
soles por cada artculo defectuoso encontrado. Calcule la ganancia esperada.
3. Considere la variable aleatoria X =el n
umero de lanzamientos de un dado hasta conseguir
un 1. Asuma que el resultado de cada lanzamiento es independiente de los otros.
(a) Encuentre la funci
on de probabilidad de X.
(b) Calcule la probabilidad de que sea necesarios mas de 2 lanzamientos para conseguir
un 1.
(c) Calcule el valor esperado de X.
4. El n
umero de errores que puede tener una pieza de tela de 10 metros es una variable
aleatoria con funci
on de probabilidad
x

f (x)

Se sabe que en promedio ocurren 1.7 errores por cada 10 metros de tela.
(a) Calcular el valor de las constantes a y b.
(b) Calcular la probabilidad una pieza de tela de 10 metros tenga exactamente 3 errores
si se sabe que tiene al menos un error.
48

Bayes, C.

3.6. EJERCICIOS

5. Suponga que la variable aleatoria X tiene funcion de densidad de probabilidad


f (x) = ex , si x > 0
Encontrar la funci
on de densidad de Y = X 2 y calcule el valor esperado de X y de Y .
6. La demanda semanal de un producto, en toneladas, es una variable aleatoria X cuya
funcion de densidad es dada por
f (x) =

x
, 0 < x < 10.
50

Cada tonelada producida cuesta 10 mil soles y se vende a 25 mil soles. Toda cantidad
que no se consigue vender, se pierde sin generar un costo adicional al de su fabricacion.
Suponga que en cierta semana un productor decide fabricar 5 toneladas.
a) Cu
al es la probabilidad de satisfacer la demanda?
b) Cu
al es la probabilidad de que se satisfaga la demanda y al mismo tiempo el productor
gane m
as de 30 mil soles?
c) Cu
al es la probabilidad de que la demanda no sea satisfecha?
d) Cu
al es la utilidad esperada?
7. Una estaci
on de servicio es abastecida de gasolina una vez por semana. El volumen X
de la posible venta semanal en miles de galones tiene la siguiente funcion de distribucion
acumulada
F (x) = 1 (1 x)k , 0 < x < 1
(a) Halle el valor de k si se sabe que la probabilidad de que se vendan mas de 500 galones
es 0.0625
(b) Cu
al debe ser la capacidad del tanque de la estacion de servicio para que la probabilidad de que su provisi
on se agote en una semana sea solo de 0.01?
8. El tiempo de duraci
on de un cierto componente electronico es una variable aleatoria X
con funci
on de densidad
(
f (x) =

, 0x<1

ax

b(2 x) , 1 x 2

donde X, est
a medido en a
nos. Ademas se sabe que en promedio uno de estos componentes
dura 1.2 a
nos.
a) Halle las constantes a y b.
b) Encuentre la funci
on de distribucion acumulada.
c) El componente se vende a 10000 soles y se la da una garanta de 6 meses (si falla antes
de 6 meses se devuelve el dinero). Calcule la utilidad esperada por la venta de 20 de
estos componentes.

49

CAPITULO 3. VARIABLE ALEATORIA

Bayes, C.

d) Si el componente tiene 6 meses de funcionamiento, calcule la probabilidad que dure


mas de un a
no.

50

Captulo 4

Distribuciones de probabilidad
En este captulo presentaremos algunas de las distribuciones de probabilidad mas importantes.

4.1.

Distribuciones Discretas

4.1.1.

Distribuci
on Hipergeom
etrica

Sea una poblaci


on de N elementos, M de los cuales presentan una caracterstica de interes
y N M no la presentan. Si de esta poblacion se selecciona una muestra aleatoria de tama
no
n sin reemplazo y se define una variable aleatoria X como
X = el n
umero de elementos que presentan la caracterstica de interes en la muestra.
Entonces X es una variable aleatoria con distribucion Hipergeometrica, cuya funcion de probabilidad es dada por:
M
f (x) =

N M

x
N

nx
!

!
,

n
x = {max {0, n + M N } , . . . , min {M, n}}
Consideraremos la siguiente notaci
on X HG(N, M, n) para representar esta distribucion.
Los parametros de esta distribuci
on pueden tomar los siguientes valores N = 1, 2, . . ., M =
0, 1, . . . , N y n = 1, 2, . . . , N .
El valor esperado y la varianza son dados por
M
E(X) = n
N


y V ar(X) = n

M
N



N M
N



N n
N 1


.

Ejemplo 4.1.
Se tiene un lote de 10 artculos de los cuales 4 son defectuosos. Se van a seleccionar al azar y
sin reemplazo una muestra de 3 de estos artculos, la variable de interes es X = el n
umero de
artculos defectuosos en la muestra.
(a) Calcule la probabilidad que los tres artculos sean defectuosos.
(b) Calcule el valor esperado y la varianza de X.
51

CAPITULO 4. DISTRIBUCIONES DE PROBABILIDAD

Bayes, C.
Soluci
on:

Tenemos que
X HG(10, 4, 3)
entonces la funci
on de probabilidad de X es dada por
!

4
f (x) =

6
3x
!
10

, x = 0, 1, 2, 3

3
4
por lo tanto P (X = 3) = f (3) =

3
10

0
!

!
=

1
30

3
Luego,
4
E(X) = 3 = 1.2
10
4.1.2.


y V ar(X) = 3

4
10



6
10

 
7
= 0.56.
9

Distribuci
on de Bernoulli

Un ensayo de Bernoulli es un experimento aleatorio que cumple las siguientes condiciones


Para cada ensayo solamente son posibles dos resultados, usualmente denominados, exito
(E) y fracaso (F) con
P (E) = p y P (F ) = 1 p
p la probabilidad de exito se mantiene constante al repetirse el experimento.
Si definimos la variable aleatoria X como
(
1, si el resultado es un exito
X=
0, si el resultado es un fracaso
Entonces X es una variable aleatoria con distribucion Bernoulli, cuya funcion de probabilidad
es dada por:
f (x) = px (1 p)1x , x = 0, 1
El valor esperado y la varianza son dados por
E(X) = p

y V ar(X) = p(1 p).

Ejemplo 4.2.
Como ejemplos de ensayos de Bernoulli tenemos
El lanzamiento de una moneda, en este caso los posibles resultados son {cara, sello}, si

consideramos como un exito el obtener una cara tenemos que p = P (Exito)


= 0.5.
52

Bayes, C.

4.1. DISTRIBUCIONES DISCRETAS

En el lanzamiento de un dado si consideramos obtener el valor de 6 o no, en este caso los


posibles resultados son {obtener un 6, no obtener un 6}, si consideramos como un exito el

obtener un 6 tenemos que p = P (Exito)


= 1/6.
4.1.3.

Distribuci
on Binomial

Consideremos que se repite en forma independiente n ensayos de Bernoulli con probabilidad


p de obtener un exito. Si definimos la variable aleatoria X como
X = N
umero de exitos obtenidos en n ensayos de Bernoulli.
Entonces X es una variable aleatoria con distribucion Binomial, cuya funcion de probabilidad
es dada por:
f (x) =

n
x

!
px (1 p)nx , x = 0, 1, ..., n, 0 < p < 1

Consideraremos la siguiente notaci


on X Binomial(n, p) para representar esta distribucion.
El valor esperado y la varianza son dados por
E(X) = np y

V ar(X) = np(1 p).

Ejemplo 4.3.
Se sabe que la probabilidad de que un artculo producido por una cierta empresa sea defectuoso
es de 0.01 independientemente de los otros. Los artculos se venden en cajas de 12 unidades
y tienen una garanta de reemplazo por una caja nueva si se encuentra mas de un artculo
defectuoso.
(a) Calcule la probabilidad que la garanta aplique en una de estas cajas.
(b) Si se venden 4 de estas cajas calcule la probabilidad que la garanta aplique solamente en
una de estas cajas.
(c) Si se venden 1000 de estas cajas, calcule el n
umero esperado de cajas en que se aplicara la
garanta.
Soluci
on:

Definimos
X = n
umero de artculos defectuosos en una caja de 12 unidades,
como existe independencia entre los artculos y la probabilidad de que un artculo sea
defectuoso es de 0.01 y no cambia tenemos que
X Binomial(12, 0.01)
entonces la funci
on de probabilidad de X es dada por
fX (x) =

12
x

!
0.01x (1 0.01)12x , x = 0, 1, ..., 12

53

CAPITULO 4. DISTRIBUCIONES DE PROBABILIDAD

Bayes, C.
Luego,

P (se aplique la garanta) = P (X > 1)


= 1 P (X 1)
= 1 P (X = 0) P (X = 1)
= 1 fX (0) fX (1)
!
12
0.010 (1 0.01)120
=1
0

12
1

!
0.011 (1 0.01)121

= 0.006174
Definimos ahora
Y = n
umero de cajas en que la garanta se aplica de 4 vendidas,
como existe independencia entre las cajas y la probabilidad de que en una caja se aplique
la garanta no cambia, tenemos que
Y Binomial(4, p)
entonces la funci
on de probabilidad de Y es dada por
fY (y) =

py (1 p)4y , y = 0, 1, 2, 3, 4

donde p = P (exito) = P (en una caja se aplique la garanta) = P (X > 1) = 0.006174


Luego,
P (Y = 1) = fY (1) =

4
1

!
0.0061741 (1 0.006174)41 = 0.02424.

Definimos ahora
W = n
umero de cajas en que la garanta se aplica de 1000 vendidas,
como existe independencia entre las cajas y la probabilidad de que en una caja se aplique
la garanta no cambia, tenemos que
W Binomial(1000, 0.006174)
Finalmente
E(W ) = 1000 0.006174 = 6.17.
podemos decir que se espera que de 1000 cajas vendidas aproximadamente en 6 se aplique
la garanta.

54

Bayes, C.
4.1.4.

4.1. DISTRIBUCIONES DISCRETAS

Distribuci
on Geom
etrica

Consideremos que se repite en forma independiente ensayos de Bernoulli con probabilidad


p de obtener un exito. Si definimos la variable aleatoria X como
X = N
umero de ensayos de Bernoulli hasta obtener el primer exito.
Entonces X es una variable aleatoria con distribucion Geometrica, cuya funcion de probabilidad
es dada por:
f (x) = p(1 p)x1 , x = 1, 2, ..., 0 < p < 1
Consideraremos la siguiente notaci
on X Geometrica(p) para representar esta distribucion.
En este caso su funci
on de distribuci
on acumulada tiene forma conocida dada por
F (m) = 1 (1 p)m
donde m es el mayor entero que sea menor o igual que x. El valor esperado y la varianza son
dados por
1
p

E(X) =

V ar(X) =

1p
.
p2

Ademas, la distribuci
on geometrica es la u
nica distribucion de probabilidad discreta que
tiene falta de memoria, esto es
P (X > m + k | X > m) = P (X > k).
Ejemplo 4.4.
Se sabe que la probabilidad que ocurra una inundacion que puede causar da
nos importantes a la
infraestructura de una ciudad en un cierto a
no es de 0.05. Asumiendo que existe independencia
entre la ocurrencia de las inundaciones.
(a) Calcule el n
umero promedio de a
nos hasta que ocurra una inundacion que cause da
nos
importantes a una ciudad.
(b) Calcule la probabilidad que el tercer a
no ocurra una inundacion que cause da
nos importantes
a una ciudad.
(c) Si han pasado dos a
nos sin que ocurra una inundacion, calcule la probabilidad que pasen
dos a
nos m
as antes que ocurra una inundacion que cause da
nos importantes a una ciudad
Soluci
on:

Definimos
X = n
umero de a
nos hasta que ocurra una inundacion que cause da
nos importantes,
como existe independencia entre que la ocurrencia de las inundaciones y la probabilidad
de que un cierto a
no ocurra una inundacion que cause da
nos importantes es de 0.05 y no
cambia tenemos que
X Geometrica(0.05)
55

CAPITULO 4. DISTRIBUCIONES DE PROBABILIDAD

Bayes, C.

entonces la funci
on de probabilidad de X es dada por
fX (x) = 0.05 0.95x1 , x = 1, 2, ...
Por lo tanto,
E(X) =

1
= 20
0.05

esto es, se espera que pase 20 a


nos para que ocurra una inundacion que cause da
nos
importantes.
Luego, nos piden
P (X = 3) = fX (3) = 0.05 0.9531 = 0.045
Adicionalmente, debemos calcular
P (X > 4 | X > 2) =

P ({X > 4} {X > 2})


P (X > 4)
1 FX (4)
0.954
=
=
=
= 0.9025.
P (X > 2)
P (X > 2)
1 FX (2)
0.952

utilizando la propiedad de falta de memoria de la distribucion geometrica tenemos que


P (X > 4 | X > 2) = P (X > 2) = 1 FX (2) = 0.952 = 0.9025.
4.1.5.

Distribuci
on Binomial Negativa

Considere que se repite en forma independiente ensayos de Bernoulli con probabilidad p de


obtener un exito. Si definimos la variable aleatoria X como
X = N
umero de ensayos de Bernoulli hasta obtener el r-esimo exito.
Entonces X es una variable aleatoria con distribucion Binomial Negativa, cuya funcion de
probabilidad es dada por:
f (x) =

x1
r1

!
pr (1 p)xr , x = r, r + 1, ..., 0 < p < 1

Consideraremos la siguiente notaci


on X BinomialN (r, p) para representar esta distribucion.
El valor esperado y la varianza son dados por
E(X) =

r
p

V ar(X) =

r(1 p)
.
p2

Ejemplo 4.5.
Un componente electr
onico tiene una probabilidad de 0.90 de pasar un control de calidad. Se
puede asumir que existe independencia entre los resultados del control de calidad de diferentes
componentes electr
onicos.
(a) Calcule la probabilidad que sean necesario revisar 5 componentes para obtener que 3 pasen
el control de calidad.

56

Bayes, C.

4.1. DISTRIBUCIONES DISCRETAS

(b) Calcule el n
umero promedio de revisiones hasta encontrar 3 componentes que pasen el
control de calidad.
Soluci
on:

Definimos
X = n
umero de componentes electronicos revisados hasta encontrar 3 que pasen el control de calidad,
como existe independencia entre que los componentes electronicos y la probabilidad de que
un componente electr
onico para el control de calidad es de 0.90 y se mantiene constante
tenemos que
X BinomialN(3, 0.90)
entonces la funci
on de probabilidad de X es dada por
fX (x) =

x1

31

0.903 0.10x3 , x = 3, 4, ...

Por lo tanto,
4

P (X = 5) = fX (5) =

0.903 0.102 = 0.04374

Finalmente,
E(X) =
4.1.6.

3
= 3.33
0.90

Distribuci
on de Poisson

Proceso de Poisson
La ocurrencia de eventos de un cierto tipo en el tiempo o en un espacio sigue un Proceso de
Poisson con tasa de ocurrencia > 0 por unidad de tiempo o espacio, si se cumple:
(i) La probabilidad que ocurra un evento en un intervalo de tama
no t suficientemente peque
no
es aproximadamente t.
(ii) La probabilidad que ocurra dos o mas eventos en un intervalo de tama
no t suficientemente
peque
no es cero.
(iii) El n
umero de eventos que ocurren en cierto intervalo es independiente del n
umero de
eventos que ocurran en otro intervalo disjunto.
Ejemplo 4.6.
A continuaci
on se presentan algunos ejemplos de procesos de Poisson:
Accidentes de tr
ansito en una interseccion de dos avenidas en un da.
Accesos a una p
agina web en una hora.
57

CAPITULO 4. DISTRIBUCIONES DE PROBABILIDAD

Bayes, C.

Llegada de clientes a un banco en un da.


Movimientos ssmicos en un a
no.
Distribuci
on de Poisson
Considere que en un proceso de Poisson con tasa de ocurrencia por unidad de tiempo o
espacio, se define la variable aleatoria X como
X = N
umero de eventos en un intervalo de tama
no t.
Entonces X es una variable aleatoria con distribucion de Poisson, cuya funcion de probabilidad
es dada por:
f (x) =

e x
, x = 0, 1, 2, ..., > 0
x!

donde = t. Consideraremos la siguiente notacion X P oisson() para representar esta


distribucion. El valor esperado y la varianza son dados por
E(X) =

V ar(X) = .

Ejemplo 4.7.
Se asume que la ocurrencia de terremotos siguen un proceso de Poisson en el tiempo. Se asume
que ocurre un terremoto cada 20 a
nos.
(a) Calcule el n
umero esperado de terremotos en un perodo de 100 a
nos.
(b) Calcule la probabilidad que ocurran mas de tres terremotos en un perodo de 50 a
nos.
(c) Cuan largo debe ser un perodo de tiempo, de modo que la probabilidad que no ocurran
terremotos durante ese perodo de tiempo sea mayor a 0.90.
Soluci
on:

Definimos X = n
umero de terremotos en un perodo de 100 a
nos, como la ocurrencia de
terremotos sigue un proceso de Poisson con tasa = 0.05 por a
no tenemos que
X P oisson(5)
entonces la funci
on de probabilidad de X es dada por
fX (x) =

e5 5x
, x = 0, 1, 2, ...
x!

Por lo tanto, E(X) = 5 esto es, se espera que ocurran 5 terremotos en un perodo de 100
a
nos.
Luego, para la parte (b) definimos
Y = n
umero de terremotos en un perodo de 50 a
nos,
58

Bayes, C.

4.2. DISTRIBUCIONES CONTINUAS

en este caso tenemos que


Y P oisson(2.5)
entonces la funci
on de probabilidad de Y es dada por
fY (y) =

e2.5 2.5y
, y = 0, 1, 2, ...
y!

finalmente calculamos la probabilidad pedida


P (Y = 3) = fY (3) =

e2.5 2.53
= 0.045
3!

Para la parte (c) definimos


W = n
umero de terremotos en un perodo de t a
nos,
en este caso tenemos que
W P oisson(0.05t)
entonces la funci
on de probabilidad de W es dada por
fW (w) =

e0.05t (0.05t)w
, w = 0, 1, 2, ...
w!

luego
P (W = 0) = fW (0) = e0.05t > 0.90
por lo tanto t < 2.12.

4.2.
4.2.1.

Distribuciones Continuas
Distribuci
on Exponencial

Una variable aleatoria X sigue una distribucion exponencial si su funcion de densidad es


dada por
f (x) = ex , x > 0, > 0.
Consideraremos la siguiente notaci
on X Exp() para representar esta distribucion. En este
caso su funci
on de distribuci
on acumulada tiene forma conocida dada por
F (x) = 1 ex .
El valor esperado y la varianza son dadas por
E(X) =

V ar(X) =

1
.
2

Ademas, la distribuci
on exponencial es la u
nica distribucion de probabilidad continua que tiene
falta de memoria, esto es
P (X > m + k | X > m) = P (X > k).
59

CAPITULO 4. DISTRIBUCIONES DE PROBABILIDAD

Bayes, C.
4.2.2.

Distribuci
on Gama

Una variable aleatoria X sigue una distribucion gama si su funcion de densidad es dada por
f (x) =

donde (a) =

1 x
x
e
, x > 0, > 0, > 0,
()

xa1 ex dx es la funci
on gama, que para valores de a enteros (a) = (a 1)!.

Consideraremos la siguiente notaci


on X Gama(, ) para representar esta distribucion. El
valor esperado y la varianza son dadas por
E(X) =
4.2.3.

y V ar(X) =

.
2

Distribuci
on Uniforme

Una variable aleatoria X sigue una distribucion uniforme si su funcion de densidad es dada
por
f (x) =

1
, a < x < b,
ba

Consideraremos la siguiente notaci


on X U nif (a, b) para representar esta distribucion. En
este caso su funci
on de distribuci
on acumulada tiene forma conocida dada por
F (x) =

xa
.
ba

El valor esperado y la varianza son dadas por


E(X) =
4.2.4.

a+b
2

y V ar(X) =

(b a)2
.
12

Distribuci
on Beta

Una variable aleatoria X sigue una distribucion beta si su funcion de densidad es dada por
f (x) =

( + ) 1
x
(1 x)1 , 0 < x < 1, > 0, > 0,
()()

Consideraremos la siguiente notaci


on X Beta(, ) para representar esta distribucion. El
valor esperado y la varianza son dadas por
E(X) =

4.2.5.

V ar(X) =

.
( + ) ( + + 1)
2

Distribuci
on Normal

Una variable aleatoria X sigue una distribucion Normal si su funcion de densidad es dada
por
f (x) =

2
1 (x)
1
e 2 2 , x R, R, 2 > 0,
2

Consideraremos la siguiente notaci


on X N (, 2 ) para representar esta distribucion. La

60

Bayes, C.

4.2. DISTRIBUCIONES CONTINUAS

funcion de distribuci
on acumulada no tiene forma analtica. El valor esperado y la varianza son
dadas por
E(X) =

V ar(X) = 2 .

La distribuci
on Normal es simetrica alrededor de la media y tiene forma acampanada. Un
caso particular importante es la distribucion Normal estandar que definimos a continuacion.
Distribuci
on Normal est
andar
Una variable aleatoria Z sigue una distribucion Normal estandar si Z N (0, 1), por lo tanto
su funcion de densidad es dada por
1 2
1
fZ (z) = e 2 z , z R.
2

La funcion de distribuci
on acumulada FZ (z) no tiene forma analtica, pero puede ser evaluada
en forma numerica o a traves de tablas.
A continuaci
on presentamos algunas propiedades importantes de la distribucion Normal:
Estandarizaci
on: Sea X N (, 2 ) entonces
Z=

X
N (0, 1).

Transformaci
on lineal: Sea X N (, 2 ) entonces
Y = aX + b N (a + b, b2 2 ).
Suma de normales independientes: Sean X1 , X2 , ..., Xn variables aleatoria independientes tal que Xi N (i , i2 ) i = 1, ..., n entonces
n
X

Xi N

i=1

n
X
i=1

i ,

n
X

!
i2

i=1

Media de normales independientes: Sean X1 , X2 , ..., Xn variables aleatoria independientes e identicamente distribuidas tal que Xi N (, ) entonces


2
X N ,
.
n
Esta u
ltima propiedad puede ser generalizada mediante el teorema presentado a continuacion.
Teorema del Lmite Central
Sean X1 , X2 , ..., Xn variables aleatoria independientes e identicamente distribuidas tal que

61

CAPITULO 4. DISTRIBUCIONES DE PROBABILIDAD

Bayes, C.

E(Xi ) = y V ar(Xi ) = 2 i = 1, ..., n entonces para un n suficientemente grande




aprox

X N
4.2.6.

2
,
n


.

Distribuci
on Log-Normal

Una variable aleatoria X sigue una distribucion log-normal si su funcion de densidad es dada
por
1 lnx 2
1
f (x) =
e 2 ( ) , x > 0, R, 2 > 0
2x

Consideraremos la siguiente notaci


on X LN (, 2 ) para representar esta distribucion. El
valor esperado y la varianza son dadas por
E(X) = e+

2
2

V ar(X) = (e 1)e2+ .

Propiedad
Si X LN (, 2 ) entonces X N (, 2 ).
4.2.7.

Distribuci
on Weibull

Una variable aleatoria X sigue una distribucion Weibull si su funcion de densidad es dada
por

f (x) = x1 e(x) , x > 0, > 0, > 0


Consideraremos la siguiente notaci
on X W eibull(, ) para representar esta distribucion. La
funcion de distribuci
on acumulada es dada por

F (x) = 1 e(x) , x > 0


El valor esperado y la varianza son dadas por
1
E(X) =

4.2.8.

 
1

"  
 2 #
1
2
1
1
y V ar(X) =
2

.
2

Distribuciones de Valor Extremo

En muchas situaciones es de interes estudiar el comportamiento de un valor extremo. Por


ejemplo, el m
aximo caudal de un ro, la velocidad maxima del viento en una cierta region, etc.
Consideremos X1 , ..., Xn variables aleatorias independientes e identicamente distribuidas, con
funcion de distribuci
on acumulada F(x), y definimos los extremos de este conjunto de variable
aleatorias como
X(1) = mn(X1 , ..., Xn )

y X(n) = max(X1 , ..., Xn ).

62

Bayes, C.

4.2. DISTRIBUCIONES CONTINUAS

Se puede demostrar que la funci


on de distribucion acumulada del maximo es dada por
FX(n) (x) = F (x)n
y que la funci
on de distribuci
on acumulada del mnimo es dada por
FX(1) (x) = 1 [1 F (x)]n .
Estas u
ltimas expresiones proveen una forma de encontrar la distribucion exacta de estos valores
extremos. Sin embargo, en muchas ocasiones se suelen utilizar distribuciones asintoticas. Esto
es, para un n suficientemente grande, la distribucion de un valor extremo se sabe que converge a
una de tres distribuciones asint
oticas. En esta seccion presentaremos solamente la distribucion
asintotica del m
aximo para los tipos I y II que son los mas utilizados.
4.2.9.

Distribuci
on de Valor Extremo tipo I

Este tipo de distribuci


on asint
otica para X(n) = max(X1 , ..., Xn ) ocurre cuando la cola de la
distribucion de X1 , ..., Xn tiene decaimiento exponencial, por ejemplo, las distribuciones Normal
y exponencial tienen este tipo de comportamiento.
Una variable aleatoria continua X tiene distribucion de valor extremo tipo I para el maximo
si su funcion de densidad es dada por
(x)

f (x) = e(x) ee

, x R, R, > 0

Consideraremos la siguiente notaci


on X V EI,max (, ) para representar esta distribucion. La
funcion de distribuci
on acumulada es dada por
(x)

F (x) = ee
El valor esperado y la varianza son dadas por
E(X) = +

V ar(X) =

2
62

donde = 0.5772 es la constante de Euler.


4.2.10.

Distribuci
on de Valor Extremo tipo II

Este tipo de distribuci


on asint
otica para X(n) = max(X1 , ..., Xn ) ocurre cuando la cola de la
distribucion de X1 , ..., Xn tiene decaimiento polinomial, por ejemplo, las distribucion log-normal
tiene este tipo de comportamiento.
Una variable aleatoria continua X tiene distribucion de valor extremo tipo II para el maximo
si su funcion de densidad es dada por
f (x) =

 +1 ( )
e x , x > 0, > 0, > 0
x

63

CAPITULO 4. DISTRIBUCIONES DE PROBABILIDAD

Bayes, C.

Consideraremos la siguiente notaci


on X V EII,max (, ) para representar esta distribucion.
La funcion de distribuci
on acumulada es dada por

F (x) = e( x )
El valor esperado y la varianza son dadas por


1
E(X) = 1

4.3.

" 


2 #
2
1
V ar(X) = 2 1
1
.

Distribuciones Muestrales

4.3.1.

Distribuci
on Chi-cuadrado

Una variable aleatoria continua W tiene distribucion chi-cuadrado si su funcion de densidad


es dada por
f (w) =

2k/2 (k/2)

w 2 1 e 2 , w > 0, k > 0

Consideraremos la siguiente notaci


on X 2(k) para representar esta distribucion, donde el
parametro k es denominado de grados de libertad. El valor esperado y la varianza son dadas
por
E(X) = k

y V ar(X) = 2k.

Propiedades
Sea Z N (0, 1) entonces Z 2 2(1) .
Sean W1 , ..., Wn variables aleatorias independientes tal que Wi 2(ki ) y sea W =

n
X

Wi

i=1

entonces
W 2(k ) donde k =

n
X

ki .

i=1

Sean X1 , ..., Xn variables aleatorias independientes e identicamente distribuidas tal que


Xi N (, 2 ) entonces
(n 1)S 2
2(n1) .
2
4.3.2.

Distribuci
on t de Student

Una variable aleatoria continua T tiene distribucion t de Student si su funcion de densidad


es dada por
f (t) =

k
2

 
 k+1
2
t2
1+
, t R, k > 0
k
k

k+1
2

Consideraremos la siguiente notaci


on T t(k) para representar esta distribucion, donde el
parametro k es denominado de grados de libertad. El valor esperado y la varianza son dadas
por
E(X) = 0 si k > 1

y V ar(X) =
64

k
si k > 2.
k2

Bayes, C.

4.3. DISTRIBUCIONES MUESTRALES

Propiedades
La distribuci
on t de Student es simetrica alrededor de 0 y converge a la distribucion
Normal cuando el par
ametro grados de libertad k tiende a infinito.
Sea Z N (0, 1) y W 2(k) independientes entonces
Z
T =q

W
k

t(k) .

Sean X1 , ..., Xn variables aleatorias independientes e identicamente distribuidas tal que


Xi N (, 2 ) entonces
X
t(n1) .
S

n
4.3.3.

Distribuci
on F

Una variable aleatoria continua F tiene distribucion F de Fisher si su funcion de densidad


es dada por
g(f ) =

n
2

n+m
2

f 2 1


 n/2 mm/2
m n
2

(n + mf )

n+m
2

, f > 0, n > 0, m > 0

Consideraremos la siguiente notaci


on F F(n,m) para representar esta distribucion, donde el
parametro n es denominado de grados de libertad del numerador y m es denominado de grados
de libertad del denominador.
Propiedades
Sean V 2(n) y W 2(m) independientes entonces
F =

Si F F (n, m) entonces

V /n
F(n,m) .
W/m

1
F (m, n)
F

Sean X1 , ..., Xn variables aleatorias independientes e identicamente distribuidas tal que


Xi N (1 , 12 ) i y sean Y1 , ..., Ym variables aleatorias independientes e identicamente
distribuidas tal que Yj N (2 , 22 ) j, entonces
F =
n
X

donde S12 =

Xi X

i=1

n1

S12 /12
F(n1,m1)
S22 /22

m
X

2
y S22 =

Yj Y

j=1

m1

65

2

Bayes, C.

CAPITULO 4. DISTRIBUCIONES DE PROBABILIDAD

66

Captulo 5

Inferencia Estadstica

67

CAPITULO 5. INFERENCIA ESTADISTICA

Bayes, C.

5.1.

Ejercicios

1. Se recolectaron 20 muestras de un cierto tipo de concreto y se midio su densidad en kg/m3 ,


los datos obtenidos se presentan a continuacion
2449

2439

2443

2455

2438

2439

2446

2410

2452

2442

2455

2445

2433

2425

2461

2416

2449

2472

2490

2448

(a) Asumiendo normalidad, encuentre un intervalo de confianza del 95 % para la media y


la desviaci
on est
andar de la densidad del concreto.
(b) Si la densidad es considerada aceptable si es mayor a 2435 kg/m3 , encuentre un
intervalo de confianza del 95 % para la proporcion de muestra aceptables. Considere
que se tiene un tama
no de muestra suficientemente grande.
(c) Si se conoce que la desviaci
on estandar de la poblacion es de 16 kg/m3 , asumiendo
normalidad, realice una prueba de hipotesis para verificar si se cumple que la densidad
media sea igual 2450.
2. Un componente de un sistema es producido por dos proveedores A y B. Se recolectaron 20
muestras de cada proveedor y se midio su tiempo de duracion en horas, los datos obtenidos
se presentan a continuaci
on
A

1002

1014

979

999

1002

1007

967

1021

961

974

1021

1059

1002

1033

1002

1023

982

994

1003

989

1014

973

897

981

1019

1012

906

1046

1024

1089

1009

994

1010

1062

984

984

952

994

939

990

(a) Asumiendo normalidad, encuentre un intervalo de confianza del 95 % para la razon de


varianzas y la diferencia de medias del tiempo de duracion de los componentes de las
marcas A y B.
68

Bayes, C.

5.1. EJERCICIOS

(b) Realice una prueba de hip


otesis para verificar si la media del tiempo de duracion de
la marca A es menor a la de B. Considere un nivel de significancia del 1 % para todas
las pruebas.
(c) Realice una prueba de hip
otesis para verificar si la proporcion de componentes que
superan las 1000 horas de duracion es la igual para ambas marcas. Considere un nivel
de significancia del 1 %.
3. Un proyecto es revisado por dos supervisores, los resultados de los u
ltimos 100 proyectos
evaluados se encuentran resumidas en la siguiente tabla:
Supervisor 1
Supervisor 2

Aprueba

Desaprueba

Aprueba

12

28

Desaprueba

18

42

(a) Realice una prueba de hip


otesis para verificar si la proporcion de aprobacion es la
igual para ambos supervisores. Considere un nivel de significancia del 5 %.
4. Se recolectaron muestras de dos marcas de llantas A y B, se registro el n
umero de kilometros recorridos hasta que se desgasten, los datos obtenidos se presentan a continuacion
Estadstica

Tama
no de muestra

12

16

Media

36700

37900

Desviacion Estandar

5000

6000

(a) Asumiendo normalidad, encuentre un intervalo de confianza del 95 % para la desviacion est
andar y la media del n
umero de kilometros recorridos hasta el desgaste de la
marca A.
(b) Asumiendo normalidad, encuentre un intervalo de confianza del 95 % para la razon
de varianzas y la diferencia de medias del n
umero de kilometros recorridos hasta el
desgaste de las marcas A y B.
(c) Realice una prueba de hip
otesis para verificar si la media del n
umero de kilometros
recorridos hasta el desgaste de la marca B es mayor a la de A. Considere un nivel de
significancia del 1 % para todas las pruebas.
5. A continuaci
on, se muestran los datos recogidos del valor en dolares de dos acciones, una
de un mercado externo cuya cotizacion termina a las 9 am. hora peruana, y otra de la
Bolsa de Valores de Lima cuya cotizacion concluye a las 3 pm.

69

CAPITULO 5. INFERENCIA ESTADISTICA

Bayes, C.
Da

Acci
on del mercado externo

Accion de la BVL

8.25

9.22

8.26

9.24

8.27

9.27

8.24

9.26

8.28

8.32

9.36

8.28

9.29

8.31

9.33

8.32

9.34

10

8.28

9.27

(a) Encuentre la recta de regresi


on que mejor se ajuste a los datos y que permita predecir
el precio de la acci
on que cotiza en la BVL cuando se conoce el precio de la accion del
mercado externo. Interprete.
(b) Halle el coeficiente de determinacion. Interprete.
(c) Estime el precio de la acci
on que cotiza en la BVL para el da 5.
6. Con la finalidad de estudiar la relacion entre los gastos en publicidad y los ingresos por
ventas de una empresa. Se recolectaron los siguientes datos.
Mes

Ventas

Publicidad

(en miles de soles)

(en miles de soles)

460.5

45.4

390.6

35.2

550.3

60.1

47.2

510.2

50.9

430.1

40.7

(a) Encuentre la recta de regresi


on que mejor se ajuste a los datos y que permita predecir
el ingreso por ventas cuando se conoce el gasto en publicidad. Interprete.
(b) Estime el ingreso por ventas del cuarto mes. Estime el ingreso por ventas si la empresa
piensa invertir en publicidad 60 000 soles. Interprete.
(c) Halle el coeficiente de determinacion y comente sus resultados.

70

Bibliografa

71