Probabilidad y Estadistica PDF

Probabilidad y Estadstica
Csar Amarilla
1 de agosto de 2011
ndice general
1. Estadstica y tipos de estadstica
1.1. Introduccin . . . . . . . . . .
1.2. Definiciones y ejemplos . . . .
1.2.1. Estadstica . . . . . .
1.2.2. Estadstica Descriptiva
1.2.3. Estadstica Inferencial
1.2.4. Poblacin y muestra .
1.3. Variables . . . . . . . . . . .
1.3.1. Tipos de variables . .
1.3.2. Escalas de medicin .
1.4. Problemas . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
8
8
9
9
9
9
9
10
10
12
14
2. Distribuciones de Frecuencia
2.1. Estadstica descriptiva . . . . .
2.2. Construccin . . . . . . . . .
2.2.1. Representacin Grfica
2.3. Problemas . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
16
16
16
20
22
3. Medidas de tendencia central

3.1. La Media . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.1. La Media Geomtrica . . . . . . . . . . . . . .
3.1.2. La Media Aritmtica . . . . . . . . . . . . . . .
3.1.3. Propiedades de la media aritmtica . . . . . . . .
3.1.4. Desventajas de la media aritmtica . . . . . . . .
3.1.5. La media para datos no agrupados . . . . . . . .
3.1.6. La media para datos agrupados . . . . . . . . . .
3.1.7. La media de la poblacin . . . . . . . . . . . . .
3.2. La mediana . . . . . . . . . . . . . . . . . . . . . . . .
3.2.1. Propiedades de la mediana . . . . . . . . . . . .
3.2.2. La mediana para datos agrupados . . . . . . . .
3.3. La moda . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.1. Propiedades de la moda . . . . . . . . . . . . .
3.3.2. Desventajas de la moda . . . . . . . . . . . . . .
3.3.3. La moda para datos agrupados . . . . . . . . . .
3.3.4. Comparacin entre medidas de tendencia central
3.3.5. Relacin entre las medidas de tendencia central .
3.4. Problemas . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
25
25
25
26
26
26
26
27
28
28
29
29
31
31
31
31
32
33
33
NDICE GENERAL
4. Medidas de Variabilidad
4.1. Introduccin . . . . . . . . . . . . . . . . . . .
4.2. Variabilidad . . . . . . . . . . . . . . . . . . .
4.2.1. Rango y rango intercuartlico . . . . . .
4.2.2. Desviacin media . . . . . . . . . . . .
4.2.3. Desviacin media para datos agrupados
4.2.4. Varianza y desviacin estndar . . . . .
4.3. Problemas . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
5. Probabilidad
5.1. Introduccin . . . . . . . . . . . . . . . . . . . .
5.2. Definiciones y ejemplos . . . . . . . . . . . . . .
5.3. Operaciones entre eventos . . . . . . . . . . . .
5.4. Definciones de probabilidad . . . . . . . . . . .
5.4.1. Concepto Clsico de Probabilidad . . . .
5.4.2. Concepto frecuentista de probabilidad . .
5.4.3. Probabilidad subjetiva . . . . . . . . . .
5.4.4. Concepto axiomtico de probabilidad . .
5.5. Teoremas de Probabilidad . . . . . . . . . . . . .
5.5.1. Teorema 1: Regla de la Adicin . . . . .
5.5.2. Teorema 2: Regla de la complementacin
5.5.3. Teorema 3: Regla de Diferenciacin . . .
5.5.4. Probabilidad Condicional . . . . . . . .
5.5.5. Teorema 4: Reglas de Multiplicacin . .
5.6. Problemas . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6. Variables aleatorias
6.1. Definiciones y ejemplos . . . . . . . . . . . . . . . . . . . . .
6.2. Distribucin de probabilidad . . . . . . . . . . . . . . . . . .
6.2.1. Propiedades de la funcin de probabilidad . . . . . . .
6.2.2. Propiedades de la funcin de densidad de probabilidad
6.2.3. Distribuciones discretas . . . . . . . . . . . . . . . .
6.2.4. Distribuciones continuas . . . . . . . . . . . . . . . .
6.3. Esperanza, varianza y momentos . . . . . . . . . . . . . . . .
6.3.1. Esperanza . . . . . . . . . . . . . . . . . . . . . . . .
6.3.2. Varianza . . . . . . . . . . . . . . . . . . . . . . . . .
6.3.3. Momentos . . . . . . . . . . . . . . . . . . . . . . .
6.4. Funcin generadora de momentos . . . . . . . . . . . . . . .
6.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7. Distribuciones de probabilidad
7.1. Distribuciones discretas de probabilidad
7.1.1. Distribucin Bernoulli . . . . .
7.1.2. Distribucin binomial . . . . .
7.1.3. Distribucin Poisson . . . . . .
7.1.4. Distribucin geomtrica . . . .
7.1.5. Distribucin binomial negativa .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
35
35
35
35
36
36
37
39
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
41
41
42
43
44
45
45
46
46
47
47
48
48
48
49
51
.
.
.
.
.
.
.
.
.
.
.
.
63
63
66
66
68
72
72
72
72
76
78
80
83
.
.
.
.
.
.
91
91
91
92
95
99
101
NDICE GENERAL
7.1.6. Distribucin hipergeomtrica . . . .
7.2. Distribuciones continuas de probabilidad . .
7.2.1. Distribucin uniforme continua . .
7.2.2. Distribucin Normal . . . . . . . .
7.2.3. Aproximacin normal a la binomial.
7.2.4. Distribucin ji-cuadrada . . . . . .
7.2.5. Distribucin t de Student . . . . . .
7.2.6. Distribucin exponencial . . . . . .
7.3. Problemas . . . . . . . . . . . . . . . . . .
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
8. Muestras aleatorias y distribuciones de muestreo.

8.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.2. Muestras aleatorias y estadsticos muestrales . . . . . . . . . . . . .
8.3. Mtodos de Muestreo . . . . . . . . . . . . . . . . . . . . . . . . .
8.3.1. Muestreo aleatorio simple . . . . . . . . . . . . . . . . . .
8.3.2. Muestreo aleatorio sistemtico . . . . . . . . . . . . . . . .
8.3.3. Muestreo aleatorio estratificado . . . . . . . . . . . . . . .
8.3.4. Muestreo aleatorio por conglomerados . . . . . . . . . . . .
8.3.5. Error de Muestreo . . . . . . . . . . . . . . . . . . . . . .
8.4. Distribuciones Muestrales . . . . . . . . . . . . . . . . . . . . . .
8.4.1. Distribucin Muestral de Medias . . . . . . . . . . . . . . .
8.4.2. Teorema del Lmite Central . . . . . . . . . . . . . . . . .
8.4.3. Distribucin Muestral de Varianzas . . . . . . . . . . . . .
8.4.4. Distribucin F . . . . . . . . . . . . . . . . . . . . . . . .
8.4.5. Distribucin Muestral de Proporciones . . . . . . . . . . .
8.4.6. Distribucin Muestral de Sumas y de Diferencias de medias
8.4.7. Distribucin Muestral de Relaciones de Varianzas . . . . . .
8.4.8. Distribucin Muestral de Diferencias de Proporciones . . .
8.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
9. Estimacin
9.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.2. Estimadores y sus propiedades . . . . . . . . . . . . . . . . . . . . . . . .
9.2.1. Propiedades de un buen estimador . . . . . . . . . . . . . . . . . .
9.3. Estimacin Puntual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.3.1. Estimadores de maxima verosimilitud . . . . . . . . . . . . . . . .
9.3.2. Estimadores por el mtodo de los momentos . . . . . . . . . . . .
9.4. Estimacin por Intervalos de Confianza . . . . . . . . . . . . . . . . . . .
9.4.1. Intervalos de confianza para estimar la media de una poblacin . . .
9.4.2. Intervalos de confianza para la varianza y la desviacin tpica de una
poblacin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.4.3. Intervalos de confianza para estimar Proporciones . . . . . . . . . .
9.4.4. Intervalos de confianza para estimar Diferencias de Medias . . . . .
9.4.5. Intervalos de confianza para Relaciones de Varianzas . . . . . . . .
9.4.6. Intervalos de confianza para Diferencias de Proporciones . . . . . .
9.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
103
107
107
110
117
120
122
125
128
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
150
150
150
151
152
153
154
155
155
155
156
158
161
164
166
169
173
173
174
.
.
.
.
.
.
.
.
175
175
175
176
179
179
181
182
183
.
.
.
.
.
.
188
191
193
196
199
201
NDICE GENERAL
10. Prueba de Hiptesis

10.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . .
10.2. Definiciones y ejemplos . . . . . . . . . . . . . . . . . . . .
10.2.1. Qu es una hiptesis? . . . . . . . . . . . . . . . .
10.2.2. Hipotesis nula y alternativa . . . . . . . . . . . . . .
10.2.3. Dos tipos de errores . . . . . . . . . . . . . . . . .
10.2.4. Regin Crtica . . . . . . . . . . . . . . . . . . . .
10.2.5. Funcin de Potencia . . . . . . . . . . . . . . . . .
10.2.6. Funcin Caracterstica de Operacin . . . . . . . . .
10.2.7. Hiptesis simples y compuestas . . . . . . . . . . .
10.2.8. Procedimiento de 4 pasos para contraste de hiptesis
10.3. Pruebas de hiptesis para grandes muestras (n 30) . . . .
10.3.1. Prueba de hiptesis para Medias . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
208
208
208
208
209
209
210
210
211
212
212
213
213
11. Anlisis de la Varianza (ANOVA)

216
11.1. Suposiciones de ANOVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216
11.2. Procedimiento del anlisis de la varianza . . . . . . . . . . . . . . . . . . . . 216
12. Anlisis de regresin y de correlacin
12.1. Introduccin . . . . . . . . . . . . . . . . . .
12.2. Modelo Estadstico . . . . . . . . . . . . . .
12.3. Modelo de regresin simple . . . . . . . . . .
12.3.1. Ajuste de curva . . . . . . . . . . . .
12.3.2. El mtodo de los mnimos cuadrados
12.3.3. Anlisis de regresin simple . . . . .
12.4. Anlisis de correlacin . . . . . . . . . . . .
12.4.1. Anlisis de correlacin simple . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
218
218
218
220
220
221
224
224
225
ndice de figuras
2.1.
2.2.
2.3.
2.4.
2.5.
Representacin grfica de un histograma de frecuencia . . . .

Representacin grfica de un histograma de frecuencia relativa
Representacin grfica de un polgono de frecuencia . . . . .
Representacin grfica de un polgono de frecuencia relativa .
Representacin grfica de una ojiva de frecuencia acumulada .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
20
20
21
21
22
5.1.
5.2.
5.3.
5.4.
Representacin grfica de la interseccin de dos eventos

Representacin grfica de la unin de dos eventos . . . .
Representacin grfica de complementos de eventos . . .
Representacin grfica de la diferencia de dos eventos . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
43
43
44
44
6.1.
6.2.
6.3.
6.4.
6.5.
6.6.
6.7.
Representacin grfica de la definicin de una variable aleatoria

Representacin grfica del espacio muestral del ejemplo 6.1.2 .
Representacin grfica de la funcin del ejemplo 6.2.1 . . . . .
Representacin grfica de la probabilidad como un ara . . . . .
Representacin grfica de f (x) (ejemplo 6.2.3 . . . . . . . . . .
Representacin grfica de F(x) del ejemplo 6.2.5 . . . . . . . .
Representacin grfica de F(x) del ejemplo 6.2.6 . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
63
64
67
68
69
70
70
Grfica de f (x) de la distribucin Poisson . . . . . . . . . . . . . . . . . . .

Grfica de f (x) de la distribucin exponencial . . . . . . . . . . . . . . . . .
Grfica de F(x) de la distribucin exponencial . . . . . . . . . . . . . . . . .
Grfica de f (x) del ejemplo 7.2.1 . . . . . . . . . . . . . . . . . . . . . . . .
Grfica de F(x) del ejemplo 7.2.1 . . . . . . . . . . . . . . . . . . . . . . .
Representacin grfica de f (x) para ciertos valores de y 2 de una variable
aleatoria normal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.7. Representacin grfica de f (x) de una variable aleatoria normal . . . . . . .
7.8. Curvas normales que tienen medias iguales y desviaciones estndar diferentes
7.9. Curvas normales que tienen medias diferentes y desviaciones estndar iguales
7.10. Curvas normales que tienen medias diferentes y desviaciones estndar diferentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.11. Grfica de f (x) cuando el parmetro k toma los valores 1,2,3,4 y 5 . . . . . .
7.12. Distribucin t versus distribucin normal . . . . . . . . . . . . . . . . . . . .
7.13. Grfica de f (x) cuando el parmetro toma los valores 0,5;1,0 y 1,5 . . . . .
7.14. Grfica de F(x) cuando el parmetro toma los valores 0,5;1,0 y 1,5 . . . . .
96
107
109
109
110
7.1.
7.2.
7.3.
7.4.
7.5.
7.6.
.
.
.
.
.
.
.
.
.
.
.
.
111
112
112
113
113
121
124
126
126
8.1. Grfica de f (x) cuando los parmetros m y n toman diferentes pares de valores.165
NDICE DE FIGURAS
9.1. Grfica del proceso de eleccin de los valores 2c y 2l . . . . . . . . . . . . . 189

9.2. Grfica de la distribucin acumulada de la 2 . . . . . . . . . . . . . . . . . . 190
12.1. Grfico de la relacin entre el nmero de aos que se estudi alemn y la
calificacin obtenida en la prueba. . . . . . . . . . . . . . . . . . . . . . . . 223
ndice de cuadros
Captulo 1
Estadstica y tipos de estadstica
1.1.
Introduccin
Qu significa la palabra estadstica?

La encontramos frecuentemente en nuestro lenguaje cotidiano. En su uso ms comn,
estadstica se refiere a informaciones numricas. Ejemplos seran; el salario inicial promedio
de un graduado de una escuela superior, el nmero de decesos anuales debido al alcoholismo,
el porcentaje de alumnos no graduados que estudian en la Universidad Nacional de Asuncin,
la variacin de ayer a hoy de los precios de los productos de la canasta familiar, etc. En estos
ejemplos la estadstica consiste en nmeros o porcentajes. A estos nmeros se les denomina
estadsticos.
La Estadstica se divide en dos grandes reas (descripcin de datos y realizacin de inferencias) que reflejan la propia historia del desarrollo de esta ciencia. La Estadstica actual es el
producto del encuentro de dos ramas distintas del saber, la antigua estadstica y el clculo de
probabilidades, que se encontraron en el siglo XIX. Etimolgicamente, la palabra estadstica
procede de la palabra estado, ya que desde la antigedad los romanos hicieron recolecciones
de datos que posteriormente tenan que resumir de una forma comprensiva y que permitiera
proporcionar informaciones tiles. Este tipo de estudios dio lugar a la estadstica descriptiva
cuya misin consiste en describir situaciones y procesos dados; para ello se sirve de tablas,
representaciones grficas, proporciones, nmeros ndice y medidas tpicas.
Sin embargo las conclusiones extradas se agotan en el propio conjunto de datos observados, pues el objetivo consista en hacerse una idea clara de lo que haba, y lo que haba se
contaba y se meda. Lo que posibilit el clculo de probabilidades fue, precisamente, el desarrollo de un conjunto de mtodos para extrapolar las conclusiones a entidades no observadas.
Es decir, proporcion el instrumento adecuado para poder hacer inferencias acerca de grandes
cantidades de observaciones potenciales a partir de unas pocas observaciones reales. Estas
tcnicas tuvieron su fundamento en el desarrollo de la curva normal por Gauss, en su aplicacin por Galton a los problemas de herencia, etc. Sin embargo los autnticos fundadores
de estas tcnicas fueron Karl Pearson (1857-1936) y Sir Ronald Fisher (1890-1962). As se
ha desarrollado la estadstica analtica o inferencial basada en la teora de probabilidades que
trata de obtener leyes generales a partir de la observacin de algunos datos. Precisamente
este fundamento probabilstico condiciona el que los resultados obtenidos se vean sujetos a
unos mrgenes de error. Ahora se puede dar una definicin de Estadstica en la que aparecen
algunos trminos no definidos lo cual no impedir entender su significado.
8
1.2. DEFINICIONES Y EJEMPLOS
1.2.
Definiciones y ejemplos
1.2.1.
Estadstica
Definicin 1.2.1 Es la ciencia que se ocupa de la ordenacin y anlisis de datos procedentes

de muestras, y de la realizacin de inferencias acerca de las poblaciones de las que stas
proceden. Es la ciencia que estudia los fenmenos aleatorios.
1.2.2.
Estadstica Descriptiva
La primer parte de la definicin de estadsticas, es comnmente conocida como Estadstica Descriptiva. La definicin es la siguiente: Es el conjunto de procedimientos utilizados
para organizar, resumir y presentar grupos de datos numricos. Los grupos de datos numricos no organizados son de poca utilidad. Sin embargo, tcnicas estadsticas estn disponibles
para organizar estos datos en distribuciones de frecuencia, presentarlos en grficas, resumirlos en promedios y medidas de variabilidad o dispersin.
1.2.3.
Estadstica Inferencial
Otra faceta de las estadsticas es la estadstica inferencial tambin llamada estadstica

inductiva. La principal utilidad de la estadstica inferencial es conocer algo acerca de una
poblacin basndose en una muestra tomada de esa poblacin. La definicin es la siguiente:
Es el conjunto de mtodos utilizados para obtener conclusiones relativas a una poblacin,
basndose en el conocimiento de las caractersticas de una muestra. Una poblacin puede
consistir de individuos, tales como todos los estudiantes de la universidad, todos los estudiantes que estudian Estadsticas o todos los internos de la penitenciaria. Una poblacin puede
tambin consistir de objetos, tales como todos los motores producidos por la planta Ford
o todas las truchas en un estanque. Una poblacin tambin puede consistir en un grupo de
medidas, tales como las estaturas equipo de bsquetbol "Dorados de Chihuahua".
1.2.4.
Poblacin y muestra
Definicin 1.2.2 : Individuo

Es cualquier elemento que porte informacin sobre el fenmeno que se estudia. As, si
estudiamos la altura de los nios de una clase, cada alumno es un individuo; si estudiamos
el precio de la vivienda, cada vivienda es un individuo.
Definicin 1.2.3 : Poblacin
Es el conjunto de todos los individuos (personas, objetos, animales, etc.) que portan informacin sobre el fenmeno que se estudia. Para inferir algo acerca de una poblacin, usualmente tomamos una muestra de ella.
Definicin 1.2.4 : Muestra
Es un subconjunto de la poblacin de inters.
1.3. VARIABLES
10
Por ejemplo una poblacin en estudio podra ser el conjunto de todos los estudiantes que
estudian administracin en la Facultad de Ciencias Econmicas de la Universidad Nacional
de Asuncin y una muestra podra consistir en el conjunto de estudiantes de primer ao de
dicha poblacin.
1.3.
Variables
Definicin 1.3.1 : Variables

Es una caracterstica que puede tomar diferentes valores. Las variables son caractersticas
observables, susceptibles de adoptar distintos valores o ser expresados en categoras. Variable
es un aspecto especifico de la realidad referido a la unidad del anlisis y puede ser medidos
o cuantificados. La variable adquiere un valor determinado en cada unidad de anlisis. Si
una caracterstica, se encuentra que toma valores diferentes en personas, lugares o cosas
diferentes, se dice que esta caracterstica es variable, es decir la caracterstica no es la misma
cuando se observa en diferentes poseedoras de ellas.
Ejemplo 1.3.1 Las siguientes caractersticas son ejemplos de variables
Estatura de las personas
Edad de los nios
El precio y la demanda de un producto
Definicin 1.3.2 : Variables Aleatorias
Cuando los valores obtenidos de la variable son el resultado de factores fortuitos o al azar.
Ejemplo 1.3.2 Las siguientes caractersticas son ejemplos de variables aleatorias
El nmero de caras obtenidas en tres lanzamientos de una moneda
El nmero de hijos en un matrimonio determinado
1.3.1.
Tipos de variables
Definicin 1.3.3 : Variable Cualitativa

Cuando la variable estudiada es no numrica es decir una caracterstica que no puede ser
medido sino solo catalogarse, esta es llamada variable cualitativa tambin llamada atributo.
Ejemplo 1.3.3 Las siguientes caractersticas son ejemplos de variables cualitativas
lugar de nacimiento
religin
color de ojos
1.3. VARIABLES
11
Definicin 1.3.4 : Variable Cuantitativa

Cuando la variable estudiada puede expresarse en forma numrica es decir puede ser medido, esta es llamada variable cuantitativa. Las variables cuantitativas pueden ser discretas o
continuas.
Ejemplo 1.3.4 Las siguientes caractersticas son ejemplos de variables cualitativas
el saldo de una cuenta bancario,
la duracin de una batera,
la velocidad de los automviles en el perifrico de la juventud
Definicin 1.3.5 : Variables Discretas
Las variables discretas pueden asumir solo ciertos valores, y hay usualmente huecos entre
los valores (valores puntuales).
Ejemplo 1.3.5 Las siguientes caractersticas son ejemplos de variables discretas
nmero de cuartos en una casa
nmero de carros en el estacionamiento del claustro
nmero de estudiantes en la clase de estadsticas.
Note que cada una de estas variables puede valer un nmero entero (por ejemplo: 1,2,3,
etc.) pero no puede valer nmeros fraccionarios (por ejemplo: 1,5). Tpicamente, las variables
discretas resultan de un conteo.
Definicin 1.3.6 : Variables Continuas
Las variables continuas pueden asumir todos los valores dentro de un rango especfico
(valores dentro de un intervalo)
Ejemplo 1.3.6 Las siguientes caractersticas son ejemplos de variables continuas
presin del aire en una llanta
el tiempo que se toma en viajar de It a San Lorenzo
el peso de los jugadores de ftbol del club Cerro Porteo
Tpicamente, las variables continuas resultan de medir algo, y lgicamente dependen de
la exactitud del instrumento de medicin.
1.3. VARIABLES
1.3.2.
12
Escalas de medicin
La estadstica no realiza sus funciones directamente sobre las modalidades observadas,

sino que stas se representan por valores numricos, y la estadstica realiza sus funciones
sobre esos valores numricos.
Se llama medicin al proceso de atribuir nmeros a las caractersticas. La medicin estudia las condiciones de construccin de representaciones numricas, y los modelos desarrollados para la medicin se llaman escalas. Por lo tanto los datos se pueden clasificar de
acuerdo con niveles de medicin. Hay cuatro escalas de medicin que son: nominal, ordinal,
de intervalo y de razn.
Definicin 1.3.7 : Escala Nominal
El trmino nivel nominal es normalmente usado para referirse a datos que solamente
pueden clasificarse en categoras. Es la escala de medicin ms bajo o ms primitiva. Sin
embargo, no hay mediciones y no hay escalas involucradas, solo hay conteo. En este tipo de
nivel de medicin el orden en que estn acomodadas las categoras es totalmente arbitrario.
Ejemplo 1.3.7 Religiones en Mxico (poblacin con 5 aos o ms, censo del 2000)
Categora
Religin Catlica
Religin no catlica
Sin religin
total
Seguidores
74 612 373
3 483 593
2 982 929
81 078 895
Definicin 1.3.8 : Escala Ordinal

Este tipo de nivel de medicin tiene caractersticas similares al nivel nominal con la diferencia de que en el nivel ordinal las categoras indican que unas son ms que las otras.
Ejemplo 1.3.8 Evaluacin de la atencin mdica en Uruguay en el ao 2006
Categora
Buena / muy buena
regular
mala / muy mala
no sabe / no contesta
total
Calificacin ( %)
75,7
17,1
2
5,2
100
Definicin 1.3.9 : Escala cuantitativa intervalar

En este nivel de medicin, las categoras estn definidas por intervalos de valores, y estn
acomodadas en orden a la magnitud de los valores. El tamao de los intervalos es el mismo.
Propiedades de la escala de intervalos

a) Las categoras de datos son mutuamente excluyentes y exhaustivas.
b) Las categoras de datos estn ordenadas de acuerdo con la cantidad de la caractersticas
que poseen.
1.3. VARIABLES
13
c) Diferencias iguales en la caracterstica estn representadas por diferencias iguales en

los nmeros asignados a las categoras
Ejemplo 1.3.9 Calificaciones de los aspirantes a la academia militar
Calificacin
90 - 99
80 - 89
70 - 79
60 - 69
Nmero de aspirantes
42
19
7
4
Definicin 1.3.10 : Escala cuantitativa Racional

La escala de razn es el de nivel ms alto. En este nivel al igual que en el nivel intervalar,
las categoras son del mismo tamao. La diferencia es que este nivel tiene un punto cero
significativo y el valor de las categoras es en relacin a ese punto, por lo que la relacin entre
dos nmeros tiene sentido.
Propiedades de la escala de Razn

a) Las categoras de datos son mutuamente excluyentes y exhaustivas.
b) Las categoras de datos estn ordenadas de acuerdo con la cantidad de las caractersticas que poseen.
c) Diferencias iguales en la caracterstica estn representadas por diferencias iguales en
los nmeros asignados a las categoras.
d) El punto cero refleja la ausencia de estas caractersticas.
Ejemplo 1.3.10 Ingreso de los empleados de la compaa en relacin a la media de la industria
Ingreso en relacin a la media
2000
1000
0
-1000
-2000
Nmero de empleados
12
25
32
17
10
Observacin
En la escala de medicin de una variable; sea cualitativa o cuantitativa; las categoras
deben ser mutuamente excluyentes. Esto significa que un individuo medicin pertenece
nicamente a una de las categorias. Adems las categoras deben ser exhaustivas, esto es
cada individuo medicin debe pertenecer a una de las categoras.
1.4. PROBLEMAS
1.4.
14
Problemas
1. Cul es el nivel de medicin de cada una de las siguientes variables?

a) Distancia que recorren los estudiantes para llegar a clases
b) Calificaciones de los estudiantes en la primera prueba de estadstica
c) Una clasificacin de los estudiantes segn el departamento en que nacieron
d) El nmero de horas que estudia por semana un estudiante
2. Cal es el nivel de medicin de estos incisos relacionados con la industria periodstica?
a) El nmero de peridicos vendidos cada domingo durante el ao 2010
b) El nmero de empleados en cada departamento, editorial, propaganda, deportes,
etctera.
c) Un resumen, por ciudad, del nmero de peridicos vendidos
d) El nmero de aos que lleva cada empleado en el peridico
3. En cada uno de los siguientes puntos determine si el grupo es una muestra o una
poblacin
a) Los participantes en un estudio de un nuevo medicamento para la diabetes
b) Todos los automovilistas que fueron multados por exceso de velocidad en la ciudad de San Lorenzo el mes pasado.
c) Todos los que reciben asistencia mdica en el Hospital Nacional de Itaugua
d) Nmero de artculos defectuosos encontrados en los embarques.
4. Las diferentes variables cuantitativas, A qu tipo de datos corresponden?
a) Nmero de clientes que llegan en un Banco antes del medio da
b) Sueldos que se pagan a los diferentes jubilados Bancarios
c) Superfice de tierra que corresponden a los Campesinos de San Pedro
d) Nivel de presin arterial de los varones mayores a 30 aos
5. En los ejemplos a continuacin establezca la muestra o poblacin
a) 50 ama de casa que utilizan determinada marca de detergentes en una ciudad de
800 habitantes.
b) Los montos de sueldos de cada uno de los trabajadores de una compaa
c) 100 estudiantes de la Universidad Nacional de Asuncin con sus respectivas calificaciones en Estadstica.
6. Diga cul es la variable y a qu naturaleza corresponde
a) Un estudiante recorre una distancia de 25 km para llegar a la Universidad
b) Distancia recorrida por un grupo de estudiantes para llegar a la Universidad
1.4. PROBLEMAS
15
c) Preferencia de color de cabello en las mujeres en tiempo de verano

d) Estado de nimo de los trabajadores de una compaia en horas de la siesta
e) Precios de los calzados de vestir masculino en una ciudad
f) Nmero de nios que no acuden diariamente en la semana en una escuela
7. Explique la diferencia entre variables cualitativas y cuantitativas.
8. Explique la diferencia entre poblacin y muestra
9. Defina el trmino mutuamente excluyentes
10. Defina el trmino mutuamente exhaustivo
11. A una muestra aleatoria de 500 clientes se le pidi probar una nueva pasta dental. De
los 500, 400 dijeron que era excelente, 32 pensaron que era buena y el resto de los
clientes no dieron ninguna opinin. Basandose en lo encontrado en la muestra haga
una diferencia de la reaccin de todos los clientes a la nueva pasta dental.
12. Una muestra aleatoria de 300 ejecutivos de los 2500 empleados en una empresa grande
mostr que 270 se mudaran a otro sitio si ello significara un ascenso importante.
Basndose en los hallazgos en la muestra describa la reaccin de todos los ejecutivo de la empresa.
13. Explique la diferencia entre variables discretas y continuas.
14. Defina el trmino escala
15. Cita los tipos de niveles de medicin
16. Identificar las escalas de medicin de las siguientes variables
a) Nmero de jugadores de ftbol
b) Ansiedad
c) Presin arterial
d) Estado de conciencia
e) Dolor
f) Grupo saguneo
g) Temperatura
Captulo 2
Distribuciones de Frecuencia
2.1.
Estadstica descriptiva
Como su nombre lo indica, la estadstica descriptiva es la parte de la estadstica que

describe y resume una serie de datos. La estadstica descriptiva hace nfasis en tres aspectos:
1. La forma de la distribucin. Para describir como estn distribuidos los datos utiliza una
herramienta llamada distribucin de frecuencia y presenta la informacin por medio
de tablas y grficas.
2. Las medidas de tendencia central: que resumen la informacin a una cifra que es representativa de la serie de datos.
3. Las medidas de variabilidad: que nos indican que tan variables son los datos respecto
a las medidas de tendencia central.
En este captulo se presenta una manera de elaborar una distribucin de frecuencia, en
las secciones siguientes se abordarn los temas de medidas de tendencia central y medidas
de variabilidad.
2.2.
Construccin
Una distribucin de frecuencias es una serie de datos agrupados en categoras, en las

cuales se muestra el nmero de observaciones que contiene cada categora.
Los pasos para la construccin de una distribucin de frecuencias son mejor explicados
con un ejemplo.
Ejemplo 2.2.1 Los siguientes datos son el nmero de meses de duracin de una muestra de
40 bateras para coche.
22
34
25
33
47
41
16
43
31
38
35
31
34
37
32
45
33
36
44
26
32
38
29
32
39
16
37
31
33
41
30
30
47
39
19
42
26
37
31
34
35
2.2. CONSTRUCCIN
17
1. Ordenacin de datos, que puede ser en orden ascendente o descendente

16
19
22
25
26
26
29
30
30
31
31
31
31
32
32
32
33
33
33
34
34
34
35
35
36
37
37
37
38
38
39
39
41
41
42
43
44
45
47
47
2. El rango (amplitud)
Rango = Dato mayor - Dato menor = 47 - 16 = 31
3. Nmero tentativo de los intervalos de clase (nic)
El nmero de intervalos (nic) puede ser como mnimo 5 y como mximo 15 de acuerdo
a la frmula : 2nic
Nmero de intervalos (nic)
5
6
7
8
9
10
Nmero mximo de datos (2nic )

32
64
128
256
512
1024
En este ejercicio, puesto que tenemos 40 datos el nic sera de 6.

Tambin al nic le podemos calcular de la siguiente manera:
nic = 1 + 3, 322log10 N = 1 + 3, 3222log10 40 = 6, 32 ' 6
4. Tamao de los intervalos de Clase (tic)
tic =
Rango
nic
31
6
= 5,16 que se redondea a 6
Para facilitar la clasificacin de los datos, el tic se redondea siempre al entero posterior.
5. Lmite inferior (LI)
Usualmente, el lmite inferior del primer intervalo de clase es el dato ms chico, que en
este ejemplo es 16.
El lmite inferior de los siguientes intervalos se calcula sumando el tic al lmite inferior
del intervalo anterior hasta llegar a un nmero no mayor al dato ms grande.
6. Lmite superior (LS)
El lmite superior se calcula con la siguiente frmula LS = LI + tic 1
2.2. CONSTRUCCIN
18
LI
16
22
28
34
40
46
LS
21
27
33
39
45
51
7. Lmite Superior Real (LSR)

Los lmites anteriores son los lmites nominales pero no son los reales. Los lmites
reales son el punto medio entre el lmite superior (LS) y el lmite inferior del siguiente
LS + LIsig
intervalo (LIsig), entonces LSR =
2
LI
16
22
28
34
40
46
LS
21
27
33
39
45
51
LSR
21,5
27,5
33,5
39,5
45,5
51,5
8. Marca de clase (X)

La marca de clase, tambin llamada punto medio del intervalo es la mitad de la distancia
entre los lmites inferior y superior de cada intervalo. La marca de clase es el valor ms
LI + LS
representativo de los valores del intervalo. Con lo cual X =
2
LI
16
22
28
34
40
46
LS
21
27
33
39
45
51
LSR
21,5
27,5
33,5
39,5
45,5
51,5
X
18,5
24,5
30,5
36,5
42,5
48,5
9. Clasificacin de los datos y conteo de frecuencias

Clasificar las observaciones en los intervalos. La prctica usual es marcar con una lnea
( / ) que representa una observacin. En el ejemplo la observacin 22 se clasifica en el
intervalo 20 - 24 porque se encuentra entre el 20 y el 24 inclusive. Una vez clasificados
todos los datos se cuentan las lneas de cada intervalo y el resultado es la frecuencia de
cada intervalo de clase.
2.2. CONSTRUCCIN
19
LI
16
22
28
34
40
46
LS
21
27
33
39
45
51
LSR
21,5
27,5
33,5
39,5
45,5
51,5
X
18,5
24,5
30,5
36,5
42,5
48,5
cuenta
//
////
///// ///// ///
///// ///// ///
///// /
//
F
2
4
13
13
6
2
10. Distribucin de frecuencia relativa (FR)

Se pueden convertir las frecuencias de clase en frecuencias relativas de clase para
mostrar los porcentajes de observaciones en cada intervalo de clase. Para convertir
una distribucin de frecuencia en una distribucin de frecuencia relativa cada una de
F
las frecuencias de clase se dividen entre el nmero total de observaciones FR =
n
LI
16
22
28
34
40
46
LS
21
27
33
39
45
51
LSR
21,5
27,5
33,5
39,5
45,5
51,5
X
cuenta
18,5
//
24,5
////
30,5 ///// ///// ///
36,5 ///// ///// ///
42,5
///// /
48,5
//
F
2
4
13
13
6
2
FR
2/40 = 0, 05
4/40 = 0, 1
13/40 = 0, 325
13/40 = 0, 325
6/40 = 0, 15
2/40 = 0, 05
11. Distribuciones de frecuencia acumulada

Las distribuciones de frecuencia acumulada se usan cuando queremos determinar cuantas observaciones, o que porcentaje de observaciones estn debajo de cierto valor.
La distribucin de frecuencia acumulada (FA) de cierto intervalo se calcula sumando
las frecuencias de clase desde el primer intervalo hasta la frecuencia de clase del intervalo de inters. Si queremos la frecuencia acumulada del intervalo 25 - 29, sumamos
las frecuencias de clase 2 + 1 + 4 = 7.
La distribucin de frecuencia relativa acumulada (FAR) de cierto intervalo se calcula
dividiendo la frecuencia acumulada entre el nmero total de observaciones
FA
FRA =
n
LI LS
16 21
22 27
28 33
34 39
40 45
46 51
LSR
21,5
27,5
33,5
39,5
45,5
51,5
X
18,5
24,5
30,5
36,5
42,5
48,5
cuenta
//
////
///// ///// ///
///// ///// ///
///// /
//
F
2
4
13
13
6
2
FR
0,05
0,1
0,325
0,325
0,15
0,05
FA FRA
2
0,05
6
0,15
19 0,475
32
0,8
38 0,95
40
1
2.2. CONSTRUCCIN
2.2.1.
20
Representacin Grfica
Tres grficas que nos ayudarn a representar grficamente una distribucin de frecuencias
son el histograma, el polgono de frecuencia y la ojiva de frecuencia acumulada.
El histograma
El histograma es una de las grficas ms ampliamente utilizadas y una de las mas fciles
de entender. Un histograma describe una distribucin de frecuencia utilizando una serie de
rectngulos adyacentes donde la altura de cada rectngulo es proporcional a la frecuencia de
clase que representa.
Figura 2.1: Representacin grfica de un histograma de frecuencia
Figura 2.2: Representacin grfica de un histograma de frecuencia relativa
2.2. CONSTRUCCIN
21
Polgono de frecuencia
El polgono de frecuencia consiste de segmentos de lnea conectando los puntos formados
por la interseccin de las marcas de clase y las frecuencias de clase.
Figura 2.3: Representacin grfica de un polgono de frecuencia
El polgono de frecuencia relativa

Es similar al anterior solo que en este se muestran porcentajes, es decir las frecuencias
relativas de cada clase.
Figura 2.4: Representacin grfica de un polgono de frecuencia relativa
2.3. PROBLEMAS
22
Ojivas de Frecuencia Acumulada

Las distribuciones de frecuencia acumulada y frecuencia relativa acumulada se presentan
grficamente con las ojivas de frecuencia acumulada y frecuencia relativa acumulada, que es
una grfica de segmentos de lnea que une los puntos donde se cruzan los lmites reales con
las frecuencias acumuladas y relativas acumuladas de cada intervalo de clase.
Figura 2.5: Representacin grfica de una ojiva de frecuencia acumulada
2.3.
Problemas
Elabore la distribucin de frecuencias de las siguientes series de datos, con sus respectivas
grficas:
1. Los resultados siguientes representan las calificaciones del examen final de un curso
de estadstica elemental.
23
80
52
41
60
34
60
77
10
71
78
67
79
81
64
83
89
17
32
95
75
54
76
82
57
41
78
64
84
69
74
65
25
72
48
74
52
92
80
88
84
63
70
85
98
62
90
80
82
55
81
74
15
85
36
76
67
43
79
61
2. Una compaa de cambio de aceite tiene varias sucursales en la zona metropolitana. El

nmero de cambios de aceite en la sucursal de la calle Roble en los pasados 20 das
son:
66 98 55 62 79 59 51 90 72 56
70 62 66 80 94 79 63 73 71 85
2.3. PROBLEMAS
23
3. El gerente de una firma especializada en renta de condominios para vacacionistas,

quiere saber como estn distribuidas los montos de las rentas mensuales de los departamentos de la firma. Seleccion una muestra de departamentos cuyas muestras son
mostradas abajo.
1170
1332
1471
1826
1440
1119
1352
Rentas mensuales de los condominios

1581 1277 1305 1472 1077 1319
1949 1403 1744 1532 1219 896
1041 1379 821 1558 1118 1533
1426 1288 1394 1545 1032 1289
1329 1407 718 1457 1449 1455
1400 1442 1593 1962 1263 1788
1459 1823 1451 1138 1592 982
1207
1418
1399
1309
1421
1020
1340
1537
1500
1510
695
2051
1501
1981
1849
1671
1760
803
1677
1668
1091
4. Los siguientes datos representan la duracin de la vida en meses de 30 bombas de

combustible similares.
24
3
18
36
72
48
4
66
71
40 16
78 3
22 57
5 18
28 67
9 54
6
72
4
30 60
15 3
12 72
5. Los siguientes datos representan la duracin de la vida, en segundos, de 50 moscas

sometidas a un nuevo atomizador en un experimento de laboratorio controlado.
17
12
16
13
7
20
14
18
7
10
10
6
8
18
5
9
9
13
7
14
23
13
3
10
15
13 12
6 7
32 9
4 27
10 9
19
10
7
19
6
18 24
13 7
10 11
16 8
7 15
6. Se aplic una encuesta donde se les pide indicar el nmero de amigos o parientes que
visitan cuando menos una vez al mes. Los resultados son los siguientes:
3
2
5
4
9
4
5
4
6
14
4
3
2
2
4
3
1
5
3
5
3
5
4
7
3
3
2
6
2
3
4
3
2
3
4
5
1
3
6
4
3
6
8
0
3
2
5
2
4
3
5
4
0
2
7. El gerente de un negocio de comida rpida esta interesado en el nmero de veces que

un cliente compra en su tienda durante un periodo de dos semanas. Las respuestas de
los 51 clientes fueron:
5
1
5
3
2
9
3
4
11
1
4
3
4
4
12
4
5
4
5
6
7
6
3
6
4 2
5 3
5 15
6
4
1
6 6
5 6
1 10
7 1
8 4
8 9
1
7
2
14
6
12
2.3. PROBLEMAS
24
8. El presidente de una agencia de viajes, quiere informacin sobre las edades de la gente
que toma cruceros por el Caribe. Una muestra de 40 clientes que tomaron un crucero
el ao pasado revel estas edades:
77
36
62
60
18
26
43
45
63
50
52
66
84
34
53
83
38
44
63
71
54
41
62
63
50
58
62
58
59
58
65
61
54
53
61
71
56
51
52
60
9. Una cadena de tiendas de artculos deportivos al servicio de esquiadores principiantes,

planea hacer un estudio de cuanto gasta un esquiador principiante en su primera compra de equipo. Una muestra de recibos de sus cajas registradoras revel esas compras
iniciales.
140
235
162
87
82
212
126
128
265
171
216
126
168
149
195
175
90
156
127
127
114
162
161
149
172
118
135
126
230
139
172
121
142
149
220
118
86
132
229
172
125
105
129
126
10. Se conduce un estudio de los efectos de fumar sobre los patrones de sueo. La medicin
que se observa es el tiempo, en minutos, que toma quedar dormido. Se obtienen estos
datos:
69 56 22 28 41 28 47 53 48
30 34 13 52 34 60 25 21 37
43 23 13 31 29 38 26 36 30
11. Un banco seleccion una muestra de 40 cuentas de cheques de estudiantes. Abajo
aparecen sus saldos de fin de mes.
404
87
703
968
74
234
125
712
234
68
350
503
149
489
440
498
279
57
37
327
215
185
252
608
123
141
27
358
55
758
521
425
43
72
302
303
321
863
127
203
12. Una compaa de luz seleccion una muestra de 20 clientes residenciales. Los siguientes datos son las cuentas que se les factur el mes pasado:
54
67
48
68
58
39
50 25
35 56
47 75
66 33
46
62
60 70
65 67
13. Una muestra de suscriptores de una compaa telefnica revel los siguientes nmeros
de llamadas recibidas en la ltima semana.
52
39
43
37
30 38
34 46
30 42
32 18
12
41
46
5
Captulo 3
Medidas de tendencia central
Promedios
A las medidas de tendencia central con frecuencia se les llama promedios. El propsito
de una medida de tendencia central es indicar con toda precisin el centro de un conjunto de
observaciones.
3.1.
La Media
3.1.1.
La Media Geomtrica
La media geomtrica es til para encontrar el promedio de porcentajes, proporciones,

ndices, o tasas de crecimiento. Tiene mucha aplicacin en el comercio y la economa porque
nos interesa encontrar el porcentaje de cambio en ventas, salarios o datos econmicos como el
producto nacional bruto. La media geomtrica de un conjunto de "n"nmeros enteros positivo
se define como la n-sima raz del producto de los n valores es decir:
p
n
X1 , X2 , . . . , Xn
Ejemplo 3.1.1 Suponga que usted recibe un 5 % de aumento en su salario este ao y un
15 % de aumento el ao prximo y quiere saber cual es el incremento porcentual promedio.
Si tiene un aumento del 5 % entonces su salario es 1,05 y si tiene un p
aumento del 15 %
su salario es de 1,15 entonces calculando la media geomtrica se obtiene (1, 05)(1, 15) =
1, 09886, por lo que el aumento promedio anual es del 9, 886 %.
Ejemplo 3.1.2 Las ganancias obtenidas por Atkins Construction Company en cuatro proyectos recientes fueron 3 %, 2 %, 4 % y 6 %. Cul es la media de las ganancias?
Por lo que la media de ganancias obtenidas por Atkins Construction Company en los
cuatro proyectos esta dada por
p
4
(0, 03)(0, 2)(0, 4)(0, 6) = 0, 03464
o sea 3,464 %
25
3.1. LA MEDIA
3.1.2.
26
La Media Aritmtica
La medida de tendencia central mas ampliamente usada es la media aritmtica, usualmente abreviada como media.
La media aritmtica de un conjunto de n valores (observaciones) es el resultado de la
suma de todos ellos dividido entre n.
3.1.3.
Propiedades de la media aritmtica
1. Puede ser calculada en distribuciones con escala relativa e intervalar.

2. Todos los valores son incluidos en el cmputo de la media.
3. Una serie de datos solo tiene una media.
4. Es una medida muy til para comparar dos o ms poblaciones.
5. Es la nica medida de tendencia central donde la suma de las desviaciones de cada
valor respecto a la media es igual a cero. Por lo tanto podemos considerar a la media
como el punto de balance de una serie de datos.
3.1.4.
Desventajas de la media aritmtica
1. Si alguno de los valores es extremadamente grande o extremadamente pequeo, la

media no es el promedio apropiado para representar la serie de datos.
2. No se puede determinar si en una distribucin de frecuencias hay intervalos de clase
abiertos.
3.1.5.
La media para datos no agrupados
Para datos crudos, es decir datos no agrupados, la media es la suma de todos los valores
dividido entre el nmero total de valores. Para encontrar la media de una muestra se usa la
siguiente frmula:
n
Xi
X=
i=1
Donde:
X : es la media de la muestra
n
Xi : es la suma de todos los valores de la muestra
i=1
n : es el nmero de elementos de la muestra

Ejemplo 3.1.3 El contenido de cinco botellas de perfume seleccionadas de forma aleatoria
de la lnea de produccin son (en ml): 85,4 ; 85,3 ; 84,9 ; 85,4 ; y 84,0. Cul es la media
aritmtica de estas observaciones?
3.1. LA MEDIA
27
Xi
X=
3.1.6.
i=1
85, 4 + 85, 3 + 84, 9 + 85, 4 + 84, 0

= 85, 0
5
La media para datos agrupados
Frecuentemente los datos ests agrupados y presentados en forma de distribucin de frecuencias. Si esto sucede es normalmente imposible recuperar los datos crudos originales. Por
consiguiente si queremos calcular la media u otro estadstico es necesario estimarlo en base
a la distribucin de frecuencias.
La media aritmtica de una muestra de datos organizados en una distribucin de frecuencias se calcula de la siguiente manera:
X=
fi Xi
n
Donde:
X : simboliza la media de la muestra
Xi : es la marca de clase del intervalo i-simo
fi : es la frecuencia de clase del intervalo i-simo
fiXi : es la suma de los productos de fi por Xi

n = f : es la suma de las frecuencias de clase
Ejemplo 3.1.4 Calcular la media aritmtica de la siguiente distribucin de frecuencia del
nmero de meses de duracin de una muestra de 40 bateras para coche.
duracin de las bateras (meses)
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
Nmero de bateras
2
1
4
15
10
5
3
Damos como un hecho que ya sabemos elaborar una distribucin de frecuencias, si se

quiere ver como se elabor vaya a la seccin de ese tema en este mismo sitio.
Primeramente, de la distribucin de frecuencias que ya tenemos, utilizaremos las marcas de clases y la frecuencias de clases, para despus calcular el producto fi Xi y proceder
3.2. LA MEDIANA
28
finalmente a calcular la sumatoria fi Xi y aplicar la frmula.

LI
15
20
25
30
35
40
45
3.1.7.
LS
19
24
29
34
39
44
49
Xi
17
22
27
32
37
42
47
fi
2
1
4
15
10
5
3
n =40
fi Xi
34
22
108
480
370
210
141
fiXi = 1365
X=
fi Xi 1365
=
= 34, 12
n
40
La media de la poblacin
Las medidas caractersticas de una muestra son llamadas estadsticos y las medidas caractersticas de una poblacin se denominan parmetros. La media de la poblacin se calcula
de la misma manera que la media de la muestra, que calculamos arriba, pero tiene diferente
notacin:
N
Xi
i=1
Donde:
: es la media de la poblacin
N
Xi : es la suma de todos los valores de la poblacin
i=1
N : es el nmero de elementos de la poblacin
3.2.
La mediana
Cuando una serie de datos contiene uno o dos valores muy grandes o muy pequeos, la
media aritmtica no es representativa. El valor central en tales problemas puede ser mejor
descrito usando una medida de tendencia central llamada mediana.
La mediana es el punto medio de los valores de una serie de datos despus de haber
sido ordenados de acuerdo a su magnitud. Hay tantos valores antes que la mediana como
posteriores en el arreglo de datos.
Ejemplo 3.2.1 El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de
la lnea de produccin son (en ml): 85,4 ; 85,3 ; 84,9 ; 85,4 ; y 84,0. Cul es la mediana de
las observaciones muestreadas?
3.2. LA MEDIANA
29
85,9
85,4
85,4 X
84,3
84,0
Por lo que la mediana es X = 85, 4
Ejemplo 3.2.2 Una muestra de los honorarios de paramdicos cargados por la clnica Baltimore revel las siguientes cantidades: 35,29, 30,25, 32,35. Cul es la mediana?
25
29
30
32
35
35
En este caso la mediana se calcula obteniendo la media de las dos observaciones centrales
30 + 32
= 31
X =
2
3.2.1.
Propiedades de la mediana
1. Hay solo una mediana en una serie de datos.

2. No es afectada por los valores extremos ( altos o bajos )
3. Puede ser calculada en distribuciones de frecuencia con intervalos abiertos, si no se
encuentra en el intervalo abierto.
4. Puede ser calculada en distribuciones con escala relativa, intervalar, y ordinal.
3.2.2.
La mediana para datos agrupados
Cuando los datos se encuentran agrupados en una distribucin de frecuencia no conocemos los datos originales, por lo tanto es necesario estimar la mediana mediante los siguientes
pasos:
1. Calcular el valor
n
2
2. Localizar el intervalo de clase donde se encuentra la mediana (intervalo mediano).

Esto se hace encontrando el primer intervalo de clase donde la frecuencia acumulada
n
es igual o mayor que .
2
3.2. LA MEDIANA
30
3. Aplicando la siguiente frmula con los valores del intervalo mediano:

X = LRI +
( n2 FA)tic
F
Donde:
X : mediana de la muestra
LRI : Limite real inferior del intervalo mediano
FA : frecuencia acumulada anterior a la frecuencia del intervalo mediano
tic : tamao de los intervalos de clase
F : frecuencia del intervalo mediano
Ejemplo 3.2.3 Calcular mediana de la siguiente distribucin de frecuencia del nmero de
meses de duracin de una muestra de 40 bateras para coche.
Duracin de las bateras (meses)
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
Nmero de bateras
2
1
4
15
10
5
3
Para calcular la mediana de una distribucin de frecuencias necesitamos obtener el intervalo el intervalo mediano para luego obtener el lmite superior real (LSR), la frecuencia
acumulada anterior a la frecuencia de la mediana (FA) y la frecuencia absoluta de la mediana
(F).
Procedamos entonces a localizar el intervalo mediano a travs de los siguientes pasos
1. El valor de
n 40
=
= 20
2
2
2. El intervalo mediano es:

LI LS
15 19
20 24
25 29
30 34
35 39
40 44
45 49
LSR
19,5
24,5
29,5
34,5
39,5
44,5
49,5
X
17
22
27
32
37
42
47
F
2
1
4
15
10
5
3
FA
2
3
7
22 intervalo mediano
32
37
40
3.3. LA MODA
31
Aplicar la frmula con los datos del intervalo mediano:

X = LRI +
3.3.
( n2 FA)tic
(20 7)(5)
= 29, 5 +
= 33, 83
F
15
La moda
La moda es la medida de tendencia central especialmente til para describir mediciones

de tipo ordinal y nominal. Es el valor de la observacin que aparece ms frecuentemente.
3.3.1.
Propiedades de la moda
1. La moda se puede determinar en todos los tipos de mediciones (nominal, ordinal, intervalar, y relativa).
2. La moda tiene la ventaja de no ser afectada por valores extremos.
3. Al igual que la mediana, puede ser calculada en distribuciones con intervalos abiertos.
3.3.2.
Desventajas de la moda
1. En muchas series de datos no hay moda porque ningn valor aparece ms de una vez.
2. En algunas series de datos hay ms de una moda, en este caso uno podra preguntarse
cual es el valor representativo de la serie de datos?
la lnea de produccin son (en ml): 85,4 ; 85,3 ; 84,9 ; 85,4 ; y 84,0. Cul es la moda de las
observaciones muestreadas?
La moda de esta secuencia de observaciones es X=85,4
3.3.3.
La moda para datos agrupados
Para datos agrupados en una distribucin de frecuencia, la moda puede ser estimada siguiendo los siguientes pasos:
1. Localizar la clase del intervalo que contenga la frecuencia de clase ms grande.
2. Aplicando la siguiente frmula con los valores del intervalo de la moda:
= LRI +
X
Donde:
: la moda de los datos de la muestra
X
LRI : Limite real inferior de la clase modal
1
tic
1 + 2
3.3. LA MODA
32
1 : diferencia entre la frecuencia de la clase modal y la frecuencia de la clase anterior.

2 : diferencia entre la frecuencia de la clase modal y la frecuencia de la clase posterior.
tic : tamao de los intervalos de clase
Si hay dos intervalos contiguos con frecuencia mxima la moda ser la media aritmtica
de las dos marcas de clases. Si hay dos o ms intervalos no contiguos con frecuencia de clase
mxima habr dos o ms modas que sern las marcas de clases de dichos intervalos.
Ejemplo 3.3.2 Calcular las modas de las siguientes distribuciones de frecuencia:
X
5
10
15
20
25
30
X F
5 4
10 8
15 6
20 7
25 8
30 8
X
5
10
15
20
25
30
3.3.4.
F
4
3
15
9
10
7
15
X=
hay dos moda

10
X=
X =
F
4
4
4
4
4
4
(25+30)
2
= 27, 5
no hay moda
Comparacin entre medidas de tendencia central
Si no hay ningn argumento de peso en contra, se preferir siempre la media. Hay dos
razones para apoyar esta norma general. La primera es que en ella se basan otros estadsticos
y la segunda es que es mejor estimador de su parmetro que la mediana y la moda.
Hay al menos tres situaciones en las que se preferir la mediana a la media:
Cuando la variable est medida en escala ordinal
Cuando haya valores extremos que distorsionen la interpretacin de la media
3.4. PROBLEMAS
33
Cuando haya intervalos abiertos, situaciones en las que el intervalo superior carece de
lmite superior, el intervalo inferior carece de lmite inferior o ambos.
La media es extremadamente sensible a las puntuaciones y un cambio en slo una de ellas
supone un cambio en la media aritmtica, mientras que la mediana slo se vera alterada por
cambios en los valores centrales.
La mediana ser la segunda candidata para representar la tendencia central y se preferir
la mediana a la moda, a menos de que:
a) Se trate de una variable medida en escala nominal
b) Haya intervalos abiertos y la mediana pertenezca a uno de ellos.
3.3.5.
Relacin entre las medidas de tendencia central
1. Para una distribucin simtrica los valores de la media, la mediana y la moda coinciden
con lo cual la distribucin de datos no presenta sesgo.
es decir: X = X = X,
Observacin : Esta igualdad no es exacta, sino que se cumple con mayor o menor
aproximacin en funcin del grado de simetra de la curva que represente grficamente
la distribucin.
con lo cual la
2. Para una distribucin asimtrica negativa se tiene que: X < X < X,
distribucin de datos presenta un sesgo negativo.
< X < X, con lo cual la dis3. Para una distribucin asimtrica positiva se tiene que: X
tribucin de datos presenta un sesgo positivo.
Observacin: La regla emprica se acepta como vlida siempre que el grado de curva
no sea muy acentuado.
3.4.
Problemas
1. El departamento de agricultura, tiene los siguientes datos que representan el crecimiento mensual (en pulgadas) de muestras de maz recien plantados
0,4
0,9
1,9
0,7
1,5
0,9
0,9
0,7
0,3
0,7
1,6
1,5
0,4
0,5
1,5
1,5
1,2
1,7
0,8
1,8
a) Organice los datos en un ordenamiento ascendente

b) calcula las medidas de tendencia central considerando los a datos como simples
2. Un fabricante de neumticos quiere determinar el dimetro interior de cierto grado de
los neumticos. Idealmente el dimetro sera 570mm. Los datos son los siguientes:
572
572
573
568
569
575
565
570
Encuentre las medidas de tendencia central y analice la relacin entre ellas
3.4. PROBLEMAS
34
3. A continuacin presentamos los datos de una muestra de la tasa de produccin diaria

de de botes de fibra de vidrio de la Hidrosport Lt. Un fabricante de Miami.
17
21
18
27
17
21
20
22
18
23
a) Calcule las mediadas de tendencia central e interprete los resultados

b) Compare las mediadas de tendencia central
4. Dada la distribucin de frecuencia de rentas mensuales de 200 departamentos (en miles
de pesos)
Renta mensual (en miles de pesos)
350-379
380-409
410-439
440-469
470-499
500-529
530-559
560-589
590-619
620-649
Total
No de departamentos
3
8
10
13
33
40
35
30
16
12
200
Determine las medidas de tendencia central y analice la relacin entre ellas

5. las edades de 60 personas que trabajan en una fbrica textil se han tabulado dando la
siguiente tabla de frecuencias:
Edades
13-17
18-22
23-27
28-32
33-37
38-42
43-47
48-52
53-57
Total
No de personas
2
6
10
13
18
6
2
2
16
60
a) Hallar las mediadas de tendencia central

b) Interpretar los resultados de la parte a)
c) Comparar las mediadas de tendencia central
Captulo 4
Medidas de Variabilidad
4.1.
Introduccin
Qu son las medidas de variabilidad?

Las medidas de variabilidad de una serie de datos, muestra o poblacin, permiten identificar que tan dispersos o concentrados se encuentran los datos respecto a una medida de
tendencia central.
Hay varias razones para analizar la variabilidad en una serie de datos. Primero, al aplicar
una medida de variabilidad podemos evaluar la medida de tendencia central utilizada. Una
medida de variabilidad pequea indica que los datos estn agrupados muy cerca, digamos, de
la media. La media, por lo tanto es considerada bastante representativa de la serie de datos.
Inversamente, una gran medida de variabilidad indica que la media no es muy representativa
de los datos.
Una segunda razn para estudiar la variabilidad de una serie de datos es para comparar
como estn esparcidos los datos en dos o ms distribuciones. Por ejemplo, la calificacin
promedio de dos estudiantes, A = {90, 80, 75, 75} y B = {90, 55, 85, 90}, es de 80. Basados
en esto podramos pensar que sus calificaciones son idnticas. Pero si revisamos el detalle de
sus calificaciones vemos que esta conclusin no es correcta.
4.2.
Variabilidad
4.2.1.
Rango y rango intercuartlico
Definicin 4.2.1 : Amplitud o Rango

Es la diferencia entre observaciones extremas, es decir la diferencia entre el mayor y el
menor valor. Es muy sensible a los valores extremos.
Ejemplo 4.2.1 Dadas las siguientes observaciones 2,1,4,3,8,4. Calcular el rango
R = 81 = 7
Definicin 4.2.2 : Rango intercuartlico
35
4.2. VARIABILIDAD
36
Es parecida al rango, pero eliminando las observaciones ms extremas o sea las inferiores
y superiores. Por lo que no es tan sensible a valores extremos. Es la distancia entre primer y
tercer cuartil.
Rango intercuartil = Q3 Q1
4.2.2.
(4.2.1)
Desviacin media
La desviacin media mide la cantidad promedio que varan los datos respecto a su media.
Es la media aritmtica de los valores absolutos de las desviaciones de los datos respecto a su
media. La frmula de la desviacin media ( Dm ) es:
n
|Xi X|
Dm =
i=1
(4.2.2)
Ejemplo 4.2.2 El contenido de cinco botellas de perfume seleccionadas de forma aleatoria

de la lnea de produccin son (en ml): 85,4 ; 85,3; 84,9 ; 85,4 y 84,0. Cul es la desviacin
media de las observaciones muestreadas?
X
X X
85,4 + 0.4
85,4 + 0.4
85,3 + 0.3
84,9 - 0.1
84,0 - 1.0
|X X|
0.4
0.4
0.3
0.1
1.0
|Xi X|
Dm =
4.2.3.
i=1
2, 2
= 0, 44
5
Desviacin media para datos agrupados
En el caso de que los datos se encuentren agrupados en una distribucin de frecuencia la

frmula es :
Dm =
fi|Xi X|
n
(4.2.3)
Ventajas y desventajas de la desviacin media

La desviacin media tiene dos ventajas. Utiliza para su cmputo todos los elementos de
la serie de datos y es fcil de entender. Sin embargo, es difcil trabajar con valores absolutos
y por ello la desviacin media no es usada frecuentemente.
Cuando la suma de las desviaciones parciales absolutas es igual a cero, la desviacin
media no es una medida de variabilidad aceptable. Por ejemplo, tenemos dos series de datos:
A = {0, 50, 100} y B = {49, 50, 51}
4.2. VARIABILIDAD
37
Claramente observamos que la serie B tiene una dispersin mayor que la serie A, sin
embargo en ambos casos la desviacin media es cero.
4.2.4.
Varianza y desviacin estndar
La varianza y la desviacin estndar sirven para cuantificar la variabilidad de una muestra

midiendo su dispersin alrededor de la media.
Varianza
Es la media aritmtica de las desviaciones cuadradas de los datos respecto a la media.
Desviacin estndar
Es la raz cuadrada de la varianza.
Varianza y desviacin estndar para datos no agrupados
Las frmulas de la varianza de una poblacin y de una muestra son ligeramente diferentes.
Las frmulas son:
N
(Xi )2
i=1
2 =
Xi2
i=1
(4.2.4)
(4.2.5)
para la varianza de una poblacin y

n
S2 =
(Xi X)2
i=1
Xi2
i=1
para la varianza de una muestra.

Las desviaciones estndar de la poblacin y muestra se calculan simplemente sacando la
raz cuadrada a la respectiva varianza.
p
= 2
(4.2.6)
desviacin estndar de una poblacin y
S=
S2
(4.2.7)
desviacin estndar de una muestra

la lnea de produccin son (en ml): 85,4; 85,3; 84,9; 85,4; y 84,0. Cul es la varianza y la
desviacin estndar de las observaciones muestreadas?
4.2. VARIABILIDAD
38
X2
7293,16
7276,09
7208,01
7293.16
7056.00
2
X = 36126, 42
X
85,4
85,3
84.9
85.4
84.0
Xi = 425, 0
Con lo cual la media de la muestra es
X=
425, 0
= 85
5
entonces la varianza est dada por

n
S2 =
Xi2
i=1
X =
36126, 42
852 = 0, 284
5
la cual arroja una desviacin estndar muestral de

S = 0, 595818764
Varianza y desviacin estndar para datos agrupados
Si los datos estn agrupados en una distribucin de frecuencia, la varianza y la desviacin
estndar de la muestra se pueden aproximar sustituyendo S fi Xi2 por SXi2 y S fi Xi por SXi . Las
frmulas quedaran de la siguiente manera:
N
2 =
fi (Xi )2
fiXi2
i=1
i=1
(4.2.8)
(4.2.9)
fiXi
para la varianza de una poblacin, en donde =

n
S2 =
i=1
fi (Xi X)2
i=1
,y
fiXi2
i=1
fiXi
para la varianza de una muestra, en donde X =
i=1
Al igual que en la situacin anterior las desviaciones estndar de la poblacin y muestra

se calculan sacando la raz cuadrada a la respectiva varianza.
p
= 2
(4.2.10)
desviacin estndar de una poblacin y
4.3. PROBLEMAS
39
S=
S2
(4.2.11)
desviacin estndar de una muestra

Ejemplo 4.2.4 Calcular la varianza y la desviacin estndar de la siguiente distribucin de
frecuencia del nmero de meses de duracin de una muestra de 40 bateras para coche.
duracin de las bateras (meses)
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
Nmero de bateras
2
1
4
15
10
5
3
Primeramente, calculamos la marca de clase, para despus calcular los productos fi Xi y

para proceder finalmente a calcular las sumatorias fi Xi y fi Xi2 y aplicar las frmulas.
fi Xi2
LI
15
20
25
30
35
40
45
LS
19
24
29
34
39
44
49
X
17
22
27
32
37
42
47
fi
2
1
4
15
10
5
3
n =40
fi Xi
34
22
108
480
370
210
141
f
X
i i = 1365
fi Xi2
588
484
2916
15360
13690
8820
6627
fi Xi2 = 48475
Entonces la media de la muestra es

X=
1365
= 34, 125
40
con lo cual la varianza muestral es

n
S2 =
fiXi2
i=1
X =
48475
(34, 125)2 = 47, 359375
40
que arroja una desviacin estndar de

S = 6, 881814804
4.3.
Problemas
1. Se conduce un estudio de los efectos de fumar sobre los patrones de sueos. La medicin que se observa es el tiempo, en minutos, que toma quedar dormido. Se obtiene
4.3. PROBLEMAS
40
estos datos:
Fumadores
No fumadores
69,3 56,0
28,6 25,1
22,1
26,4
47,6
34,9
53,2 48,1
29,8 38,5
52,7
30,2
34,4
30,6
60,2 43,8
31,8 41,6
a) Encuentre las medidas de tendencia central para cada grupo

b) Encuentre la varianza y desviacin estndar de cada grupo
c) Diga cual de los dos grupos de datos est ms concentrada
2. La compaa National Tire tiene fondos de reserva en valores negociable a corto plazo.
El saldo diario de cierre (en millones de dlares) de la cuenta de valores negociables
en lapso de dos semanas es el que mostramos a continuacin
Semana 1
Semana 2
1973
1969
1970
1892
1972 1975
1893 1887
1976
1895
a) Calcula las mediadas de tendencia central para cada grupo e interprete los resultados obtenidos.
b) Calcula la desviacin media, la varianza, la desviacin tpica y el coeficiente de
variacin de cada grupo.
c) Diga cual de los grupos tiene mejor concentracin
Captulo 5
Probabilidad
5.1.
Introduccin
La teora de probabilidad tuvo como uno de sus primeros puntos de partida el intentar
resolver un problema particular concerniente a una apuesta de juego de dados entre dos personas. El problema al que nos referimos involucraba una gran cantidad de dinero y puede
plantearse de la siguiente forma: Dos jugadores escogen cada uno de ellos un nmero del 1
al 6, distinto uno del otro, y apuestan 32 doblones de oro a que el nmero escogido por uno
de ellos aparece en tres ocasiones antes que el nmero del contrario al lanzar sucesivamente
un dado. Suponga que el nmero de uno de los jugadores ha aparecido dos veces y el nmero
del otro una sola vez. Cmo debe dividirse el total de la apuesta si el juego se suspende?
Uno de los apostadores, Antonio de Gombaud, popularmente conocido como el caballero
De Mere, deseando conocer la respuesta al problema plantea a Blaise Pascal (1623-1662) la
situacin. Pascal a su vez consulta con Pierre de Fermat (1601-1665) e inician un intercambio
de cartas a propsito del problema. Esto sucede en el ao de 1654. Los historiadores de
la matemtica stan generalmente de acuerdo en considerar este hecho como el origen del
estudio de las probabilidades. Con lo anteriormente mencionado se inician algunos esfuerzos
por dar solucin a ste y otros problemas similares que se plantean. Con el paso del tiempo
se sientan las bases y las experiencias necesarias para la bsqueda de una teora matemtica
que sintetice los conceptos y los mtodos de solucin de los muchos problemas particulares
resueltos a lo largo de varios aos.
Las ideas de probabilidades permanecen circunscritas a los problemas de juegos de azar
hasta que Pierre Laplace (1749-1827) y Friedrich Gauss (1777-1855) hacen notar que las
teorias desarrolladas son aplicables tambin a otras actividades diferentes de los juegos de
azar. En el segundo congreso internacional de matemticas, celebrado en la ciudad de Paris
en el ao 1900, el matemtico David Hilbert (1862-1943) plantea 23 problemas matemticos
de importancia. Uno de estos problemas es el de encontrar axiomas o postulados a partir
de los cuales se pueda construir una teora matemtica de la probabilidad. Aproximadamente treinta aos despus, en 1933, el matemtico ruso Andrei Nikolaevich Kolmogorov
(1903-1987) propone ciertos axiomas basados en la teora de la medida desarrollada por
H. Lebesgue(1875-1941), que a la postre resultaron adecuados para la construccin de una
teora de la probabilidad. Esta teora prevalece hoy en da y ha adquirido el calificativo de
teora clsica. Actualmente la teora clsica de la probabilidad se ha desarrollado y exten41
42
dido enormemente gracias a muchos pensadores que han contribudo a su crecimiento, y es

sin duda una parte importante y bien establecida de las matemticas. Ha resultado til para
resolver problemas puramente matemticos, pero sobre todo y principalmente, para modelar
situaciones reales o imaginarias, en donde el azar es relevante.
5.2.
Definicin 5.2.1 Experimento: Es cualquier procedimiento mediante el cual obtenemos

una observacin. En particular, para el estudio de la probabilidad nos interesa observar aquellos experimentos cuyos resultados no son pronosticables con certeza , esto es aquellos experimentos tales que cuando se les repite bajo las mismas condiciones iniciales, el resultado que
se obtiene no siempre es el mismo, es decir aquellos en que existe aleatoriedad. Este tipo de
experimento se denomina experimentos aleatorios simbolizado por .
Ejemplo 5.2.1 A continuacin presentamos algunos ejemplos posibles de experimentos
Lanzamiento de una moneda
Tomar un punto de un circulo
Elegir un alumno en el campus para preguntarle cuntos libros ha solicitado a prstamo en la biblioteca universitaria durante el ltimo mes.
Contar el nmero de cabellos en la cabeza de una persona.
Medir la resistencia elctrica de un componente electrnico
Definicin 5.2.2 Espacio Muestral: Es el conjunto de todos los resultados individuales
que puede tener un experimento aleatorio. El espacio muestral simbolizado por puede no
ser nico. A cada uno de los elementos del espacio muestral se le llama punto muestral.
Definicin 5.2.3 Evento: Es cualquier resultado posible al realizar un experimento aleatorio. Si un evento tiene un nico elemento, se le llama evento simple. En general, a cualquier
subconjunto del espacio muestral se le llama evento compuesto.
Ejemplo 5.2.2 Si un experimento aleatorio consiste en lanzar un dado y observar el nmero
que aparece en la cara superior, entonces claramente el espacio muestral es el conjunto
= {1; 2; 3; 4; 5; 6}. Como ejemplo de un evento para este experimento podemos definir el
conjunto A = {2; 4; 6}, que corresponde al suceso de obtener como resultado un nmero par.
Si al lanzar el dado una vez se obtiene el nmero 4, decimos entonces que se observ la ocurrencia del evento A, y si se obtiene por ejemplo el resultado 1, decimos que no se observ la
ocurrencia del evento A.
Ejemplo 5.2.3 Considere el experimento aleatorio de participar en un juego de lotera. Suponga que hay un milln de nmeros en esta lotera y un jugador participa con un boleto.
Cul es un posible espacio muestral para este experimento?. Naturalmente al jugador le
interesa conocer su suerte en este juego y puede proponer como espacio muestral el conjunto
= {ganar; perder}. Sin embargo puede tambin tomarse como espacio muestral el conjunto que contiene a todos los posibles nmeros de esta lotera, es decir, = {1; 2; :::; 1000000}.
5.3. OPERACIONES ENTRE EVENTOS
43
Este ejemplo sencillo muestra que el espacio muestral de un experimento aleatorio no es

nico y depende del inters del observador.
Puesto que los conceptos de espacio muestral y evento involucran forzosamente la terminologa de conjuntos, recordaremos a continuacin algunas operaciones entre estos objetos, y
algunas propiedades que nos seran de utilidad en el estudio de la probabilidad y la estadtica.
5.3.
Operaciones entre eventos
Interseccin
La interseccin de dos eventos dados A y B de un espacio muestral ; es el conjunto de
resultados de un experimento aleatorio que pertenece a los dos eventos dados. El smbolo de
la interseccin es .
Figura 5.1: Representacin grfica de la interseccin de dos eventos
Unin
La unin de dos eventos dados A y B de un espacio muestral ; es el conjunto de resultados de un experimento aleatorio que pertenece a alguno de estos dos eventos dados. El
smbolo de la unin es .
Figura 5.2: Representacin grfica de la unin de dos eventos
5.4. DEFINCIONES DE PROBABILIDAD
44
Complemento
El complemento de un evento A de un espacio muestral ; es el conjunto de resultados de
un experimento aleatorio que no pertenece a dicho evento dado. El smbolo del complemento
es .
Figura 5.3: Representacin grfica de complementos de eventos
Diferencia
Diferencia de dos eventos A y B de un espacio muestral ; es el conjunto de resultados
de un evento dado que no pertenece a otro evento dado. El operador de la diferencia es el
signo "menos"().
Figura 5.4: Representacin grfica de la diferencia de dos eventos
5.4.
Definciones de probabilidad
La teora de la probabilidad es la parte de las matemticas que se encarga del estudio de

los fenmenos o experimentos aleatorios. La probabilidad de un evento A, es un nmero real
en el intervalo [0; 1] que denotaremos por P(A), y representa una medida de la frecuencia
con la que se observa la ocurrencia del evento A cuando se efecta el experimento aleatorio
en cuestin. Existen al menos cuatro definiciones de probabilidad las cuales explicamos a
continuacin.
5.4.1.
45
Concepto Clsico de Probabilidad
El primero en dar una definicin clsica de probabilidad fue Jakob Bernoulli en 1713,
reformulada despus por Abraham De Moivre como: una fraccin; en la que el numerador
es igual al nmero de apariciones del suceso dado y el denominador es igual al nmero total
de casos en los que es suceso pueda o no pueda ocurrir. Tal fraccin expresa la probabilidad
de que ocurra el suceso dado.
El enfoque clsico de la probabilidad est basado en la suposicin de que todos los resultados del experimento son igualmente posibles o tienen el mismo peso. La definicin clsica
de la probabilidad es la siguiente: Sea A un subconjunto de un espacio muestral de cardinalidad finita. Se define la probabilidad del evento A como el cociente:
P(A) =
#A
#
(5.4.1)
lo que usualmente se expresa como

P(A) =
nmero de casos favorables al evento A

nmero total de resultados posibles del experimento
en donde el smbolo #A denota la cardinalidad o nmero de elementos del conjunto A. Claramente esta definicin es slo vlida para espacios muestrales finitos, pues forzosamente necesitamos suponer que el nmero de elementos en es finito. El espacio muestral debe ser
equiprobable como ya se mencion, pues para calcular la probabilidad de un evento A dado, nicamente necesitamos contar cuntos elementos tiene A respecto del total, sin importar
exactamente qu elementos particulares sean.
Ejemplo 5.4.1 El experimento consiste en el lanzamiento de un dado. Cul es la probabilidad de que se obtenga como resultado un dos?
Las caras del dado estn numeradas del 1 al 6, entonces hay solo una posibilidad de entre
un total de seis de que el resultado del experimento sea el nmero 2, entonces la probabilidad
de obtener el nmero 2 es
1
P(cae 2) = = 0, 16667
6
La principal dificultad que presenta esta interpretacin de la probabilidad es que se basa
en sucesos equiprobables (todos los posibles resultados tienen la misma probabilidad de ocurrencia ), siendo fcil para problemas sencillos, como los de cartas, dados o urnas, es casi
imposible para problemas ms complejos.
5.4.2.
Concepto frecuentista de probabilidad
Bernoulli resolvi la cuestin de cmo hallar la probabilidad de ocurrencia de un suceso

aun siendo imposible contar los casos favorables:
Aqu hay otro camino disponible para alcanzar el resultado deseado. Lo que no se puede
hallar a priori se puede obtener a posteriori, es decir, mediante la observacin mltiple de los
resultados de pruebas similares.
46
De esta manera, Bernoulli introdujo el concepto de probabilidad frecuentista o estadstica que consiste en asignar como probabilidad de un suceso, el resultado que se obtendra
si el proceso se repitiera en condiciones similares un nmero grande de veces. Por lo tanto
supongamos que se realizan n repeticiones de un cierto experimento aleatorio y sea A un
evento cualquiera. Denotemos por n(A) el nmero de veces que ocurre el evento A en las
n realizaciones del experimento. Se define entonces la probabilidad frecuentista de A como
indica el siguiente lmite
n(A)
P(A) = lm
n n
En este caso, debemos hacer notar que no es humanamente posible llevar a cabo una infinidad de veces el experimento aleatorio, de modo que en la prctica no es posible encontrar
mediante este mecanismo la probabilidad de un evento cualquiera. Esta limitacin hace que
esta definicin de probabilidad no sea enteramente formal, pero tiene algunas ventajas.
Ejemplo 5.4.2 Se quiere saber si una moneda est cargada. Para determinar la probabilidad
de que caiga cara se lanza 60 veces la moneda al aire, de las cuales 25 veces cay cara. Si
aplicamos la frmula
25
= 0, 4167
P(cae cara) =
60
Algunas dificultades que presenta este enfoque de la probabilidad es que no dice cual es
el nmero grande de observaciones necesario, o que se entiende por condiciones similares,
porque si las condiciones son las mismas los resultados sern tambin los mismos.
5.4.3.
Probabilidad subjetiva
En el segundo cuarto del siglo XX surgi una nueva interpretacin de la probabilidad llamada subjetiva, segn la cual la probabilidad mide el grado de creencia de un individuo en
la verdad de una proposicin, variando entre 0 (el individuo cree que es falso) a 1 (cree que es
cierto), es decir de lo que el observador conoce del fenmeno en estudio. Esta interpretacin
fue propuesta por primera vez por el filsofo Frank P. Ramsey. Para los subjetivistas la probabilidad de un suceso debe variar en funcin de la nueva informacin recibida respecto del
suceso.
Segn este enfoque la probabilidad de que un evento en particular suceda es asignada
basndose en cualquier informacin disponible, como intuicin, opiniones etc.
Ejemplo 5.4.3 Cul es la probabilidad de que un cierto equipo de ftbol gane en su prximo partido?. Ciertas circunstancias internas del equipo, las condiciones del equipo rival o
cualquier otra condicin externa, son elementos que slo algunas personas conocen y que
podran darnos una idea ms exacta de esta probabilidad.
5.4.4.
Concepto axiomtico de probabilidad
En la definicin axiomtica de la probabilidad no se establece la forma explcita de calcular las probabilidades sino nicamente se proponen las reglas que el clculo de probabilidades
debe satisfacer. Esta teora axiomtica de la probabilidad fue desarrollada por el matemtico
ruso Andrei N. Kolmogorov basandose como dijimos en la introduccin de este captulo en
5.5. TEOREMAS DE PROBABILIDAD
47
la teora de la medida estructurada por H. Lebesgue. El modelo matemtico propuesto por

Kolmogorov en el ao 1933 para estudiar los experimentos aleatorios es el llamado espacio
de probabilidad .
Axiomas de Probabilidad
Axioma 1: P(A) 0, con A
Axioma 2: P() = 1
/ con i distintos de j, entonces
Axioma 3: Si A1 , A2 , , tales que Ai A j = 0,
P(
)=
n=1
P(Ai)
n=1
5.5.
Teoremas de Probabilidad
5.5.1.
Teorema 1: Regla de la Adicin
La probabilidad de que alguno de dos eventos pertenecientes a un mismo espacio muestral

ocurra se determina mediante la siguiente ecuacin:
P(A B) = P(A) + P(B) P(A B)
Ejemplo 5.5.1 Si el experimento es lanzar un dado una vez, el espacio muestral es:
S = {1, 2, 3, 4, 5, 6}
Si el evento A es el resultado es un nmero par entonces
A = {2, 4, 6}
Si el evento B es el resultado es un nmero menor de 3
B = {1, 2}
Cul ser la probabilidad de que suceda alguno de estos dos eventos?
La probabilidad de que ocurra A y la probabilidad de que ocurra B son respectivamente:
3 1
2 1
P(A) = =
y P(B) = =
6 2
6 3
Para aplicar este teorema es necesario conocer la probabilidad de la interseccin de estos dos eventos, para as poder conocer la probabilidad de la unin, o de manera inversa,
conociendo la probabilidad de la unin se puede calcular la probabilidad de la interseccin.
En este caso queremos saber la probabilidad de la unin conociendo la probabilidad de
la interseccin, entonces es necesario conocer la interseccin de estos dos eventos, que es
nmero par y menor de 3, con lo cual
A B = {2}
48
1
6
Si aplicamos la regla de adicin:
por lo que P(A B) =
P(A B) = P(A) + P(B) P(A B)

P(A B) =
5.5.2.
1 1 1 2
+ =
2 3 6 3
Teorema 2: Regla de la complementacin
La probabilidad de que el complemento de un evento A ocurra est dada por la siguiente

ecuacin:
P(A) = 1 P(A)
Ejemplo 5.5.2 Si A es cae cara en el experimento consistente en lanzar un moneda, entonces
la probabilidad de que no caiga cara es:
P(A) = 1 P(A) = 1
5.5.3.
1 1
=
2 2
Teorema 3: Regla de Diferenciacin
La probabilidad de que un evento dado A ocurra pero no ocurra otro evento dado B
pertenecientes al mismo espacio muestral est dada por
P(A B) = P(A) P(A B)
Ejemplo 5.5.3 Si el evento A es cae un nmero par y si el evento B es cae un nmero
menor de 3, ambos pertenecientes al espacio muestral = {1, 2, 3, 4, 5, 6} que resulta del
experimento aleatorio consistente en el lanzamiento de un dado, entonces la probabilidad de
que caiga un nmero par pero no es menor que tres es:
P(A B) = P(A) P(A B) =
3 1
= 0, 3333
6 6
Y la probabilidad de que caiga un nmero menor que tres pero no sea par es:
P(B A) = P(B) P(AB) =
5.5.4.
2 1
= 0,167
6 6
Probabilidad Condicional
La probabilidad condicional, es la probabilidad de que un evento dado ocurra dado que

otro evento ocurre. El operador de la probabilidad condicional es el signo |, esto es, la probabilidad condicional del evento A dado que ha ocurrido el evento B, denotada por P(A|B), se
define como sigue:
P(A B)
P(A|B) =
P(B)
49
Ejemplo 5.5.4 Considere el experimento de extraer un naipe de un mazo de 40 (baraja espaola), sean los eventos A = {se extrae un as} y B = {el naipe extraido es de copas}. Calcular P(A|B)
Como en el mazo de 40 barajas hay un solo as de copas y 10 naipes de copas en total se
tiene que
1
10 1
P(A B) =
y P(B) =
=
40
40 4
entonces la probabilidad de que ocurra A dado que se sabe que ocurri B es
P(A|B) =
5.5.5.
P(A B)
=
P(B)
1
40
1
4
1
10
Teorema 4: Reglas de Multiplicacin
Regla de multiplicacin para eventos independientes

Dos eventos son independientes si la ocurrencia de uno no altera la probabilidad de ocurrencia del otro. Para dos eventos independientes A y B, la probabilidad de que ambos eventos
sucedan es encontrada mediante la multiplicacin de sus respectivas probabilidades, esto es
P(A B) = P(A) P(B)
Ejemplo 5.5.5 Una maquina empaca vegetales en una bolsa de plstico. Experiencias anteriores revelan que en ocasiones los paquetes tienen menos del peso correcto, y en otras ms,
pero la mayora de las veces tiene el peso satisfactorio. Como muestra la siguiente tabla:
Peso
Probabilidad
debajo del correcto
0,025
correcto
0,900
arriba del correcto
0,075
Supongamos que queremos saber la probabilidad de que al inspeccionar tres paquetes, los
tres pesen correctamente. Establezcamos los siguientes eventos:
A = {el primer paquete pesa correctamente}
B = {el segundo paquete pesa correctamente}
C = {el tercer paquete pesa correctamente}
La probabilidad de cada uno de estos eventos independientes es:
P(A) = 0, 900
P(B) = 0, 900
P(C) = 0, 900
Segn el teorema de multiplicacin la probabilidad de que los tres eventos ocurran es:
P(A B C) = P(A) P(B) P(C) = (0, 900) (0, 900) (0, 900) = 0, 729
50
Regla de multiplicacin para probabilidad condicional

Para dos eventos A y B, donde A depende de la ocurrencia de B, la probabilidad de que
sucedan ambos eventos est dada por la frmula:
P(A B) = P(B) P(A|B)
Ejemplo 5.5.6 Cierto departamento de una compaa esta compuesto por 8 hombres y 4
mujeres, de entre ellos se va elegir al nuevo jefe del departamento, para lo cual se entrevistar
a dos de ellos. Si todos tienen la misma probabilidad de ser elegidos, cual es la probabilidad
de que las dos personas entrevistadas sean mujeres?
Definamos entonces los siguientes eventos
A = {el primer entrevistado es mujer}
B = {el segundo entrevistado es mujer}
La probabilidad de que suceda el evento A = {el primer entrevistado es mujer} es:
P(A) =
4
1
=
12 3
La probabilidad de que suceda el evento B = {el segundo entrevistado es mujer} dado

que ya sucedi A, y solo hay tres mujeres de 11 elementos es:
P(B|A) =
3
11
Segn el teorema de multiplicacin, la probabilidad de que los dos eventos ocurran es:
P(A B) = P(A) P(B|A) =
1 3
1
=
3 11 11
Teorema de Bayes
En el siglo XVIII el reverendo Thomas Bayes, un ministro presbiteriano ingls, se hizo esta pregunta: realmente existe Dios?. Siendo el, un entusiasta matemtico se evoc a
desarrollar una frmula para encontrar la probabilidad de que Dios existe, basndose en la
evidencia disponible sobre la tierra. Aos despus de la muerte de Bayes, Laplace desarroll el trabajo del reverendo, y por vez primera, se logra la determinacin de la probabilidad
de las causas a partir de los efectos que han podido ser observados. El clculo de dichas
probabilidades recibe el nombre de teorema de Bayes. La frmula del teorema de Bayes es:
P(A1 |B) =
P(A1 )P(B|A1 )
P(A1 )P(B|A1 ) + P(A2 )P(B|A2 ) + ... + P(An )P(B|An )
Ejemplo 5.5.7 : Don Pepe tiene una tienda, en el trabajan tres cajeras, Andrea, Bianca, y
Consuelo. Andrea realiza el 50 % de los cobros, Bianca el 30 % y Consuelo el 20 %. Cuando
cobra Andrea hay un 1 % de probabilidad de que lo haga mal, cuando lo hace Bianca hay un
2 % de que cobre mal, y si cobra Consuelo hay un 3 % de probabilidad de que se equivoque.
Un cliente se quej con Don Pepe porque le cobraron mal. Cul es la probabilidad de que
el mal cobro lo haya hecho Andrea?
5.6. PROBLEMAS
51
Para responder a la pregunta vamos a considerar los siguientes eventos:

M = {se hizo un mal cobro}
A = {el cobro fue hecho por Andrea}
B = {el cobro fue hecho por Bianca}
C = {el cobro fue hecho por Consuelo}
De los eventos anteriores podemos obtener las siguientes probabilidades:
P(A) = 0, 5
P(B) = 0, 3
P(C) = 0, 2
P(M|A) = 0, 01
P(M|B) = 0, 02
P(M|C) = 0, 03
Utilizando el teorema de Bayes para encontrar la probabilidad de que el cobro lo haya

hecho Andrea dado que fue un mal cobro, tenemos que
P(A|M) =
P(A)P(M|A)
P(A)P(M|A) + P(B)P(M|B) + P(C)P(M|C)
Sustituyendo los valores:

P(A|M) =
5.6.
(0, 5)(0, 01)

0, 005
=
= 0, 2941
(0, 5)(0, 01) + (0, 3)(0, 02) + (0, 2)(0, 03) 0, 017
Problemas
1. Suponga que de un grupo de 500 estudiantes universitarios se encuentra que 300 fuman, que 350 consumen bebidas alcohlicas y que 250 tienen estos dos hbitos nocivos
para la salud. Cul es la probabilidad de que un estudiante seleccionado aleatoriamente
a) tenga alguno de estos dos malos hbitos?
b) no tenga ninguno de estos dos psimos hbitos?
c) fume pero no tome?
d) tome pero no fume?
e) No fume?
f) Fume dado que toma?
g) Toma dado que fuma?
h) No tenga alguno de estos nefastos hbitos?
2. La probabilidad de que una compaa norteamericana ubique una de sus plantas en
Jurez es 0,7, la probabilidad de que instale una planta en Chihuahua es 0,4, la probabilidad de que no se ubique ni en Jurez ni en Chihuahua es 0,20. Cul es la probabilidad
de que
a) Se ubique en alguna de estas dos ciudades?
5.6. PROBLEMAS
52
b) Se ubique en ambas ciudades?

c) No se ubique en alguna de estas dos ciudades?
d) Se ubique en Chihuahua pero no en Jurez?
e) Se ubique en Jurez pero no en Chihuahua?
f) Ubique una planta en Jurez dado que ya se ubic en Chihuahua?
g) Ubique una planta en Chihuahua dado que ya se ubic en Jurez?
3. En cierta escuela de 45 estudiantes que reprobaron Estadsticas I, 32 dijeron que reprobaron por no estudiar, 18 porque no le entienden al maestro, 9 por causas diferentes a
estas dos. Encuentre la probabilidad de los siguientes eventos:
a) Reprob porque no estudi o porque no le entiende al maestro
b) Reprob porque no estudi y porque no le entiende al maestro
c) Reprob porque no estudi y no porque no le entiende al maestro
d) Reprob porque no le entiende al maestro y no porque no estudi
4. Se realiz una encuesta sobre preferencias en materia de peridicos, de 350 personas
entrevistadas, 200 leen el Heraldo, 140 leen el Diario y 105 leen los dos peridicos.
Encontrar la probabilidad de los siguientes eventos:
a) Lee alguno de estos dos peridicos
b) No lee ninguno de estos dos peridicos
c) Lee el Diario pero el Heraldo no
d) Lee el Heraldo pero el Diario no
e) Lee el Heraldo dado que lee el Diario
f) Lee el Diario dado que lee el Heraldo
g) No lee alguno de estos dos Peridicos
5. La probabilidad de que en un matrimonio, el esposo vea cierto programa de TV es 0.4,
la probabilidad de que la esposa lo haga es de 0.5. La probabilidad de que el esposo
vea el programa de TV dado que la esposa lo hace es de 0.7. Encuentre la probabilidad
de que:
a) Ambos vean el programa de TV
b) Alguno de los dos vea el programa de TV
c) Ninguno vea el programa de TV
d) El esposo vea el programa pero la esposa no
e) La esposa vea el programa pero el esposo no
f) La esposa vea el programa dado que el esposo lo hace
g) Alguno de los dos no ve el programa
5.6. PROBLEMAS
53
6. El profesor Ramos tiene muchos aos impartiendo la clase de matemticas, por experiencia sabe que el 80 % de los estudiantes contestan los problemas que les encarga de
tarea. Tambin sabe que el 90 % de los estudiantes que hacen la tarea aprueban el curso
y que el 60 % de los estudiantes que no hacen la tarea reprueban. Manuel aprob el
curso, cual es la probabilidad de que hizo la tarea?
7. Un equipo de bisbol juega el 70 % de las veces de noche y el 30 % de da. Ellos ganan
el 50 % de los juegos nocturnos y el 90 % de los juegos diurnos. El da de ayer ganaron,
cual es la probabilidad de que el juego fue en la noche?
8. El 30 % de las ventas de una tienda departamental son en efectivo, el 30 % son pagadas
con cheque en el momento de la compra y el 40 % son a crdito. El 20 % de las compras
en efectivo, 90 % de las compras con cheque y el 60 % de las compras a crdito son
mayores a $500. En este momento se est realizando una compra por $1000, cual es la
probabilidad de que sea en efectivo?
9. Una urna contiene 5 bolillas blancas, 4 negras, 6 rojas y 10 verdes. Se extrae una bolilla
de la urna. Calcular la probabilidad de que:
a) la bolilla extrada sea blanca
Respuesta: 0,20
b) la bolilla extrada no sea verde
Respuesta: 0,60
c) la bolilla extrada no sea ni roja ni negra
Respuesta: 0,60
d) la bolilla extrada sea negra
Respuesta: 0,16
10. Cierta poblacin de 1500 habitantes, fue clasificado, segn su nacionalidad, resultando:
950 paraguayos, 200 espaoles, 300 italianos y 50 franceses. Si se elige un habitante
al azar, calcular la probabilidad de que:
a) resulte de habla castellana
Respuesta: 0,77
b) resulte extranjero
Respuesta: 0,77
11. Se arrojan dos monedas. Calcular la probabilidad de obtener:

a) una cara
Respuesta: 0,50
b) dos caras
Respuesta: 0,25
c) mas de dos caras
Respuesta: 0,00
d) ninguna cara
Respuesta: 0,25
12. Se arroja un dado. Calcular la probabilidad de obtener:

a) un nmero par, mayor de 3
Respuesta: 0,33
b) un nmero impar
Respuesta: 0,5
13. Se arrojan simultneamente tres monedas. Calcular la probabilidad de obtener:

a) exactamente 2 caras
Respuesta :0,375
b) 2 o mas caras
Respuesta :0,50
c) mas de 2 caras
Respuesta :0,125
5.6. PROBLEMAS
d) a lo sumo 2 caras
54
Respuesta :0,875
14. De un conjunto de 21 tarjetas numeradas del 1 al 21, se extrae una al azar. Calcular la
probabilidad de que la tarjeta extraida un nmero:
a) sea mltiplo de 3 o de 7
Respuesta: 0,4762
b) sea mltiplo de 5 o de 7
Respuesta: 0,3333
c) sea mltiplo de 4 o de 11
Respuesta: 0,2857
d) sea par o mltiplo de 3
Respuesta: 0,8095
e) sea mltiplo de 3 o de 4
Respuesta: 0,5714
f) sea mltiplo de 3 o de 5
Respuesta: 0,5238
15. Supngase que el Seor Gmez planea salir la noche del sbado prximo. Las probabilidades de que baya a un juego de baloncesto, al cine o a una carrera de caballo son
0,35; 0,30 y 0,20 respectivamente. Determinar la probabilidad de que:
a) haga cual quiera de estas tres cosas
Respuesta: 0,85
b) que no haga ninguna de estas tres cosas
Respuesta: 0,15
16. En un grupo de colegio han suspendido las matemticas el 60 % de los nios, fsica el
50 % y ambas asignaturas el 20 %. Calcular la probabilidad de que elegido un nio al
azar, haya suspendido las matemticas, la fsica o ambas.
Respuesta:0,90
17. Durante una semana dada las probabilidades de que unas acciones aumenten su precio,
permanezcan constantes o disminuyan su precio son estimados en 0,30; 0,20 y 0,50
respectivamente.
a) Cul es la probabilidad que estas acciones aumenten su precio o permanezcan
sin cambios?
Respuesta: 0,50
b) Cul es la probabilidad de que esas acciones, el precio cambie durante las semana?
Respuesta: 0,80
18. Suponga que el 80 % de los norteamericanos, que pasan vacaciones en Europa visitan
Paris, el 70 % Berln y el 60 % visitan Paris y Berln.
a) Cul es la probabilidad de que un norteamericano que pasa vacaciones en Europa visite Paris o Berln o ambos?
Respuesta: 0,90
b) Cul es la probabilidad de que no visite ninguna de esas ciudades?
Rta: 0,10
19. Suponga que la probabilidad de que llegue a asistir a una universidad es 0,60, la probabilidad de que trabaje tiempo completo es 0,70, la probabilidad de que llegue a asistir
a una universidad y trabaje tiempo completo es 0,50. Cul es la probabilidad de que
asista a una universidad o trabaje tiempo completo?
Respuesta: 0,80
20. Una caja contiene 10 esferas, 5 de ellas son blancas, 3 rojas y 2 negras. Se selecciona
aleatoriamente esferas de la caja sin reemplazo:
a) Si se extraen dos esferas de la caja. Cul es la probabilidad de que las 2 esferas
blancas?
Respuesta: 0,2222
5.6. PROBLEMAS
55
b) Si se extraen dos esferas de la caja. Cul es la probabilidad de que extraer una

roja y despus una negra?
Respuesta: 0,0667
c) Si se extraen 3 esferas de la caja Cul es la probabilidad de que las tres sean
rojas?
Respuesta: 0,0083
d) Si se extraen 3 esferas de la caja. Cul es la probabilidad de extraer una negra,
despus una roja y finalmente una blanca?
Respuesta: 0,0417
21. Se tiene un grupo de 12 tornillos, de los cuales 4 son defectuosos. Se recogen 2 tornillos
al azar. Cul es la probabilidad de que:
a) los 2 sean defectuosos
Respuesta: 0,091
b) ninguno de los 2 sean defectuosos
Respuesta: 0,4242
22. Se tiene tres urnas, la primera contiene 50 bolas rojas y 50 bolas blancas; la segunda 60
bolas amarillas y 40 blancas, la tercera 70 bolas verdes y 30 blancas. Si se selecciona
aleatorimente una de las urnas y se extraen dos bolas con reposicin:
a) Cul es la probabilidad de que ninguna sea blanca?
Respuesta: 0,3667
b) Cul es la probabilidad de que ambas sean blancas?
Respuesta: 0,1667
23. Se arrojan dos dados legales. Calcular la probabilidad de que:

a) ocurra una suma de 7 puntos
Respuesta:0,1667
b) ocurra una suma de 2 o 3 puntos
Respuesta:0,0833
c) ocurra una suma de menos de 5 puntos
Respuesta:0,1667
d) ocurra una suma de al menos 10 puntos
Respuesta:0,1667
24. De 100 individuos que presenten su solicitud para ocupar puestos de analista de sistemas en una gran empresa en el ultimo ao. 40 contaban con experiencia laboral
previa y 30 tenan titulo profesional. Sin embargo 20 de los solicitantes tenan tanto
experiencia laboral como titulo profesional, de modo que han sido incluidos en ambos
conteos.
a) Cul es la probabilidad de que un solicitante aleatoriamente elegido tenga ya sea
experiencia laboral o titulo profesional o ambos?
Respuesta: 0,50
b) Cul es la probabilidad de que un solicitante aleatoriamente elegido tenga ya sea
experiencia laboral o titulo profesional pero no ambos?
Respuesta: 0,30
25. De 300 estudiantes de administracin 100 estn actualmente inscritos en contabilidad
y 80 estn actualmente inscritos en estadstica aplicada a la administracin. Estas cifras
de inscripcin incluyen a 30 estudiantes inscritos en ambos cursos.
a) Cul es la probabilidad de que un estudiante aleatoriamente elegido este inscrito
ya sea en contabilidad o en estadstica o en ambos?
Respuesta: 0,50
b) Cul es la probabilidad de que un estudiante aleatoriamente elegido este inscrito
ya sea en contabilidad o en estadstica pero no en ambos?
Respuesta: 0,40
5.6. PROBLEMAS
56
26. En una caja hay 15 lapiceras con las plumas en buen estado, de los cuales 5 no tienen
tinta, adems 6 lapiceras con las plumas rotas. Al sacar una lapicera. Calcular la probabilidad de que la lapicera no escriba.
Respuesta: 0,5238
27. Para la sealizacin de emergencia se ha instalado dos indicadores que funcionan independientemente; la probabilidad de que un indicador se accione durante la avera es
igual a 0,95 para el primero y 0,90 para el segundo. Hallar las siguientes probabilidades
que durante una avera:
a) accione solo un indicador
Respuesta: 0,14
b) accione por lo menos un indicador
Respuesta: 0,995
28. Una caja contiene 20 unidades de cierto producto electrnico, 4 de ellos son defectuosos y 16 son buenas. Se seleccionarn aleatoriamente 4 unidades y se vendern.
Obtngase la probabilidad de que:
a) las cuatro unidades vendidas sean defectuosos
1
Respuesta: 4845
b) entre las cuatro unidades vendidas 2 sean buenas
48
Respuesta: 323
c) se vendan al menos tres unidades defectuosas
13
Respuesta: 969
29. De 12 cuentas contables que se tienen en un archivo, 4 contienen un error de procedimientos en la elaboracin de los saldos:
a) Si el auditor elige al azar 2 cuentas. Cul es la probabilidad de que ninguna
cuenta contenga error de procesamiento? Respuesta: 14
33
b) Si el auditor elige al azar 3 cuentas. Cul es la probabilidad de que ninguna
cuenta contenga error de procesamiento? Respuesta: 14
55
c) Si el auditor muestrea 2 cuentas. Cul es la probabilidad de que las cuenta
1
elegidas contenga errores? Respuesta: 11
d) Si el auditor muestrea 2 cuentas. Cul es la probabilidad de que al menos una
de ellas contenga error? Respuesta: 19
33
e) Si el auditor muestrea 3 cuentas. Cul es la probabilidad de que al menos una
de ellas contenga error? Respuesta: 41
55
29. En un deposito hay 3000 cajas de plumas de las marcas A, B, C, D y E y en ellas hay
cajas de plumas deterioradas. Las cajas se distinguen de la siguiente manera:
Marca A: hay 200 cajas: 50 son deterioradas
Marca B: hay 300 cajas: 40 son deterioradas
Marca C: hay 1000 cajas: 300 son deterioradas
Marca D: hay 800 cajas: 80 son deterioradas
Marca E: hay 700 cajas: 30 son deterioradas
Si se elige una caja al azar, y resulta deteriorada, calcular la probabilidad de que
pertenezca:
a) a la marca A
Respuesta: 0,1
5.6. PROBLEMAS
57
b) a la marca B
Respuesta: 0,08
c) a la marca C
Respuesta: 0,6
d) a la marca A o D
Respuesta: 0,26
e) a la marca B o E
Respuesta: 0,24
30. La urna A tiene 2 boletines rojos y 3 azules; la urna B contiene 4 rojas y 1 azul y la urna
C 3 rojas y 4 azules. Se selecciona aleatoriamente una urna y un boletn es extrado y
que resulta ser rojo. Hallar la probabilidad de haber escogido:
a) la urna A
Respuesta: 14
57
b) la urna B
Respuesta: 28
57
c) la urna C
5
Respuesta: 19
d) la urna A o B
Respuesta: 14
19
e) la urna A o C
Respuesta: 29
57
31. Un agente de una compaa de seguros vende plizas a 5 personas, todas de edad idntica y con buena salud. De acuerdo con la tabla de los actuarios la probabilidad de que
una persona de esta edad especifica est viva en 30 aos es 23 . Hallar la probabilidad
de que en 30 aos estn vivas:
a) las 5 personas
32
Respuesta: 243
b) al menos 3 personas
Respuesta: 64
81
c) solamente 2 personas
40
Respuesta: 243
d) al menos una persona
Respuesta: 242
243
32. En una exhibicin canina, 3 de los 10 perros premiados deben seleccionarse para que
aparezcan en un comercial de comida para perros. Se han otorgados premios a tres
cooles, cuatro pastores alemn, dos perros galeces y un perro de agua.
a) Cual es la probabilidad de que los tres perros elegidos sean de la misma raza?
Respuesta: 0,042
b) Cual es la probabilidad de que se seleccionen dos cooles y un pastor alemn?
Respuesta: 0,10
33. Una caja con guantes de bisbol contiene 2 guantes para jugadores zurdos y 7 para
diestros. Si se seleccionan 3 guantes al azar:
a) Cul es la probabilidad de que los tres sean para jugadores diestros?
Respuesta: 0,417
b) Cul es la probabilidad de que se escogiera un guante para un jugador diestro y
2 para zurdos?
Respuesta: 0,083
34. En una caja hay 18 artculos de los cuales cuatro son defectuosas. Si se extrae aleatoriamente tres artculos al mismo tiempo. Calcular las siguientes probabilidades
a) los tres artculos sean buenos
Respuesta: 0,4461
5.6. PROBLEMAS
58
b) no mas de dos artculos sean defectuosos

c) al menos dos artculos sern buenos
Respuesta: 0,9951
Respuesta: 0,8922
35. Un distribuidor recibe un embarque de 24 aparatos de televisin, de los cuales 6 son

defectuosas. El distribuidor selecciona cuatro aparatos del embarque para ponerlos en
exhibicin. Obtngase la probabilidad de que:
a) 2 de los 4 aparatos sean defectuosas
Respuesta: 0,216
b) no hay mas de 2 defectuosas en los 4 aparatos
Respuesta: 0,9647
36. Un vendedor de automviles acaba de recibir un embarque de 20 automviles nuevos

de los cuales 15 son sedan y 5 convertibles. Si se venden aleatoriamente 2 automviles.
Cul es la probabilidad de que los 2 vendidos sean del mismo modelo?
Rta: 23
38
37. Un articulo se produce utilizando los componentes A y B. La probabilidad de que A
tenga defectos es 0,03 y la probabilidad de que B tenga defectos es 0,02. Cul es la
probabilidad de que el producto tenga defectos despus de armado? Rta: 0,0494
38. La probabilidad de que un hombre vivir 10 aos ms es 14 y la probabilidad de que su
esposa vivir 10 aos mas es 13 . Hallar la probabilidad de que:
a) ambos estn vivos dentro de 10 aos
Respuesta: 0,0833
b) al menos uno estar vivo a los 10 aos
Respuesta: 0,50
c) ninguno estarn vivos a los 10 aos
Respuesta: 0,50
d) solamente la esposa estar viva a los 10 aos
Respuesta: 0,25
39. La probabilidad de que en los hogares de una poblacin tengan lava vajilla es 0,40 y
de que tengan video es de 0,30. Calcular las siguientes probabilidades:
a) que tengan lava vajilla y video
Respuesta: 0,12
b) que tengan lava vajilla o tengan video
Respuesta: 0,58
c) que en tres hogares elegidos al azar haya lava vajilla
Respuesta: 0,064
d) que en dos hogares haya dos lava vajilla o dos videos
Respuesta: 0,25
40. Se extrae tres cartas de un mazo de 40. Calcular las siguientes probabilidades:
a) Que sean de distintos palos
Respuesta: 0,4049
b) sota, caballo y rey en ese orden
Respuesta: 0,00108
c) a lo sumo dos copas
Respuesta: 0,988
41. De un baraja espaola de 40 naipes bien mezcladas, se saca 4 naipes sucesivamente.

Hallar la probabilidad de que:
a) sean un as y tres reyes
Respuesta: 0,000175
b) dos sean reyes y dos sotas
Respuesta: 0,000394
42. De una baraja de 40 naipes bien mezcladas, se sacan al azar 5 cartas. Hallar la probabilidad de que:
5.6. PROBLEMAS
59
a) 4 sean sotas
Respuesta: 0,000055
b) al menos uno sea un as
Respuesta: 0,4271
c) tres sean caballos y tres reyes
Respuesta: 0,0000365
43. Se extraen 5 cartas de una baraja de 52 cartas. Hallar la probabilidad de extraer:

a) 4 aces
1
54145
1
Respuesta: 649740
1
Respuesta: 108290
64
Respuesta: 162435
18472
Respuesta: 54145
Respuesta:
b) 4 aces y un rey
c) 3 dieses y dos jotas
d) un nueve, diez, jota, reina y rey en cualquier orden
e) al menos un as
44. El 80 % de la poblacin es morena y el 70 % es de ojos oscuro. Si se selecciona una

persona al azar, calcular la probabilidad de:
a) no ser de piel morena o tener los ojos oscuros
Respuesta: 0,76
b) ser de piel morena y tener los ojos oscuros
Respuesta: 0,56
45. En una zapatera hay tres estanteras A, B y C, la primera tiene 50 pares de zapatos
negros y 25 marrones, la segunda tiene 40 de cada color y la ultima 20 negros y 30
marrones. Si un cliente no tiene preferencia especial respecto a las estanteras ni respecto al color elige un par de zapatos y es marrn. Calcule la probabilidad de que
15
proceda de la estantera B.
Respuesta: 43
46. Dos seres humanos y ocho elefantes se sientan al azar entorno a una mesa circular.
Calcular la probabilidad de que los humanos esten juntos.
Respuesta:
47. Si A y B son dos sucesos tales que P(A) = 0, 6 y P(B) = 0, 7. Calcular: P(A B) y
P(A B) sabiendo que P(A B) P(A B) = 0, 4
Respuesta: P(A B) = 0, 8 y
P(A B) =0,5 o P(A B) = 0, 5 y P(A B) = 0, 8
48. Al lanzar un dado al aire, sea A el suceso de obtener un mltiplo de 3 y B el suceso de
obtener un nmero par. Justificar si los sucesos son o no independientes.
Respuesta:
Son independientes
49. Un jugador lleva en el bolsillo dos monedas, una normal y otras con dos caras. Elige al
azar una de las monedas y la lanza al aire.
Calcular la probabilidad de que caiga cara
Respuesta:
Si el resultado es cara, calcular la probabilidad de haber elegido la moneda con

dos caras
Respuesta:
50. De los 250 empleados de una compaa, 130 fuman cigarrillos. Hay 150 hombres que
trabajan en esta compaa de los cuales 85 fuman cigarrillos. Cul es la probabilidad
de que un empleado seleccionado en forma aleatoria,
no fume cigarrillo?
5.6. PROBLEMAS
60
sea mujer y fume cigarrillo?

sea hombre o fume cigarrillo?
digamos que se encuentra con una empleada de la compaa. Cul es la probabilidad de que no fume cigarrillo?
51. Se desea determinar si hay una relacin entre el inters de un estudiante por la estadstica y su capacidad para las matemticas, se selecciona una muestra aleatoria de 200
estudiantes y se les pregunta si su capacidad para las matemticas y su inters por la
estadstica es bajo, promedio o alto. Los resultados fueron como sigue:
Inters en estadstica
Bajo
Promedio
Alto
Total
Capacidad para las matemticas

Bajo Promedio Alto Total
60
15
15
90
15
45
10
70
5
10
25
40
80
70
50
200
Si se selecciona un estudiante al azar, cul es la probabilidad de que l o ella:

tenga alta capacidad para las matemticas?
tenga un inters promedio para la estadstica?
tenga baja capacidad para las matemticas y bajo inters promedio en la estadstica?
Suponga que se sabe que la persona seleccionada tiene alta capacidad para las
matemticas, cul es la probabilidad de que tenga un alto inters en la estadstica?
52. Una moneda esta cargada de modo que la posibilidad de salir cara (H) sea el doble de
salir sello (S). Hallar P(H) y P(T )
Respuesta:
53. Tres caballos A, B y C intervienen en una carrera; A tiene el doble de posibilidad de
ganar que B; y B el doble de ganar que C. Cul ea la probabilidad de ganar, esto es;
P(A), P(B) y P(C)?
Respuesta:
54. Dos hombres y tres mujeres intervienen en un torneo de ajedrez. Los del mismo sexo
tienen igual probabilidad de ganar pero cada hombre tiene el doble de probabilidad de
ganar que una mujer.
Hallar la probabilidad de una mujer gane el torneo
Respuesta:
Si y son casados, hallar la probabilidad de que uno de ellos gane el torneo.

spuesta:
Re-
55. Una clase consta de 10 hombres y 20 mujeres de los cuales la mitad de los hombres y
la mitad de las mujeres tienen ojos castaos. Hallar la probabilidad de que una persona
escogida al azar sea un hombre o tenga los ojos castaos.
Respuesta:
56. La probabilidad de que A de en el blanco es 0,4 y la de B es 0,5. Si A y B disparan,
Cul es la probabilidad de que uno de ellos pegue en el blanco?
Respuesta:
5.6. PROBLEMAS
61
57. Se escogen al azar dos dgitos desde del conjunto {1, 2, 3, ...., 9}. Si la suma es par,
hallar la probabilidad de que ambos sean nmeros impares.
Respuesta:
58. Se escogen al azar tres lamparas entre 15 de las cuales 5 son defectuosos. Hallar la
probabilidad de que:
ninguna sea defectuosa
Respuesta:
una por lo menos sea defectuosa
Respuesta:
59. Se selecciona al azar dos cartas entre 10 cartas numeradas de 1 a 10. Hallar la probabilidad de que la suma sea impar si:
las dos cartas se sacan juntas
Respuesta:
se sacan una tras otra sin reposicin
Respuesta:
se sacan una tras otra con reposicin
Respuesta:
60. Una clase tiene 12 nios y 4 nias. Se seleccionan tres estudiantes de la clase al azar.
Cul es la probabilidad de que todas sean nias?
Respuesta:
61. En cierta facultad, 4 % de los hombres y 1 % de las mujeres tienen ms de 6 pies de
estatura . Adems, 60 % de los estudiantes son mujeres. Ahora bien si se selecciona al
azar un estudiante y es ms alto que 6 pies, Cul es la probabilidad de que el estudiante
seleccionado sea mujer?
Respuesta:
62. Una caja contiene tres monedas; una de las monedas es corriente, otra tiene dos caras
y la tercera esta cargada de modo que la probabilidad de obtener cara sea 0,6 . Se
selecciona una de las monedas y se lanza al aire. Hallar la probabilidad de que salga
cara.
Respuesta:
63. Una urna contiene 3 bolas rojas y 7 blancas. Se saca una bola de la urna y se reemplaza
por una de otro color. Se saca de la urna una segunda bola.
Hallar la probabilidad de que la segunda bola sea roja
Respuesta:
Si ambas son del mismo color. Cul es la probabilidad de que las dos sean
blancas?
Respuesta:
64. Se nos da dos urnas como sigue: La urna A contiene 3 bolas rojas y 2 bolas blancas y la
urna B contiene 2 bolas rojas y 5 bolas blancas. Se selecciona al azar una urna; se saca
una bola y se coloca en la otra urna, luego se saca una bola de la segunda urna. Hallar
la probabilidad de que las dos bolas sacadas sean del mismo color.
Respuesta:
65. En una carretera entre las ciudades A y B hay tres semforos, a una distancia de unos
kilmetros entre si. Los ciclos de los mismos son de un minuto cada uno. Los tres
semforos estn prendidos en verde durante 30, 40 y 50 segundos respectivamente.
Suponiendo que un auto observa los reglamentos de transito. Calcular la probabilidad
de que el auto:
haga el viaje sin parar por causa del semforo
deba parar exactamente ante un semforo
Respuesta:
Respuesta:
5.6. PROBLEMAS
62
deba parar exactamente ante dos semforos

deba parar en todos los semforos
Respuesta:
Respuesta:
66. La suma de las probabilidades de que tres hombres H1 , H2 y H3 peguen en el blanco es

0,95. Adems la posibilidad de que H1 de en el blanco es el doble de que lo haga H2 y
H2 tiene la misma posibilidad de dar en el blanco que H3 , cada uno dispara una vez al
blanco.
Hallar la probabilidad de que exactamente uno de ellos pegue en el blanco.
spuesta:
Re-
Si solo un pega en el blanco. Cul es la probabilidad de que sea el primer

hombre?
Respuesta:
67. La probabilidad de que cierto componente electrnico funcione es de 0,90. Un aparato
contiene dos de estos componentes. El aparato funciona si por lo menos uno de los
componentes funciona.
Sin importar cual de los componentes funcione o no. Cules son los posibles
resultados? ( Puede suponer independencia en la operacin de los componentes).
Cul es la probabilidad de que el aparato no funcione
Respuesta: 0,99
Captulo 6
Variables aleatorias
6.1.
Definicin 6.1.1 Una variable aleatoria es aquella que toma un conjunto de valores numricos asociados a los resultados de nuestro inters que produce un experimento aleatorio, es
decir una funcin que asocia a cada evento del espacio muestral un nmero real.
La definicin anterior nos dice que dado un experimento aleatorio cualquiera, y el espacio
muestral asociado a dicho experimento, una variable aleatoria es una transformacin X del
espacio de resultados (espacio muestral) al conjunto de nmeros reales, esto es, asigna a cada
elemento , un nmero real X(). La expresin matemtica est dada por:
X : R
Figura 6.1: Representacin grfica de la definicin de una variable aleatoria

A menudo se escribe simplemente v.a. en lugar del trmino variable aleatoria. En sentido estricto una variable aleatoria es una funcin de en R que satisface adems cierta
condicin de medibilidad, pero omitiremos tales tecnicismos pues no son de utilidad para los
propsitos de este curso. Suponga entonces que se efecta el experimento aleatorio una vez
y se obtiene un resultado en R. Al transformar este resultado con la variable aleatoria X
se obtiene un nmero real X() = x. Podemos entonces suponer que los posibles resultados
del experimento aleatorio son los diferentes nmeros reales x que la funcin X puede tomar.
Haremos aqui la siguiente observacin importante. Seguiremos la notacin usual de usar la
letra mayscula X para denotar una variable aleatoria cualquiera, es decir, X es una funcin
de en R, mientras que la letra minscula x denota un nmero real y que es un posible valor
de la variable aleatoria. En general, las variables aleatorias se denotan usando las ltimas
63
64
letras del alfabeto en maysculas, U,V,W, X,Y, Z, y para un valor cualquiera de ellas se usa
la misma letra pero en minscula.
Ejemplo 6.1.1 Si un experimento aleatorio consiste en lanzar una vez un dado equilibrado
y observar la cara superior del dado una vez que cae. Denotemos por 1,2,3,4,5 y 6 las
seis caras del dado. Es claro que el espacio muestral es = {1, 2, 3, 4, 5, 6}. Podemos definir
entonces la variable aleatoria X : R como X({1}) = 1 y X({2, 3, 4, 5, 6}) = 0 si
nuestro inters es el nmero de veces que se obtiene el 1 en este experimento.
Ejemplo 6.1.2 Consideremos el experimento aleatorio consistente en lanzar un dardo en
un tablero circular de radio uno. El espacio muestral o conjunto de posibles resultados del
experimento se puede escribir como sigue:
= {(x, y) : x2 + y2 1}
Los siguientes son ejemplos de funciones de en R, variables aleatorias, asociadas a este
experimento aleatorio:
a) X(x, y) = x, proyeccin sobre el eje horizontal.
b) Y (x, y) = y, proyeccin sobre el eje vertical.
p
c) Z(x, y) = x2 + y2 , distancia al centro del crculo.
d) V (x, y) = |x| + |y|, distancia del taxista.
e) W (x, y) = xy, producto de las coordenadas.
Figura 6.2: Representacin grfica del espacio muestral del ejemplo 6.1.2
Considerando el conjunto de valores que una variable aleatoria puede tomar, se puede
clasificar a las variables aleatorias en dos tipos: discretas o continuas.
Definicin 6.1.2 Una variable aleatoria es discreta cuando el conjunto de valores que sta toma es un conjunto discreto, es decir, un conjunto finito o numerable. Por ejemplo, el
conjunto {0, 1, 2, ..., n} es un conjunto discreto porque es finito, lo mismo N pues aunque es
infinito, es numerable y por lo tanto discreto.
65
Ejemplo 6.1.3 Un experimento aleatorio consiste en escoger a una persona al azar. La

variable aleatoria X evaluada en corresponde a conocer la siguiente caracterstica, o una
codificacin de esta caracterstica, de la persona escogida. En cada caso se trata de una variable aleatoria discreta:
a) Edad en aos.
b) Nmero de hijos.
c) Peso.
d) Estatura.
e) Sueldo.
f) Nivel escolar.
g) Estado civil.
h) Lugar de nacimiento.
Definicin 6.1.3 Una variable aleatoria es continua cuando toma todos los valores dentro
de un intervalo (a, b) R.
Ejemplo 6.1.4 En el ejemplo del lanzamiento de un dardo en un tablero circular de radio
uno, el espacio muestral (Figura 6.1) es infinito no numerable, las variables X,Y, Z,V y
W definidas all son todas variables aleatorias continuas. Si se dibujan crculos concntricos
alrededor del origen y si se asignan premios asociados a cada una de las regiones resultantes,
puede obtenerse un ejemplo de una variable aleatoria discreta sobre este espacio muestral.
La clasificacin anterior de variables aleatorias no es completa pues existen variables que
no son de ninguno de los dos tipos mencionados. Por simplicidad en este curso estudiaremos
nicamente variables aleatorias que son discretas o continuas.
Usaremos tambin la siguiente notacin importante: Si A es un subconjunto de R, entonces la expresin (X A), incluyendo el parntesis, denota el conjunto { : X() A},
es decir, (X A) = { : X() A}. En palabras, la expresin (X A) denota aquel conjunto de elementos de tales que bajo la aplicacin de la funcin X toman un valor dentro
del conjunto A. A este conjunto se le llama la imagen inversa de A, y se le denota por X 1 A.
Ejemplo 6.1.5 Consideremos el experimento de lanzar una moneda al aire y la variable
aleatoria X que lleva el resultado Cara al valor 0 y el resultado Cruz al valor 1. Tenemos
por ejemplo que (X [1, )) = {Cruz00 } pues el conjunto de elementos de tales que bajo
la funcin X toman un valor mayor o igual a uno, es decir caen dentro del intervalo [1, ),
es nicamente el elemento Cruz. Por lo tanto P(X [1, )) = P{Cruz00 } = 12 . Del mismo
modo puede verificarse que
a) P(X [1, 2)) = P({Cruz00 }) = 12 .
b) P(X [0, 1)) = P({Cara00 }) = 12 .
/ = 0.
c) P(X [2, 4]) = P(0)
d) P(X = 1) = P({Cruz00 }) = 12 .
/ = 0.
e) P(X 1) = P(0)
f) P(X 0) = P() = 1.
Usaremos con mucha frecuencia la notacin arriba explicada. El lector debe asegurarse
de comprender bien que si x es un nmero real entonces (X x) es un subconjunto de y por
lo tanto un evento. Lo mismo sucede con el complemento de este conjunto que es (X > x).
Podemos escribir entonces la igualdad de conjuntos (X x) (X > x) = . Y aplicando
probabilidad se obtiene:
P(X x) + P(X > x) = 1
6.2. DISTRIBUCIN DE PROBABILIDAD
66
Nota importante. A travs de una variable aleatoria se puede considerar que los posibles
resultados de un experimento aleatorio no son elementos en sino nmeros reales que la
variable aleatoria puede tomar. Esta es una consideracin radical pues ya no consideraremos
experimentos aleatorios particulares, ni espacios muestrales arbitrarios , ni eventos (subconjuntos) de , en lugar de ello consideraremos que una cierta variable aleatoria de inters
toma valores en un cierto subconjunto de nmeros reales. La probabilidad definida antes para
subconjuntos de se traslada, como explicamos antes, a probabilidades para subconjuntos
de R. Esta perspectiva permite estudiar modelos generales y despus aplicarlos a cualquier
situacin particular. A partir de ahora y en lo que resta del curso el trmino variable aleatoria
constituir un elemento frecuente en los enunciados.
6.2.
Distribucin de probabilidad
En esta seccin vamos a estudiar a las dos funciones que se asocian a cada variable aleatoria y que adems nos provean de informacin acerca de las caractersticas de dicha variable
aleatoria. Una de estas funciones es llamada funcin de distribucin y se asocia a una variable continua o discreta, la otra depende del tipo de variable estudiada, en el caso continuo se
denomina funcin de densidad de probabilidad y en caso discreto simplemente funcin de
probabilidad. Estas funciones nos permiten representar a un mismo tiempo tanto los valores
que pueden tomar la variable aleatoria como las probabilidades de los distintos eventos involucrados. Entonces en primer trmino defininamos primero la funcin de probabilidad para
una variable aleatoria discreta, despus la funcin de densidad para una variable continua, y
finalmente definamos la funcin de distribucin para ambos tipos de variables aleatorias.
Definicin 6.2.1 (Funcin de probabilidad para una variable discreta)
Sea X una variable aleatoria discreta que toma los valores x1 , x2 , . . . con probabilidades
respectivas P(X = x1 ), P(X = x2 ), . . . . Esta lista de valores numricos y sus probabilidades
puede ser finita o bien infinita, pero numerable. La funcin de probabilidad de la variable
aleatoria X denotada por f (x) : R [0, ) se define como sigue
P(X = x) si x = x1 , x2 , . . .
f (x) =
(6.2.1)
0
en otro caso
En palabras, la funcin de probabilidad es simplemente aquella funcin que indica los
valores de la probabilidad en los distintos valores que toma la variable aleatoria discreta.
Recordemos que es importante poder distinguir entre X y x, pues conceptualmente son cosas
muy distintas. Denotaremos generalmente a una funcin de probabilidad con la letra f minscula. A veces escribiremos fX (x) y el subndice nos ayudar a especificar que tal funcin es
la funcin de probabilidad de la variable aleatoria X. Esta notacin ser particularmente til
cuando consideremos varias variables aleatorias a la vez.
6.2.1.
Propiedades de la funcin de probabilidad
Si toda funcin de la forma (6.2.1) cumple las siguientes dos propiedades la llamaremos
funcin de probabilidad.
1) f (x) 0 para todo x R

2)
67
f (x) = 1
x
Ejemplo 6.2.1 Considere la variable aleatoria discreta X que toma los valores 1, 2 y 3, con
probabilidades 0,3; 0,5 y 0,2 respectivamente. Entonces la funcin de probabilidad de X es
0, 3 si x = 1
0, 5 si x = 2
f (x) =
0, 2 si x = 3
Esta funcin se muestra grficamente en la Figura 6.2. Alternativamente podemos tambin expresar esta funcin mediante la tabla mostrada ms abajo. En esta representacin se
entiende de manera implcita que f (x) es cero para cualquier valor de x distinto de 1, 2 y 3.
En particular, compruebe que las siguientes probabilidades son correctas:
P(X 2) = 0, 7
P(|X| = 1) = 0, 3
P(X < 1) = 0
Figura 6.3: Representacin grfica de la funcin del ejemplo 6.2.1

x
p(x)
1
0,3
2
0,5
3
0,2
Ejemplo 6.2.2 Encontremos el valor de la constante c que hace que la siguiente funcin sea
de probabilidad.
cx si x = 0, 1, 2, 3
f (x) =
0 en otro caso
Los posibles valores de la variable aleatoria discreta, no especificada, son 0, 1, 2 y 3, con
probabilidades 0, c, 2c y 3c, respectivamente. Como la suma de estas probabilidades debe ser
uno, obtenemos la ecuacin c + 2c + 3c = 1. De aqui obtenemos c = 16 . Este es el valor de c
que hace que f (x) sea no negativa y sume uno, es decir, una funcin de probabilidad.
Definicin 6.2.2 (Funcin de densidad para una variable aleatoria continua)
Sea X una variable aleatoria continua. Decimos que la funcin integrable y no negativa
f (x) : R [0, ) es la funcin de densidad de X si para cualquier intervalo (a, b) de R se
cumple la igualdad
P(X (a, b)) =
Z b
a
f (x)dx
68
Es decir, la probabilidad de que la variable tome un valor dentro del intervalo (a, b) se
puede calcular o expresar como el rea bajo la funcin de densidad en el intervalo (a, b).
De esta forma el clculo de una probabilidad se reduce al clculo de una integral. Vase
la Figura 6.4. No es difcil comprobar que toda funcin de densidad f (x) de una variable
aleatoria continua X cumple las dos propiedades que mencionamos a continuacin anlogas
al caso discreto.
Figura 6.4: Representacin grfica de la probabilidad como un ara
6.2.2.
Propiedades de la funcin de densidad de probabilidad
Si toda funcin de la forma f (x) : R [0, ) cumple las siguientes dos propiedades la
llamaremos funcin de densidad de probabilidad.
1) f (x) 0 para todo x R
2)
Z +
f (x)dx = 1
Toda funcin f (x) : R [0, ) que satisfaga estas dos propiedades, sin necesidad de
tener una variable aleatoria de por medio, se llamar funcin de densidad.
Ejemplo 6.2.3 La funcin f (x) dada por:
si x (1, 3)
2
f (x) =
0 en otro caso
es una funcin de densidad de una variable aleatoria continua que toma valores en el intervalo
(1, 3), y cuya grfica aparece en la Figura 6.5. Observe que se trata de una funcin no negativa
y cuya integral vale uno.
Ejemplo 6.2.4 Encontrar el valor de la constante c que hace que la siguiente funcin sea de
densidad.
c|x| si x [1, 1]
f (x) =
0
en otro caso
69
Figura 6.5: Representacin grfica de f (x) (ejemplo 6.2.3

Se trata de una variable aleatoria continua que toma valores en el intervalo [1, 1]. Como
esta funcin debe integrar uno tenemos que:
1=
f (x)dx =
Z 1
1
c|x|dx = 2c
Z 1
0
x 2 1
=c
xdx = 2c
2 0
Por lo tanto, cuando tomamos c = 1 la funcin anterior resulta ser una funcin de densidad pues ahora cumple con ser no negativa e integrar uno.
Definicin 6.2.3 (Funcin de distribucin). Sea X una variable aleatoria discreta o continua. La funcin de distribucin de X, denotada por F(x) : R [0, 1], se define como
F(x) = P(X x)
Esto es, la funcin de distribucin evaluada en un nmero x cualquiera es simplemente la
probabilidad de que la variable aleatoria tome un valor menor o igual a x, o en otras palabras,
que tome un valor en el intervalo (, x]. Siendo F(x) una probabilidad, sus valores estn
siempre entre 0 y 1. Esta funcin resulta ser importante y se le conoce tambin, por razones
evidentes, con el nombre de funcin de acumulacin de probabilidad. Con un par de ejemplo mostraremos la forma de calcular esta funcin a partir de la funcin de probabilidad o de
la funcin de densidad.
Ejemplo 6.2.5 Consideremos la variable aleatoria discreta X del ejemplo 6.2.1. Tenemos que
la correspondiente funcin de distribucin evaluada en x se calcula sumando las probabilidades P(X = u) para valores de u menores o iguales a x, es decir,
0 si x < 1
0, 3 si 1 x < 2
F(x) = P(X x) = P(X = u) =
0, 8 si 2 x < 3
ux
1 si x 3
cuya grfica aparece en la Figura 6.6. Este es el comportamiento tpico de una funcin de
distribucin de una v.a. discreta, es no decreciente, constante por pedazos, y si la funcin
tiene una discontinuidad en x, entonces el tamao de tal discontinuidad es exactamente la
probabilidad de que la variable aleatoria tome ese valor.
70
Figura 6.6: Representacin grfica de F(x) del ejemplo 6.2.5

Ejemplo 6.2.6 Consideremos ahora la variable aleatoria continua X del ejemplo 6.2.3. La
correspondiente funcin de distribucin se obtiene calculando la siguiente integral:
F(x) = P(X x) =
Z x
0
si x 1
0
si x 1
Z x
1
x1
f (u)du =
du si 1 < x < 3 =
si 1 < x < 3
2
1 2
1
si x 3
1
si x 3
cuya grfica aparece en la Figura 6.7. Observe que esta funcin es continua y no decreciente.
Figura 6.7: Representacin grfica de F(x) del ejemplo 6.2.6

En los dos ejemplos anteriores se ha mostrado la forma de obtener F(x) a partir de f (x).
Ahora explicaremos el proceso contrario. En el caso continuo tenemos que para toda x en R,
F(x) = P(X x) =
Z x
f (u)du
d
(F(x)) =
dx
f (x). De este modo podemos encontrar f (x) a partir de F(x). En el caso discreto, f (x) =
de modo que por el teorema fundamental del clculo, y cuando F(x) es diferenciable,
71
P(X = x) = F(x) F(x ), en donde F(x ) es el lmite por la izquierda de la funcin

F en el punto x, en smbolos, F(x ) = lm F(x h), con h > 0. Anlogamente, la exh0
presin F(x+ ) significa el lmite por la derecha de la funcin F en el punto x, es decir,

F(x+ ) = lm F(x + h), con h > 0.
h0
Proposicin 6.2.1 . Toda funcin de distribucin F(x) satisface las siguientes propiedades:
1. 0 F(x) 1
2. lm F(x) = 1
x
3.
lm F(x) = 0
4. Si x1 x2 , entonces F(x1 ) F(x2 )

5. Si x1 x2 , entonces P(x1 < X x2 ) = F(x2 ) F(x1 )
6. F(x) = F(x+ )
Demostracin
1. Como F(x) es una probabilidad pues, por definicin, F(x) = P(X x). Por lo tanto se
cumple la primera propiedad.
2. Cuando x tiende a infinito el conjunto (X x) se aproxima al conjunto (X ) que es
idntico a = R, por lo tanto, cuando x ,
F(x) P(X ) = P(R) = 1
3. Anlogamente el conjunto (X x) se aproxima al conjunto (X ) = 0/ cuando x
tiende a menos infinito. Por lo tanto, cuando x ,
/ =0
F(x) P(X ) = P(0)
4. Es suficiente observar que si x1 x2 , entonces (X x1 ) (X x2 ). Aplicando probabilidad obtenemos P(X x1 ) P(X x2 ).
5. Por teoria elemental de conjuntos el evento (x1 < X x2 ) puede descomponerse en la
diferencia (X x2 ) (X x1 ), en donde (X x1 ) (X x2 ). Por lo tanto
P(x1 < X x2 ) = P(X x2 ) P(X x1 ) = F(x2 ) F(x1 )
6. Para h > 0 tenemos que F(x + h) = P(X x + h) = P(X x) + P(x < X x + h), de
modo que cuando h tiende a cero, el conjunto (x < X x + h) tiende al conjunto vaco.
Concluimos entonces que, cuando h 0 con h > 0,
/ = F(x)
F(x + h) F(x) + P(0)
La propiedad 4) significa que F(x) es una funcin montona no decreciente. Mientras
que la propiedad 6) establece que F(x) es una funcin continua por la derecha.
6.3. ESPERANZA, VARIANZA Y MOMENTOS
6.2.3.
72
Distribuciones discretas
Las distribuciones de variables aleatorias discretas ms importantes son las siguientes:

a) Distribucin binomial
b) Distribucin binomial negativa
c) Distribucin Poisson
d) Distribucin geomtrica
e) Distribucin hipergeomtrica
6.2.4.
Distribuciones continuas
Las distribuciones de variable continua ms importantes son las siguientes:

a) Distribucin ji cuadrado
b) Distribucin exponencial
c) Distribucin t-student
d) Distribucin normal
e) Distribucin Gamma
f) Distribucin Beta
Las distribuciones continuas son imposibles de tabular y por lo tanto se representan con
curvas.
6.3.
Esperanza, varianza y momentos
Todos los seres humanos tenemos caractersticas numricas que nos identifican y nos
distinguen de otras personas, por ejemplo, la edad, estatura, talla, peso, etc. Si pudiramos
considerar la totalidad de todos estos nmeros para una persona en particular, la identificaramos de manera nica. Algo similar sucede con las variables aleatorias. En esta seccin
estudiaremos algunas caractersticas numricas asociadas a las variables aleatorias.
6.3.1.
Esperanza
Definicin 6.3.1 Esperanza

La esperanza de una variable aleatoria X es un nmero real denotado por E(X) y que se
calcula como sigue:
73
1. Si X es una variable aleatoria discreta con funcin de probabilidad f (x), entonces:

E(X) = x f (x)
x
en donde la suma se efecta sobre todos los posibles valores que pueda tomar la variable
aleatoria X, y se define cuando esta suma sea absolutamente convergente, es decir,
E(X) = |x| f (x)
x
El nmero de sumandos puede ser finito o infinito dependiendo del conjunto de valores
de la variable aleatoria.
2. Si X es una variable aleatoria continua con funcin de densidad de probabilidad f (x),
entonces la esperanza es
Z
E(X) =
x f (x)dx
suponiendo que esta integral es absolutamente convergente, es decir,

E(X) =
|x f (x)|dx
Si la suma o la integral anteriores no cumplen la condicin de convergencia absoluta, entonces se dice que la esperanza no existe. La esperanza de una variable aleatoria es entonces
un nmero que indica el promedio ponderado de los diferentes valores que puede tomar la
variable aleatoria. A la esperanza se le conoce tambin con los nombre de: media, valor esperado o valor promedio. En general se usa la letra griega (mu) para denotarla. La integral
o suma arriba mencionados pueden no ser convergentes y en ese caso se dice que la variable
aleatoria no tiene esperanza finita. La situacin anterior se ilustra en los ejercicios 126 y 127.
La esperanza es uno de los conceptos ms importantes en probabilidad y tiene un amplio
uso en las aplicaciones y otras ramas de la ciencia. Ilustraremos a continuacin la forma de
calcular la esperanza.
Ejemplo 6.3.1 Sea X una variable aleatoria discreta con funcin de densidad dada por la
siguiente tabla.
x
-1
0
1
2
f(x) 1/8 4/8 1/8 2/8
La esperanza de X es el nmero
3
E(X) =
4
1
2 1
1
x f (x) = 1 + 0 + 1 + 2 =
8
8
8
8 2
x=1
Observe que la suma su efecta para todos los valores de x indicados en la tabla, es decir :
-1, 0, 1 y 2. Tambin es instructivo observar que la esperanza no es necesariamente uno de
los valores tomados por la variable aleatoria. En este ejemplo el valor 21 nunca es tomado por
la variable aleatoria, pero es su valor esperado.
74
Ejemplo 6.3.2 Considere la variable aleatoria continua X con funcin de densidad:
2x si 0 < x < 1
f (x) =
0 en otro caso
La esperanza de X es
E(X) =
x f (x)dx =
Z 1
0
1
2
2 2
x 2x = x =
3
3
0
Observe que la integral slo es relevante en el intervalo (0, 1), pues fuera de dicho intervalo
la funcin de densidad se anula.
Esperanza de una funcin de una variable aleatoria
En algunos casos es necesario saber calcular la esperanza de una funcin de una variable
aleatoria. Por ejemplo, si X es una variable aleatoria, entonces es claro que Y = X 2 es una
funcin de X y es tambin una variable aleatoria. Si Zquisiramos calcular la esperanza de
Y = X 2 segun la definicin tendramos que calcular
y fY (y)dy, para lo cual se necesita
encontrar primero la funcin de densidad de Y , y ello en general no es fcil. El siguiente

resultado es muy til y nos dice cmo calcular esta esperanza conociendo nicamente la funcin de densidad de X. A veces se le refiere como el teorema del estadstico inconsciente.
Proposicin 6.3.1 Sea X una variable aleatoria y sea g : R R una funcin tal que g(X)
es una variable aleatoria con esperanza finita. Entonces:
1. Si X es una variable aleatoria discreta; con funcin de probabilidad fX (x), se define la
esperanza de la variable aleatoria discreta g(x) esta dada por la siguiente:
E[g(X)] = g(x) fX (x)
(6.3.2)
2. Si X es una variable aleatoria continua; con funcin de densidad de probabilidad fX (x);

entonces la esperanza de la variable aleatoria continua g(x) est dada por la siguiente
ecuacin:
Z
(6.3.3)
E[g(X)] =
g(x) fX (x)dx
En general, la demostracin de este resultado es complicada, asi es que la omitiremos y

nos concentraremos en su uso y aplicacin.
Ejemplo 6.3.3 Calcularemos E(Y ) en donde Y = X 2 , y X es la variable aleatoria continua
del ejemplo anterior, es decir, con funcin de densidad
2x si 0 < x < 1
f (x) =
0 en otro caso
75
Por la proposicin anterior tenemos que:

E(Y ) = E(X 2 ) =
g(x) f (x)dx =
Z 1
0
1
2 4
1
2
x 2x = x =
4
2
0
Ejemplo 6.3.4 Sea X una variable aleatoria con funcin de probabilidad dada por la tabla
que aparece abajo. Encuentre la funcin de probabilidad de Y = X 2 usando la ecuacin(6.3.2).
x
f(x)
-1
1/8
0
4/8
1
1/8
2
2/8
Por la ecuacin (6.3.2) la esperanza de Y = X 2 es

1
4
1
2 5
E(Y ) = g(x) f (x) = x2 f (x) = (1)2 + 02 + 12 + 22 =
8
8
8
8 4
X
X
Propiedades de la esperanza
Proposicin 6.3.2 Sean X y Y variables aleatorias con esperanzas finitas y sea c una constante. Entonces
a) E(c) = c
b) E(cX) = cE(X)
c) Si X 0, entonces E(X) 0
d) E(X +Y ) = E(X) + E(Y )
Demostracin
a) Si X es una v.a. discreta por definicin de esperanza para caso discreto tenemos que:
E(c) = cP(X = x) = c P(X = x) = c
x
Si X es una v.a. continua por definicin de esperanza para caso continuo tenemos que:
E(c) =
c f (x)dx = c
f (x)dx = c
b) Si X es una v.a. discreta por definicin de esperanza para caso discreto tenemos que:
E(cX) = (cx)P(X = x) = c xP(X = x) = cE(X)
x
Si X es una v.a. continua por definicin de esperanza para caso continuo tenemos que:
E(cX) =
(cx) f (x)dx = c
x f (x)dx = cE(X)
76
c) Este inciso es muy evidente pues cuando se cumple la hiptesis (E(X) 0), en la
integral o suma correspondiente solo aparecern trminos que son no negativos.
d) Esta ltima propiedad, en cambio, no es sencilla de demostrar y an en el caso discreto
requiere de detalles tcnicos que preferimos omitir.
Oservaciones:
Observe que la segunda y la cuarta propiedad establecen que la esperanza es lineal, es
decir, separa sumas y tambin separa multiplicaciones por constantes; esto es
E(c1 X + c2Y ) = c1 E(X) + c2 E(Y )
Adems si X1 , X2 , . . . , Xn son v.a. y c1 , c2 , . . . , cn son constantes arbitrarias se tiene que:
ciXi
k=1
ciE(Xi)
k=1
Si X e Y son v.a. independientes entonces E(XY ) = E(X)E(Y ). Esto mismo se extiende

n
n
para una sucesin X1 , X2 , . . . , Xn de v.a. independientes, esto es E Xi = E(Xi ).
i=1
i=1
Esta ltima propiedad no la detallaremos pero la utilizaremos en algunas demostraciones.
6.3.2.
Varianza
Definicin 6.3.2 (Varianza)

La varianza de una variable aleatoria X, denotada por Var(X), se define como la siguiente
esperanza, si sta existe,
[x E(X)]2 f (x)
si X es una v.a. discreta
x
Var(X) = E[X E(X)]2 =
Z
[x E(X)]2 f (x)dx si X es una v.a. continua
La varianza es una medida del grado de dispersin de los diferentes valores tomados por
la variable aleatoria. Se le denota regularmente por la letra 2 (sigma cuadrada). A la raz
cuadrada positiva de la varianza, esto es , se le llama desviacin estndar. Nuevamente la
anterior suma o integral puede no existir y en ese caso decimos que la variable aleatoria
no tiene varianza finita. Observemos que para calcular Var(X) necesitamos conocer primero
E(X). Veamos algunos ejemplos sencillos.
Ejemplo 6.3.5 Calcularemos la varianza de la variable aleatoria discreta X con funcin de
probabilidad dada por la siguiente tabla.
x
f(x)
-1
1/8
0
4/8
1
1/8
2
2/8
77
1
Recordemos primeramente que por clculos previos, E(X) = . Aplicando la definicin de
2
varianza para v.a. discreta Var(X) = [x E(X)]2 f (x), tenemos que:
x
1 2 4
1 2 1
1 2 2
1 2 1
Var(X) = 1
+ 0
+ 1
+ 2
=1
2
8
2
8
2
8
2
8
Ejemplo 6.3.6 Calcularemos la varianza de la variable aleatoria continua X con funcin de
densidad f (x) = 2x para x (0, 1) y cero en otro caso. En un clculo previo habamos encon2
trado que E(X) = . Aplicando la definicin de varianza para una v.a. continua Var(X) =
3
Z
2
[x E(X)] f (x)dx, tenemos que
Var(X) =
Z 1
2 2
2xdx =
3
Z 1
0
x4 8
8
8
4 1
1
2x3 x2 + x dx =
x3 + x2 =
3
9
2 9
9
18
0
Propiedades de la varianza
Ahora enunciamos algunas propiedades de la varianza.
Proposicin 6.3.3 Sean X y Y dos variables aleatorias, y sea c una constante. Entonces
a) Var(X) 0
b) Var(c) = 0
c) Var(cX) = c2Var(X)
d) Var(X + c) = Var(X)
e) Var(X) = E(X 2 ) (E(X))2
f) Var(X +Y ) 6= V (X) +V (Y )
Demostracin
a) Este inciso es evidente a partir de la definicin de varianza pues en ella aparece una
suma o integral de trminos no negativos.
b) Para este inciso la constante c es una v.a. con un nico valor, de modo que E(c) = c,
entonces
Var(X) = E(c c)2 = E(0)2 = E(0) = 0
c) Para este inciso tenemos que:
Var(cX) = E[cX E(cX)]2 = E[cX cE(X)]2 = E[c2 (X E(X))2 ]
= c2 E[X E(X)]2 = c2Var(X)
78
d) La demostracin de este inciso tiene un procedimiento anlogo al anterior, esto es,

Var(X + c) = E[(X + c) E(X + c)]2 = E[X + c (E(X) + E(c))]2
= E[X + c E(X) c)]2 = E[X E(X)]2 = Var(X)
e) Para demostrar esta propiedad se desarrolla el cuadrado en la definicin de varianza, y
se usa la propiedad de linealidad de la esperanza, esto es,
Var(X) = E[X E(X)]2 = E[X 2 2XE(X) + (E(X))2 ]
= E(X 2 ) 2E[XE(X)] + E[E(X)]2 = E(X 2 ) 2[E(X)]2 + [E(X)]2
= E(X 2 ) [E(X)]2
f) Finalmente para demostrar la propiedad (f) es suficiente dar un ejemplo. Puede tomarse
el caso Y = X, en general y por lo demostrado antes, se tiene que
Var(X +Y ) = Var(2X) = 22Var(X) = 4Var(X) 6= 2Var(X) = Var(X) +Var(Y )
Observacin:
Si X e Y son v.a. independientes y c1 , c2 son constantes arbitrarias entonces
Var(c1 X + c2Y ) = c21Var(X) + c22Var(Y )
Adems si X1 , X2 , . . . , Xn son v.a. independientes todas entre si y c1 , c2 , . . . , cn son constantes arbitrarias se tiene que:
Var
c
X
=
i
i
k=1
c2i Var(Xi)
k=1
Nota: En este curso no entraremos en detalles con respecto a las v.a. independientes por
eso no demostraremos las propiedades que este hecho implica en la esperanza y la varianza
de la suma de v.a. de este tipo mencionadas anteriormente.
6.3.3.
Momentos
Los momentos de una variable aleatoria son nmeros que representan algunas caractersticas de la distribucin de probabilidad asociada. Bajo ciertas condiciones el conjunto de
momentos determinan de manera nica a la distribucin de probabilidad. A continuacin
definiremos los momentos si existen de una variable aleatoria alrededor del origen y alrededor de la media tambin llamada momento central.
Definicin 6.3.3 (Momentos)
Se define el n-simo momento de una variable aleatoria X alrededor del origen, cuando
existe, como el nmero E(X n ), para cualquier valor natural de n. El n-simo momento central
de X, cuando existe, es el nmero E[(X ]n , en donde = E(X).
79
Observe que el primer momento de X alrededor del origen es simplemente la esperanza,

y el segundo momento central es la varianza. Tenemos entonces que si X es una variable
aleatoria con funcion de probabilidad f (x) si es discreta o funcin de densidad de probabilidad f (x) si es continua, entonces el n- simo momento de X, si existe, se calcula como
sigue:
xn f (x)
x
E(X n ) =
Z
xn f (x)dx si X es una v.a. continua
El n-simo momento central de X se calcula, para variables aleatorias discretas y continuas respectivamente, como indican las siguientes frmulas:
(x )n f (x)
x
E[X ]n =
Z
(x )n f (x)dx si X es una v.a. continua
Ejemplo 6.3.7 Sea la variable aleatoria discreta X con funcin de probabilidad dada por la
siguiente tabla.
x
0
1
2
f(x) 1/4 2/4 1/4
a) Hallar el primer, segundo y tercer momento alrededor del origen
b) Calcular el primer, segundo y tercer momento alrededor de la media
Desarrollo de los incisos
a) Por definicin de momentos alrededor del origen tenemos que
2
E(X) =
x f (x) = 0 4 + 1 4 + 2 4 = 1
x=0
E(X 2 ) =
x2 f (x) = 02 4 + 12 4 + 22 4 = 2
x=0
E(X 3 ) =
x3 f (x) = 03 4 + 13 4 + 23 4 = 2
x=0
b) Por definicin de momentos alrededor de la media cuyo valor es 1 tenemos que

2
E(X ) =
(x 1) f (x) = (0 1) 4 + (1 1) 4 + (2 1) 4 = 0
x=0
2
E[(X ) ] =
(x 1)2 f (x) = (0 1)2 4 + (1 1)2 4 + (2 1)2 4 = 2
x=0
3
E[(X 1) ] =
(x 1)3 f (x) = (0 1)3 4 + (1 1)3 4 + (2 1)3 4 = 0
x=0
6.4. FUNCIN GENERADORA DE MOMENTOS
80
Ejemplo 6.3.8 Una variable aleatoria X tiene funcin de densidad de probabilidad dada por:
x
si 0 < x < 2
2
f (x) =
0 en otro caso
a) Hallar el primer, segundo y tercer momento alrededor del origen
b) Calcular el primer y segundo momento alrededor de la media
Desarrollo de los incisos
a) Por definicin de momentos alrededor del origen tenemos que
Z 2
x
x3 2 4
E(X) =
x dx = =
6 0 3
0 2
Z 2
x
x4 2
E(X 2 ) =
x2 dx = = 2
2
8 0
0
Z 2
5
x
x 2 16
x3 dx = =
E(X 3 ) =
2
10 0
5
0
b) Por definicin de momentos alrededor de la media tenemos que
4 4 4
4
= E(X) E
= =0
E(X ) = E X
3
3
3 3
Z
Z
h
2
4 2x
4 2
1 2 3 8 2 16
x
=
x x + x dx
E[(X )2 ] = E X
dx =
3
3 2
2 0
3
9
0
4
2
1 x
8
8
2
=
x3 + x2 =
2 4 9
9
9
0
6.4.
Funcin generadora de momentos
A continuacin definiremos una funcin especial denominada funcin generadora de momentos.

Definicin 6.4.1 (Funcin generadora de momentos)
Sea X una variable aleatoria con funcin de probabilidad f (x) en el caso de que sea discreta
o funcin de densidad f (x) en el caso de que sea continua. Se define a la funcin generadora
de momentos de la variable aleatoria X como la siguiente esperanza,
MX (t) = E(etX )
La funcin generadora de momentos de X se calcula, para variables aleatorias discretas y
continuas respectivamente, como indican las siguientes frmulas:
etx f (x)
x
MX (t) =
Z
etx f (x)dx si X es una v.a. continua
81
Ejemplo 6.4.1 Sea X la variable aleatoria discreta del ejemplo 6.3.7, es decir, con funcin de
probabilidad dada por la tabla.
x
f(x)
0
1/4
1
2/4
2
1/4
Obtener su funcin generadora de momentos.

Por la definicin de funcin generadora de momentos tenemos
MX (t) = E(etX ) =
e2t + 2et + 1
tx
0 1
1t 2
2t 1
e
f
(x)
=
e
+
e
+
e
4
4
4
4
x=0
Ejemplo 6.4.2 Una variable aleatoria X tiene funcin de densidad de probabilidad dada por:
2x
si x 0
2e
f (x) =
0
en otro caso
Obtener su funcin generadora de momentos.
Por la definicin de funcin generadora de momentos tenemos
MX (t) = E(etX ) =
=
etx f (x)dx =
Z
0
etx 2e2x dx = 2
Z
0
e(2t)x dx
2
2
e(2t)x =
(2 t)
2t
0
Propiedades de la funcin generadora de momentos

Proposicin 6.4.1 Sea X una variable aleatoria con los primeros n momentos alrededor del
origen finitos, estos es, E(X k ) < ; k {0, 1, 2, . . . , n} y funcin generadora de momentos
MX (t) , entonces se tiene que:
dn
MX (0) = E(X n )
n
dt
Demostracin
Por definicin de funcin generadora de momentos, MX (t) = E(eXt ) y por serie de Taylor,
(tX)k
e(Xt) =
. Por lo tanto
k=0 k!
k
t
(tX)k
= E(X k )
MX (t) = E
k=0 k!
k=0 k!
Derivando n veces a MX (t) obtenemos la siguiente secuencia
d
t k1
t k1
MX (t) =
E(X k ) =
E(X k1 X) = E(XetX )
dt
(k
1)!
(k
1)!
k=1
k=1
82
t k2
t k2
d2
k
MX (t) =
E(X ) =
E(X k2 X 2 ) = E(X 2 etX )
2
dt
k=2 (k 2)!
k=2 (k 2)!
..
.
t kn
t kn
dn
k
M
(t)
=
E(X
)
=
E(X kn X n ) = E(X n etX )
X
dt n
(k
n)!
(k
n)!
k=n
k=n
Por lo que finalmente
dn
M
(0)
= E(X n )
X
dt n
Ejemplo 6.4.3 Tomemos nuevamente a la variable aleatoria discreta X del ejemplo 6.4.1
junto con su funcin generadora de momentos y calculemos los cuatro primeros momentos
de la variable alrededor del origen. Entonces
et + et + 1
MX (t) =
2
d
e2t + et
1+1
E(X) =
Mx (t) =
=1
=
dx
2
2
t=0
t=0
d2
2e2t + et
2+1 3
E(X 2 ) = 2 Mx (t) =
=
=
dx
2
2
2
t=0
t=0
3
2t
t
d
4e + e
4+1 5
E(X) = 3 Mx (t) =
=
=
dx
2
2
2
t=0
t=0
4
2t
t
d
8e + e
8+1 9
E(X) = 4 Mx (t) =
=
=
dx
2
2
2
t=0
t=0
Ejemplo 6.4.4 Tomemos ahora la variable aleatoria continua X del ejemplo 6.4.2 junto con
su funcin generadora de momentos y calculemos los cuatro primeros momentos de la variable alrededor del origen. Entonces
MX (t) =
2
2t
d
2
2
1
Mx (t) =
= 2=
2
dx
(2 t) t=0 2
2
t=0
4
4
d2
1
E(X 2 ) = 2 Mx (t) =
= 3=
3
dx
(2 t) t=0 2
2
t=0
12
12 3
d3
E(X) = 3 Mx (t) =
= 4 =
4
dx
(2 t) t=0 2
4
t=0
48
d4
48 3
E(X) = 4 Mx (t) =
= 5 =
5
dx
2
t=0
(2 t) t=0 2
E(X) =
Proposicin 6.4.2 Si X1 , X2 , . . . , Xn son v.a. independientes entonces

n
Xi
i=1
(t) = MXi (t)

i=1
6.5. PROBLEMAS
83
Demostracin
Por definicin de funcin generadora de momentos se tiene que
n
Xi
Xit
n
n
n
Xi t
Xi t
i=1
=
E
e
=
E
e
=
E(e
)
=
(t)
MXi (t)
i=1
i=1
i=1
i=1
Notese que para esta demostracin utilizamos la propiedad de la esperanza para v.a. independientes.
6.5.
Problemas
Variables Aleatorias
1. Determine en cada caso si la variable aleatoria en cuestin es discreta o continua.
Cules son sus posible valores?
a) Tiempo de vida de una persona escogida al azar.
b) Nmero de errores tipogrficos en una pgina escogida al azar de un libro.
c) Tiempo de servicio en una transaccin escogida al azar realizada por una persona
en un cajero automtico.
d) Monto de una reclamacin por accidente automovilstico escogida al azar del
conjunto de reclamaciones efectuadas a una compaa aseguradora.
2. Considere el experimento aleatorio de escoger un nmero al azar dentro del intervalo
unitario (0, 1). Suponga que cada resultado de este experimento se escribe en su expansin decimal como = 0, x1 x2 x3 . . . . Determine en los siguientes casos el conjunto de
valores de la variable aleatoria definida y clasifique sta como discreta o continua.
a) X() =
b) X() = x1
c) X() = 1
d) X() = 0, 0x1 x2 x3 . . .
3. Considere un experimento aleatorio con espacio muestral equiprobable = {1, 2, 3, 4, 5, 6}.
Defina la variable aleatoria X() = 2( 3). Cules son los posibles valores de X?.
Calcule P(X = 0), P(X {2, 3}), P(X 0), P(X < 0), P(X 2 = 1), P(2X 4 = 0), y
P(X 2 = 4).
4. Considere el ejemplo del experimento aleatorio de lanzar un dardo en un tablero circular de radio p
uno, Figura 1.13, junto con las variables aleatorias X(x, y) = x,Y (x, y) = y
y Z(x, y) = x2 + y2 . Suponga que para cada regin A cuya rea puede ser calcurea(A)
lada se define por P(A) =
.
rea()
1
1
1
Calcule P(X 0), P(X < 0), P(X +Y 1), P(Y > X), P Z <
yP
<Z<
.
2
3
2
6.5. PROBLEMAS
84
Funciones de probabilidad, de densidad y de distribucin

1. Grafique y compruebe que las siguientes funciones son de probabilidad
x2
si x = 2, 1, 0, 1, 2
10
a) f (x) =
0 en otro caso
(2x 5)2
si x = 1, 2, 3, 4, 5
70
b) f (x) =
0
en otro caso
2. Grafique y compruebe que las siguientes funciones son de densidad
x+1
si x (1, 1)
2
a) f (x) =
0
en otro caso
x
e
si x > 0
b) f (x) =
0 si x 0
3. Encuentre el valor de la constante c para que f (x) sea una funcin de probabilidad.
Grafique esta funcin y calcule P(X 2, 3, 4) y P(X < 3) en cada caso.
cx si x = 1, 2, . . . , 10
a) f (x) =
0 en otro caso
2
cx si x = 1, 2, . . . , 10
b) f (x) =
0 en otro caso
4. Determine si la siguiente funcin es de probabilidad. Grafique la funcin y justifique
su respuesta.
si x = 0, 1
2
f (x) =
si x = 2
0 otro caso
5. Determine si la siguiente funcin es de probabilidad. Grafique la funcin y justifique
su respuesta.
3 x 1 4x
4
si x = 0, 1, 2, 3, 4
x!(4 x)! 4
4
f (x) =
0
otro caso
6.5. PROBLEMAS
85
6. Encuentre el valor de la constante c para que la siguiente funcin sea de densidad.

Grafique f (x) y calcule P(X ) y P(X [, 2]).
c(1 + senx) si x [0, 2]

f (x) =
0
en otro caso
7. Encuentre el valor de la constante c para que la siguiente funcin sea de densidad.
Grafique f (x) y calcule P(X (1, )).
f (x) = ce|x| para < x <
8. Determine si cada una de las siguientes funciones es de densidad. Grafique la funcin
en cada caso y justifique su respuesta.
4x
si x [0, 2]
5
a) f (x) =
0
otro caso
2x2
4
2x +
si x [0, 3]
3
3
b) f (x) =
0
en otro caso
9. Explique porqu no es posible encontrar un valor de la constante c para que la siguiente
funcin sea de probabilidad o de densidad.
cx si x = 2, 1, 0, 1, 2
a) f (x) =
0
otro caso
c senx si x [, ]
b) f (x) =
0
en otro caso
10. Sea X una v.a. discreta con funcin de probabilidad dada por la siguiente tabla. Grafique
f (x) y calcule P(X 0), P(X < 0) y P(X 2 = 1).
x
-1
f(x) 0,2
0
0,3
1
0,5
11. Dadas las variables aleatorias con funciones de probabilidad dada por las tablas
x
f(x)
0
1/210
x
f(x)
2
1/36
1
4/35
3
1/18
2
3
3/7 8/21
4
1/12
a) Grafique en ambos casos
5
1/9
4
1/14
6
5/36
7
1/6
8
5/36
9
1/9
10
1/12
11
1/18
12
1/36
6.5. PROBLEMAS
86
b) Calcule P(X 2), P(X 3) y P(1 X 3) en ambos casos

12. Sea X una v.a. discreta con funcin de probabilidad dada por la tabla que aparece abajo.
Grafique f (x). Calcule la funcin de probabilidad de las siguientes variables aleatorias
Y = X 2 , Z = |X| y W = 2X 5. Grafique en cada caso.
x
f(x)
-2
0,1
-1
0,15
0
0,4
2
0,1
3
0,15
5
0,1
13. Sea X discreta con funcin de probabilidad dada por la tabla que aparece abajo. Encuentre el valor de c y grafique f (x). Calcule y grafique la funcin de probabilidad de
la variable Y = X 2 .
x
-2 0 2
f(x) 0,1 c 0,1
14. Sea X una variable aleatoria con la siguiente funcin de distribucin. Encuentre y
grafique f (x). Calcule P(0 X < 10).
1 x+1
1
si x = 0, 1, 2, 3, . . .
2
F(x) =
0
otro caso
15. Sea X una v.a. continua con funcin de densidad
si k x 4k
10
f (x) =
0
otro caso
a) Determine el valor de la constante k y grafique f (x)
b) Calcule y grafique F(x)
c) Calcule P(1 X 3), P(X 2) y P(X 0)
1
d) Encuentre m tal que P(|X 1| m) =
2
16. Sea X una variable aleatoria continua con la funcin de densidad que aparece abajo.
Encuentre el valor de la constante c y grafique la funcin f (x). Encuentre y grafique
adems la funcin de distribucin F(x).
2x
si 0 < x < c
9
f (x) =
0 si en otro caso
17. Dada la siguiente funcin f (x) =
ce3x si x > 0
0
si x 0
a) Obtenga el valor de c que haga que esta funcin sea de densidad para X
6.5. PROBLEMAS
87
b) Calcule y grafique F(x)

c) Calcule P(X 10), P(X 5) y P(5 X 10)
18. El tiempo en minutos que una persona espera un autobs es una v.a. con funcin de
densidad dada por
1
2 si 0 < t < 1
1
f (t) =
4 si 2 < t < 4
0 para otro valor de t

Hallar la probabilidad de que el tiempo en que la persona que espera el autobs sea de
a) mayor de 3 minutos
b) entre 1 y 2 minutos
c) menor de 3 minutos
19. Una v.a. tiene funcin de densidad
2
cx si 1 t 2
f (t) =
cx si 2 t 3
0 para otro valor de x

Hallar:
a) la constante c
b) la funcin de distribucin
1
3
c) P(X > 2) y P
<X <
2
2
20. Sea X una variable aleatoria con la funcin de distribucin que aparece abajo. Es X
discreta o continua? Grafique F(x). Encuentre y grafique la correspondiente funcin
de densidad f (x). Calcule adems P(X = 2) y P(1 < X < 2).
0
para x < 1
1
F(x) =
si 1 x < 2
1
para x 2
21. Sea X una variable aleatoria con la funcin de distribucin que aparece abajo. Es X
discreta o continua? Grafique F(x). Encuentre y grafique la correspondiente funcin
1
1
de densidad f (x). Calcule adems P(X = ) y P(X > ).
2
2
0 para x < 0
x si 0 x < 1
F(x) =
1 para x 1
6.5. PROBLEMAS
88
22. Una urna contiene cuatro bolas numeradas 1, 2, 3 y 4. Se extraen dos bolas al azar, una
a la vez y sin reemplazo. Sea X la variable aleatoria que denota la suma de los nmeros
de las dos bolas seleccionadas.
a)
b)
c)
d)
Determine
Calcule y grafique f (x)
Calcule y grafique F(x)
Calcule P(X 6), P(3 < X 5) y P(X = 6)
Esperanza, varianza, momentos y funcin generadora de momentos

1. Sea a un nmero fijo. Construya una variable aleatoria X tal que E(X) = a.
2. Calcule la esperanza de la variable aleatoria discreta X cuya funcin de probabilidad
es
si x = 0, 1
1
a) f (x) =
si x = 2, 3
0 otro caso
si x = 1, 1
1
b) f (x) =
si x = 0
0 otro caso
3. Calcule la esperanza de la variable aleatoria continua X cuya funcin de densidad es
a) f (x) = ex , para x > 0
b) f (x) = 6x(1 x), para 0 < x < 1
4. Sea X una variable aleatoria discreta con la funcin de probabilidad que aparece abajo.
Demuestre que f (x) es efectivamente una funcin de probabilidad y que la esperanza
de X no existe. Este es un ejemplo de una variable aleatoria discreta que no tiene
esperanza finita.
para x = 1, 2, 3, . . .
x(x + 1)
f (x) =
0
para otros casos
5. Sea X una variable aleatoria continua con la funcin de densidad que aparece abajo.
Demuestre que esta funcin es efectivamente una funcin de densidad. Compruebe
adems que la esperanza de X no existe. Este es un ejemplo de una variable aleatoria
continua que no tiene esperanza finita. Es un caso particular de la distribucin Cauchy.
1
, para < x <
f (x) =
2
(x + 1)
6.5. PROBLEMAS
89
6. Demuestre que no existe la esperanza de la v.a X cuando su funcin de densidad es
2 para x > 1
x
f (x) =
0 para x 1
7. Encuentre la esperanza y luego demuestre que la varianza de una variable aleatoria con
la siguiente funcin de densidad no existe.
3 para x > 1
x
f (x) =
0 para x 1
8. Diga falso o verdadero. Justifique en cada caso.
a) La esperanza de una v.a. puede ser cero.
b) No hay dos v.a.s distintas con la misma esperanza.
c) La esperanza de una v.a. nunca es negativa.
d) La varianza de una v.a. puede ser cero.
e) La varianza de una v.a. nunca es negativa.
f) No hay dos v.a.s distintas con la misma varianza.
9. Demuestre que
a) E(E(X)) = E(X)
b) Var(Var(X)) = 0
10. Sea X la variable aleatoria constante c. Compruebe que
a) E(X) = c
b) E(X n ) = cn
c) Var(X) = 0
11. Calcule la media y varianza de la variable aleatoria X con funcin de probabilidad
si x = 0, 1, 2
2
f (x) =
si x = 3, 4, 5
0 otro caso
12. Calcule la media y varianza de la variable aleatoria X cuya funcin de probabilidad es
x+1
1
si x = 0, 1, 2, 3, . . .
2
f (x) =
0
otro caso
6.5. PROBLEMAS
90

a) Var(E(X)) = 0
b) E(Var(X)) = E(X)
14. Sea X una variable aleatoria continua con funcin de densidad f (x) = 12e|x| , para
< x < . Demuestre que f (x) es efectivamente una funcin de densidad y compruebe que
a) E(X) = 0
b) E(X 2 ) = 2
c) Var(X) = 2
d) E(X n ) = n! para n par
a) E(X) = E(X)
b) Var(X) = Var(X)
c) E(Var(X)) = Var(E(X))
16. Encuentre el error en la siguiente demostracin de la afirmacin de que la varianza de
cualquier variable aleatoria es cero.
0 = Var(0)
= Var(X + (X))
= Var(X) +Var(X)
= Var(X) +Var(X)
= 2Var(X)
Captulo 7
Distribuciones de probabilidad
Estudiaremos a continuacin algunas distribuciones de probabilidad de variables aleatorias importantes. Estas distribuciones son modelos particulares para asignar probabilidades
a subconjuntos de nmeros reales. Empezaremos con las distribuciones de tipo discreto y
continuaremos despus con las de tipo continuo. Es importante sealar que sta es slamente
una lista parcial de algunas distribuciones de probabilidad de mayor uso.
7.1.
Distribuciones discretas de probabilidad
7.1.1.
Distribucin Bernoulli
Un ensayo Bernoulli se define como aquel experimento aleatorio con nicamente dos
posibles resultados, llamados genricamente xito y fracaso, con probabilidades respectivas P(xito) = p y P(Fracaso) = 1 p.
Construccin de una distribucin de Bernoulli
Sea un experimento aleatorio que arroja nicamente dos posibles resultados, denominados xito y fracaso. Si se define la variable aleatoria X como aquella funcin que lleva el
resultado xito al nmero 1 y el resultado fracaso al nmero 0, entonces decimos que X tiene
una distribucin Bernoulli con parmetro p (0, 1), y escribimos X Ber(p). La funcin de
probabilidad es
x
p (1 p)1x si x = 0, 1
f (x) =
0
para otro caso
Proposicin 7.1.1 Sea X Ber(p), entonces tenemos que
a) E(X) = p
b) Var(X) = p(1 p)
c) MX (t) = 1 p + pet
Demostracin
a) A partir de la definicin de esperanza se tiene que
E(X) = x f (x) = 0 (1 p) + 1 p = p
x
91
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD
92
b) Segn la definicin de varianza, Var(X) = [x E(X)]2 f (x), entonces tenemos que

x
Var(X) = (0 p)2 (1 p) + (1 p)2 p = p2 (1 p) + p(1 p)2 = p(1 p)

c) Recordando que la funcin generadora de momentos se define como MX (t) = E(etX ),
entonces
MX (t) = etx f (x) = e0 (1 p) + et p = 1 p + pet
x
Ejemplo 7.1.1 Considere el experimento aleatorio de lanzar una moneda al aire. Calcula la
esperanza, la varianza y la funcin generadora de momentos.
Suponga que 1 = cara y 2 = cruz son los dos resultados posibles, con probabilidades
1
1
p = y 1 p = , respectivamente. Sea X la variable aleatoria dada por X(1 ) = 1, y
2
2
1
X(2 ) = 0. Entonces X tiene distribucin Ber
, por lo tanto
2
E(X) = p =
1
2
1
1
1
Var(X) = p(1 p) = (1 ) =
2
2
4
1 1
1
MX (t) = 1 + et = (1 + et )
2 2
2
7.1.2.
Distribucin binomial
La distribucin binomial fue desarrollada por suizo Jakob Bernoulli (1654-1705), es la

principal distribucin de probabilidad discreta. La variable aleatoria binomial y su distribucin estn basadas en un experimento que satisface las condiciones citadas a continuacin.
Construccin de la distribucin binomial
Suponga que se realizan n ensayos idnticos independientes de Bernoulli en donde la
probabilidad de xito y de fracaso en cada uno de ellos es la misma, siendo la probabilidad
de xito igual a p y la del fracaso igual a 1 p, con p (0, 1). El espacio muestral de este
experimento consiste de todas las posibles sucesiones de longitud n de xitos y de fracasos,
esto es
= {(EEE . . . E), (FEE . . . E), (FFE . . . E), . . . , (FFF . . . FE), (FFF . . . F)}
Usando el principio multiplicativo, es fcil ver que este conjunto tiene 2n elementos.
Si ahora se define la variable aleatoria X como el nmero de xitos en cada una de estas
sucesiones, esto es
X(EEE . . . E) = n, X(FEE . . . E) = n 1, . . . , X(FFF . . . EF) = 1, X(FFF . . . F) = 0
entonces X toma los valores 0, 1, . . . , n, y se dice que X tiene una distribucin binomial con
parmetros n y p. Se escribe X bin(n, p), y su funcin de probabilidad es
f (x) =
93
n!
px (n p)1x si x = 0, 1, . . . , n
x!(n x)!
para otro caso
Proposicin 7.1.2 Sea X bin(n, p), entonces tenemos que

a) E(X) = np
b) Var(X) = n(1 p)
c) MX (t) = (1 p + pet )n
Demostracin
a) Como la variable aleatoria X constituye el nmero de xitos obtenidos en cada uno
de los posibles resultados en el experimento (posibles sucesiones de ). Entonces
n
X=
X j , donde X j Ber(p),
j = {1, 2, . . . , n}, por lo que la esperanza, varian-
j=1
za y funcin generadora de momentos de cada X j son E(X j ) = p, Var(X j ) = p(1 p)

y MX j (t) = pet + p 1 respectivamente. Aplicando la propiedad de linealidad de la
esperanza se tiene
E(X) = E
X
j =
n
j=1
E(X j ) =
j=1
p = np
j=1
b) Tomando en cuenta la propiedad de varianza que establece que si tenemos n variables

aleatorias independientes, todas con varianzas finitas, entonces la varianza de las suma
de las n v.a. es idntica a la suma de las varianzas de las variables, por lo tanto la
varianza de X es:
n
Var(X) = Var( X j ) =
j=1
Var(X j ) =
j=1
p(1 p) = np(1 p)
j=1
c) Una de las propiedades de la funcin generadora de momentos establece que si tenemos

n variables aleatorias independientes, entonces la funcin generadora de momentos de
la suma de las n v.a. es idntico al producto de la funcin generadora de momentos de
las variables, entonces
MX (t) = M
Xj
j=1
j=1
(t) = MX j (t) = (pet + p 1) = (pet + p 1)n
j=1
Ejemplo 7.1.2 El experimento consiste en lanzar cuatro veces al aire una moneda. Nuestro
inters es el nmero de caras obtenidas en los cuatro lanzamientos. Como es evidente, la
probabilidad de obtener un xito ( cara ), en una de las pruebas ( lanzamiento ) es 0,50 y la
de obtener un fracaso es tambin 0,50.
a) Cul es la probabilidad de no obtener caras en los cuatro lanzamientos?
94
b) Cul es la probabilidad de obtener dos caras en los cuatro lanzamientos?

c) Haga una distribucin de probabilidad binomial
d) Calcular la media, la desviacin estndar y la funcin generadora de momentos de esta
distribucin binomial
Esta distribucin binomial tiene por funcin de probabilidad a la siguiente funcin
1 x 1 4x
4!
si x = 0, 1, 2, 3, 4
x!(4 x)! 2
2
f (x) =
0
para otro caso
1 4
4!
si x = 0, 1, 2, 3, 4
x!(4 x)! 2
0
para otro caso
a) La probabilidad de no obtener caras en los cuatro lanzamientos es P(X = 0), esto es,
P(X = 0) =
1 4
4!
1
=
0!(4 0)! 2
16
b) La probabilidad de obtener dos caras en los cuatro lanzamientos es P(X = 2), esto es,
1 4
4!
6
3
P(X = 2) =
=
=
2!(4 2)! 2
16 8
c) La distribucin de probabilidad est dada por la siguiente tabla
x
p(x)
0
1/16
1
4/16
2
3/8
3
1/4
4
1/16
c) Teniendo en cuenta la proposicin 7.1.1 tenemos que la esperanza, la varianza y la

funcin generadora de momentos son respectivamente
E(X) = 4
1
=2
2
1 1
Var(X) = 4 = 1
2 2
1 1 4
1
MX (t) = 1 + et = (et + 1)4
2 2
16
7.1.3.
95
Distribucin Poisson
Esta distribucin fue descubierta por Simen Denis Poisson (1781-1840) en 1837 como
lmite de la distribucin binomial. En 1838 en su trabajo Recherches sur la probabilit des
jugements en matires criminelles et matire civile (Investigacin sobre la probabilidad de
los juicios en materias criminales y civiles). El trabajo estaba enfocado en ciertas variables aleatorias N que cuentan, entre otras cosas, un nmero de ocurrencias discretas (muchas
veces llamadas arribos) que tienen lugar durante un intervalo de tiempo de duracin determinada.
La distribucin de Poisson tiene conexin con los procesos de Poisson. Se aplica a varios
fenmenos discretos de la naturaleza (esto es, aquellos fenmenos que ocurren 0, 1, 2, 3, . . .
veces durante un periodo definido de tiempo o en una rea determinada) cuando la probabilidad de ocurrencia del fenmeno es constante en el tiempo o el espacio.
Ejemplos de eventos que pueden ser modelados por la distribucin de Poisson
a) El nmero de autos que pasan a travs de un cierto punto en una ruta (suficientemente
distantes de los semforos) durante un periodo definido de tiempo.
b) El nmero de errores de ortografa que uno comete al escribir una nica pgina.
c) El nmero de llamadas telefnicas en una central telefnica por minuto.
d) El nmero de servidores web accedidos por minuto.
e) El nmero de animales muertos encontrados por unidad de longitud de ruta.
f) El nmero de mutaciones de determinada cadena de ADN despus de cierta cantidad
de radiacin.
g) El nmero de ncleos atmicos inestables que decayeron en un determinado periodo
de tiempo en una porcin de sustancia radiactiva.
h) La radiactividad de la sustancia se debilitar con el tiempo, por lo tanto el tiempo total
del intervalo usado en el modelo debe ser significativamente menor que la vida media
de la sustancia.
i) El nmero de estrellas en un determinado volumen de espacio.
j) La distribucin de receptores visuales en la retina del ojo humano.
k) La inventiva de un inventor a travs de su carrera
La distribucin de Poisson surge cuando estamos interesados en medir el nmeros de
sucesos aleatorios que suceden en un intervalo de tiempo fijo. La variable aleatoria se distribuye a lo largo del tiempo o del espacio. Las condiciones para que se trate de una distribucin de Poisson son:
Los eventos de inters deben ocurrir independientemente unos de otros
La probabilidad de que suceda un evento en un intervalo depende de la longitud del
intervalo y no de su posicin.
96
Construccin de una distribucin de Poisson

Supongamos que deseamos observar el nmero de ocurrencias de un cierto evento dentro
de un intervalo de tiempo dado, por ejemplo, el nmero de clientes que llegan a un cajero automtico durante la noche, o tal vez deseamos registrar el nmero de accidentes que ocurren
en cierta avenida durante todo un da. Para modelar este tipo de situaciones podemos definir
la variable aleatoria X como el nmero de ocurrencia de este evento en el intervalo de tiempo
dado. Es claro entonces que X puede tomar los valores 0, 1, 2, . . . , y en principio no ponemos
una cota superior para el nmero de observaciones del evento. Adicionalmente supongamos
que conocemos la tasa media de ocurrencia del evento de inters, que denotamos por la letra
(lambda). El parmetro es positivo y se interpreta como el nmero promedio de ocurrencias del evento, por unidad de tiempo. La probabilidad de que la variable aleatoria X tome un
valor entero x 0 se definir a continuacin. Decimos que X tiene una distribucin Poisson
con parmetro > 0, y escribimos X Poisson() cuando:
e x
si x = 0, 1, 2, . . .
x!
f (x) =
0
para otro caso
Figura 7.1: Grfica de f (x) de la distribucin Poisson

El eje horizontal es el ndice x. La funcin solamente est definida en valores enteros de
x. Las lneas que conectan los puntos son solo guas para el ojo y no indican continuidad.
Proposicin 7.1.3 Sea X Poisson(), entonces tenemos que
a) E(X) =
b) Var(X) =
t
c) MX (t) = e(e 1)
97
Demostracin
E(X) =
x=0
x1
e x
e x
e
=
=
=
x!
x=1 (x 1)!
x=1 (x 1)!
b) Segn una de las propiedades de la varianza se tiene, Var(X) = E(X 2 ) [E(X)]2 , entonces calculemos primero E(X 2 )
E(X 2 ) =
x2
x=0
e x
e x
e x
= x
= (x 1 + 1)
x!
(x 1)!
x=1 (x 1)!
x=1
x1
e x
e x
e x
e
= (x 1)
+
=
+
(x 1)! x=1 (x 1)! x=2 (x 2)!
x=1
x=1 (x 1)!
x1
e x2
e
+
= 2 +
(x
2)!
(x
1)!
x=2
x=1
= 2
Entonces:
Var(X) = 2 + 2 =
c) Por la definicin de funcin generadora de momentos, se tiene que
MX (t) =
etx
x=0
t
t
e x
(et )x
= e
= e ee = e(e 1)
x!
x=0 x!
Ejemplo 7.1.3 Una distribucin de Poisson est dada por

P(X = x) =
e1,8 (1, 8)x

x!
Hallar
a) P(X = 1), P(X 2) y P(X 3)
b) E(X),Var(X) y MX (t)
Desarrollo
a) Tomando la funcin de probabilidad tenemos que
P(X = 1) =
e1,8 (1, 8)1

= 1, 8e1,8 = 0, 2975
1!
P(X 2) = P(X = 0) + P(X = 1) + P(X = 2)

e1,8 (1, 8)0 e1,8 (1, 8)1 e1,8 (1, 8)2
=
+
+
= 0, 7306
0!
1!
2!
P(X 3) = 1 P(x < 3) = 1 [P(X = 0) + P(X = 1) + P(X = 2)]
= 1 0, 7306 = 0, 2694
98
b) A partir de la proposicin 7.1.3 se tiene que

E(X) = Var(X) = = 1, 8 y
MX (t) = e1,8(e 1)
Relacin con la distribucin binomial

La distribucin de Poisson puede ser vista como un caso lmite de la distribucin binomial, es decir, una distribucin binomial en la que n y p 0 se puede aproximar
por una distribucin de Poisson de parmetro = np.
Ejemplo 7.1.4 En una central telefnica automtica la probabilidad de que una llamada sea conectada errneamente es 103 .
a) Para un da donde son conectadas 2000 llamadas independientes, hallar el valor
aproximado de la probabilidad que se efecten 4 conexiones errneas.
b) Cul es el nmero mnimo de llamadas independientes que se requieren para
asegurar con probabilidad 0,9 que por lo menos una de las llamadas sea conectada
errneamente?
Desarrollo
a) Sea X la v.a que represente el nmero de llamadas telefnicas conectadas errneamente en un da determinado. Entonces la funcin de probabilidad de X est dada
por:
enp (np)x
P(X = x) =
x!
donde p = 103 y n = 2000 segn las condiciones de este problema. Entonces
np = 2 y
e2 (2)4
P(X = 4) =
= 0, 09
4!
b) Si X es nuevamente el nmero de llamadas conectadas errneamente en un da
determinado entonces X Poisson(np). Segn la informacin P(X 1) 0, 9 y
considerando que P(X 1) = 1 P(X < 1) = 1 P(X = 0) entonces:
1
enp (np)0
0, 9
0!
0, 1 enp
ln|0, 1| np
n 2303 llamadas
7.1.4.
99
Distribucin geomtrica
En la teora de probabilidad y estadstica, la distribucin geomtrica es cualquiera de las

dos distribuciones de probabilidad discretas siguientes:
La distribucin de probabilidad del nmero X de ensayos de Bernoulli necesaria para
obtener un xito, contenido en el conjunto {1, 2, 3, . . . } o
la distribucin de probabilidad del nmero Y = X 1 de fallos antes del primer xito,
contenido en el conjunto {0, 1, 2, 3, . . . }
A cualquiera de stas dos distribuciones se la denomina distribucin geomtrica, es una
cuestin de convencin y conveniencia.
Construccin de una distribucin geomtrica
Supongamos que tenemos ahora una sucesin infinita de ensayos independientes Bernoulli, en cada uno de los cuales la probabilidad de xito es p. Para cada una de estas sucesiones
definimos la variable aleatoria X como el nmero de fracasos antes de obtener el primer
xito. Por ejemplo, X(FEFEFF . . . ) = 1, X(EFFEEE . . . ) = 0, X(FFFEFE . . . ) = 3. Observamos que X puede tomar los valores 0, 1, 2, . . . . La probabilidad de que X tome el valor
entero x 0 es p(1 p)x . Decimos entonces que X tiene una distribucin geomtrica con
parmetro p, y escribimos X geo(p) cuando
p(1 p)x si x = 0, 1, 2, . . .
P(X = x) =
0
para otro caso
El nombre de esta distribucin proviene del hecho de que cuando escribimos la suma
de todas las probabilidades, obtenemos una suma geomtrica. La inspeccin sucesiva de
artculos hasta encontrar una defectuoso, posiblemente en un proceso de control de calidad,
puede modelarse usando una distribucin geomtrica.
Proposicin 7.1.4 Si X es la v.a. que muestra el nmero de fracasos antes del primer xito
esto es; X geo(p) entonces:
a) E(X) =
(1 p)
p
b) Var(X) =
(1 p)
p2
1
p
, con t < ln
c) MX (t) =
t
1 e (1 p)
1 p
Demostracin
E(X) =
x=0
x=0
x=0
xp(1 p)x = p x(1 p)x = p(1 p) x(1 p)x1
100
i
d h
d
x
[(1 p)x ] = p(1 p)
(1
p)
d p x=1
x=1 d p
= p(1 p)
= p(1 p)
d 1
(1) 1 p
1 = p(1 p) 2 =
dp p
p
p
b) Segn una de las propiedades de la varianza se tiene, Var(X) = E(X 2 ) [E(X)]2 , entonces calculemos primero E(X 2 )
E(X 2 ) =
x=0
p(1 p) = p x (1 p) = p(1 p) x2 (1 p)x1

x
x=1
x=1
i
d
d h
x
[x(1 p)x ] = p(1 p)
x(1
p)
d p x=1
x=1 d p
= p(1 p)
= p(1 p)
i
d h1
d h1 pi
x
px(1
p)
=
p(1
p)
d p p x=1
d p p2
h p2 (1 p)2p i
p 2 (1 p)(2 p)
= p(1 p)
=
p(1
p)
=
p4
p3
p2
Entonces:
Var(X) =
(1 p)(2 p) (1 p)2 1 p
= 2
p2
p2
p
c) Por la definicin de funcin generadora de momentos, se tiene que

1
p
MX (t) = e p(1 p) = p [e (1 p)] =

con t < ln
t
1 e (1 p)
1 p
x=0
x=0
tx
Observacin: Recordar que una serie geomtrica es de la forma

si su radio r cumple con la condicin |r| < 1
rx1 y converge a 1 r
x=1
Ejemplo 7.1.5 Supongamos que un dado ordinario (equilibrado) es lanzado repetidas veces
hasta que aparece el resultado 1 por primera vez. Calcular
a) obtener la distribucin de probabilidad de la v.a. que se ajuste a este experimento y
calcular la probabilidad de obtener el 1 en el cuarto lanzamiento
b) la esperanza, la varianza y la funcin generadora de momentos
Desarrollo
a) Sea X la v.a que represente el nmero de lanzamientos necesarios del dado para obtener
por primera vez el resultado 1. Entonces X geo(P = 16 ), con lo cual
x
si x = 0, 1, 2, . . .
16 56
P(X = x) =
0
para otro caso

Por lo que
P(X = 3) =
101
1
5 3
125
1
=
6
6
1296
b) Segn la proposicin 7.1.4 se tiene que

E(X) =
1 16
1
6
=5
1 1
V (X) = 52 = 30
1
6
MX (t) =
7.1.5.
1
1
6
=
6 5et
1 et 1 16
Distribucin binomial negativa
Si en una sucesin infinita de ensayos de Bernoulli (el resultado en cada experimento

es un xito o fracaso) cada uno con parmetro p (0, 1); la variable aleatoria X cuenta el
nmero de fracasos antes de obtener el r-simo xito, entonces decimos que X tiene una
distribucin binomial negativa con parmetros r y p, y escribimos X bin neg(r, p).
Construccin de una distribucin binomial negativa
Para construir una distribucin binomial negativa es necesario conocer el nmero de pruebas que se repiten, el r-simo xito en el nmero de pruebas que se repiten y la probabilidad
de que suceda un xito en cada una de las pruebas.
Para n = r, r + 1, . . . se define An como el suceso que establece que el nmero total de
pruebas requeridas para obtener exactamente r xitos es n. Como el suceso An ocurre si y
solo si ocurren exactamente r 1 xitos en las primeras n 1 pruebas y el r-simo xito se
da en la n-simo prueba. Puesto que todas las pruebas son de Bernoulli entonces son todas
independientes entre si y plicando el principio de anlisis combinatorio, se obtiene que:
n1
P(An ) =
pr1 (1 p)(n1)(r1) p
r1
con lo cual
P(An ) =
n1
r1
pr (1 p)nr
(7.1.1)
Si decimos que X es la v.a. que cuenta el nmero de fracasos antes de obtener el r-simo
xito, entonces X puede tomar los valores del conjunto {0, 1, 2, . . . }. Adems recordemos
que n por definicin de An es nmero de fracasos (x) ms nmero de xitos (r), esto es
n = x + r. Entonces se entiende la v.a. X podra caracterizar numricamente al suceso An
como X(An ) = x, por lo que tendremos;
P(An ) = P(Ax+r ) = P(X = x)
(7.1.2)
102
Tomando en cuenta las ecuaciones 7.1.1 y 7.1.2 se tiene

r+x1
pr (1 p)x si x = 0, 1, 2, . . .
x
P(X = x) =
0
para otro caso
donde
r+x1
(r + x 1)!
x!(r 1)!
Aparece el trmino pr pues la sucesin de ensayos Bernoulli no concluye sino hasta

obtener r xitos. Podemos
tener
un nmero variable de fracasos, de ah el trmino (1 p)x , y
finalmente el factor
r+x1
que nos dice las diferentes formas en que los r xitos pueden
aparecer en los r + x 1 ensayos realizados antes del ltimo que necesariamente fue un xito.
Es claro que esta distribucin es una generalizacin de la distribucin geomtrica, la cual
se obtiene tomando r = 1.
Proposicin 7.1.5 Si X es la v.a. que muestra el nmero de fracasos antes del r xito esto
es; X bin neg(r, p) entonces:
a) E(X) =
r(1 p)
p
b) Var(X) =
r(1 p)
p2
1
ir
p
c) MX (t) =
, con t < ln
t
1 e (1 p)
1 p
h
Demostracin
Si X es la v.a que cuenta el nmero de fracasos antes del r-simo xito en sucesin
r
de pruebas de Bernoulli; entonces X =
Xi, donde todas las v.a. Xi son independientes
i=1
1 p
1 p
entre si y cada Xi geo(p), i = 1, 2, . . . , r; con lo cual E(Xi ) =
,Var(Xi ) =
p
p2
p
. Esto resulta del hecho de que para cada xito se tubo que haber
y MXi (t) =
1 et (1 p)
tenido un cierto nmero de fracasos, que es la caracterstica de la distribucin geomtrica.
Entonces
a) la esperanza de X es
E(X) = E
r
r
1 p r(1 p)
=
X
E(X
)
=
i i p = p
i=1
i=1
i=1
r
b) la varianza de X es
Var(X) = Var
Xi
i=1
1 p r(1 p)
=
2
p2
i=1 p
= Var(Xi ) =
i=1
103
c) y la funcin generadora de momentos de X es

h
ir
p
p
=
t
1 et (1 p)
i=1 1 e (1 p)
MX (t) = M
Xi
(t) = MXi (t) =

i=1
i=1
Ejemplo 7.1.6 Se lanza repetidas veces una moneda honesta, cuyos dos resultados son cara
y cruz.
a) Cul es la probabilidad de obtener la tercera cruz en el quinto lanzamiento?
b) Obtener la esperanza, varianza y la funcin generadora de momentos para esta distribucin
Desarrollo
a) Sea X la v.a. que represente el nmero de caras (fracasos) necesarias astes de obtener
por tercera vez cruz. Entonces X bin neg(3, 21 ), con lo cual

2+x
3
x
1
1
si x = 0, 1, 2, . . .
2
2
x
P(X = x) =
0
para otro caso
Por lo que
P(X = 2) =
2+2

1 3 1 2
2
=6
1 5
2
6
= 0, 1875
32
b) Segn la proposicin 7.1.5 se tiene que

E(X) =
1
3 1 2
1
2
=3
1
3 1 2
V (X) = 2 = 6
1
2
MX (t) =
7.1.6.
1
1
=
2
2 et
1 et 1 12
Distribucin hipergeomtrica
Como la mayora de los muestreos se hacen sin remplazamiento. As, si la poblacin es

pequea la probabilidad de obtener el artculo del tipo requerido cambia en cada observacin.
En estadstica la distribucin hipergeomtrica es una distribucin de probabilidad discreta
con tres parmetros discretos N, r y n. Adems es apropiada para muestreos sin reemplazamiento de poblaciones pequeas. Esta distribucin se refiere a un espacio muestral donde hay
elementos que tienen dos tipos de caractersticas posibles. Indica la probabilidad de obtener
un nmero de objetos x de uno de estos tipos, al sacar una muestra de tamao n, de un total
de N objetos, de los cuales k son del tipo requerido.
104
Construccin de una distribucin hipergeomtrica

Supongamos que tenemos un conjunto de N objetos de los cuales k son de una primera
clase y N k son de una segunda clase. Supongamos que de este conjunto tomamos una
muestra aleatoria de tamao n (n N), la muestra es sin reemplazo y el orden de los objetos seleccionados no importa. El espacio muestral de este experimento consiste de todas
las posibles muestras de tamao n que sepueden
obtener del conjunto mayor de tamao N.
La cardinalidad del espacio muestral es
N
n
. Si para cada muestra definimos la variable
aleatoria X como el nmero de objetos de la primera clase contenidos en la muestra seleccionada, entonces X puede tomar los valores 0, 1, 2, . . . , n; suponiendo n k. La probabilidad
de que X tome un valor x estar dada por la frmula que enunciamos a continuacin. Decimos que X tiene una distribucin hipergeomtrica con parmetros N, k y n, y escribimos
X hipergeo(N, k, n) si
!
!
k
N k
x
nx
!
si x = 0, 1, 2, . . . , n
N
P(X = x) =
0
para otro caso

k
El trmino
nos dice las diferentes formas en que de los k objetos de la primera clase
x
N k
se pueden escoger x de ellos, y el trmino
es nuevamente las diferentes formas de
nx
escoger nx objetos de la totalidad de N k objetos de la segunda clase. Usamos el principio

multiplicativo para obtener el nmero total de muestras diferentes en donde x objetos son de
la primera clase y n x objetos son de la segunda clase.
Proposicin 7.1.6 Dada una poblacin finita de tamao N con dos clases posibles de objetos.
Si X es la v.a. que muestra el nmero de objetos de la primera clase contenidos en una muestra
de tamao n seleccionada de dicha poblacin entonces X hipergeo(N, k, n) y presenta las
siguientes caracteristicas:
a) E(X) =
nk
N
b) Var(X) =
k N n
nk
1
N
N N 1
Demostracin
Como primer paso seleccionemos n objetos de la poblacin de tamao N que contiene
n
k objetos de una primera clase y N k objetos de la segunda clase. Definamos a X =
Xi
i=1
como la v.a aleatoria que cuenta el nmero de objetos de la primera clase en la muestra
seleccionada; en donde cada Xi , i = 1, 2, . . . , n es una v.a que presenta las siguientes caractersticas:
Xi = 1 si se selecciona un objeto de la primera clase en la i-sima extraccin
105
Xi = 0 si se selecciona un objeto de la segunda clase en la i-sima extraccin

Debido a la aleatoriedad, la probabilidad de que la i-sima bola extraida sea de la primera
k
clase es simplemente . Por lo tanto:
N
k
N k
P(Xi = 1) =
y P(Xi = 0) =
N
N
E(Xi ) = P(Xi = 1) =
k
N
Var(Xi ) = E(Xi2 ) [E(Xi )]2 =
k k 2 k
k
=
1
N
N
N
N
Entonces tenemos que:

a) la esperanza de X es
E(X) = E
n
n
k
nk
X
=
E(X
)
=
i
i
N = N
i=1
i=1
i=1
n
b) la varianza de X es
X
i = E(X 2) E(X)
n
Var(X) = Var
i=1
calculemos entonces:

k
N k
k1
N k
2
x
n x
nk n
x
nx
x1
nx
2

E(X ) =
=
N
N
1
N x=1
x=0
n
nk
N x=1
(x 1 + 1)
k1
x1
N 1
nk (k 1)(n 1) n
=
N
N 1
x=2
"
k2
x2
n1
nx
n1
"
N k
N k
nx
N 2
x1
x=1
n2
"
k1
nk (k 1)(n 1)
nk (k 1)(n 1) + N 1
+1 =
N
N 1
N
N 1
N k
nx
N 1
n1
Por lo tanto
"
#
"
#
nk 2 nk N 2 (k + n)N + nk
nk (k 1)(n 1) + N 1
Var(X) =
=
N
N 1
N
N
N(N 1)
=
nk N k N n
N
N
N
106
Ejemplo 7.1.7 Supngase que una urna contiene cinco bolas rojas y diez azules. Si se seleccionan bolas de la urna sin reemplazamiento; sea X la v.a que cuenta el nmero de bolas rojas
extraidas. Si se extraen al azar sin reemplazamiento siete bolas
a) Cul es la probabilidad de seleccionar exactamente cuatro bolas rojas?
b) Cul es la probabilidad de seleccionar almenos tres bolas rojas?
c) Calcular la esperanza y la varianza de esta distribucin
Desarrollo
Como X es la v.a que cuenta el nmero de bolas rojas extraidas en un muestreo sin reemplazmiento; se tiene que X hipergeo(15, 5, 7). Por lo tanto
!
!
5
10
x
7x
!
si x = 0, 1, 2, 3, 4, 5
15
P(X = x) =
0
para otro caso
a) Para contestar la pregunta de este item basta calcular P(X = 4), esto es;

10
P(X = 4) =
15
5 120
40
=
6435
429
b) Para contestar esta parte debemos calcular P(X 3); que equivale a decir,
P(X 3) = P(X = 3) + P(X = 4) + P(X = 5)
Por lo tanto
P(X 3) =
10
4
15
10
3
15
10
15
c) Segn la proposicin 7.1.6 se tiene que

75 7
=
15
3
7 5 15 5 15 7
E(X) =
V (X) =
15
15
15 1
8
9
140 40
1
61
+
+
=
429 429 143 143
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD
7.2.
Distribuciones continuas de probabilidad
7.2.1.
Distribucin uniforme continua
107
Las distribuciones uniformes corresponden al experimento de elegir puntos al azar entre

dos puntos fijos a y b. Como la probabilidad de elegir cualquier punto es la misma, la funcin
de densidad tendr la misma altura en todos los puntos entre a y b, es decir se trata de una
1
funcin constante desde a y b, de altura
.
ba
Definicin 7.2.1 Decimos que una variable aleatoria X tiene una distribucin uniforme
continua en el intervalo (a, b), y escribimos X uni f (a, b) cuando su funcin de densidad
es
si a < x < b
ba
f (x) =
0
en otro caso
La grfica general de esta funcin se muestra en la Figura 7.1, y es evidente que se
trata de una funcin de densidad pues es no negativa e integra uno. Los parmetros de esta
distribucin son los nmeros a y b.
Figura 7.2: Grfica de f (x) de la distribucin exponencial

Proposicin 7.2.1 Sea X la v.a. continua con distribucin uniforme en el intervalo (a, b),
entonces X tiene las siguientes caractersticas
a) E(X) =
a+b
2
b) Var(X) =
c) MX (t) =
(b a)2
12
ebt eat
(b a)t
d) F(x) =
108
si x > a
x
ba
si a x < b
si x b
Demostracin
Como X es una v.a. continua con distribucin uniforme en el intervalo (a, b) entonces su
funcin de densidad de probabilidad es
si a < x < b
ba
f (x) =
0
en otro caso
con lo cual
a) por definicin de esperanza para v.a. continua
E(X) =
x f (x)dx =
Z b
a
b
1
1
a+b
1
dx =
x2 =
(b2 a2 ) =
ba
2(b a) a 2(b a)
2
b) por definicin de varianza para v.a continua

Z
a + b 2 1
a + b 3 b
1
x
x
Var(X) =
dx =
2
ba
3(b a)
2
a
h
h b a 3 a b 3 i
a + b 3
1
1
a + b 3 i
b
=
=
a
3(b a)
2
2
3(b a)
2
2
=
1 (b a)2 (b a)2
=
3
4
12
c) por defincicin de funcin generadora de momentos

MX (t) =
etx
1
1
dx =
ba
ba
Z b
a
etx dx =
b ebt eat
1
etx =
t(b a) a (b a)t
d) por definicin de funcin de distribucin
0
si x < a
0
x
Z x 1
F(x) = P(X x) =
du si a x < b =
ba
0 ba
1
1
si x > b
si x < a
si a x < b
si x b
Ejemplo 7.2.1 Supongase que tenemos una cuerda de 2m de longitud que queremos cortar
por un punto al azar a una cierta distancia de uno de los extremos. Sea X la v.a. que represente
el punto elegido; entonces
109
Figura 7.3: Grfica de F(x) de la distribucin exponencial

a) Expresar y grficar la funcin de densidad?
b) Calcular P(X 0, 7), P(X 1) y P(0, 5 X 1, 25)
c) Obtener E(X),Var(X) y MX (t), adems a partir de la funcin de densidad obtener y
graficar la funcin de distribucin
Desarrollo
Como X es la v.a que represente el punto elegido entre 0 y 2; entonces X uni f (0, 2)
a) Como el rea debe ser 1, la altura del rectngulo ser 12 , entonces la funcin de densidad
es:
si 0 < x < 2
2
f (x) =
0 en otro caso
Figura 7.4: Grfica de f (x) del ejemplo 7.2.1
110
b) Calculemos ahora P(X 0, 7), P(X 1) y P(0, 5 X 1, 25)

P(X 0, 7) =
Z 0,7
1
0
1 0,7 1
dx = x = (0, 7 0) = 0, 35
2
2 0
2
Z 2
1
1 2 1
1
dx = x = (2 1) =
2 1 2
2
1 2
Z 1,25
1
1 1,25 1
P(0, 5 X 1, 25) =
dx = x
= (1, 25 0, 5) = 0, 375
2 0,5
2
0,5 2
P(X 1) =
c) Por la proposicin 7.2.1

E(X) =
0+2
=1
2
x
F(x) =
2
Var(X) =
(2 0)2 1
=
12
3
MX (t) =
e2t e0t
e2t 1
=
(2 0)t
2t
si x < 0
si 0 x < 2
si x 2
Figura 7.5: Grfica de F(x) del ejemplo 7.2.1
7.2.2.
Distribucin Normal
La distribucin normal fue reconocida por primera vez por el francs Abraham de Moivre
(1667-1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elabor desarrollos ms profundos y formul la ecuacin de la curva; de ah que tambin se la conozca, ms comnmente,
como la campana de Gauss. La distribucin de una variable normal est completamente
determinada por dos parmetros, su media smbolizada por y su desviacin estndar simbolizada por .
La distribucin continua de probabilidad ms importante de toda la estadstica es la distribucin de probabilidad normal.
111
Definicin 7.2.2 Decimos que una v.a. X tiene distribucin de probabilidad normal si su
funcin de densidad de probabilidad est definida por la siguiente ecuacin:
f (x) =
1
22
1 x 2
)
e 2 (
, para
< x <
en donde R y > 0 son los parmetros. Escribimos entonces X N(, 2 ). La grfica de

esta funcin de densidad tiene forma de campana como se puede apreciar en la Figura 7.6, en
donde se muestra adems el significado geomtrico de los dos parmetros.
Figura 7.6: Representacin grfica de f (x) para ciertos valores de y 2 de una variable
aleatoria normal.
No es inmediato pero es posible demostrar que E(X) = , y ello significa que la campana
esta centrada en este valor, el cual puede ser negativo, positivo o cero. Tambin puede demostrarse que Var(X) = 2 , y que la distancia del punto a cualquiera de los dos puntos en
donde la funcin tiene puntos de inflexin es , por lo tanto la campana se abre o se cierra de
acuerdo a la magnitud de este parmetro. El papel que desempean y puede apreciarse
en la grfica 7.7.
Caractersticas de la distribucin de probabilidad normal
La distribucin de probabilidad normal con su curva tiene las siguientes caractersticas:
1. La curva normal tiene forma de campana. La media, la moda y la mediana de la distribucin son iguales y se localizan en el centro de la distribucin.
2. La distribucin de probabilidad normal es simtrica alrededor de su media. Por o tanto,
la mitad del rea bajo la curva est antes del punto central y la otra mitad despus. El
rea total bajo la curva es igual a 1.
3. La curva normal se aproxima de manera asinttica al eje horizontal conforme se aleja
de la media en cualquier direccin. Esto significa que la curva se acerca al eje horizontal conforme se aleja de la media, pero nunca lo llega a tocar.
112
Figura 7.7: Representacin grfica de f (x) de una variable aleatoria normal

La familia de la distribucin de probabilidad normal
La forma de la campana de Gauss depende de los parmetros y . La media indica
la posicin de la campana, de modo que para diferentes valores de la grfica es desplazada
a lo largo del eje horizontal. Por otra parte, la desviacin estndar determina el grado de
apuntalamiento de la curva. Cuanto mayor sea el valor de , ms se dispersarn los datos en
torno a la media y la curva ser ms plana. Un valor pequeo de este parmetro indica, por
lo tanto, una gran probabilidad de obtener datos cercanos al valor medio de la distribucin.
Como se deduce, no existe una nica distribucin normal, sino una familia de distribuciones con una forma comn, diferenciadas por los valores de sus medias y sus varianzas.
Si las curvas tienen iguales sus medias pero diferentes varianzas entonces las curvas estarn centradas en la misma posicin y tendrn diferentes formas; tal como lo muestra
la Figura 7.8.
Figura 7.8: Curvas normales que tienen medias iguales y desviaciones estndar diferentes
Si las curvas tienen desviaciones estndar iguales y medias diferentes, las curvas sern
idnticas pero centradas en diferentes posiciones sobre el eje horizontal, as como lo
muestra la Figura 7.9.
113
Figura 7.9: Curvas normales que tienen medias diferentes y desviaciones estndar iguales
Si las curvas tienen medias diferentes y tambin sus desviaciones estndar son diferentes entonces aparte de estar centradas en diferentes lugares del eje x, tendr formas
diferentes; as como lo muestra la Figura 7.10.
Figura 7.10: Curvas normales que tienen medias diferentes y desviaciones estndar diferentes
La distribucin normal estndar
En particular, decimos que la variable aleatoria X tiene una distribucin normal estndar
si tiene una distribucin normal con parmetros E(X) = = 0 y Var(X) = 2 = 1. En este
caso la funcin de densidad se reduce a la siguiente expresin
x2
1
f (x) = e 2
2
Para facilitar los clculos se decidi tabular las diferentes probabilidades para variable
aleatoria que sigue una distribucin normal. Pero, puesto que sera imposible tener una tabla
para cada posible distribucin normal, se elabor solamente una, la tabla de la distribucin
normal estndar.
De esta manera solo se tiene que transformar o estandarizar una distribucin normal especfica, se revisa la tabla, y se conoce la probabilidad. Para la estandarizacin se debe realizar la siguiente operacin.
114
Proposicin 7.2.2 Sea X una variable aleatoria con distribucin normal con parmetros
y 2 . Entonces la siguiente variable aleatoria tiene una distribucin normal estndar
Z=
(7.2.3)
Demostracin
Para probar que Z sigue una distribucin normal estandar debemos mostrar que E(Z) = 0
y Var(Z) = 1. Recordemos adems que si X N(, 2 ) entonces E(X) = y Var(X) = 2 .
Para realizar la demostracin de esta proposicin recordemos adems las propiedades de la
esperanza y la varianza de una v.a. Por lo tanto
X 1
1
1
E(Z) = E
= E(X ) = [E(X) ] = [ ] = 0
x
1
1
1
Var(Z) = Var
= 2 Var(X ) = 2 Var(X) = 2 2 = 1
A la operacin anterior se le conoce con el nombre de estandarizacin, y bajo tal transformacin se dice que la variable X ha sido estandarizada. Es comn usar la letra Z para denotar
una variable aleatoria con distribucin normal estndar, y seguiremos nosotros tambin esa
costumbre.
La proposicin anterior parece muy modesta pero tiene una gran importancia operacional pues establece que el clculo de las probabilidades de una variable aleatoria normal
cualquiera se reduce al clculo de las probabilidades para la normal estndar. Explicaremos
esta situacin con ms detalles. Suponga que X es una variable aleatoria con distribucin
N(, 2 ), y que deseamos calcular, por ejemplo, P(a < X < b), para a < b nmeros dados.
Tenemos entonces que
a X b
P(a < X < b) = P(a < X < b ) = P
<
<
por lotanto
La igualdad de estas probabilidades es consecuencia de la igualdad de los eventos. De

esta forma una probabilidad que involucra a la variable X se ha reducido a una probabilidad
que involucra a una variable Z.
P(a < X < b) = P
<Z<
reas bajo la curva normal

Una caracterstica que tiene cualquier distribucin normal es que el rea bajo la curva,
que representa la probabilidad de que la variable aleatoria tome ciertos valores X x, se
distribuye siempre en la misma proporcin.
En la tabla de la distribucin normal estndar, estn registradas las reas bajo la curva
normal que se encuentran a la derecha de los valores Z positivos, de esta forma solo se
necesita transformar la distribucin normal de inters en una distribucin normal estndar
mediante la frmula, y el rea a la derecha del valor z ser el mismo que el rea a la derecha
de x, esto es P(X x) = P(Z z).
115
Ejemplo 7.2.2 Los coeficientes intelectuales de 600 aspirantes de cierta universidad se distribuyen aproximadamente de forma normal con una media de 115 y una desviacin estndar
de 12. Si se selecciona un aspirante al azar, encuentre la probabilidad de que:
a) tenga un coeficiente mayor de 120
b) tenga un coeficiente menor de 100
c) tenga un coeficiente menor de 122
d) tenga un coeficiente entre 115 y 125
e) tenga un coeficiente entre 90 y 105
Desarrollo
Segn las condiciones del problema la v.a. X representa el coeficiente intelectual del
estudiante elegido y adems X N(115, 144).
Para calcular las probabilidades de los distintos itens debemos transformar esta distribucin normal en una distribucin normal estndar (con media cero y desviacin estndar 1),
x 115
para lo cual hay que cambiar el valor de x por un valor z con la frmula z =
. Entonces
12
la probabilidad de que:
120 115
= P(Z > 0, 41)
12
La distribucin ya transformada se observa en el siguiente grfico:
a) tenga un coeficiente mayor de 120 es: P(X > 120) = P Z >
Se busca el valor del rea para 0 Z 0, 41 en la tabla de reas bajo la curva normal
estandar; que corresponde al valor 0,1591. Como el rea a la derecha del valor z = 0, 41
es el que corresponde a la probabilidad pedida, entonces la probabilidad de que un
aspirante a la universidad tenga un coeficiente intelectual mayor de 120 es:
P(X > 120) = P(Z > 0, 41) = 0, 5 0, 1591 = 0, 3409
b) tenga un coeficiente menor de 100 es:
100 115
= P(Z < 1, 25)
P(X < 100) = Z <
12
La distribucin ya transformada queda as:
116
En la tabla de reas bajo la curva normal estandar no se tabularon valores z negativos,

pero como la curva normal es simtrica, el rea entre cero y el valor z = 1, 25 smbolizado por A(1, 25); es del mismo tamao que el rea entre cero y el valor z = 1, 25
dada por A(1, 25), por lo que solo se necesita buscar en la tabla el rea correspondiente
al valor positivo de z. Como el rea que se busca esta a la izquierda de z = 1, 25, se
tiene que:
P(X < 100) = P(Z < 1, 25) = 0, 5 A(1, 25) = 0, 5 0, 3944 = 0, 1056
c) tenga un coeficiente menor de 122 es:
122 115
P(X < 122) = Z <
= P(Z < 0, 58)
12
La distribucin ya transformada queda as:
estandar, que es el valor 0,2190. Y como el rea a la izquierda del valor z = 0, 58 es el
rea que buscamos, entonces el resultado a buscar es:
P(X < 122) = P(Z < 0, 58) = 0, 5 + 0, 2190 = 0, 7190
d) tenga un coeficiente entre de 115 y 125 es:
P(115 < X < 125) =
115 115
12
<Z<
125 115
= P(0 < Z < 0, 83)
12
117
estandar, que es el valor 0,2967. Y como el rea a buscar es el rea entre z = 0 y z = 0, 83,
entonces el resultado a buscar es:
P(115 < X < 125) = P(0 < Z < 0, 83) = 0, 2967
e) tenga un coeficiente entre de 90 y 105 es:
90 115
105 115
<Z<
= P(2, 08 < Z < 0, 83)
P(90 < X < 105) =
12
12
Se busca el valor del rea para 2, 08 Z 0, 83 en la tabla de reas bajo la curva

normal estandar, que es el valor 0,2967. Y como el rea a buscar es el rea entre z = 0 y
z = 0, 83, entonces el resultado a buscar es:
P(115 < X < 125) = P(0 < Z < 0, 83) = 0, 2967
7.2.3.
Aproximacin normal a la binomial.
Cuando las muestras son pequeas, en una distribucin binomial se obtienen fcilmente
probabilidades asociadas a un evento mediante la frmula de la binomial. Cuando las muestras son grandes, el clculo nos llevara bastante tiempo. La distribucin normal es a menudo
una buena aproximacin a una distribucin binomial cuando np y nq son ms grandes que 5.
118
Ejemplo 7.2.3 La probabilidad de que un paciente se recupere de una rara enfermedad de la

sangre es 0,4. Si se sabe que 100 personas contrajeron esa enfermedad,
a) Cul es la probabilidad de que menos de 30 sobrevivan?
b) Cul es la probabilidad de que exactamente 35 sobrevivan?
c) Cul es la probabilidad de que a lo ms 30 sobrevivan?
Desarrollo
El primer paso es verificar si el experimento cumple con los requisitos de una distribucin binomial, y si es el caso calcular la media y la desviacin estndar de la distribucin.
Como cada paciente puede recuperarse o no de la enfermedad y adems esta situacin se da
de manera independiente entre dichos pacientes, entonces este experimento cumple con las
condiciones de la distribucin binomial.
Si X es la variable aleatoria que denota el nmero de pacientes que sobreviven a la enfermedad (se recuperan), entonces X bin(n = 100; P = 0, 4). Entonces la media y la varianza
de X estan dadas por:
E(X) = p = np = (100)(0, 4) = 40
p
p
p
Var(X) = p = np(1 p) = (100)(0, 4)(0, 6) = 24 = 4, 899

a) P(X < 30)
Para resolver el problema con la frmula de la distribucin binomial se tendra que
calcular 30 binomiales, desde la binomial de cero hasta la binomial de 29. Mediante el
uso de la aproximacin normal a la binomial el procedimiento es mucho ms corto.
El primer paso es aplicar al valor de x el factor de correccin de continuidad, que es
simplemente sumar o restar 0, 5 al valor de x, dependiendo del problema. En este caso
queremos la probabilidad de que x valga menos de 30, no incluye al 30, entonces se le
resta 0, 5. En seguida se aplica la frmula de Z, utilizando el valor de x = 29, 5, y en
seguida buscar el rea en la tabla normal:
29, 5 40
= P(Z < 2, 14)
P(X < 30) = P Z <
4, 899
119
Recordemos que en la tabla de reas bajo la curva normal no se tabulan valores negativos de z y que la distribucin normal es simtrica; estos A(z) = A(z). Se busca el
valor del rea para 0 Z 2, 14 en la dicha tabla, que corresponde al valor 0,48382.
Y como el rea a la izquierda del valor z = 2, 14 es el rea que buscamos, entonces el
resultado a buscar es:
P(X < 30) = P(Z < 2, 14) = 0, 5 0, 48382 = 0, 01618
b) P(X = 35)
En este caso se pide una probabilidad cuando la variable aleatoria X toma un valor
exacto. En una distribucin continua la probabilidad de que la variable aleatoria sea
exactamente un determinado valor no se puede calcular y se estima que es cero, mientras que en una distribucin discreta aproximada a una distribucin normal (continua)
la probabilidad de X sea igual a un valor puntual se calcula sumando y restando el factor de correccin de continuidad a dicho valor puntual y estimar el rea entre ambos
puntos.
Por lo tanto
34, 5 40
35, 5 40
P(X = 35) = P
Z
= P(1,12 Z 0, 92)
4, 899
4, 899
120
Se buscan en tabla, los valores de las reas para 0 z 0, 92 y 0 z 1, 12. Se

encuentra que A(1, 12) = A(1, 12) = 0, 3686 y A(0, 92) = A(0, 92) = 0, 3212. Como
el rea buscada se encuentra entre z = 1, 12 y z = 0, 92 que es exactamente igual al
rea comprendida entre z = 0, 92 y z = 1, 12 por la simetra de la distribucin normal;
entonces:
P(X = 35) = P(1, 12 Z 0, 92) = A(1, 12)A(0, 92) = 0, 36860, 3212 = 0, 0474
Oservacin: En este caso, como se pide la probabilidad cuando X es exctamente igual
a 35, lo podemos resolver con la frmula de la binomial, y el resultado que produce es
poco diferente: 0,04913.
c) P(X 30)
Aqu se pide la probabilidad de que X tome valores desde 0 hasta 30 inclusive, como el
30 est incluido el factor de correccin de continuidad se suma. Entonces
30, 5 40
P(x 30) = P Z
= P(Z 1, 94)
4, 899
Como A(1, 94) = A(1, 94); se busca el valor del rea para 0 Z 1, 94 en la tabla,
que corresponde al valor 0,4738. Y como el rea a la izquierda del valor z = 1, 94 es
el rea que buscamos, entonces el resultado a buscar es:
P(X 30) = P(Z < 1, 94) = 0, 5 0, 4738 = 0, 0262
7.2.4.
Distribucin ji-cuadrada
Si X1 , X2 , . . . , Xk son variables aleatorias normales e independientes. La suma de X12 , X22 , . . . , Xk2

se dice que es una variable aleatoria ji-cuadrada (2 ) con k > 0 grados de libertad, es decir
2k = X12 + X22 + + Xk2
Hay un nmero infinito de distribuciones ji-cuadrada, una correspondiente a cada entero
positivo k.
121
Definicin 7.2.3 Decimos que la variable aleatoria continua X tiene una distribucin jicuadrada con k grados de libertad (k entero positivo), si su funcin de densidad est dada por
la siguiente expresin:
k
1
1 x
2k ( k ) x 2 e 2 si 0 < x <
2
f (x) =
0
si x 0
Figura 7.11: Grfica de f (x) cuando el parmetro k toma los valores 1,2,3,4 y 5
Por la definicin anterior; ji-cuadrada es una variable aleatoria continua con posibles
valores en el intervalo (0, ). Esta distribucin tiene un solo parmetro denotado aqui por
la letra k, y al cual se le llama grados de libertad. Tambin al parmetro de ji-cuadrado se
denota por la letra griega . A pesar de la aparente expresin complicada de f (x), no es difcil
comprobar que es efectivamente una funcin de densidad de probabilidad. La grfica de esta
funcin para varios valores del parmetro k aparece en la Figura 7.9.
Escribiremos simplemente X 2 (k), en donde la letra griega se pronuncia ji o
tambin chi. Puede demostrarse que E(X) = k y Var(X) = 2k. La distribucin ji-cuadrada
puede obtenerse como indican los siguientes resultados que dejaremos sin demostrar.
Proposicin 7.2.3 Si X es una v. a. que sigue una distribucin normal tipificada (X
N(0, 1)), entonces la v.a. X 2 sigue una distribucin ji-cuadrada con un grado de libertad
(X 2 2 (1)).
Es decir, el cuadrado de una variable aleatoria con distribucin normal estndar tiene
distribucin ji-cuadrada con un grado de libertad. Por otro lado, el siguiente resultado establece que la suma de dos variables aleatorias independientes con distribucin ji-cuadrada
tiene distribucin nuevamente ji-cuadrada con grado de libertad igual a la suma de los grados
de libertad de los sumandos.
122
Proposicin 7.2.4 Si X 2 (n) y Y 2 (m) son dos variables aleatorias independientes,

entonces X +Y tiene distribucin 2 (n + m).
En general si las v.a. X1 , X2 , . . . , Xn son independientes y si Xi ; i = 1, 2, . . . , n tiene una
distribucin 2 con n j grados de libertad para j = 1, 2, . . . , k entonces la suma X1 + X2 + +
Xn tiene una distribucin 2 con n1 + n2 + + nk grados de libertad.
Proposicin 7.2.5 Sean X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin normal
n
Xi 2
con media y varianza 2 . La distribucin de la v.a. Y =
es del tipo ji-cuadrado
i=1
con n grados de libertad.
Caractersticas de la distribucin ji-cuadrada
La distribucin ji-cuadrada es un caso particular de la distribucin gamma.
Las distribuciones ji-cuadradas son positivamente asimtricas.
Est distribucin esta estrechamente ligada con muestras aleatorias de una distribucin
normal.
En la prctica, las probabilidades ji-cuadradas, cuando k 30, pueden calcularse empleando aproximaciones normales en la forma usual.
La distribucin ji-cuadrado tiene muchas aplicaciones en inferencia estadstica, por
ejemplo en el test ji-cuadrado que consiste en una prueba de independencia y bondad
de ajuste, adems en la estimacin de varianzas.
Tambin est involucrada en el problema de estimar la media de una poblacin normalmente distribuida y en el problema de estimar la pendiente de una recta de regresin
lineal, a travs de su papel en la distribucin t de Student que veremos ms adelante,
y participa en todos los problemas de anlisis de varianza, por su papel en la distribucin F de Snedecor, que es la distribucin del cociente de dos variables aleatorias de
distribucin ji-cuadrada e independientes.
7.2.5.
Distribucin t de Student
Esta distribucin fue desarrollada por William Sealy Gossett, que trabajaba en el departamento de fermentacin de la cervecera Guinness en Irlanda. Las circunstancias en las que
se llevan a cabo los procesos de fermentacin en la produccin de cerveza demostraron a
Gosset las limitaciones de la teora de muestras grandes y le enfatizaron la necesidad de un
mtodo correcto para el tratamiento de muestras pequeas. Estas circunstancias de su trabajo
dirigieron a Gosset al descubrimiento de la distribucin t, quin public sus estudios sobre
esta distribucin en 1908 con el seudnimo Student.
Gossett se interes en el comportamiento del valor de una v.a. Y N(0, 1) cuando se
utilizaba S en vez de , y particularmente en la discrepancia entre S y cuando S se calcula
de muestras muy pequeas.
123
La distribucin t est renacionada con muestras aleatorias de una distribucin normal.

Esta distribucin, as como la 2 , han sido ampliamente aplicadas en problemas importantes
de inferencia estadstica. La distribucin t es conocida tambin como distribucin de Student
en honor de W.S. Gosset. La distribucin t se define como sigue:
Considerense dos variables aleatorias independientes Y y W , tales que Y tenga una distribucin normal tipificada y W tenga una distribucin 2 con n grados de libertad. Sea X la
variable aleatoria definida como:
Y
X=r
W
n
entonces, la distribucin de X se denomina la distribucin t con n grados de libertad.
Definicin 7.2.4 Decimos que la variable aleatoria continua X tiene una distribucin t con
n grados de libertad si su funcin de densidad est dada por:
n+1
2
x2 n+1
2
1
+
f (x) =
para < x <
n
n
n ( 2 )
en tal caso se escribe X t(n)
Es posible demostrar que E(X) = 0, y Var(X) =
n
para n > 2.
(n 2)
Relacin con muestras de una distribucin normal

Supongamos que las variables aleatorias X1 , X2 , . . . , Xn constituyen una muestra aleatoria
de una distribucin normal con media y varianza 2 . Como es usual, se define a la media
1 n
1 n
2
muestral como X = Xi y a la varianza muestral como S = (Xi X)2 .
n i=1
n i=1
Si se definen las variables aleatorias Y y W mediante las relaciones
n
(X ) n
Y=
y W=
(Xi X)2
i=1
nS2
2
Vemos que Y N(0, 1) y W 2 (n 1). Adems se sabe que si X y S2 son variables

aleatorias que resultan de muestras aleatorias normales entonces son independientes. Por lo
Y
que la v.a. T definida por la relacin T = q
tiene distribucin t con n 1 grados de
W
n1
libertad. Entonces
(X ) n
(X ) n
(X
)
n1
T= s
=
=
2
nS
S
nS
2
n 1
n1
Un aspecto importamte es que ni el valor de T ni la distribucin de T dependen del valor

de la varianza 2 . Por lo tanto podemos utilizar la distribucin t en situaciones de muestreo
sobre poblaciones normales que cumplan con las siguientes caracteristicas:
124
las muestras extraidas son pequeas (n < 30) y

la varinza 2 es desconocida.
Figura 7.12: Distribucin t versus distribucin normal
Las caractersticas de la distribucin t

1. Es una distribucin continua.
2. Tiene forma de campana y es simtrica.
3. Es una familia de curvas.
4. Todas tienen la misma media de cero, pero sus desviaciones estndar difieren de acuerdo al tamao de la muestra.
5. La distribucin t es ms baja y dispersa que la distribucin normal. Cuando el tamao
de la muestra se incrementa, la distribucin t se aproxima a la normal.
En resumen la distribucin t se puede encontrar en los siguientes contextos:
Proposicin 7.2.6 Si las variables aleatorias Y N(0, 1) y W 2 (n) son independientes,
entonces la v.a.
Y
X = q t(n)
W
n
Proposicin 7.2.7 Sean X1 , X2 , . . . , Xn variables aleatorias independientes cada una de ellas

con distribucin N(, 2 ). Entonces la v.a.
(X ) n 1
t(n 1)
T=
S
1 n
1 n
2
donde X = Xi y S = (Xi X)2 .
n i=1
n i=1
7.2.6.
125
Distribucin exponencial
El modelo de probabilidad de la exponencial tiene su origen en el proceso de Poisson.

Una probabilidad de Poisson se relaciona con la probabilidad de ocurrencia de un nmero
especfico de xitos en intervalos de tiempos finitos, donde el nmero de xitos es la variable
aleatoria.
Invirtiendo los papeles de una variable aleatoria de Poisson se tiene lo que se llama un
modelo exponencial. Una variable aleatoria exponencial X es el intervalo de tiempo, o espacio requerido para obtener un nmero especifico de xitos.
La distribucin exponencial se utiliza a menudo en problemas prcticos para representar
la distribucin del tiempo que transcurre antes de la ocurrencia de un suceso.
La distribucin exponencial se usa para modelar intervalos de tiempos entre sucesos. Es
muy usada para simular el tiempo entre llegadas cuando las llegadas son completamente
aleatorias y para modelar tiempo de servicio, en los sistemas de colas.
Definicin 7.2.5 Decimos que una variable aleatoria continua X tiene una distribucin
exponencial con parmetro > 0, y escribimos X exp(), cuando su funcin de densidad
de probabilidad es
ex si x > 0
f (x) =
0
si x 0
La grfica de esta funcin cuando el parmetro toma los valores particulares 0,5; 1,0 y
1,5 se muestra en la Figura 7.11.
La correspondiente funcin de distribucin de esta v.a. est dada por
0
si x 0
F(x) = P(X x) =
1 ex si x > 0
La grfica de esta funcin cuando el parmetro toma los valores particulares 0,5; 1,0 y
1,5 se muestra en la Figura 7.12.
Proposicin 7.2.8 Sea X la v.a. continua con distribucin exponencial, entonces X tiene las
siguientes caractersticas
a) E(X) =
b) Var(X) =
c) MX (t) =
1
2
Demostracin
Figura 7.13: Grfica de f (x) cuando el parmetro toma los valores 0,5;1,0 y 1,5
Figura 7.14: Grfica de F(x) cuando el parmetro toma los valores 0,5;1,0 y 1,5
126
127
Por definicin de esperanza se tiene que

Z
1 1
E(X) =
x f (x)dx =
xe dx = e
x+ =
0
0
Z
Z
2x 2
2
2
2
2 x
x 2
E(X ) =
x f (x)dx =
x e dx = e
x + + 2 = 2
0
0
Entonces la varianza est dada por
Var(X) =
2 1 2
1
= 2
2
Finalmente por definicin de funcin generadora de momentos se tiene que

MX (t) =
xt
e f (x)dx =
Z
0
xt x
e e
dx =
Z
0
e(t)x dx =
e(t)x
=
( t) 0
t
Ejemplo 7.2.4 Suponga que el tiempo en minutos que un usuario cualquiera permanece re1
visando su correo electrnico sigue una distribucin exponencial de parmetro = . Calcule
5
la probabilidad de que un usuario cualquiera permanezca conectado al servidor de correo
a) menos de un minuto
b) ms de un ahora
c) Calcula la esperanza, varianza y la funcin generadora de momentos
Solucin
a) Para este primer inciso tenemos que
P(X < 1) =
Z 1
1 1
1
1 1x
1
e 5 dx = 5e 5 x = 1 e 5 = 0, 1813
0
b) Siguiendo el mismo razonamiento del inciso anterior y teniendo en cuenta que una
hora equivale a 60 minutos se tiene que
Z
1 1 x
1 1x
5
e dx = 5e 5 = e12 = 6, 14 106
P(X > 60) =
5
60
60 5
c) Tomando en cuenta la proposicin 7.2.3
1
E(X) 1 = 5
5
Var(X) =
1
= 25
( 51 )2
MX (t) =
1
5
1
5
1
1 5t
7.3. PROBLEMAS
7.3.
128
Problemas
Distribucin binomial
1. Sea X una variable aleatoria con distribucin bin(n, p) tal que E(X) = 4 y Var(X) = 2.
Cules son los valores de n y p?
2. Sea X una variable aleatoria con distribucin bin(n, p). Demuestre que la variable Y =
n X tiene distribucin bin(n, 1 p). Proporcione una explicacin probabilsta de este
resultado.
3. Sea X con distribucin bin(n, p). Demuestre que para x = 0, 1, . . . , n 1, se cumple la
siguiente frmula. Esta expresin permite calcular las probabilidades de esta distribucin de una forma iterativa.
P(X = x + 1) =
p(n x)
P(X = x)
(1 p)(x + 1)
4. Se lanza una moneda equilibrada 6 veces. Calcule la probabilidad de que cada cara
caiga exactamente 3 veces.
5. Se lanza una moneda equilibrada 2n veces. Calcule la probabilidad de que ambas caras
caigan el mismo nmero de veces.
6. Sea X una variable aleatoria con distribucin bin(n, p). Demuestre que
0 Var(X) E(X)
7. Suponiendo que es igualmente probable que nazca un hombre (H) o una mujer (M), y
considerando la observacin de 6 nacimientos. Cul de los siguientes eventos es ms
probable que ocurra?
a) MHHMHM
b) MMMMHM
c) HMHMHM
8. La probabilidad de que un paciente se recupere de una extraa enfermedad es 0, 4. Si
se sabe que 15 personas contraen esa enfermedad,
a) Haga un histograma donde represente la distribucin binomial para este caso.
b) Cul es la probabilidad de que sobrevivan al menos 10?
c) Cul es la probabilidad de que sobrevivan de 3 a 8?
d) Calcule la media y la varianza de esta distribucin binomial.
9. En la ciudad la necesidad de dinero para comprar drogas se establece como la razn del
75 % de los robos. Encuentre la probabilidad de que entre los siguientes cinco casos de
robo:
a) dos resulten de la necesidad de dinero para comprar drogas
7.3. PROBLEMAS
129
b) al menos tres resulten de la necesidad de dinero para comprar drogas

c) Represente esta distribucin binomial en un histograma
d) Calcule la media y la varianza de esta distribucin binomial
10. Un prominente mdico afirma que 70 % de las personas con cncer de pulmn son
fumadores empedernidos. Si su aseveracin es correcta:
a) encuentre la probabilidad de que de 10 de tales pacientes menos de la mitad sean
fumadores empedernidos
b) encuentre la probabilidad de que de 10 de los pacientes con cncer de pulmn
ninguno sea fumador empedernido
11. De acuerdo con un estudio publicado por un grupo de socilogos de la Universidad de
Massachussets aproximadamente el 60 % de los consumidores de Valium en el estado
de Massachussets tomaron Valium por primera vez debido a problemas psicolgicos.
Encuentre la probabilidad de que entre los siguientes ocho consumidores entrevistados
en este estado:
a) tres comenzaron a tomar Valium por problemas psicolgicos.
b) al menos cinco comenzaron a consumir Valium por problemas que no fueron
psicolgicos
12. De acuerdo a una encuesta a nivel nacional en Estados Unidos de la universidad de
Michigan a estudiantes universitarios de ltimo ao revela que el 70 % de los estudiantes desaprueba el consumo diario de la mariguana. Si se seleccionan doce estudiantes
al azar y se les pide su opinin, encuentre la probabilidad de que el nmero de los que
desaprueban fumar mariguana todos los das sea:
a) entre siete y nueve
b) a lo ms cinco
c) no memos de ocho
d) Represente esta distribucin binomial en un histograma
e) Calcule la media y la varianza de esta distribucin binomial.
13. Un estudio examin las actitudes hacia los antidepresivos. El estudio revel que aproximadamente el 70 % cree que los antidepresivos en realidad no curan nada, slo encubren el problema real. De acuerdo con este estudio
a) cul es la probabilidad de que al menos tres de las siguientes cinco personas
seleccionadas al azar sean de esta opinin?
b) Represente esta distribucin binomial en un histograma
7.3. PROBLEMAS
130
c) Calcule la media y la varianza de esta distribucin binomial.

14. El departamento de mercadotecnia de Kellogg Company planea realizar una investigacin para determinar si los consumidores de cereal en hojuelas pueden distinguir su
cereal favorito de otros. Para probar el cuestionario y el procedimiento a ser usado se
invit a ocho personas a participar en un experimento. Se les coloc frente a cinco
pequeos tazones de cereal en hojuelas marcados con las letras A, B,C, D, y E para
que identificaran su cereal favorito. A las personas se les inform que solo uno de los
tazones contena su cereal favorito.
a) Si una persona no pudo identificar su cereal favorito y supuso que estaba en el
tazn C. Cul es la probabilidad de que la persona haya adivinado correctamente?
b) Cul es la variable aleatoria en este problema?
c) Es la variable aleatoria discreta o continua? Por qu?
d) Suponga que a las ocho personas les fue imposible identificar su cereal favorito y
trataron de adivinar en cual tazn estaba. Cul es la probabilidad de que ninguno
de los ocho haya adivinado correctamente?
e) Desarrolle una distribucin binomial para este experimento
f) Calcule la media, varianza, y desviacin estndar de la distribucin.
g) Represente la distribucin de probabilidad en una grfica.
h) Suponga que siete de las ocho personas identifican el cereal que ms les gusta.
Es razonable decir que ellos adivinaron? Explique. Cul es tu conclusin?
i) Por qu es la distribucin binomial apropiada para este problema?
15. Al determinar la concentracin letal de una sustancia presente en agua contaminada,
se encuentra que una cierta concentracin mata el 20 % de los peces que se exponen a
ella durante 24 horas. Se colocan 20 peces en un tanque con esta concentracin de la
sustancia. Calcular la probabilidad de que a las 24 hs.
a) sobrevivan exactamente 14
b) sobrevivan por lo menos 10
c) sobrevivan cuando mucho 16
d) sobrevivan entre 5 y 10
16. Harley Davidson, director de control de calidad de la compaa de automviles Kyoto
Motor, se encuentra realizando su revisin mensual de trasmisiones automticas . En
el procedimiento, se retiran 10 trasmisiones de la pila de componentes y se les revisa
en busca de defectos de fabricacin. A lo largo del tiempo solo, el 2 % de las trasmisiones tienen defectos de fabricacin (suponga que los defectos se presentan de manera
independiente en diferentes trasmisiones).
a) Cual es la probabilidad de que la muestra de Harlley contenga mas de dos
trasmisiones con defectos de fabrica?
7.3. PROBLEMAS
131
b) Cual es la probabilidad de que ninguna de las trasmisiones elegidas tengan

defectos de fabrica?
17. Harry Ohme esta a cargo de la seccin de electrnica de una gran tienda departamental.
Se has dado cuenta de que la probabilidad de que un cliente que solamente se encuentra curioseando compre algo es de 0,3. Suponga que 15 clientes visitan la seccin de
electrnica cada hora.
a) Cual es la probabilidad de que almenos una de las personas que curiosea compr
algo durante una hora dada?
b) Cual es la probabilidad de que almenos cuatro personas que curiosean compre
c) Cual es la probabilidad de que ninguna de las personas que curiosean compre
d) Cual es la probabilidad de que no mas de cuatro personas que curiosean compre
18. Un aparato de radio que no funciona se agrupa accidentalmente con 5 radios que funcionan. Cual es la probabilidad de que se escoja un conjunto de tres radios, el aparato
que no funciona este entre los tres escogidos?
19. Una abogada especializada en litigios por drogas estima que gana el 70 % de sus casos
que van a la corte. Acaba de leer Drogas: Un caso para legalizacin en el nmero
del 3 de octubre de 1989 y quiere usar parte de los argumentos del artculo en su
prximo juicio. Considere su probabilidad de xito estimado, si actualmente representa
a 5 acusados en distintos casos. Cul es la probabilidad de qu:
a) gane por lo menos tres casos?
b) por lo menos un caso?
20. En el pasado, Phin Anderson ha cometido errores en el 5 % de las declaraciones de impuestos que prepara. Cual es la probabilidad de que no cometa errores en las primeras
7 declaraciones que prepara para esta ao fiscal?
21. Un jefe de proyectos ha comprobado que un subcontratista falla en entregar a tiempo las ordenes corrientes, en aproximadamente el 20 % de las ocasiones. El jefe de
proyectos tiene 6 ordenes que este subcontratista se comprometi a entregar. Calcule
la probabilidad de que:
a) el subcontratista entregue todas las ordenes
b) el subcontratista entregue almenos cuatro ordenes
c) el subcontratista entregue exactamente 5 ordenes
22. Un complejo sistema electrnico esta construido con cierto nmero de componentes de
apoyo en sus subsistema. Un subsistema contiene cuatro componentes idnticos, cada
uno con una probabilidad de 0,2 de fallar en menos de 1000 hs. El subsistema funciona
si dos componentes cualesquiera de los cuatro trabajan en forma adecuada. Se suponen
que los componentes operan independientemente.
7.3. PROBLEMAS
132
a) Encuentre la probabilidad de que exactamente dos de cuatro componentes resistan

mas de 1000hs.
b) Encuentre la probabilidad de que el subsistema funcione por mas de 1000hs.
23. Sobre una mesa se derraman 20 monedas. Calcular la probabilidad de caigan:
a) por lo menos 5 caras
b) ms de 15 caras
c) entre 12 y 17 caras
d) a lo sumo tres caras
e) como mnimo dos caras
f) cuando mucho cuatro caras
24. Un examen de opcin mltiple esta compuesto de 15 preguntas, con cinco respuestas
posibles cada una, de las cuales solamente una es la correcta. Supngase que uno de
los estudiantes que realiza el examen contesta las preguntas al azar. Cual es la probabilidad de que conteste al menos 10 preguntas correctamente?
25. Un sistema para detectar incendios utiliza tres celdas sensibles a la temperatura que
actan independientemente, talque una o ms pueden activar la alarma. Cada celda
tiene una probabilidad p = 0, 8 de activar la alarma al alcanzar la temperatura de 100
grados Celsius o ms. Sea Y el numero de celdas que activan la alarma cuando la
temperatura alcanza 100 grados. Encuentre la probabilidad de que la alarma funcione
cuando la temperatura alcanza los 100 grados.
26. Suponga que un lote de produccin de 40000 hornos de microondas incluye 32000 sin
ningn defecto, que no requieren en absoluto ningn ajuste. Sin embargo el departamento de control de calidad, sin conocer el dato referente al lote de produccin, toma
una muestra aleatoria de 10 hornos para calcular la calidad global.
a) Cul es la probabilidad de que la muestra sea dividida equitativamente es decir
5 hornos defectuosos y 5 no defectuosos?
b) Cul es la probabilidad de que se encuentre a lo sumo 3 defectuosos?
c) Cul es la probabilidad de que se encuentre por lo menos un horno no defectuoso?
d) Cul es la probabilidad de que a lo mas 6 sean no defectuosos?
27. A la larga, el 20 % de los gerentes que reciben capacitacin obtienen la calificacin de
sobresaliente, el 50 % la de aceptable y el 30 % la de insatisfactorio. En una muestra de
20 gerentes seleccionados al azar, encuentre las siguientes probabilidades:
a) exactamente 4 gerentes son calificados con sobresaliente
b) al menos 4 gerentes son calificados con sobresaliente
c) exactamente 15 gerentes son calificados con sobresaliente o aceptable
d) al menos 15 gerentes son calificados con sobresaliente o aceptable
7.3. PROBLEMAS
133
28. Una cadena de moteles ha adoptado la poltica de hacer un descuento del 3 % a los
clientes que paguen en efectivo en vez de hacerlo con tarjeta de crdito. Su experiencia
indica que el 30 % de los clientes aceptan el descuento. Sea Y el nmero de personas
que aceptan el descuento entre los prximos 20 clientes.
a) Suponiendo que las probabilidades binomiales sean aplicables, encuentre la probabilidad de que exactamente 5 entre los prximos 20 clientes acepten el descuento.
b) Encuentre P(5o menos clientes acepten el descuento)
c) Cul es el valor esperado y la desviacin estndar del nmero de personas que
aceptarn el descuento?
29. Un fabricante de medicamentos afirma que solo el 10 % que resultan efectivas en las
pruebas con animales pasan el resto de las que se le exige para su comercializacin.
Actualmente, el fabricante tiene 8 nuevos medicamentos de probada efectividad en
experimentos con animales y que esperan pasar en las siguientes pruebas.
a) Encuentre la probabilidad de que ninguno de los 8 medicamentos sea comercializado.
b) Encuentre la probabilidad de que al menos 2 de ellos sean comercializados.
c) Encuentre el nmero esperado de medicamentos comercializados entre los 8 nuevos
medicamentos
30. Una compaa pequea utiliza un servicio de paquetera para enviar los pedidos de
quesos especiales que son para obsequios. La compaa ha encontrado que el 90 %
de los paquetes se entregan a tiempo. Se enva un embarque de 20 paquetes. Sea Y =
nmero de paquetes embarcados a tiempo. Suponiendo que las hiptesis binomiales se
cumplen calcular:
a) la probabilidad de que de al menos un paquete se entregue a tiempo
b) la probabilidad de que a lo sumo 6 paquetes no se entreguen a tiempo
c) la probabilidad de que por lo menos 7 paquetes se entreguen a tiempo
d) el valor esperado y la varianza del numero de paquetes embarcados a tiempo
31. La revista Statistical Adstrac (U.S) informa que la mediana del ingreso familiar en
Estados Unidos durante 1985 fue 27755 dlares. En cuatro familias seleccionadas al
azar, calcular la probabilidad de que:
a) las cuatro tuvieron ingresos mayores que 27755 dlares en 1985
b) una de las cuatro haya tenido ingresos menores 27755 dlares en 1985
32. Entre personas que donan sangre en una clnica, 80 % tienen RH+, es decir el factor
Rhesus en su sangre. Cinco personas donan sangre en al clnica en determinado da.
a) Calcular la probabilidad de que al menos una de las cinco no tenga el factor RH+.
b) Calcular la probabilidad de que cuando mucho 4 de las 5 tenga sangre del tipo
RH+.
7.3. PROBLEMAS
134
Distribucin Geomtrica
1. Considere una urna con 3 bolas negras y 5 bolas blancas. Se escoge una bola al azar,
se registra su color, y despues se regresa a la urna. Cuntas extracciones en promedio
se necesitan realizar hasta obtener una bola negra por primera vez?
2. Sea X una variable aleatoria con distribucin geo(p). Demuestre que para cualesquiera
a, b = 0, 1, 2, . . . se cumple la siguiente propiedad llamada de prdida de memoria:
P(X a + b|X a) = P(X b).
Distribucin Poisson
1. Sea X una variable aleatoria con distribucin Poisson(). Demuestre que para todo
x = 0, 1, 2, . . . se cumple la siguiente frmula. Esta expresin permite calcular las probabilidades Poisson de una forma iterativa.
P(X = x + 1) =
P(X = x)
(x + 1)
2. Sea X una variable aleatoria con distribucin Poisson(). Demuestre que la probabili(1 + e2 )
.
dad de que X tome un valor par es
2
3. El nmero de computadoras que fallan por mes en un laboratorio de cmputo tiene
una distribucin Poisson con un promedio mensual de = 2 mquinas descompuestas.
El laboratorio tiene capacidad para reparar hasta dos mquinas por mes. Cuando se
descomponen ms de dos mquinas, las restantes se envan fuera del laboratorio para
su reparacin.
a) Cul es la probabilidad de que en un mes cualquiera sea necesario enviar mquinas
fuera del laboratorio para su reparacin?
b) Responda al inciso anterior cuando se reduce la capacidad de reparacin del laboratorio a una computadora por mes.
c) Cul es el nmero de computadoras con falla ms probable en un mes?
4. Sea Y una variable aleatoria que tiene una distribucin de Poisson cuyo promedio es
de 2. Calcular:
a) P(Y = 4)
b) P(Y 4)
c) P(Y 4)
5. Si la probabilidad de que un tornillo sea defectuosa es 0,008. Cul es la probabilidad
de que en una caja con 100 tornillos contenga uno o ms defectuosos?
6. Supongamos que la probabilidad de que una persona reciba una inyeccin de penicilina
y sufra una reaccin desfavorable es de 0,0002. Si 3000 personas reciben aplicaciones
de este medicamento. Cul es la probabilidad de que 0,1,2,3,4 o 5 personas reaccionen mal?
7.3. PROBLEMAS
135
7. El nmero de llamadas telefnicas que entra en una central de edificio de oficinas es

de 4 minutos en promedio.
a) Calcular la probabilidad de que no lleguen llamadas en un determinado periodo
de un minuto.
b) Calcular la probabilidad de que por lo menos lleguen 4 llamadas en un periodo
de un minuto.
c) Calcular la probabilidad de que por lo menos lleguen dos llamadas en un periodo
determinado de dos minutos.
8. Se certifica la calidad de los discos para computadora pasndolos por un certificador
que cuenta el nmero de pulsos faltantes. Una determinada marca de discos para computadora tiene en promedio 0,1 pulsos faltantes por discos.
a) Calcular la probabilidad de que el siguiente disco que se inspeccione no le falte
pulso.
b) Calcular la probabilidad de que al siguiente disco que se inspeccione le falte mas
de un pulso.
c) Calcular la probabilidad de que a ninguno de dos discos inspeccionados le falten
pulsos.
9. En Estados Unidos se ha establecido el limite mximo nacional de velocidad de 50
millas por hora, desde 1974. Kamerud que ha estudiado los efectos de esta ley, informa
que las frecuencia de accidentes fatales en las carreteras interestatales en 1975, estando
vigente el limite, es aproximadamente 19 109 millas-vehculo.
a) Calcular la probabilidad de que se tengan cuando mucho 15 accidentes fatales en
109 millas-vehculo.
b) Calcular la probabilidad de que por lo menos se tengan 20 accidentes fatales en
109 millas-vehculo.
10. En un sistema de computo de tiempo compartido, el nmero de peticiones de telepuerto
es 0,20 por milisegundo, en promedio y sigue una distribucin de Poisson.
a) Calcular la probabilidad de que no lleguen peticiones durante el siguiente milisegundo.
b) Calcular la probabilidad de que no lleguen peticiones durante los siguiente tres
milisegundo.
11. Los grandes almacenes Bon han determinado que la demanda de cierto modelo de
cmara fotogrfica tiene una distribucin de Poisson con una media de 2 por semana.
La directora del departamento de cmara quiere estudiar la demanda actual para ver si
se justifica ofrecer clases de fotografa. Acaba de leer un articulo sobre el paisaje en el
American Photographer y piensa que ese tipo de clases seria efectivo.
a) Determinar la distribucin de probabilidad de la demanda semanal
b) Si la tienda guarda 4 camaras de estas en una semana dada. Cul es la probabilidad exceda al inventario?
7.3. PROBLEMAS
136
12. Los autos llegan al lavadero 22 con una tasa promedio de 9 por hora. Si la llegada por
hora sigue una distribucin de Poisson, averige la probabilidad de que lleguen 15 o
ms autos durante una hora dad de operacin.
13. Se estima que el nmero de taxis que esperan recoger un pasajero delante de la terminal
de mnibus de Asuncin tiene una distribucin de Poisson con una media de 5,5 taxis.
a) Averige la probabilidad de, en una observacin aleatoria haya exactamente 6
taxis esperando.
b) Averige la probabilidad de, en una observacin aleatoria haya mas de 10 taxis
esperando.
c) Averige la probabilidad de, en una observacin aleatoria no haya taxis esperando.
14. La concertista de piano Donna Prima se preocupa cada vez ms por el nmero de
tosidos que se presentan en la audiencia justo antes que empiece a tocar. Durante su
ultima gira, Donna estimo un promedio de 8 tosidos justo antes de empezar su concierto. La seora prima le ha prometido a su director que si escucha ms de 5 tosidos en
el concierto esa noche, se rehusar a tocar. Cul es la probabilidad de que la artista
toque esa noche?
15. En promedio cinco pjaros chocan contra el monumento en Washington y mueren por
este motivo cada semana. Bill Garey, un oficial del Servicio del Parque Nacional de Estados Unidos, ha solicitado que el congreso estadounidense asigne fondos para adquirir
equipos que alejen a los pjaros de dicho monumento. Un subcomit del congreso le
ha respondido que pueden asignarle fondos para tal fin a menos que la probabilidad de
que mueran ms de tres pjaros cada semana sea mayor que 0,70. Se destinaran los
fondos para la compra de los equipos que alejen a los pjaros del monumento?
16. El nmero de nudos en un tipo particular de madera tiene una distribucin de Poisson
con una media de 1,5 nudos de 10 pies cbicos de madera. Encuentre la probabilidad
de que un bloque de esta madera de 10 pies cbico tenga a lo ms un nudo.
17. El 3 % de las calculadoras de bolsillo de un modelo en particular fallan durante el
primer mes de operacin. F Mart acaba de recibir un lote de 100 de estas calculadoras.
a) Averige la probabilidad de que ninguna calculadora falle
b) Averige la probabilidad de que fallen ms de tres calculadoras
c) Averige la probabilidad de que menos de 2 calculadoras fallen
18. La Articulate Corporation espera que el 99 % de los saldos de sus cuentas por cobrar
sean correctas. Se seleccion una muestra aleatoria de 200 cuentas para auditarlas.
a) Cul es la probabilidad de que ninguna de las cuentas tenga errores ?
b) Cul es la probabilidad de que 5 de las cuentas tenga errores ?
c) Cul es la probabilidad de que ms de 5 cuentas tenga errores ?
7.3. PROBLEMAS
137
19. En los ltimos 20 aos, solo el 2 % en promedio de los cheques endosados a la American Herat Association fueron rechazados. Este mes, la asociacin recibi 200 cheques.
Cul es la probabilidad de que:
a) exactamente 10 de ellos sean rechazadas
b) exactamente 5 de ellos sean rechazadas
20. El centro contencioso del condado de Orange, en California maneja varios tipos de
litigios, pero casi todos ellos son del tipo conyugal. De hecho 96 % de los pleitos que
atiende el centro son de esta naturaleza. Cul es la probabilidad de que de 80 litigios
atendidos por el centro exactamente 7 no sean del tipo conyugal?
Distribucin Uniforme
1. Sea X una variable aleatoria con distribucin uniforme en el intervalo (1, 4).
a) Obtener la funcin de densidad para esta distribucin uniforme
b) Calcular la probabilidad de que X este entre 1 y 3
c) Calcular la probabilidad de que X sea mayor que 2
d) Obtener la esperanza y la varianza de esta distribucin
2. Se escoge al azar un nmero del intervalo (0, 2)
a) Obtener la funcin de densidad para esta distribucin uniforme
b) Calcular la probabilidad de que el nmero elegido este entre 1 y 1,5
c) Calcular la probabilidad de que el nmero elegido sea mayor que 0,5
d) Obtener la esperanza y la varianza de esta distribucin
3. Se escogen al azar dos nmeros del intervalo (0, 3). Sea X la variable aleatoria que
indica la suma de los dos nmeros elegidos. Si X sigue una distribucin uniforme
a) Obtener la funcin de densidad para X
b) Calcular la probabilidad de que X este entre 2 y 4
c) Calcular la probabilidad de que el nmero elegido sea menor que 4
d) Obtener la esperanza y la varianza de X
Distribucin Normal
1. Sea X con distribucin N(10, 25). Calcule
a) P(X 10)
b) P(X < 0)
c) P(0 < X 10)
d) P(X 20)
e) P(20 < X 10)
2. Sea X con distribucin N(0, 100). Calcule
7.3. PROBLEMAS
138
a) P(X 10)
b) P(X > 0)
c) P(0 < X 40)
d) P(X 30)
e) P(10 < X 10)
3. Encuentre x tal que
a) F(x) = 0, 8666
b) 1 F(x) = 0, 9154
4. Un investigador reporta que unos ratones vivirn un promedio de 40 meses cuando sus
dietas se restringen drsticamente y despus se enriquecen con vitaminas y protenas.
Suponga que la vida de tales ratones se distribuye normalmente con una desviacin
estndar de 6,3 meses, encuentre la probabilidad de que un ratn viva:
a) Ms de 32 meses
b) Menos de 28 meses
c) Entre 37 y 49 meses
d) Entre 45 y 50 meses
e) Entre 40 y 43 meses
f) Cul es la probabilidad de que de seis ratones 4 vivan ms de 30 meses?
5. Las barras de centeno que cierta panadera distribuye a las tiendas locales tienen una
longitud promedio de 30 centmetros y una desviacin estndar de 2 centmetros.
Suponga que las longitudes se distribuyen normalmente, qu porcentaje de las barras son
a) Ms largas de 31,7 cm?
b) Entre 29,3 cm. y 33,5 cm de longitud?
c) Entre 32 cm y 35 cm?
d) Ms cortas de 38 cm?
e) Entre 27,5 cm. y 30 cm?
f) Cul es la probabilidad de que de 4 barras, tres midan ms de 35 cm?
6. Un abogado va todos los das de su casa a su oficina en el centro de la ciudad. El tiempo
promedio del viaje es 24 minutos, con una desviacin estndar de 3,8 minutos. Si las
duraciones de los viajes estn distribuidas normalmente:
a) Cul es la probabilidad de que un viaje tome al menos
1
2
hora?
b) Si la oficina abre a las 9:00 a.m. y l sale de su casa diariamente a las 8:45 a.m.,
qu porcentaje de las veces llega tarde al trabajo?
c) Si sale de su casa a las 8:35 a.m. y el caf se sirve en la oficina de las 8:50 a.m. a
las 9:00 a.m., cul es la probabilidad de que llegue a la hora del caf?
7.3. PROBLEMAS
139
d) Encuentre cual es el tiempo a partir del cual que duran el 15 % de los viajes ms
lentos?
e) Encuentre la probabilidad de que dos de los siguientes tres viajes tomen como
mximo 12 hora.
7. Las alturas de 1000 estudiantes se distribuyen normalmente con una media de 174,5
cm y una desviacin estndar de 6,9 cm., cuntos de estos estudiantes se esperara
que tuvieran alturas
a) Menores de 160 cm?
b) Entre 171,5 cm y 182 cm?
c) Mayores a 165 cm?
d) Entre 174,5 cm y 180 cm?
e) Entre 180 cm y 195 cm?
f) Menores de 185 cm?
g) Cul es la probabilidad de que de cinco estudiantes, al menos 3 midan ms de
180 cm?
h) Cul es la probabilidad de que de 3 estudiantes, ninguno mida menos de 160
cm?
8. Una estacin de radio encontr que el tiempo promedio que una persona sintoniza esa
estacin es de 15 minutos con una desviacin estndar de 3,5 minutos. Cual es la
probabilidad de que un radioescucha sintonice la estacin por:
a) ms de 20 minutos?
b) entre 15 y 18 minutos?
c) entre 10 y 12 minutos?
d) Cuantos minutos como mximo sintonizan la estacin el 70 % de los radioescuchas?
e) Cul es la probabilidad de que de 8 radioescuchas, al menos 7 sintonicen la
estacin por ms de 5 minutos?
9. Un analista financiero seala que (conforme a su probabilidad subjetiva) el precio Y de
los bonos de gobierno a largo plazo, con un valor de 1000 dlares, tendr al cabo de un
ao una distribucin normal con un valor esperado de 980 dlares y desviacin tpica
de 40 dlares.
a) Encuentre P(Y 1000)
b) Encuentre P(Y 940)
c) Encuentre P(960 Y 1060)
10. Suponga que el salario por hora de un trabajador en una fabrica de ropa (que se basa
en un sistema de pago a destajo) tiene una distribucin normal con un valor esperado
de 5,10 dlares y una desviacin estndar de 0,40 dlares.
7.3. PROBLEMAS
140
a) Encuentre la probabilidad de que el salario por hora de un trabajador sea superior

a 5,40 dlares
b) Encuentre la probabilidad de que el salario por hora de un trabajador se encuentre
entre 4,70 y 5,50 dlares
c) Encuentre la probabilidad de que el salario por hora sea superior al salario mnimo
de 3,90 dlares
11. Se ha determinado que la vida til de cierta marca de llantas radiales tiene una distribucin normal con media 38000 kilmetros y desviacin estndar 3000 kilmetros.
a) Cul es la probabilidad de que una llanta elegida al azar tenga vida til de cuando
menos 35000 km.?
b) Cul es la probabilidad de que dure mas de 45000 km.?
12. Si un distribuidor hace un pedido de 500 llantas de las especificadas en el problema
anterior . Aproximadamente cuantas llantas duraran:
a) entre 40000 y 45000 kilmetros?
b) 40000 kilmetros o ms?
13. Una operacin de maquinado produce ejes de aceros cuyos dimetros estn distribuidos normalmente con un promedio de 1,005 pulgadas y desviacin estndar de 0,01
pulgadas. Las especificaciones piden dimetros que queden en el intervalo 1, 00 0, 02
pulgadas. Qu porcentaje de la produccin no cumplir las especificaciones?
14. Las ausencias por enfermedad de los empleados de una empresa en un mes tiene una
distribucin normal aproximada con promedios de 200 horas y una varianza de 400
horas.
a) Calcular la probabilidad de que el mes prximo el ausentismo total por enfermedad sea menar que 150 horas.
b) Para plantear el programa del mes prximo. Cunto tiempo debe suponer darse
el ausentismo por enfermedad, si aquella cantidad solo se debe superar con una
probabilidad de tan solo 0,10.
15. Una empresa elctrica fabrica focos que tienen una duracin, antes de fundirse, que se
distribuye normalmente con una media igual a 800 horas y una desviacin estndar de
40 horas.
a) Encuentre la probabilidad de que un foco se funda entre 778 y 834 horas
b) Sabiendo que el porcentaje de los focos de mayor duracin es de 35,5 %, encuentre el tiempo de duracin.
16. Las calificaciones de un examen se distribuyen normalmente con valor esperado igual
a 74 y desviacin estndar igual a 7. Si 12 % de la clase obtiene Calificacin A . Cul
es la A ms baja posible y la B ms alta posible?.
7.3. PROBLEMAS
141
17. Si los ingresos mensuales de mdicos Norteamericanos estn distribuidos normalmente, con media 15000 dlares y con un desvo estndar de 3500 dlares . Cul
es la probabilidad de que un medico elegido al azar tenga un ingreso anual de :
a) superior a 16260 dlares
b) entre 16260 y 18500 dlares
c) entre 11500 y 18500 dlares
d) entre 8000 y 11500 dlares
18. Los puntos logrados por los candidatos en una prueba de actitud estn distribuidos
normalmente con una media de 500 y una desviacin 100. Qu porcentaje de los
candidatos reciben puntajes
a) superiores a 700
b) entre 400 y 600
19. Si la estatura de los estudiantes de una universidad estn normalmente distribuidos con
media de 70 pulgadas, con un desvo estndar de 3 pulgadas.
a) Si la estatura mnima para ser probado en el equipo de baloncesto es de 72 pulgadas. Que proporcin de los estudiantes estaran en condiciones de someterse
a la prueba?
b) Si para ocupar la posicin de centro hay que tener una estatura de 76 pulgadas.
Que proporcin de los estudiantes aptos para jugar baloncesto podran ocupar
dicho lugar?
20. El examen dado por un grupo de estudiantes arroja una media de 65 con una desviacin
tpica de 10. Si quisiramos dar al 15 % superior una calificacin A , al 20 % siguiente
B, al 30 % del medio C, al siguiente 25 % D y al 10 % ms bajo F. Qu calificaciones
numricas siguen el trazado de la curva?.
21. Las distribucin de los salarios de 2000 trabajadores tiene una media de 70 dlares y
una varianza de 36 dlares. Suponga que la distribucin es normal aproximada. Calcular la probabilidad que ganen:
a) entre 65 y 77 dlares
b) 82 dlares y mas
c) Cuantos trabajadores ganan 60 dlares o menos?
22. Un especialista en ictiologa tropical esta interesado en estimar cuanto tiempo puede
sobrevivir cierto tipo de pez en agua con determinado porcentaje de toxicidad. Luego
de una serie de experimentos llega a estimar que la vida media de este tipo de pez
alcanza 100 das con un desvi estndar de 20 das.
a) Cul es la probabilidad de un pez sobreviva ms de 110 das?
b) Cul es la probabilidad de un pez sobreviva entre 95 y 105 das?
7.3. PROBLEMAS
142
23. Dos estudiantes fueron informados de que haban recibido referencias tipificadas de
0,8 y -0,4 respectivamente, en un examen de ingls. Si sus puntuaciones fueron de 88
y 64 respectivamente. Hallar la media y la desviacin tpica de las puntuaciones.
24. La media de los pesos de 500 estudiantes de un cierto colegio es 151 libras y la
desviacin tpica 15 libras. Suponiendo que los pesos se distribuyen normalmente,
hallar
a) el nmero de estudiantes que pesan entre 120 y 155 libras
b) la probabilidad de que un estudiante pese ms de 185 libras
25. Una fabrica de productos para televisores vende transistores de vida media de 1000
horas y desviacin estndar de 100 horas. Suponiendo que la distribucin de vida en
horas de los transistores es normal, calcular:
a) la probabilidad de que un transistor elegido al azar tenga una duracin de vida
comprendida entre 875 y 1075 horas
b) la probabilidad de que un transistor elegido al azar tenga una duracin de vida
mayor a 1020 horas
26. La cantidad semanal que una compaa gasta en mantenimiento y reparaciones tiene
una distribucin normal aproximada cuyo promedio es de 400 dlares y su desviacin
estndar 20 dlares. Si el presupuesto para cubrir los gastos de reparacin para la semana siguiente es de 450 dlares.
a) Cul es la probabilidad de que los costos reales sean mayores que la cantidad
supuesta?
b) De cuanto debe ser el presupuesto semanal para mantenimientos y reparaciones
para que tan solo se rebase con una probabilidad de 0,1.
27. Los conductores que se fabrican para utilizar en determinado sistema de computo necesitan tener resistencias que varen entre 0,12 y 0,14 ohm. Las resistencias reales medidas de los conductores que producen la compaa A tiene una distribucin normal con
un promedio de 0,13 ohm y una desviacin estndar de 0,005 ohm.
a) Cul es la probabilidad de que un conductor seleccionado al azar de la produccin de la compaa A cumpla con las especificaciones?
b) Si se usan cuatro de estos conductores en el sistema y son de la compaa A .
Cul es la probabilidad de que los cuatro conductor cumplan con las especificaciones?
28. A una temperatura de 25C, las resistencias de un termistor de determinado tipo tiene
una distribucin normal con un promedio de 10000 ohm y una desviacin tpica de
4000 ohm. Los termistores se clasificaran para enviar a un cliente, los que tengan resistencias entre 8000 y 15000 ohm. Qu fraccin de los termistores se debe enviar?
29. Los tiempos de las primera avera de una unidad de cierta marca de impresoras de
chorro de tinta tienen aproximadamente una distribucin normal con un promedio de
1500 horas y una desviacin estndar de 200 horas.
7.3. PROBLEMAS
143
a) Qu fraccin de esas impresoras fallarn antes de 1000 horas?

b) Cul debe ser el tiempo de garanta para estas impresoras si el fabricante desea
que solo presente averas el 5 % de las impresoras dentro del tiempo de garanta?
30. Una encuesta entre los habitantes de cierta ciudad, indic que el ingreso promedio era
de 45000 guaranes, con una desviacin estndar de 5000 guaranes. Admitiendo una
distribucin normal para la variable ingreso, calcular
a) porcentaje de habitantes con renta superior a 55000 guaranes
b) porcentaje de habitantes con rentas comprendidas entre 50000 y 52000 guaranes
31. Se acepta que la vida de las bombillas producidas por una compaa elctrica tiene una
distribucin normal, con una media igual a 1000 hs. y una desviacin tpica de 50 hs.
Determinar la probabilidad de que una bombilla tomada al azar se queme:
a) en memos de 900 hs.
b) entre 900 y 1100 hs.
32. El peso medio de 500 bacas es de 151 kilogramos, con una dispersin de 15 kilogramos. Suponiendo que la variable peso se encuentre normalmente distribuida, determinar:
a) Cuntas vacas pesan entre 120 y 155 kilogramos?
b) Cuntas vacas pesan 185 kilos o ms?
c) Cuntas vacas pesan menos de 128 kilogramos?
33. En un examen de matemticas, el puntaje promedio es de 42 puntos, con una desviacin
estndar de 9 puntos. Hay un 10 % de compaeros que por tener mayor puntaje reciben
un premio. Se pide determinar el puntaje mnimo para lograr dicho premio, suponiendo
normal la distribucin de las calificaciones.
34. Los resultados obtenidos por los aspirantes que rindieron examen de ingreso en una
Facultad, indicaron una distribucin aproximadamente normal de la variable puntaje
con un valor medio de 60 puntos y una dispersin de 8 puntos. Calcular el porcentaje
de aspirante que obtuvieron puntajes:
a) mayores a 70 puntos
b) inferiores a 56 puntos
c) entre 65 y 75 puntos
Aproximacin normal a la binomial
1. Investigadores de la Universidad George Washington reportan que aproximadamente
75 % de las personas creen que los tranquilizantes funcionan muy bien para hacer que
una persona est ms tranquila y relajada. De las siguientes 80 personas entrevistadas,
cual es la probabilidad de que
a) Al menos 50 sean de esa opinin?
7.3. PROBLEMAS
144
b) A lo ms 56 tengan esta opinin?

c) Entre 60 y 70 tengan esta opinin?
d) Exactamente 43 tengan esta opinin?
2. Si el 20 % de los residentes de una ciudad de Estados Unidos prefiere un telfono
blanco sobre cualquier otro color disponible. Cul es la probabilidad de que entre los
siguientes mil telfonos que se instalen en esta cuidad
a) Entre 170 y 200 sean blancos
b) Al menos 210 sean blancos
c) Ms de 225 sean blancos
d) Entre 180 y 225 sean blancos
3. Un fabricante de medicamentos sostiene que cierto medicamento cura una enfermedad
de la sangre en promedio el 80 % de los casos. Para verificar esta afirmacin, inspectores de gobierno utilizan el medicamento en una muestra de 100 individuos y deciden
aceptar la afirmacin si 75 o ms se curan.
a) Cul es la probabilidad de que el gobierno acepte la afirmacin?
b) Cul es la probabilidad de que el gobierno rechace la afirmacin si en realidad
la probabilidad de curarse es de 0,70?
4. Un estudio sobre nuevos delincuentes juveniles revel que el 38 % de ellos vuelve a
delinquir.
a) Cul es la probabilidad de que de cien nuevos delincuentes juveniles 30 o ms
vuelvan a delinquir?
b) Cul es la probabilidad de que de 50 nuevos delincuentes juveniles 40 o menos
vuelvan a delinquir?
c) Cul es la probabilidad de que de 35 nuevos delincuentes juveniles 15 vuelvan a
delinquir?
5. Para varios millares de artculos que se mantienen en existencia en una empresa, existe
una probabilidad global del 0,08 de que un articulo especifico (incluyendo tamao y
color determinado) no se encuentre en existencia. Si para un embarque que cubre los
pedidos para 120 artculos distintos.
a) Cul es la probabilidad de que 15 o ms de ellos no se encuentren en existencia?
b) Cul es la probabilidad de que haya entre 10 y 15 artculos que no se encuentren
en existencia?
6. La probabilidad de que un paciente se recupere de una delicada operacin del corazn
es 0,9. De los siguientes 100 pacientes que tienen estas operacin cul es al probabilidad de que:
a) sobrevivan entre 84 y 95 inclusive ?
b) sobrevivan menos de 86 ?
7.3. PROBLEMAS
145
7. La Articulate Corporation espera que el 99 % de los saldos de sus cuentas por cobrar
sean correctas. Se selecciono una muestra de 200 cuentas para auditarlas.
a) Cul es la probabilidad de que ninguna de las cuentas tengan errores?
b) Cul es la probabilidad de que 5 de las cuentas tengan errores?
c) Cul es la probabilidad de que ms de 5 cuentas tengan errores?
8. En los ltimos 20 aos, solo 3 % de los cheques endosados a la American Herat Association fueron rechazados. Este mes, la asociacin recibi 200 cheques . Cul es la
probabilidad de que:
a) exactamente 10 de ellos sean rechazadas?
b) exactamente 5 de ellos sean rechazadas?
c) ms de 20 sean rechazadas?
d) a lo sumo 30 sean rechazadas?
9. Suponga que el 10 % de los habitantes de una ciudad son pelirrojos. Un grupo de encuestadores selecciona 200 personas al azar y les pregunta confidencialmente por quien
votaran en las prximas elecciones.
a) Cul es la probabilidad de que 15 o ms sean pelirrojos?
b) Cul es la probabilidad de que 30 o menos sean pelirrojos?
c) Cul es la probabilidad de que 20 sean pelirrojos?
10. Supngase que se sabe que la probabilidad de recuperacin de cierta enfermedad es de
40
a) la probabilidad de que ms de 20 personas se recuperen
b) la probabilidad de que se recuperen entre 10 y 25 personas inclusive
c) el valor esperado de personas que se recuperan
11. Si el 15 % de motores elctricos producidos por una lnea de montaje son defectuosos,
determinar la probabilidad de que entre 100 motores elegidos al azar :
a) haya a lo sumo 20 defectuosos
b) por lo menos 80 no defectuosos
c) hayas entre 15 y 25 defectuosos
12. La proporcin de familias que usan el jabn A en cierta ciudad es de 0,3. Se toma una
muestra aleatoria de 40 familias. Determinar
a) el numero esperado de familias que usen el jabn A
b) la probabilidad de que mas de 12 familias usen el jabn A
c) la probabilidad de que menos de 30 familias usen el jabn A
13. La proporcin de estudiantes que reciben calificacin C es de 0,7. Se toma una muestra
aleatoria de 150 estudiantes.
7.3. PROBLEMAS
146
a) Cul es la probabilidad de que a lo sumo 100 estudiantes tengan calificacin C?

b) Cul es la probabilidad de que cuando menos 95 estudiantes tengan calificacin
C?
c) Cul es la probabilidad de que exactamente 105 estudiantes tengan calificacin
C?.
14. La probabilidad de que una persona que entra en un supermercado efecte compra es
de 0,80. Si entran 35 personas diariamente. Calcular la probabilidad de que :
a) ms de 25 personas realicen compras
b) por lo menos 28 efectu compras
Distribucin Exponencial
1. Suponga que el tiempo que un usuario cualquiera permanece conectado a un servidor
en una red de cmputo se puede modelar como una variable aleatoria con distribucin
exponencial con media igual a 10 minutos. De mil usuarios, Cuntos tienen un conexin superior a una hora?. Calcule adems la probabilidad de que un usuario cualquiera
a) no permanezca conectado mas de 10 minutos.
b) permanezca conectado ms de 10 minutos pero menos de una hora
2. Sabemos que la duracin del tipo de bombillas que usamos sigue una distribucin
exponencial de media 6 horas.
a) Si una persona entra a la habitacin con la luz encendida dispuesta a permanecer
siete horas. Podr hacerlo sin que se funda la bombilla?.
b) Encuentre el tiempo promedio de duracin de las bobillas.
3. Si la cantidad de dinero pagado por cada pliza en una compaa de seguros se distribuye exponencialmente con media 2000.
a) Si una persona en este momento est pagando una poliza de seguros a la compaa
cul es la probabilidad de que sea un monto superior a 2500?.
b) Encuentre la cantidad promedio de pago de dinero por un seguro a la compaa.
4. Una mquina de servicio tiene una unidad de reserva para sustituirla de inmediato
cuando falle. El Tiempo a la falla (tiempo entre fallas) de la mquina (o de su unidad
de reserva) es exponencial, y sucede cada 40 minutos en promedio.
a) El operador de la mquina dice que sta tiene la costumbre de descomponerse
cada noche a eso de las 8:30 P.M. Analizar lo que dice el operador.
b) La cantidad promedio de fallas en una semana, suponiendo que el servicio se
ofrece 24 horas por da y 7 das por semana.
c) La probabilidad de que haya al menos una falla en un perodo de 2 horas.
d) La probabilidad de que la prxima falla no suceda en menos de 3 horas.
7.3. PROBLEMAS
147
e) Si no ha sucedido falla en 3 horas despus de la ltima falla, cul es la probabilidad de que el tiempo entre fallas sea de 4 horas cuando mucho?.
5. El tiempo entre llegadas en una dependencia del Banco Mercan es exponencial con
valor medio de 0,05 hora. La oficina abre a las 8:00 A.M.
a) Escriba la distribucin exponencial que describa el tiempo entre llegadas.
b) Determine la probabilidad de que no lleguen clientes a la oficina hasta las 8:15
A.M.
c) Son las 8:35 A.M. El ltimo cliente entr a las 8:26. Cul es la probabilidad de
que el siguiente cliente llegue antes de las 8:38 A.M.? Y de que no llegue hasta
las 8:40?.
d) Cul es la cantidad promedio de clientes que llegan entre las 8:10 y las 8:45
A.M.?
6. Suponga que el tiempo entre descomposturas de una mquina es exponencial, con
promedio de 6 horas. Si la mquina ha trabajado sin fallar durante las ltimas tres
horas, cul es la probabilidad de que continue sin fallar durante la prxima hora? De
que se descomponga durante la siguiente 0,5 hora?.
7. El tiempo entre llegadas a una sala de juego en la sociedad de alumnos es exponencial,
con una media de 10 minutos.
a) Cul es la frecuencia de llegadas por hora?
b) Cul es la probabilidad de que no lleguen alumnos a esa sala durante los 15
minutos siguientes?.
c) Cul es la probabilidad de que al menos un alumno visite la sala de juegos durante los prximos 20 minutos?
8. El gerente de un nuevo restaurante de comida rpida desea cuantificar el proceso de
llegadas de clientes, estimando la fraccin del intervalo de tiempo entre llegadas que
sea:
a) menor que 2 minutos,
b) entre 2 y 3 minutos y
c) ms de 3 minutos.
Las llegadas en restaurantes parecidos tienen una frecuencia de 35 clientes por hora.
El tiempo entre llegadas tiene distribucin exponencial.
9. Ana y Pedro, dos empleados de un restaurante de comida rpida, juegan lo siguiente
mientras esperan la llegada de clientes. Pedro le paga 2 dlares a Ana si el prximo
cliente no llega en menos de 1 minuto; en caso contrario, Ana le paga a Pedro 2 dlares.
Calcule la recompensa promedio de Pedro en un perodo de 8 horas. El tiempo entre
llegadas es exponencial, con una media de 1,5 minutos.
7.3. PROBLEMAS
148
10. Si un cliente llega a McDonalds en menos de 4 minutos despus del cliente inmediato
anterior, recibir un descuento del 10 %. Si el tiempo entre llegadas es entre 4 y 5
minutos, el descuento, es del 6 %. Si el tiempo entre llegadas es mayor que 5 minutos,
el cliente tiene 2 % de descuento. El tiempo entre llegadas es exponencial, con media
de 6 minutos.
a) Determine la probabilidad de que un cliente que llegue reciba el mximo descuento.
b) Determine el descuento promedio a cada cliente que llega
11. Se sabe que el tiempo entre fallas de un refrigerador Kencore es exponencial, con una
media de 9000 horas (ms o menos 1 ao de funcionamiento), y la empresa otorga una
garanta de 1 ao con el refrigerador. Cul es la probabilidad de que la garanta cubra
una reparacin por descompostura?.
12. Los nios nacen en un estado poco poblado, con una frecuencia de un nacimiento cada
12 minutos. El tiempo entre nacimientos sigue una distribucin exponencial. Determinar
a) La cantidad promedio de nacimientos por ao
b) La probabilidad de que no haya nacimientos en cualquier da
c) La probabilidad de emitir 50 certificados de nacimientos en 3 horas, cuando se
emitieron 40 certificados durante las primeras 2 horas del perodo de 3 horas.
d) Suponga que el empleado que pasa la informacin de los certificados de nacimiento a la computadora suele esperar hasta que se hayan acumulado 5 certificados.
Calcule la probabilidad de que el empleado capture un nuevo lote en cada hora.
13. Un coleccionista de arte viaja una vez al mes, en promedio, para asistir a subastas.
En cada viaje se garantiza una compra. El tiempo entre los viajes tiene distribucin
exponencial. Determine lo siguiente:
a) La probabilidad de que el coleccionista no compre obras de arte en un perodo de
3 meses.
b) La probabilidad de que el coleccionista no compre ms de 8 obras de arte por
ao.
c) La probabilidad de que el tiempo entre viajes sucesivos sea mayor que 1 mes.
14. En un banco, la frecuencia de llegadas es de 2 clientes por minuto. Determine lo siguiente:
a) La cantidad promedio de llegadas durante 5 minutos.
b) La probabilidad de que no haya llegadas durante el prximo 0,5 minuto.
c) La probabilidad de que haya al menos una llegada durante el siguiente 0,5 minuto.
d) La probabilidad de que el tiempo entre dos llegadas sucesivas sea de 3 minutos,
cuando menos.
15. El tiempo entre llegadas al restaurante Juan Arepa es exponencial con media de 5
minutos. El restaurante abre a las 11:00 A.M. Determine:
7.3. PROBLEMAS
149
a) La probabilidad de tener 10 llegadas al restaurante hasta las 11:12 A.M. si hubo

8 llegadas hasta las 11:05.
b) La probabilidad de que un cliente llegue entre las 11:28 y las 11:33 A.M. si el
ltimo cliente lleg a las 11:25 A.M.
Captulo 8
Muestras aleatorias y distribuciones de
muestreo.
8.1.
Introduccin
Supongamos que tenemos una poblacin de inters, esto es, un conjunto arbitrario de individuos (personas, animales, plantas objetos en general) cualesquiera, y deseamos conocer
cierta informacin de esta poblacin. Debido a la imposibilidad o no conveniencia de tener
informacin de todos y cada uno de los elementos de la poblacin, generalmente tomamos un
pequeo subconjunto de ella, al cual llamamos muestra. Con base en esta muestra trataremos
de inferir la informacin de la poblacin en su totalidad.
8.2.
Muestras aleatorias y estadsticos muestrales
Definicin 8.2.1 Una muestra aleatoria (escribimos simplemente m.a.) es una coleccin de
variables aleatorias X1 , X2 , . . . , Xn que son independientes e idnticamente distribuidas.
De este modo, cuando se diga, por ejemplo, que una muestra aleatoria es tomada de una
poblacin normal con media y varianza 2 , ello significa que las variables aleatorias que
forman la m.a. son independientes entre s, y todas ellas tienen la misma distribucin normal
y los mismos parmetros que la poblacin. Una muestra aleatoria constituye el elemento
bsico para llevar a cabo inferencias estadsticas.
Definicin 8.2.2 Una estadstica o estadstico muestral es una funcin cualquiera de una
muestra aleatoria X1 , X2 , . . . , Xn , y por lo tanto es tambin una variable aleatoria.
150
8.3. MTODOS DE MUESTREO
151
Una estadstica es entonces cualquier funcin de las variables aleatorias que se observaron
en la muestra; de manera que esta funcin no contiene cantidades desconocidas.
Veremos a continuacin dos ejemplos de estadsticas que sern usados con frecuencia
ms adelante. Considere una muestra aleatoria X1 , X2 , . . . , Xn . La funcin X definida como
sigue
1 n
X = Xi
n i=1
es una estadstica, y se le conoce con el nombre de media muestral. El otro ejemplo es el de
la varianza muestral, que se puede expresar de dos maneras distintas y se definen por
S2 =
8.3.
1 n
1 n
2
2
(X
X)
y
S
=
i
(Xi X)2
n i=1
n 1 i=1
Mtodos de Muestreo
Por qu muestrear?
Muestreo es la actividad por la cual se toman ciertas muestras de una poblacin de elementos de los cuales vamos a tomar ciertos criterios de decisin, el muestreo es importante
porque a travs de l podemos hacer anlisis de situaciones de una empresa o de algn campo
de la sociedad.
Y porque no se estudia la poblacin completa? se preguntaran algunos, pero en ocasiones no es factible, veamos algunas razones por las cuales conviene muestrear:
1. La naturaleza destructiva de algunas pruebas.
Por ejemplo se quiere conocer la resistencia de los tornillos que se fabrica en una planta, para conocerla es necesario destruir el producto, lgicamente no podemos probar
toda la poblacin porque nos quedaramos sin productos.
2. La imposibilidad fsica de chequear todos los elementos de la poblacin.
Por ejemplo se quiere conocer el efecto de un nuevo insecticida en las moscas, como se
puede comprender no es posible contactar a todas las moscas para realizar el estudio.
3. El costo de estudiar a toda la poblacin es muy alto.
Por ejemplo se quiere conocer la opinin de la poblacin sobre cierto personaje de la
poltica, si en el pas hay 100 millones de habitantes, se tendra que contratar mucho
personal y equipo para realizar el estudio.
4. El tiempo para contactar a toda la poblacin es inviable.
En ocasiones se necesita informacin rpida para tomar una decisin importante, tal
vez estudiar a toda la poblacin nos lleve ms tiempo del que disponemos.
152
Por las razones anteriores, en muchos casos es conveniente el uso de muestras, pero
para que podamos extraer conclusiones, es importante que elijamos bien las muestras para
nuestros estudios. Hay cuestiones que debemos especificar a la hora de elegir una muestra:
a) El tipo de muestreo que se va a utilizar.
b) El tamao de la muestra.
c) El nivel de confianza de las conclusiones que vamos a presentar.
Clasificacin de los mtodos de muestreo
Los mtodos de muestreo pueden dividirse en dos grandes grupos: mtodos de muestreo
probabilsticos y mtodos de muestreo no probabilsticos.
Muestreos no probabilsticos
No sirven para realizar generalizaciones, pues no se tiene certeza de que la muestra extrada sea representativa, ya que no todos los sujetos de la poblacin tienen la misma probabilidad de se elegidos. En general se seleccionan a los sujetos siguiendo determinados criterios
procurando que la muestra sea representativa.
Muestreo intencional u opinativo: en el que la persona que selecciona la muestra es
quien procura que sea representativa, dependiendo de su intencin u opinin, siendo
por tanto la representatividad subjetiva.
Muestreo sin norma: se toma la muestra sin norma alguna, la muestra podra ser
representativa si la poblacin es homognea y no se producen sesgos de seleccin.
Muestreos probabilsticos
Los muestreos probabilsticos son aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra. Dentro de los mtodos de
muestreo probabilsticos encontramos los siguientes tipos:
1. Muestreo aleatorio simple
2. Muestreo sistemtico
3. Muestreo estratificado
4. Muestreo por conglomerados
8.3.1.
Muestreo aleatorio simple
Una muestra seleccionada de modo que cada uno de los individuos en la poblacin tengan
las mismas posibilidades de ser seleccionados.
El procedimiento de seleccin consiste en:
primeramente se asigna un nmero a cada elemento de la poblacin,
153
despus al azar (como una urna, tablas de nmeros aleatorios, nmeros aleatorios generados electrnicamente, etc.) se eligen los elementos necesarios para la muestra.
La ventaja de este mtodo de muestreo es que es sencillo y de fcil comprensin. Sus
desventajas son:
requiere que se posea de antemano un listado completo de toda la poblacin y
que cuando se trabaja con muestras pequeas es posible que no represente a la poblacin
adecuadamente.
Ejemplo 8.3.1 En una compaa con 150 trabajadores se quiere obtener una muestra aleatoria de 15 elementos para un chequeo mdico. Se sigue el siguiente procedimiento:
1) Los trabajadores fueron numerados del 1 al 150
2) Mediante una tabla de nmeros aleatorios se procede a seleccionarlos.
3) El punto de arranque en la tabla se fija mediante la hora en ese momento, 4:03, por lo
tanto se inicia en la fila 4, columna 3.
4) Como los nmeros de los trabajadores van desde 1 hasta 150 solo se toman en cuenta las
primeras 3 cifras de cada nmero y se registran los nmeros que se vayan encontrando
en ese rango.
El primer nmero encontrado fue el 054 en la fila 4 columna 5, se siguen revisando
los nmeros horizontalmente, el siguiente seleccionado fue el 095 y as sucesivamente. La
muestra de 15 nmeros fue la siguiente:
054
005
041
8.3.2.
095
050
021
080
024
105
004
046
009
147
018
146
Muestreo aleatorio sistemtico
Se acomodan los individuos de la poblacin en cierta forma. Se selecciona un punto de

partida aleatorio y luego se toma cada k-simo miembro para formar parte de la muestra.
El procedimiento de seleccin consiste en:
primeramente es necesario conocer el nmero de los elementos de la poblacin (N) y
el tamao que deber tener la muestra (n);
se define cada cuantos elementos de la poblacin seleccionaremos uno para la muestra
con la siguiente ecuacin k = Nn .
Se comienza la seleccin eligiendo aleatoriamente el primer elemento entre 1 y k, luego
se cuentan k elementos y se selecciona el segundo y as sucesivamente hasta completar
la muestra.
Este mtodo tiene las ventajas:
154
de ser fcil de aplicar,

no es necesario tener un listado de toda la poblacin y
asegura una cobertura de unidades de todos los tipos.
Su desventaja es que si la constante de muestreo est asociada con el fenmeno de inters,
las estimaciones obtenidas a partir de la muestra pueden contener un sesgo.
Ejemplo 8.3.2 Suponga que la poblacin de inters consiste de 2000 expedientes en un
archivo. Para seleccionar una muestra de 100 con el mtodo aleatorio simple primero se tendra que numerar todos los expedientes. En este mtodo se selecciona el primer expediente
de acuerdo al mtodo aleatorio simple, luego como se quiere una muestra de 100, se divide
2000
100 = 20, y se selecciona un expediente cada 20.
8.3.3.
Muestreo aleatorio estratificado
En un muestreo aleatorio estratificado se divide la poblacin en subgrupos denominados estratos, y se selecciona una muestra de cada uno de ellos. En ciertas ocasiones resultar
conveniente estratificar la muestra segn ciertas variables de inters. Para ello debemos conocer la composicin estratificada de la poblacin objetivo a muestrear. Una vez calculado el
tamao muestral apropiado, este se reparte de cierta manera que puede ser proporcional o no
proporcional entre los distintos estratos definidos en la poblacin. Como el nombre lo indca,
un procedimiento o afijacin de muestreo proporcional requiere que el nmero de individuos
de cada estrato est en la misma proporcin que la problacin.
Entre sus ventajas, este mtodo asegura que la muestra represente adecuadamente a la
poblacin en funcin de ciertas variables seleccionadas, adems de obtener estimaciones
ms precisas.
La desventaja es que se ha de conocer como se distribuye la poblacin de acuerdo a las
variables utilizadas para la estratificacin.
Ejemplo 8.3.3 Se quiere obtener una muestra de 50 estudiantes de la universidad. Se pretende que la muestra sea representativa en relacin al lugar de origen de los estudiantes (si
son de la localidad o son forneos). Se sabe que en esta universidad el 30 % de los estudiantes son forneos. Primero debemos identificar los estratos de la poblacin y sus respectivas
proporciones:
Estududiantes locales 0.70
Estudiantes forneos 0.30
La muestra deber mantener esas mismas proporciones, para lo cual es preciso multiplicar
el tamao de la muestra (n) por las proporciones de los estratos y obtenemos el nmero de
elementos que sern selecionados de cada estrato:
Estudiantes locales
Estudiantes forneos
(0,70)(50) = 35
(0,30)(50) = 15
Ahora se procede a seleccionarlos por medio de alguno de los mtodos anteriores.
8.4. DISTRIBUCIONES MUESTRALES
8.3.4.
155
Muestreo aleatorio por conglomerados
El muestreo por conglomerados consiste en dividir la poblacin en sectores o conglomerados, seleccionar una muestra aleatoria de esos sectores, y finalmente obtener una muestra
aleatoria de cada uno de los sectores seleccionados. Muchas veces se le emplea para reducir
el costo de realizar un muestreo de una poblacin dispersa en una gran rea geogrfica.
Entre sus ventajas se encuentra que es muy eficiente cuando la poblacin es muy grande
y dispersa, adems de que no es preciso tener un listado de toda la poblacin, slo de las
unidades primarias de muestreo.
Su desventaja radica en que una muestra de conglomerados, usualmente produce un mayor error muestral (por lo tanto, da menor precisin de las estimaciones acerca de la poblacin)
que una muestra aleatoria simple del mismo tamao.
Ejemplo 8.3.4 Se quiere conocer la opinin de los padres de familia sobre los temas de educacin sexual tratados en los libros de texto de primaria en la Repblica Mexicana. Como la
poblacin est muy dispersa y es muy grande, es necesario hacer un muestreo por conglomerados en varias etapas.
Primero dividimos la Repblica en sectores geogrficos, que podran ser los estados, y
seleccionamos una muestra aleatoria de ellos. Luego en cada uno de ellos hacemos una seleccin aleatoria de escuelas primarias. Y por ltimo en las escuelas seleccionadas obtenemos
una muestra aleatoria de padres de familia.
8.3.5.
Error de Muestreo
Al seleccionar una muestra aleatoria, sin importar por cual de los cuatro mtodos, es
poco probable que la media de la muestra sea idntica a la media de la poblacin de donde
fue obtenida. De la misma forma, es probable que la desviacin estndar de la muestra no
sea exactamente igual al valor correspondiente de la poblacin. Por lo tanto podemos esperar
alguna diferencia entre un estadstico muestral y el correspondiente parmetro poblacional.
Esta diferencia es llamada error de muestreo.
8.4.
Distribuciones Muestrales
Las distribuciones muestrales constituyen distribuciones de probabilidad de los estadsticos muestrales. Por ejemplo si tomamos una muestra aleatoria X1 , X2 , . . . , Xn de una poblacin
con cierta distribucin y calculamos X y S2 ; podramos establecer una distribucin muestral
de medias y una distribucin muestral de varianzas. Adems si tenemos dos poblaciones
podemos extraer muestras aleatorias de cada poblacin, calcular ciertos extadsticos muestrales de cada poblacin, establecer relaciones entre ellos y finalmente obtener una distribucin para dicha relacin. Por ejemplo si tenemos dos poblaciones y extraemos muestras
aleatorias de ciertos tamaos de cada poblacin, luego calculamos las medias muestrales
correspondientes, adems de las respectivas varianzas, podramos establecer una distribucin muestral de sumas o de diferencias medias y una distribucin muestral de relaciones de
varianzas.
156
A continuacin presentaremos primeramente algunas distribuciones muestrales para el

caso de una sola poblacin y luego distribuciones muestrales para el caso de dos poblaciones.
8.4.1.
Distribucin Muestral de Medias
Definicin 8.4.1 Una distribucin muestral de medias es una distribucin de probabilidad

de todas las posibles medias muestrales, de un tamao de muestra dado, seleccionadas de una
poblacin.
Para fines de entender mejor el concepto de distribucin muestral de medias estudiemos
la siguiente poblacin. Don Pepe en su restaurante tiene 5 parrilleros (poblacin), a los cuales
se les paga por hora segn su trabajo. Las percepciones de los parrilleros son las siguientes:
Parrillero
Adrin
Blas
Carmela
Diana
Enrique
Percepcin por hora

$ 9,00
$ 8,00
$ 8,00
$ 8,00
$ 7,00
La poblacin en este ejemplo son los ingresos por hora de los cinco parrilleros. Si calculamos
la media de esta poblacin obtendramos
9+8+8+8+7
=8
5
Para facilitar la explicacin y comenzar a elaborar la distribucin muestral de medias,
vamos a fijar el tamao de muestra (n) en 2. Formamos todas las posibles muestras de tamao
2, y como vemos en el siguiente cuadro son 10, y a cada una le calculamos la media.
=
muestra
1
2
3
4
5
6
7
8
9
10
parrilleros
A-B
A-C
A-D
A-E
B-C
B-D
B-E
C-D
C-E
D-E
percepciones
9,00 8,00
9,00 8,00
9,00 8,00
9,00 7,00
8,00 8,00
8,00 8,00
8,00 7,00
8,00 8,00
8,00 7,00
8,00 7,00
media
8,50
8,50
8,50
8,00
8,00
8,00
7,50
8,00
7,50
7,50
A continuacin elaboramos una distribucin de probabilidad con las medias de las muestras, quedando de la siguiente manera:
Distribucin Muestral de Medias para n=2
media muestral frecuencia Probabilidad
7,50
3
0,3
8,00
4
0,4
8,50
3
0,3
10
1,0
157
Calculamos la media de la distribucin que acabamos de hacer:

X =
3(7, 5) + 4(8, 0) + 3(8, 5)

=8
10
A partir de las observaciones anteriores podemos supioner que la media de la distribucin

muestral de medias es igual a la media de la poblacin y que la forma de la distribucin
muestral presenta un cambio respecto a la forma de la poblacin.
Proposicin 8.4.1 La media de la distribucin muestral de medias denotada por X est
dada por
E(X) = X =
donde es la media de la poblacin de la cual provienen todas las muestras de tamao n.
Demostracin
Para realizar la demostracin de esta proposicin recordemos que una muestra aleatoria de tamao n esta constituida por n variables aleatorias independientes e identicamente
distribuidas, esto es cada una de las variables aleatorias Xi , i = 1, 2, . . . , n intervinientes
tienen los mismos parmetros que el de la poblacin de la cual provienen. Por lo tanto
E(Xi ) = , i = 1, 2, . . . , n; entonces
E(X) = E
n i=1
Xi
1 n
1
= E(Xi ) = n =
n i=1
n
Proposicin 8.4.2 Si una poblacin es infinita o si el muestreo es con reemplazamiento,

entonces la varianza de la distribucin muestral de medias, denotada por 2X , esta dada por
E(X )2 = 2X =
2
n
donde 2 es la varianza de la poblacin de la cual provienen todas las muestras de tamao n.

Demostracin
Como ya se dijo anteriormente las variables aleatorias Xi , i = 1, 2, . . . , n intervienientes
en la muestra aleatoria son independientes e identicamente distribuidas con lo cual tendremos
que Var(Xi ) = 2 , i = 1, 2, . . . , n y para cualquier par de variables aleatorias Xi , X j , i 6= j
en la muestra se tendr Var(Xi + X j ) = Var(Xi ) +Var(X j ). Por lo tanto
E(X )2 = 2X = Var(X) = Var
1 n
1 2 2
=
n =
X
Var(X
)
=
i
i
n i=1
n2 i=1
n2
n
n
Observacin: Cuando el tamao de la poblacin es finita o el muestreo es sin reemplazamiento, entonces

2 N n
2X =
n N 1
Cuando el tamao de la muestra es pequeo (n < 30) y la varianza poblacional es desconocida, la distribucin muestral de medias
se podr relacionar con la distribucin t de
(X ) n 1
Student, teniendo en cuenta que tc =
t(n 1).
S
8.4.2.
158
Teorema del Lmite Central
El Teorema del Lmite Central consiste en un conjunto de resultados acerca del comportamiento de las distribuciones muestrales. En el que se afirma, bajo ciertas hiptesis, que la
distribucin de las medias de un nmero muy grande de muestras se aproxima a una distribucin normal.
El trmino Central, debido a Poly (1920), significa fundamental, o de importancia central, este describe el rol que cumple este teorema en la teora de la probabilidad.
Muchos grandes matemticos colaboraron para desarrollar el teorema del lmite central,
sin embargo Laplace ocupa un lugar fundamental, a pesar de que nunca enunci formalmente
este resultado, ni lo demostr rigurosamente, a l le debemos este importante descubrimiento.
Teorema 8.4.1 Teorema del Lmite Central:
Para una poblacin con una media y una varianza 2 , la distribucin de las medias
de todas las muestras posibles de tamao n generadas de la poblacin estar distribuida de
forma aproximadamente normal asumiendo que el tamao de la muestra es lo suficientemente
grande.
Con relacin al teorema del lmite central debemos enfatizar en:
1. Si el tamao de la muestra n es suficientemente grande (n 30) la distribucin de las
medias ser aproximadamente normal. No importa si la poblacin es normal, sesgada
u uniforme, si la muestra es grande el teorema se aplicar.
2. La media de la poblacin y la media de la distribucin de todas las posibles muestras sern iguales. Si la poblacin es grande y un gran nmero de muestras son seleccionadas de esa poblacin entonces la media de las medias muestrales se aproximar a
la media poblacional.
3. La desviacin estndar de la distribucin muestral de las medias, a la que llamaremos
error estndar, es determinado por:
a) Si la poblacin es infinita o si el muestreo es con reemplazamiento: X =

n
r
N n
b) Si la poblacin es finita o el muestreo es sin reemplazamiento: X =

n N 1
Ejemplo 8.4.1 Los pesos de los paquetes recibidos en un departamento de almacenamiento
tienen una media de 300 libras y una desviacin estndar de 50 libras.
a) Cul es la probabilidad de que el peso medio de 35 paquetes recibidos aleatoriamente
sea menor que 320 libras?
b) Cul es la probabilidad de que el peso medio de 40 paquetes recibidos aleatoriamente
sea mayor que 290 libras?
c) Cul es la probabilidad de que el peso de 25 paquetes recibidos aleatoriamente y cargados en un ascensor supere el lmite de seguridad del ascensor, que es 8200 libras?
159
Desarrollo
Segn las condiciones del problema; la media y la desviacin estndar poblacional son
respectivamente = 300 libras y = 50 libras. Como no se conoce el tamao de la poblacin
se asume que es infinita, por lo que los parmetros de la distribucin muestral de medias
50
sern: X = = 300 libras y X = = libras. Entonces la probabilidad de que
n
n
a) el peso medio de 35 paquetes recibidos aleatoriamente sea menor que 320 libras es
320 300
P(X < 320) = P Z <
= P(Z < 2, 37) = 0, 5 + A(2, 37)
50
35
Buscando en la tabla de la distribucin Z encontramos que A(2, 37) = 0, 4911 por lo

que la probabilidad buscada esta dada por
P(X < 320) = 0, 5 + 0, 4911 = 0, 9911
b) el peso medio de 40 paquetes recibidos aleatoriamente sea mayor que 290 libras
290 300
= P(Z > 1, 26) = 0, 5+A(1, 26) = 0, 5+A(1, 26)
P(X > 290) = P Z >
50
40
Buscando nuevamente en la tabla de Z encontramos que A(1, 26) = 0, 3962 por lo que
la probabilidad buscada esta dada por
P(X > 290) = 0, 5 + 0, 3962 = 0, 8962
160
c) el peso de 25 paquetes recibidos aleatoriamente y cargados en un ascensor supere el

lmite de peso de 8200 libras es
8200
328 300
P X>
=P Z>
= P(Z > 2, 8) = 0, 5 A(2, 8)
50
25
25
Buscando en la tabla de la distribucin Z encontramos que A(2, 8) = 0, 4974 por lo que

la probabilidad buscada esta dada por
P(X > 328) = 0, 5 0, 4974 = 0, 0026
Ejemplo 8.4.2 El peso medio de un grupo de 1000 estudiantes es de 68,2 kg y la desviacin
estndar es de 2,5 kg. Halle la probabilidad de que en una muestra de 100 estudiantes la
media muestral
a) sea mayor que 68,9 kg
b) est entre 67,5 y 68,5 kg
Desarrollo
Segn las condiciones del problema; la media y la desviacin estndar poblacional son
respectivamente = 68, 2 kg y = 2, 5 kg. El tamao de la poblacin es 1000 estudiantes,
por lo que los
distribucin muestral de medias sern: X = = 68, 2 kg y
r parmetros de lar
2, 5
N n
1000 100
=
= 0, 2373 kg. Entonces la probabilidad de que
X =
n
N 1
1000 1
100
la media muestral
a) sea mayor que 68, 9 kg es
68, 9 68, 2
= P(Z > 2, 95) = 0, 5 A(2, 95)
P(X > 68, 9) = P Z >
0, 2373
Buscando en la tabla de la distribucin Z encontramos que A(2, 95) = 0, 4984 por lo
que la probabilidad buscada est dada por
P(X > 328) = 0, 5 0, 4984 = 0, 0016
161
b) est entre 67, 5 y 68, 5 kg es

67, 5 68, 2
68, 5 68, 2
P(67, 5 < X < 68, 5) = P
<Z<
= P(2, 95 < Z < 1, 26)
0, 2373
0, 2373
= A(2, 95) + A(1, 26) = A(2, 95) + A(1, 26)
Buscando en la tabla de la distribucin Z encontramos que A(2, 95) = 0, 4984 y

A(1, 26) = 0, 3962 por lo que la probabilidad buscada est dada por
P(67, 5 < X < 68, 5) = 0, 4984 + 0, 3962 = 0, 8946
8.4.3.
Distribucin Muestral de Varianzas
Supongase que las variables aleatorias X1 , X2 , . . . , Xn constituyen una muestra aleatoria de

una distribucin normal con media conocida y varianza desconocida 2 > 0. Se desarrollar
ahora una distribucin de muestreo para la varianza muestral S2 . Por definicin
S2 =
1 n
(Xi )2
n i=1
Como el parmetro poblacional no siempre es conocido, muchas veces se sustituye

por X, en la definicin de varianza muestral. Entonces
2
2
n
n
X
X
X
i
i
i=1
i=1
2
2
S =
y S =
n1
n
162
Deduccin de la distribucin de muestreo de S2

La sustitucin anterior lo realizamos para determinar la distribucin de muestreo de S2 ,
con base a una muestra aleatoria proveniente de una distribucin normal. Entonces
S2 =
1 n
1 n
2
(X
X)
=
[(Xi ) (X )]2
i
n i=1
n i=1
n
nS = [(Xi )2 2(Xi )(X ) + (X )2 ]

2
i=1
n
i=1
n
i=1
i=1
= (Xi )2 2(X ) (Xi ) + (X )2

= (Xi )2 2n(X )2 + n(X )2
i=1
n
= (Xi )2 n(X )2
i=1
Por lo tanto
(Xi )2 = nS2 + n(X )2
i=1
Dividimos la expresin anterior por 2 tenemos

n
(Xi )2
i=1
nS2 n(X )2
+
2
2
2
n
(Xi )2
Por la prosicin 7.2.5 la v.a.
i=1
tiene una distribucin ji-cuadrada con n gra-
n(X )2
dos de libertad, adems por la proposicin 7.2.3 la v.a.
tiene una distribucin
2
ji-cuadrada con un grado de libertad, por lo que finalmente por la proposicin 7.2.4 la v.a.
nS2
tiene una distribucin ji-cuadrada con n 1 grados de libertad.
2
Probamos entonces que la distribucin muestral de varianzas para muestras de tamao
n provenientes de una distribucin normal con media y varianza 2 tiene una distribucin
ji-cuadrada con n 1 grados de libertad.
Proposicin 8.4.3 Si se extraen muestras de tamao n de una poblacin normal con media
y varianza 2 , entonces la esperanza y la varianza de S2 son respectivamente
S 2 =
.
n1 2
2(n 1) 4
y S 2 =
n
n2
163
Desarrollo
Para realizar la demostracin primeramente recordemos que la esperanza y la varianza
de una distribucin ji-cuadrada con con k grados de libertad estn dadas por k y 2k respectinS2
vamente. Adems tomemos en cuenta que la v.a. 2 tiene una distribucin ji-cuadrada con
n 1 grados de libertad. Entonces

E
por lo que
nS2
2
= n 1 y Var
nS2
2
= 2(n 1)
n
n2
2
E(S
)
=
n
1
y
Var(S2 ) = 2(n 1)
2
4
con lo cual
E(S2 ) =
n1 2
2(n 1) 4
y Var(S2 ) =
n
n2
Ejemplo 8.4.3 Una poblacin normal tiene una varianza de 15. Si se extraen muestras de
tamao 5 de esta poblacin; qu porcentajes pueden tener varianzas
a) menores que 10?
b) mayores que 20?
Calcule adems la media y la varianza de esta distribucin muestral de varianzas.
Desarrollo
Segn las condiciones del problema; 2 = 15 y n = 5. Adems el grado de libertad ser
n 1 = 5 1 = 4, entonces
a) para responder este inciso debemos calcular primeramente 21 que viene dada por la
siguiente relacin
nS2 (5)(10)
21 = 21 =
= 3, 3333
15
Luego se busca en la tabla 2 un valor que tenga 4 grados de libertad y este lo ms

cercano a 3,3333. Este valor resulta ser 2[0,50 ; 4] = 3, 36 y por lo cual la probabilidad
buscada es de aproximadamente 0,50.
164
b) para responder a este inciso se debe realizar un procedimiento anlogo al anterior; esto
es
nS2 (5)(20)
22 = 22 =
= 6, 667
15
Luego en la tabla 2 se observa que el valor 6,667 con 4 grados de libertad est ente los
valores 2[0,80 ;4] = 5, 99 y 2[0,90 ;4] = 7, 78; con lo cual podramos tomar al promedio
de estos valores como el valor ms cercano. Entonces
2[0,80 ;4] + 2[0,90 ;4]
5, 99 + 7, 78
= 6, 885
2
2
con lo cual la probabilidad buscada es de aproximadamente 1 0, 85 = 0, 15.
2[0,85 ;4]
La esperanza y la varianza para esta distribucin vienen dadas por la siguientes relaciones
n1 2 4
= 15 = 12
n
5
2(n 1) 2 2(4)
Var(S2 ) =
= 2 15 = 4, 8
n2
5
E(S2 ) =
8.4.4.
Distribucin F
Esta distribucin de probabilidad es usada en varias situaciones. Es usada cuando queremos probar si dos varianzas muestrales provienen de la misma poblacin o de poblaciones
con caractersticas idnticas, adems es aplicada cuando se quiere comparar las medias de
ms de dos poblaciones simultneamente.
La distribucin F se define como la razn entre dos distribuciones ji-cuadrada independientes, dividida cada una de ellas entre sus respectivos grados de libertad.
Consideremos dos variables aleatorias independientes Y y W tales que Y tiene una distribucin 2 con m grados de libertad y W una distribucin 2 com n grados de libertad,
donde m y n son enteros positivos. Se define una nueva variable aleatoria como sigue:
X=
Y
m
W
n
nY
mW
entonces a la variable aleatoria X se le denomina distribucin F de Snedecor con m y n

grados de libertad.
165
Definicin 8.4.2 Una variable aleatoria X tiene distribucin F de Snedecor si su funcin

de densidad de probabilidad est dada por
m n

m+n
m
m 2 n2
2
x 2 1

si x > 0
m+n
n
m
2
(mx
+
n)
f (x) =
2
2
0
si x 0
Figura 8.1: Grfica de f (x) cuando los parmetros m y n toman diferentes pares de valores.
Caractersticas de la distribucin F
Hay una familia de distribuciones F. Cada miembro de esta familia est determinado
por los grados de libertad del numerador (varianza mayor) y por los del denominador
(varianza menor).
La distribucin F es una distribucin continua y no puede tomar valores negativos.
La curva que representa la distribucin F est sesgada hacia la derecha.
Su rango de valores va desde 0 hasta infinito, cuanto ms se incrementa F, la curva se
aproxima al eje X, pero nunca lo toca.
Inferencias con respecto a las varianzas de dos distribuciones normales independientes.
Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin normal con media X y varianza 2X , sea adems Y1 ,Y2 , . . . ,Ym otra muestra aleatoria de una distribucinb normal con
media Y y varianza Y2 . Si se supone independencia entre las variables aleatorias X e Y , las
(n 1)SX2
(m 1)SY2
estadsticas uX =
y
u
=
son distribuciones ji-cuadradas con n 1 y
Y
2X
Y2
166
m 1 grados de libertad. Entonces

F=
ux
n1
uY
m1
SX2
2X
SY2
Y2
tiene una distribucin F con n 1 y m 1 grados de libertad.

Si las dos varianzas poblacionales son iguales la frmula se reduce a:
F=
8.4.5.
SX2
SY2
Distribucin Muestral de Proporciones
Sea una poblacin finita de tamao N, en la que la probabilidad de ocurrencia de un

suceso en el que se est interesado es P y la probabilidad de ocurrencia del suceso contrario a
aquel en el que se est interesado es Q = 1 P (poblacin Bernoulli). Si de est poblacin se
extraen todas las posibles muestras de tamao n, con n < N, y se averigua para cada una de
las muestras la proporcin correspondiente al atributo o categoria en el que se est interesado
con relacin al total de elementos n de la muestra se obtendr una distribucin muestral de
proporciones.
X
Se define una proporcin de muestra como p = , donde X es el nmero de unidades de
n
la muestra que posee el rasgo en el que se est interesado y n es el tamao de muestra. Por
su forma de definicin X es la suma de las variables aleatorias Benoulli de la muestra que
poseen el rasgo de inters y por lo tanto X tiene distribucin Binomial con parmetro P.
Si se obtiene una muestra de tamao n al azar, con reemplazamiento (reposicin), la
distribucin por muestreo de P, obedece a la ley de probabilidad binomial. La media y la
varianza estn dadas por:
X E(X) nP
=
E( p)
= p = E
=
=P
n
n
n
X Var(X) nP(1 P) P(1 P)
=
2p = Var
=
=
n
n2
n2
n
para muestras de tamao n < 30.
Cuando el muestreo se realiza sin sustitucin, obedece a la ley de probabilidades hipergeomtrica y como la poblacin es finita, la media y la varianza estn dadas por
X E(X) 1 nk
k
=
=
= =P
E( p)
= p = E
n
n
n N
N
X Var(X) nk(N k)(N n) 1 k
k N n P(1 P) N n
2p = Var
=
=
= 1
2
2
2
n
n
n N (N 1)
n N
N N 1
n
N 1
Cuando el muestreo es efectuado ya sea con o sin reemplazamiento, si el tamao de las
muestras es n 30, la distribucin muestral de las proporciones en las muestras se aproxima a
la normal por aplicacin del teorema central del lmite. A continuacin se enuncia el teorema
central del lmite para este caso.
167
Teorema de la convergencia o central del lmite

Sea una variable aleatoria con slo dos caracteres complementarios (el considerado y su
contrario) cuyas proporciones con respecto al total son P y 1 P respectivamente. Si de esta
poblacin se extraen muestras de tamao n grande de forma que nP > 5 y n(1 P) > 5, la
distribucin muestral de las proporciones p,
del caracter considerado en la poblacin, que
aparecen en cada una de las muestras, sigue una distribucin normal con valor medio p = P
P(1 P)
y varianza 2p =
.
n
p P
La variable
se aproxima a una normal estandar cuando n se aproxima al infinito.
p
La funcin de distribucin de p con n grande es
p0 P
P( p p0 ) = P Z
p
Cuando n no es tan grande, pueden obtenerse aproximaciones normales muy satisfac1
torias, introduciendo un factor de correccin de continuidad dada por
. La funcin de
2n
distribucin de p para este caso ser
1
P
p0 2n
P( p p0 ) = P Z
p
Ejemplo 8.4.4 De un total de 1000 muestras de 200 nios cada uno, en cuanto cabe esperar que
a) menos del 40 % sean nios?
b) entre el 40 % y el 60 % sean nias
c) el 53 % o ms sean nias
Desarrollo
Segn las especificaciones de este problema tenemos 1000 muestras, cada una de tamao
n = 200. Como la poblacin del cual provienen las muestras est constituido por dos caracteres: nio y nia, con lo cual se tiene
1
1
= 0, 5 y P(nia) = = 0, 5
2
2
Para responder a los tres incisos calculemos primeramente p ; que ser el mismo para
los tres incisos ya que los dos acontecimientos involucrados tienen las misma probabilidad
de ocurrencia. Por lo tanto
r
r
P(1 P)
(0, 5)(0, 5)
=
= 0, 0354
p =
n
200
P(nio) =
1
; que se le suma o se le resta a
Adems se tendr en cuenta el factor de correccin
2n
los lmites en los clculos de acuerdo a si se quiere que influya o no las probabilidades de
ocurrencia de tales valores lmites. Esta consideracin lo hacemos debido a que n = 200 no
es tan grande.
168
a) La probabilidad de que menos del 40 % sean nios esta dada por

!
1
0, 40 2(200)
0, 5
P(pnio < 0, 40) = P Z <
= P(Z < 2, 90) = 0, 5 A(2, 90)
0, 0354
Se rest el factor de correccin al lmite superior 0,4 debido a que pnio < 0, 4. Esta
resta garantiza que la probabilidad de ocurrencia de este valor extremo no forme parte
del resultado final. Luego en la tabla de Z se observa que A(2, 90) = A(2, 90) =
0, 4981, con lo cual
P(pnio < 0, 40) = 0, 5 0, 4981 = 0, 0019
Finalmente (1000)(0, 0019) = 1, 9. Por lo que en aproximadamente 2 muestras cabe
esperar que menos del 40 % sean nios.
b) La probabilidad de que entre el 40 % y 60 % sean nias esta dada por
!
1
1
0, 40 + 2(200)
0, 5
0, 60 2(200)
0, 5
P(0, 4 < pnia < 0, 6) = P
<Z<
0, 0354
0, 0354
= P(2, 75 < Z < 2, 75) = A(2, 75) + A(2, 75) = 2A(2, 75)
El factor de correccin se le sum al lmite inferior 0,4 y se le rest al superior 0,6;

debido a que 0, 4 < pnia < 0, 6. Esta suma y resta se hizo para garantizar que la
169
probabilidad de ocurrencia de estos valores extremos no formen parte del resultado

final. Luego en la tabla de Z se observa que A(2, 75) = 0, 4970, con lo cual
P(0, 4 < pnia < 0, 60) = 2(0, 4970) = 0, 994
Entonces (1000)(0, 994) = 994. Lo que significa que con 994 muestras cabe esperar
que entre 40 % y 60 % sean inas.
c) La probabilidad de que 53 % o ms sean nias est dada por
!
1
0, 53 2(200)
0, 5
P(pnia 0, 53) = P Z
= P(Z 0, 78) = 0, 5 A(0, 78)
0, 0354
Se rest el factor de correccin al lmite inferior 0,53 debido a que pnia 0, 53. Esta
resta garantiza que la probabilidad de ocurrencia de este valor extremo forme parte del
resultado final. Luego en la tabla de Z se observa que A(0, 78) = 0, 2823, con lo cual
P(pnia 0, 53) = 0, 5 0, 0, 2823 = 0, 2177
Con lo cual (1000)(0, 2177) = 217, 7. Por lo que en aproximadamente 218 muestras
cabe esperar que 53 % o ms sean nias.
8.4.6.
Distribucin Muestral de Sumas y de Diferencias de medias
Sean dos poblaciones normalmente distribuidas con medias X y Y , adems de varianzas

y Y2 respectivamente. De la poblacin uno se extraen todas las posibles muestras de
tamao n1 , y de la poblacin dos todas las posibles muestras de tamao n2 , con el fin de
obtener M muestras de cada poblacin. Si de cada muestra n1 se extrae su media X y de
cada muestra n2 se extrae su media Y y se relacionan de tal forma que establescan sumas
o diferencias (X + Y X Y ) se tendr una variable aleatoria formada por el conjunto de
dichas sumas diferencias.
2X
Proposicin 8.4.4 Sean X e Y dos variables aleatorias independientes y normalmente distribuidas con medias X y Y , adems de varianzas 2X y Y2 respectivamente. Si todos los
posibles pares de muestras se extraen de estas poblaciones, tanto la suma como la diferencia
entre las medias muestrales estarn normalmente distribuidas con medias X+Y = X + Y
y XY = X Y respectivamente, y adems las varianzas de estas dos distribuciones sern
2
iguales, esto es X+Y
= 2XY = X2 + Y2 .
170
Demostracin
Recordemos primeramente que por la proposicin 8.4.1 la media de toda distribucin
muestral de medias coincide con la media de la poblacin del cual se extraen las muestras.
Entonces la media de la distribuciones muestral de sumas y la media de la distribucin muestral de diferencias sern respectivamente
E(X +Y ) = E(X) + E(Y ) = X + Y
E(X Y ) = E(X) E(Y ) = X Y
Como las variables aleatorias X e Y son independientes se tendr que tambin X e cY ,
con c 6= 0 sern independientes entonces
Var(X +Y ) = Var(X) +Var(Y ) = 2X + Y2
Var(X Y ) = Var[X + (Y )] = Var(X) +Var(Y ) = Var(X) +Var(Y ) = X2 + Y2
Observacin: Si las poblaciones son infinitas o los muestreos son sin reemplazamiento
entonces
2 2
2X+Y = 2XY = X + Y
nX nY
de lo contrario si almenos uno de ellos por ejemplo la poblacin 1 es finita o el muestreo fue
hecho sin reemplazamiento se tiene
2X2 =
2X NX nX
nX NX 1
donde nX y NX son el tamao de la muestra y de la poblacin uno respectivamente.

Cuando las muestras n1 y n2 son de gran tamao, esto es n1 + n2 2 30, la distribucin
muestral de sumas de medias por aplicacin del teorema central del lmite se aproxima a una
distribucin normal con media X+Y = X + Y y varinaza 2X+Y = 2X + Y2 . Por lo tanto la
variable aleatoria
(X +Y ) X+Y
Z=
N(0, 1)
X+Y
Bajo estas mismas condiciones la distribucin muestral de diferencias de medias tambin
se aproxima a una distribucin normal con media XY = X Y y varinaza 2XY = 2X +Y2
y la variable aleatoria.
(X Y ) XY
Z=
N(0, 1)
XY
Ejemplo 8.4.5 Los acumuladores del automvil de manufactura XY tienen una duracin
promedio de 360 das con una desviacin estndar de 45 das, y los de manufactura ZW
duran en promedio 300 das con una desviacin estndar de 30 das. Si se prueban muestras
al azar de 50 acumuladores de cada marca.
a) Halllar la probabilidad de que los de la marca XY tenga una duracin promedio de a lo
ms 40 das sobre los de la marca ZW.
171
b) Halllar la probabilidad de que la suma de los promedios de los dos grupos sea mayor
que 670 das.
Desarrollo
Si nombramos por X a los acumuladores del automvil de manufactura XY y por Y a los
acumuladores del automvil de manufactura ZW tendremos: X = 360 das, X = 45 das,
nX = 50, Y = 300 das, Y = 30 das y nY = 50.
a) La probabilidad de que los acumuladores de la marca XY tenga una duracin promedio de a lo ms 40 das sobre los de la marca ZW, se puede calcular estableciendo una
distribucin muestral de diferencias de medias sobre las dos poblaciones de acumuladores. Adems n1 + n2 2 = 50 + 50 2 = 98, con lo cual
!
(X Y ) (X Y )
q
P(X Y + 40) = P(X Y 40) = P Z
2X + Y2
entonces se tiene que
40 (360 300)
P(X Y 40) = P Z q
452
302
50 + 50
!
= P(Z 2, 61) = 0, 5 A(2, 61)
Buscando en la tabla Z: A(2, 61) = A(2, 61) = 0, 4955, con lo cual

P(X Y 40) = 0, 5 0, 4955 = 0, 0045
b) La probabilidad de que suma de los promedios de los acumuladores tenga una duracin
mayor de 670 das, se puede calcular estableciendo una distribucin muestral de sumas
de medias sobre las dos poblaciones de acumuladores para automviles. Adems se
tiene que n1 + n2 2 = 50 + 50 2 = 98, con lo cual
!
(X +Y ) (X + Y )
q
P(X +Y > 670) = P Z >
2X + Y2
172
entonces se tiene que
670 (360 + 300)

q
P(X +Y > 670) = P Z >
452
302
50 + 50
!
= P(Z > 1, 31) = 0, 5 A(1, 31)
Buscando en la tabla Z: A(1, 31) = 0, 4049, con lo cual

P(X +Y > 670) = 0, 5 0, 4049 = 0, 0951
A continuacin se analizar que ocurre cuando de las poblaciones se extraen pequeas
muestras (cuando n1 + n2 2 < 30), y adems las varianzas poblacionales son desconocidas.
Para ello consideremos las siguientes variables aleatorias con sus distribuciones asociadas
(X Y ) XY
n1 S 2
n2 SY2
N(0, 1); 2 X 2 (n1 1) y
2 (n2 1)
2
XY
X
Y
Por la proposicin 7.2.4
n1 SX2 n2 SY2
+ 2 2 (n1 + n2 2); entonces
2X
Y
(X Y ) XY
XY
T=v
t(n1 + n2 2)
u
u n1 SX2 n2 SY2
u 2 + 2
t X
Y
n1 + n2 2
Si se asume que las varianzas poblacionales son iguales; esto es 2X = Y2 = 2 ; se tendr
las siguientes relaciones
s
r
1
2 2
1
+
=
+
XY =
n1 n2
n1 n2
v
u
u n1 SX2 n2 SY2
s
u 2 + 2
t X
Y
1 n1 SX2 + n2 SY2
=
n1 + n2 2
n1 + n2 2
173
Entonces se tendr que

(X Y ) XY
r
1
1
+
(X Y ) XY
(X Y ) XY
n
n2
r
=
T= s 1
=s
r
1
1
2
2
2
2
1
n1 SX + n2 SY
1
1 n1 SX + n2 SY
Sp
+
+
n1 n2
n1 + n2 2 n1 n2
n1 + n2 2
s
n1 SX2 + n2 SY2
donde SP =
recibe el nombre de varianza combinada de las muestras.
n1 + n2 2
Como se puede observar tanto T como su distribucin no dependen de las varianzas
poblaciones. Esto es caracterstico de las distribuciones t.
8.4.7.
Distribucin Muestral de Relaciones de Varianzas
8.4.8.
Distribucin Muestral de Diferencias de Proporciones
Sean dos poblaciones con distribuciones de Bernoulli, tal que la primera tiene parmetro
P1 y la segunda parmetro P2 . De la poblacin uno se extraen muestras aleatorias de tamao
n1 , y de la poblacin dos muestras de tamao n2 . Sean las proporciones muestrales
p1 =
X
Y
y p2 =
n1
n1
donde X es la v.a. que indica el nmero de unidades de la muestra n1 que posee cierto rasgo y
Y la v.a. que indica el nmero de unidades en la muestra n2 que posee tambin un cierto rasgo.
Si las proporciones muestrales se relacionan a pares de tal forma que establescan diferencias
( p1 p2 ); se tendr una nueva v.a. formada por el conjunto de dichas diferencias.
Si X e Y son independientes la distribucin muestral de diferencias de proporciones estarn dadas respectivamente por
p1 p2 = E( p1 p2 ) = E( p1 ) E( p2 ) = p1 p2
2p1 p2 = Var( p1 p2 ) = Var( p1 ) +Var( p2 ) = 2p1 + 2p2
Si las poblaciones son infinitas o el muestreo en cada poblacin se realiza con sustitucin
la distribucin muestral de proporciones en cada poblacin seguir una ley bimonial y se
tendr que
p1 p2 = P1 P2
P1 (1 P1 ) P2 (1 P2 )
+
n1
n2
Por el contrario si almenos una de las poblaciones es finita o el muestreo en l se realiza
sin reemplazamiento, la distribucin muestral de proporciones obtenida obedecer a la ley
hipergeomtrica y se tendr que
2p1 p2 =
2p1 =
P2 (1 P2 ) N2 n2
P1 (1 P1 ) N1 n1
2p2 =
n1
N1 1
n2
N2 1
8.5. PROBLEMAS
174
donde N1 es el tamao de la poblacin uno y N2 el tamao de la poblacin dos.

Si las muestras son lo suficientemente grandes, por aplicacin del teorema central del
lmite, la distribucin muestral de diferencias de proporciones se apoximar a la normal con
media p1 p2 y varianza 2p1 p2 .
Ejemplo 8.4.6 Un colegio de artes liberales tiene 100 profesores, 60 de los cuales tienen el
doctorado. Dos muestras con n1 = n2 = 30, son extradas independientemente de este grupo
de profesores, con reposicin, y se anotan los nmeros de los que tienen el doctorado. Hallar
la probabilidad de que las dos muestras difieran en 8 ms en el nmero con doctorado.
Desarrollo
Segn el problema el tamao de la poblacin es de 100 profesores, de las cuales 60 tienen
doctorado y 40 no, con lo cual la proporcin de profesores con doctorado es P = 0, 6 y la de
su opuesto es 1 P = 0, 4. El rasgo a estudiar en cada muestra es tiene doctorado.
X
Y
y p2 = ; donde X representa el nmero de profesores con doctorado
n1
n2
en la muestra n1 y Y nmero de profesores con doctorado en la muestra n2 . Adems como
los muestreos fueron hechos de la misma poblacin y con sustitucin, se tiene
Se define p1 =
p1 p2 = P1 P2 = 0, 6 0, 6 = 0
s
p1 p2 =
P1 (1 P1 ) P2 (1 P2 )
+
=
n1
n2
(0, 6)(0, 4) (0, 6)(0, 4)

+
= 0, 1265
30
30
Entonces la probabilidad de que las dos muestras difieran en 8 ms en el nmero de

profesores con doctorado est dada por
X Y
0, 2667
8
= P( p1 p2 0, 2667) = P Z
P(X Y 8) = P
30
30
0, 1265
= P(Z 2, 11) = 0, 5 A(2, 11)
Finalmente la probabilidada pedida es P(X Y 8) = 0, 5 0, 4826 = 0, 0174.
8.5.
Problemas
Captulo 9
Estimacin
9.1.
Introduccin
El objetivo ms importante de la Estadstica es obtener una inferencia con respecto a

la poblacin basndose en la informacin contenida en una muestra. Como las poblaciones
se describen mediante medidas numricas denominadas parmetros, el objetivo de la mayora de las investigaciones estadsticas es deducir una inferencia con respecto a uno o ms
parmetros de la poblacin. Los parmetros poblacionales pertenecen a ciertos conjuntos de
valores denominados espacios parmetricos.
Un problema de inferencia estadstica o, ms simplemente, un problema de estadstica es
un problema en el cual se han de analizar datos que han sido generados de acuerdo con una
distribucin de probabilidad desconocida y en el que se debe realizar algn tipo de inferencia
acerca de tal distribucin. En otras palabras, en un problema de estadstica existen dos o ms
distribuciones de probabilidad que podran haber generado algunos datos experimentales.
En la mayoria de los problemas reales, existe un nmero infinito de distribuciones posibles
distintas que podran haber generado los datos. Analizando los datos, se intenta conocer la
distribucin desconocida para realizar inferencias acerca de ciertas propiedades de la distribucin y determinar la verosimilitud relativa que cada distribucin posible tiene de ser la
correcta.
Los problemas que se tratan en la inferencia estadstica se dividen generalmente en dos
clases: los problemas de estimacin y los de prueba de hiptesis.
El procedimiento mediante el cual; a partir del conocimiento de las caractersticas de la
muestra que llamaremos estimadores; inferimos las caractersticas de la poblacin se llama
estimacin, que a su vez se divide en estimacin puntual y estimacin por intervalos.
9.2.
Estimadores y sus propiedades
Definicin 9.2.1 Sea X una v.a. con una distribucin de probabilidad que depende de un
parmetro desconocido perteneciente a un espacio parmetrico . Sea X1 , X2 , . . . , Xn una
muestra aleatoria de X. Adems sean x1 , x2 , . . . , xn los valores muestrales correspondientes.
Si g(X1 , X2 , . . . , Xn ) es una funcin de la muestra que va a ser usada para estimarle a , nos
referimos a g como un estimador de .
175
9.2. ESTIMADORES Y SUS PROPIEDADES
176
El valor que toma g, es decir g(x1 , x2 , . . . , xn ) ser mencionado como una estimacin de
y habitualmente es escrito como: = g(x1 , x2 , . . . , xn )
9.2.1.
Propiedades de un buen estimador
Insesgado
Se dice que un estimador para un parmetro poblacional es insesgado si su valor esperado es igual al verdadero valor del parmetro poblacional. Esto es; si es el estimador
y es el parmetro entonces:
=
E()
X
un estimacin del parmetro P; donde X es una v.a. binon
mial con parmetros P y n. Probar que p es un estimador insesgado de P.
Ejemplo 9.2.1 Sea p =
Desarrollo
Recordemos que si X bin(P, n) tendremos que E(X) = nP. Entonces
X 1
1
E( p)
=E
= E(X) = nP = P
n
n
n
por lo que p es un estimador insesgado de P.
Eficiente
La eficiencia se refiere al tamao de la varianza del estadstico. Si comparamos dos
estadsticos; 1 y 2 ambos insesgados con varianzas Var( 1 ) y Var( 2 ) respectivamente; y tratamos de decidir cual de ellos es un estimador ms eficiente, escogeramos
al que tuviese la menor varianza, es decir se preferir a 1 si Var( 1 ) < Var( 2 ). El
estadstico eficiente recibe el nombre estadstico estimador insesgado de varianza
mnima.
Ejemplo 9.2.2 Sea una poblacin con media y varianza 2 . La distribucin mues2
y la distral de medias tiene media dada por E(X) = y varianza Var(X) =
n
tribucin muestral de medianas tiene tambin media E(Xmediana ) = , pero varianza
2
Var(Xmediana ) =
. Vemos que X y Xmediana son estimadores insesgados del parmetro
2n
y adems Var(X) < Var(Xmediana ), por lo que X es un estimador eficiente de .
Eficiencia relativa
Tambin se pueden comparar dos estimadores en base a su eficiencia relativa. Sean 1 y
2 dos estimadores diferentes del parmetro . La eficiencia relativa de 2 , comparada
con 1 , se define por la rezn:
E( 1 )2
(9.2.1)
R=
E( 2 )2
177
Si R > 1, 2 ser relativamente ms eficiente que 1 .

Si R < 1, 1 ser relativamente ms eficiente que 2 .
En la ecuacin anterior E( i )2 , para i = 1, 2 se llama error cuadrtico medio y
pueden escribirse como
E( i )2 = Var( i ) + [ E( i )]2
donde E( i ) se llama sesgo del estimador y puede ser positivo, negativo cero. Si
es cero el estimador ser insesgado.
Si 1 y 2 son insesgados, la eficiencia relativa no es ms que el cociente de sus varianzar.
Var( 1 )
R=
(9.2.2)
Var( 2 )
Consistente convergente
Un estadstico es un estimador consistente de un parmetro poblacional, si a medida
que aumenta el tamao de la muestra se tiene casi la certeza de que el valor del estadstico se aproxima bastante al valor del parmetro de la poblacin. Entonces, es un
estimador consistente del parmetro si, para cualquier nmero > 0, la probabilidad
de que la diferencia entre el estimador y el parmetro sea menor que tienda a la
unidad cuando el tamao de la poblacin (n) tiende al infinito. Es decir:
P(| | < ) 1
cuando
Proposicin 9.2.1 Sea una estimacin del parmetro basada en una muestra de
= , y si lm Var()
= 0; entonces es una estimacin convertamao n; si lm E()
gente de .
Ejemplo 9.2.3 La media muestral es un estimador convergente o consistente del parmetro

, ya que
2
lm E(X) = lm = y lm Var(X) = lm
=0
n
n
n
n n
Suficiente
Definicin 9.2.2 Consideremos una muestra aleatoria X1 , X2 , . . . , Xn tomada de una
poblacin con distribucin f (x|) y sean Y1 ,Y2 , . . . ,Yn estadisticos muestrales. Un estadstico Y1 = Y1 (X1 , X2 , . . . , Xn ) se denomina suficiente si la distribucin condicional
f (y2 , y3 , . . . , yn |y1 , ) = f (y2 , y3 , . . . , yn |y1 ).
La definicin anterior nos dice que un estimador es suficiente si utiliza una cantidad
de la informacin contenida de la muestra y adems ningn otro estimador podra
extraer informacin adicional de la muestra sobre el parmetro de la poblacin que
se est estimando que no sea ya suministrada por .
178
Criterio de Fisher-Neyman
Un estadstico Y1 = Y1 (X1 , X2 , . . . , Xn ) es suficiente, si y slo si:
n
f (x1 , x2 , . . . , xn |) = f (xi |) = f (y1 |)h(x1 , x2 , . . . , xn )

i=1
donde h no contiene a .
Ejemplo 9.2.4 Sea X1 , X2 , . . . , Xn una muestra aleatoria tomada de una distribucin
Bernoulli con parmetro 0 < p < 1. Verificar que el estadstico Y1 = X1 + X2 + + Xn
es suficiente.
Como la poblacin tiene distribucin Bernoulli con parmetro 0 < p < 1, la distribucin conjunta de X1 , X2 , . . . , Xn est dada por
n
f (x1 , x2 , . . . , xn |p) = f (xi |p) =

i=1
i=1
pxi (1 p)1xi
xi
pi=1
(1 xi)
(1 p)i=1
Como el estadstico Y1 est dada por la relacin Y1 = X1 + X2 + + Xn entonces tiene

distribucin binomial con parmetro p esto es
f (y1 |p) =
n!
py1 (1 p)ny1
y1 !(n y1 )!
donde y1 = xi .
i=1
De las dos relaciones anteriores tendremos que

f (x1 , x2 , . . . , xn |p) = f (y1 |p)
y1 !(n y1 )!
n!
n
con lo cual segn el criterio de Fisher-Neyman Y1 = Xi es un estimador suficiente.

i=1
Invariante
Un estimador de un parmetro se dice invariante, respecto a una clase de transfor es un estimador de g() con propiedades anlogas a .
macin g, si g()
Ejemplo 9.2.5 Consideremos una distribucin normal con media y varianza 2 .
2
Sean X un estimador de y X un estimador de 2 .
Como la distribucin muestral de medias tiene media E(X) = tenemos que X es un
2
y por una
estimador insesgado de , adems la varianza viene dada por Var(X) =
n
de las propiedades de varianza
2
2
2
= E(X ) [E(X)]2 = E(X ) 2
n
9.3. ESTIMACIN PUNTUAL
179
2
2
+ 2 . Entonces X no es un estimador insesgado de 2 , con lo
n
cual X no es un estimador invariante de .
2
con los cual E(X ) =
9.3.
Estimacin Puntual
El objetivo de la estimacin puntual es obtener valores puntuales aproximados de los

parmetros poblacionales. Consiste en considerar que el parmetro poblacional es aproximadamente igual al estimador o valor puntual obtenido apartir de la informacin de la muestra.
Ejemplo 9.3.1 Los siguientes datos corresponden a una muestra aleatoria de las estaturas
de jugadores de baloncesto de una liga local. Vamos a realizar una estimacin puntual de la
estatura promedio de los jugadores de baloncesto de esta liga.
1,95
1,80
2,15
1,85
1,83 2,04
2,05 1,99
2,02
1,95
Se calcula la media aritmtica de la muestra de los 10 basquetbolistas:

X=
1 10
xi = 1, 96
10 i=1
Como es una estimacin puntual, se establece que la estatura promedio de los jugadores
de baloncesto de esta liga es aproximadamente igual a 1, 96 metros.Esto es = 1, 96.
Supongamos ahora que extraemos una muestra aleatoria de una poblacin con cierta distribucin de probabilidad y queremos estimar un cierto parmetro de est poblacin a traves
de la muestra tomada. Existen dos metodos de estimacin puntual de un parmetro poblacional:
Mtodo de mxima verosimilitud
Mtodo de los momentos
9.3.1.
Estimadores de maxima verosimilitud
Consideremos una distribucin de probabilidad concreta sobre la recta real que puede
ser representada por una funcin de probabilidad o una funcin de densidad de probabilidad
f . Recordemos que n variables aleatorias X1 , X2 , . . . , Xn constituyen una muestra aleatoria
de est distribucin si son independientes y estn idnticamente distribuidas, es decir que
cada Xi , i = 1, 2, . . . , n tiene funcin de probabilidad o funcin de densidad de probabilidad
dada por f . En otras palabras, las variables aleatorias X1 , X2 , . . . , Xn constituyen una muestra
aleatoria de la distribucin representada por f si su funcin de probabilidad o funcin de
densidad de probabilidad conjunta g para los puntos reales x1 , x2 , . . . , xn se especifica como
sigue:
g(x1 , x2 , . . . , xn ) = f (x1 ) f (x2 ) f (xn )
180
Considrese un problema de inferencia estadstica en el que se van a seleccionar observaciones de una distribucin cuya funcin de probabilidad o de densidad de probabilidad
es f (x|), donde es un parmetro desconocido. Se supone que el valor desconocido del
parmetro debe pertenecer a un espacio paramtrico . El problema de estimacin consiste en intentar determinar donde es probable que se encuentre el verdadero valor de en ,
partiendo de las observaciones de f (x|).
Funcin de verosimilitud
Si las variables aleatroias X1 , X2 , . . . , Xn constituyen una muestra aleatoria de una distribucin cuya funcin de probabilidad o de densidad de probabilidad es f (x|), entonces
la funcin de probabilidad o de densidad de probabilidad conjunta de las varables aleatorias
X1 , X2 , . . . , Xn , est dada por:
L(x1 , x2 , . . . , xn |) = f (x1 |) f (x2 |) f (xn |)
Cuando la funcin de probabilidad o de densidad de probabilidad conjunta L(x1 , x2 , . . . , xn |)
de las observaciones de una muestra aleatoria se considera como una funcin de para los
valores x1 , x2 , . . . , xn se llama funcin de verosimilitud.
Ejemplo 9.3.2 Supongamos que las variables aleatorias X1 , X2 , . . . , Xn constituyen una muestra aleatoria de una distribucin de Bernoulli con parmetro p desconocido (0 p 1).
Encontrar la funcin de verosimilitud.
Desarrollo
Como cada Xi ; i = 1, 2, . . . , n; tiene distribucin de Bernoulli entonces
x
si x = 0, 1
p i (1 p)1xi
f (x) =
0
en otro caso
por lo que la funcin de verosimilitud es
n
xi
(1 xi)
L(x1 , x2 , . . . , xn |p) = pxi (1 p)1xi = pi=1 (1 p)i=1

i=1
Pasos para obtener el estimador de verosimilitud

Tomar una muestra aleatoria de tamao n de la poblacin cuyo parmetro se desea
estimar.
Establecer la forma de la funcin de probabilidad o densidad de probabilidad de la
poblacin.
Obtener la funcin de verosimilitud a partir de la muestra.
Por ultimo el estimador de verosimilitud ser el valor de que maximiza al logaritmo
de la funcin de verosimilitud.
181
Ejemplo 9.3.3 Suponiendo que el tiempo para fallar T , de una componente tiene una distribucin exponencial con parmetro desconocido. Si se extrae una mustra aleatoria de
tamao n de esta poblacin, hallar el estimador de verosimilitud de .
Desarrollo
Como cada Ti , i = 1, 2, . . . , n tiene distribucin exponencial con prmetro por ser una
muestra aleatoria proveniente de una poblacin exponencial con dicho parmetro entonces
si ti > 0
eti
f (ti ) =
0
en otro caso
por lo que la funcin de verosimilitud es
n
ti
L(x1 , x2 , . . . , xn |p) = e
ti
i=1
= e
i=1
entonces el logaritmo de esta funcin esta dada por la siguiente relacin

n
log L(x1 , x2 , . . . , xn |p) = log e
ti
i=1
Aplicando propiedades de logaritmo teenmos

n
log L(x1 , x2 , . . . , xn |p) = nlog ti

i=1
Derivando parcialmente con respecto a la expresin anterior e igualando a cero se

obtiene la siguiente relacin
n
1
(log L(x1 , x2 , . . . , xn |p)) = n ti = 0
i=1
con lo cual
n
1
= n =
t
ti
i=1
1
Entonces el estimador verosimil de es = .
t
9.3.2.
Estimadores por el mtodo de los momentos
Recordemos que la definicin del r-simo momento alrededor del origen de una v.a. X
est dada por E(X r ).
Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin con funcin de probabilidad
o de densidad de probabilidad f (X|). El r-simo momento muestral alrededor del origen se
define por
1 n
mr = Xir
n i=1
9.4. ESTIMACIN POR INTERVALOS DE CONFIANZA
182
El mtodo de los momentos proporciona una alternativa razonable cuando no se puede

determinar los estimadores de mxima verosimilitud. Este mtodo consiste en igualar los
momentos apropiados de la distribucin de la poblacin, con los correspondientes momentos
muestrales para estimar un parmetro desconocido de la distribucin.
Sea f (x|1 , 2 , . . . , k ) una funcin de probabilidad o de densidad con k parmetros y
designemos por 1 , 2 , . . . , k ,los primeros k momentos alrededor del origen, es decir
si X es discreta
xt f (x|1, 2, . . . , k )
x
t =
Z
xt f (x|1 , 2 , . . . , k )dx
si X es continua
para t = 1, 2, . . . , k.
En general t ser funcin de los k parmetros. Sea ahora X1 , X2 , . . . , Xn una muestra
aleatoria de tamao n de f (x|1 , 2 , . . . , k ). A partir de esta muestra formamos los k primeros
momentos muestrales m1 , m2 , . . . , mn . Sean 1 , 2 , . . . , k las soluciones que resultan de las k
ecuaciones mt = t , para t = 1, 2, . . . , k. Las soluciones 1 , 2 , . . . , k constituyen los estimadores por el metodo de los momentos.
Ejemplo 9.3.4 Sea una poblacin normal con parmetros y 2 , ambas desconocidas. Sea
X1 , X2 , . . . , Xn una muestra aleatoria de tamao n de esta distribucin. Obtener por el metodo
de los momentos las estimaciones de y de 2 .
Desarrollo
Como la distribucin es normal entonces E(X) = y Var(X) = 2 . Adems recordemos
que Var(X) = E(X 2 ) [E(X)]2 , entonces E(X 2 ) = 2 + 2 . Por otro lado los momentos
1 n
1 n
muestrales se definen como m1 = Xi y m2 = Xi2 . Tomando en consideracin la
n i=1
n i=1
n
1
1 n
relacin mt = t temdremos que : = Xi = X y 2 + 2 = Xi2 , entonces
n i=1
n i=1
1 n
1 n
1 n 2
2
2
2 = Xi2 X =
X
nX
= (Xi X)2
i
n i=1
n i=1
n i=1
Entonces los estimadores por el mtodo de los momentos son
1 n
2
= X y = (Xi X)2
n i=1
9.4.
Estimacin por Intervalos de Confianza
La estimacin puntual no es muy conveniente, pues con el procedimiento de estimacin

de un parmetro a travs de un nico valor no se puede determinar el error de muestreo, ni la
precisin de la estimacin, ni la confianza que merece tal estimacin.
Hay otro mtodo para hacer una estimacin mucho ms precisa, la estimacin por intervalos de confianza. Este mtodo consiste en el procedimiento de encontrar un intervalo de
valores dentro del cual se espera que se encuentre un parmetro poblacional.
183
Definicin 9.4.1 Sea (0, 1). Un intervalo de confianza para un parmetro desconocido
de una distribucin de probabilidad es un intervalo aleatorio de la forma ( 1 , 2 ), en donde
1 y 2 son estadsticas muestrales tales que:
P( 1 < < 2 ) = 1
A las estadsticas 1 y 2 se les conoce como lmites inferior y superior, respectivamente,
del intervalo de confianza. A los nmeros y 1 se les conoce como nivel se significacin
y grado o nivel de confianza, respectivamente. En general, se toma el valor de cercano a 0
de tal forma que el grado de confianza, 1, es cercano a 1. Entonces el nivel de confianza es
la probabilidad de que el parmetro poblacional se encuentre dentro del intervalo encontrado.
Los niveles de confianza ms ampliamente usados son 0, 95 y 0, 99, sin embargo puede usarse
cualquier probabilidad cercana a 1.
Interpretacin de un intervalo de confianza
Segn la definicin anterior; podramos realizar la interpretacin de dos maneras distintas, que son:
el verdadero valor del parmetro desconocido se encuentre entre los valores 1 y 2
con un grado de confiabilidad de 1 ; o tambin
la probabilidad de que el verdadero valor del parmetro desconocido se encuentre
entre los valores 1 y 2 es igual a 1 .
Para entender mejor el concepto de intervalo de confianza vamos a suponer que seleccionamos 100 muestras de una poblacin y calculamos la media de las muestras e intervalos
de confianza del 95 % para cada muestra. Descubriremos que cerca de 95 de los 100 intervalos de confianza contienen la media poblacional.
Pasos para construir un intervalo de confianza
1. Establecer el nivel de confianza.
2. Determinar el valor de la variable aleatoria estndar.
3. Calcular los estadsticos de la muestra.
4. Calcular el error estndar.
5. Calcular el error mximo de estimacin.
6. Determinar los lmites del intervalo de confianza e interpretar.
9.4.1.
Intervalos de confianza para estimar la media de una poblacin
Para la estimacin de la media de una poblacin se deben tener en cuenta las siguientes
condiciones:
Tomar una muestra aleatoria de tamao n de la poblacin cuya media se quiere estimar.
El estadstico a utilizar es la media muestral X.
La distribucin muestral a considerar es la distribucin muestral de medias.
184
Intervalos de confianza para estimar la media de una poblacin con muestras grandes
Recordemos que si la muestra es lo suficientemente grande, esto es n 30, la distribucin muestral de medias por aplicacin del teorema central del lmite se aproxima a una
distribucin normal con media X = y varianza 2X . Entonces la v.a.
Z=
X X
N(0, 1)
X
Por lo tanto para encontrar el intervalo de confianza podramos establecer un nivel de

confianza de 1 , que sera la probabilidad de que Z se encuentre entre dos valores, esto es
X X
P(Z1 < Z < Z2 ) = P Z1 <
< Z2 = 1
X
Como la distribucin normal tipificada est centrada en el cero y es simtrica entonces

podramos establecer que Z1 = Z2 . Si Zc = Z2 y se despeja X en expresin
Z1 <
X X
< Z2
X
se tendr
X Zc X < X < X + Zc X
que generalmente se abrevia como
X Zc X
con lo cual el intervalo buscado para la media poblacional es
(X Zc X , X + Zc X )
Finalmente la expresin para el intervalo de confianza en trmino de probabilidad est
dada por la relacin
P(X Zc X < < X + Zc X ) = 1
2
2 N n
, de lo contrario 2X =
,
n
n N 1
donde N es el tamao de la poblacin. Si se desconoce el valor de la varianza poblacional 2 ,
se ha de utilizar la varianza muestral S2 para encontrar el intervalo.
Nota: Recordar que si la poblacin es infinita 2X =
185
Ejemplo 9.4.1 Los resultados siguientes representan las calificaciones de una muestra aleatoria de estudiantes en el primer examen de estadstica elemental. Elaborar un intervalo de
confianza del 95 % para estimar la media poblacional.
23
80
52
41
60
34
60
77
10
71
78
67
79
81
64
83
89
17
32
95
75
54
76
82
57
41
78
64
84
69
74
65
25
72
48
74
52
92
80
88
84
63
70
85
98
62
90
80
82
55
81
74
15
85
36
76
67
43
79
61
Desarrollo
1. El nivel de confianza ya est establecido como 95 %. Entonces 1 = 0, 95
2. Como se trata de estimar la media poblacional y n = 60 > 30, la variable aleatoria
estndar a utilizar es Z de la distribucin normal estndar. Como 1 es la probabilidad de que la media poblacional se encuentre dentro del intervalo buscado (centro de
la curva), es la probabilidad de que no se encuentre en el intervalo (extremos de la
curva), y cada extremo de la curva o cola corresponde al valor .

2
Como la distribucin normal estndar se tabula dos maneras: la primera utilizando la
funcin de distribucin (tabla 1) y la segunda integrando la funcin de densidad en
el intervalo que va de cero a cualquier valor positivo de Z (tabla 2). Como nosotros
utilizaremos la tabla 2, busquemos en dicha tabla el valor de Z que corresponde al rea
de 0, 5 , que resulta ser 1, 96.

2
3. Para estimar la media poblacional necesitamos calcular los estadsticos de la muestra
que son la media y la varianza muestral. Entonces la media muestral ser
X=
1 60
3929
Xi =
= 65, 483
60 i=1
60
En el caso de la varianza muestral se puede optar por S2 S2 , la eleccin es del investigador, pero generalmente se prefiere usar S2 ya que es un estimador insesgado de la
varianza poblacional 2 . Para fines comparativos calculemos los dos
S2 =
283635 3929 2
60 2
1 60 2
2
X
=
= 439, 183 y S2 =
S = 446, 627
X
i
60 i=1
60
60
60 1
4. Como no conocemos el tamao de la poblacin se asume que es infinita. Calculemos

ahora el error estndar utilizando la desviacin estndar muestral para las dos situa esto se hace debido a que no conocemos el valor de 2 . Por lo tanto
ciones (S y S),
S
S
X = = 2, 705 y X = = 2, 728
60
60
186
5. A continuacin se calcula el error mximo de estimacin denotado por E para las dos
situaciones, entonces
E = Zc X = (1, 96)(2, 705) = 5, 302 y E = Zc X = (1, 96)(2, 728) = 5, 347
6. Finalmente se calculan los lmites del intervalo de confianza de la siguiente manera:
Restando a la media de la muestra el error mximo de estimacin se obtiene el
lmite inferior.
Sumando a la media de la muestra el error mximo de estimacin se obtiene el
lmite superior.
Entonces si ulitizamos S como estimacin de , los lmites inferior y superior sern
respectivamente
X E = 60, 181 y X + E = 70, 785
por lo que el intervalo de confianza buscado ser (60, 181 ; 70, 785), es decir
P(60, 181 < < 70, 785) = 0, 95
Este resultado se interpreta de la siguiente manera: La calificacin media de los estudiantes en el primer examen de estadstica elemental, se encuentre entre 60,181 y
70,785 con un grado de confianza del 95 %.
los lmites inferior y superior sern respectivamente
Si por el contrario utilizamos S,
X E = 60, 136 y X + E = 70, 83
por lo que el intervalo de confianza buscado ser (60, 136 ; 70, 83), es decir
P(60, 136 < < 70, 83) = 0, 95
Este resultado se interpreta de la siguiente manera: Hay una probabilidad de 0,95
de que la calificacin media de los estudiantes en el primer examen de estadstica
elemental, se encuentre entre 60,136 y 70,83.
Si comparamos los intervalos obtenidos vemos que hay muy poca diferencia, pero la
obtenida con S es un poco ms ancha y por lo tanto un poco ms fiable.
Intervalos de confianza para estimar la media de una poblacin con muestras pequeas
Si la muestra es de tamao menor que 30 y la varianza poblacional es desconocida, entonces para calcular el intervalo de confianza que contiene a la media poblacional se utiliza
la distribucin t de Student en vez de la distribucin normal. Luego se siguen los mismos
pasos de los intervalos de confianza para muestras grandes.
Tomando en consideracin que cuando se tienen muestras paqueas (n < 30) y la varianza
poblacional es desconocida, la distribucin muestral de medias puede ser relacionada con una
distribucin t de Studens. Por lo tanto la v.a.
(X X ) n 1
t(n 1)
T=
S
187
Como t al igual que Z, est centrada en el origen y es simtrica podemos reemplazar a Z

por T en el procedimiento anterior para encontrar un intervalo de confianza con un grado de
fiabilidad de 1 para la media poblacional , esto es
(X X ) n 1
P(tc < T < tc ) = P tc <
< tc = 1
S
Realizando un anlisis totalmente anlogo al caso de muestras grandes se tendr que

S
S
X tc
< < X + tc
n1
n1
con lo cual el intervalo buscado estar dada por
S
S
X tc
, X + tc
n1
n1
que se abrevia generalmente con la expresin

X tc
S
n1
Entonces la expresin para el intervalo de confianza en trmino de probabilidad ent dada

por
S
S
P X tc
< < X + tc
= 1
n1
n1
Ejemplo 9.4.2 Una muestra aleatoria de 12 secretarias que escriben a mquina arroj un
promedio 85,2 palabras por minuto con una desviacin estndar de 9,3 palabras por minuto. Encuentre un intervalo de confianza de 95 % para el nmero promedio de palabras por
minuto escritas por todas las secretarias.
Desarrollo
1. El nivel de confianza establecido es 1 = 0, 95.
2. Como la muestra es pequea (n = 12 < 30) y la varianza poblacional es desconocida
se procede a determina el valor de t, para lo cual antes se debe determinar los grados
de libertad, que estn dadas por n 1 = 12 1 = 11. El valor de t de la tabla de la
188
distribucin t corresponde al rea que se encuentra a la derecha del valor positivo de t

que buscamos, por lo tanto para los intervalos de confianza sera la mitad del valor del
nivel de significacin, esto es
t =
0, 05
=
= 0, 025
2
2
Se busca en la tabla t lo siguiente

n 1 = 11
/2 = 0, 025
2,201
con lo cual el valor buscado es tc = 2, 201.

3. Los estadsticos de la muestra son: X = 85, 2 y S = 9, 3
4. El error estndar estar dada por
S
9, 3
=
= 2, 804
n1
12 1
5. El error mximo de estimacin ser
S
= (2, 201)(2, 804) = 6, 172
E = tc
n1
6. Finalmente los lmites inferior y superior sern respectivamente
X E = 85, 2 6, 172 = 79, 028 y X + E = 85, 2 + 6, 172 = 91, 372
Por lo tanto el intervalo de confianza buscado es (79, 028 ; 91, 372), que en trmino de
probabilidades se expresa como
P(79, 028 < < 91, 372) = 0, 95
Este resultado se interpreta de la siguiente manera: Hay una probabilidad de 0,95 de
que el nmero promedio de palabras por minuto escritas por todas las secretarias, se
encuentre entre 79,028 y 91,372.
9.4.2.
Intervalos de confianza para la varianza y la desviacin tpica de

una poblacin.
Intervalos de confianza para la varianza

Para encontrar un intervalo de confianza con un cierto grado de fiabilidad 1 , para
todo 0 < < 1, que contenga a la varinaza poblacional 2 , si esta se desconocida, se puede
nS2
utilizar a la v. a. 2 , donde n es el tamao de muestra y S2 es la varianza muestral. Teniendo
en cuenta que esta v. a. se distribuye como una ji-cuadrada con n 1 grados de libertad,
puede seleccionarse dos valores de esta distribucin (2c y 2l ), tales que la probabilidad de
189
nS2
que 2 est entre estos dos valores sea igual al grado de fiabilidad propuesto, tal como lo
muestra la figura 9.1. Esto es
nS2
P 2c < 2 < 2l = 1
Figura 9.1: Grfica del proceso de eleccin de los valores 2c y 2l .

Tomando la expresin 2c <
nS2
< 2c y despejando en ella a 2 , se tendr
2
2l
2c
1
nS2
nS2
2
<
<
<
<
nS2 2 nS2
2c
2l
Entonces la probabilidad de que la varianza poblacional est entre los valores
estar dada por la relacin
nS2 nS2
y 2
c
2l
nS2
nS2
P 2 < 2 < 2 = 1
c
l
con lo cual el intervalo de confianza de 2 con un nivel de confianza de 1 estar dada por
nS2
2l
nS2
2c
Analizando la elaboracin de la tabla de la distribucin ji-cuadrada encontramos que si

X 2 (n) entonces P(X x) = p, donde p es el rea bajo la curva y va desde el valor cero a
un cierta valor x = 2[p ; ] , donde son los grados de libertad, tal como lo muestra la siguiente
figura
Por lo tanto analizando las figuras 9.1 y 9.2, tenemos que:
2l = 2[1
2
; n1]
y 2c = 2[
2
; n1]
190
Figura 9.2: Grfica de la distribucin acumulada de la 2 .

Intervalos de confianza para la desviacin tpica
De la expresin que se obtuvo para el estimdor por intervalos de confianza para la varianza de una poblacin, se puede encontrar un intervalo de confianza para la desviacin estndar.
Entonces de la expresin
nS2
nS
< 2 < 2
2
[1 ; n1]
[ ; n1]
2
se obtiene lo siguiente
[1 2
nS
<<
; n1]
nS
[ 2
; n1]
en trmino de probabilidades, esto es
nS
nS2
nS
nS
2
P 2
< < 2
=P
<<
= 1
[1 2 ; n1]
[ 2 ; n1]
[1 ; n1]
[ ; n1]
2
Por lo tanto el intervalo de confianza para est dada por
nS
nS
;
)
[1 2 ; n1] [ 2 ; n1]
Ejemplo 9.4.3 Las resistencias a la rotura, expresada en libras, de 5 ejemplares de cuerdas
estn dadas por los siguientes valores:
460
540
660
580
550
Estime los intervalos de confianza del 90 % para la varianza 2 y la desviacin estndar

de la poblacional.
Desarrollo
1. El nivel de confianza establecido es 1 = 0, 90, con lo cual = 0, 10.
2. Como se desea estimar a la varianza poblacional, la variable aleatoria a utilizar es 2 de
la distribucin ji-cuadrada. Como siguiente paso, se procede a determina los valores 2c
y 2l , para lo cual antes se debe determinar los grados de libertad que estn dadas por
191
n 1 = 5 1 = 4. El valor de p de la tabla de la distribucin ji-cuadrada corresponde

al rea que se encuentra a la izquierda del valor de 2 que se busca. Como
2l = 2[1
2
; n1]
= 2[0,95 ; 4] y 2c = 2[
2
; n1]
= 2[0,05 ; 4]
se busca en la tabla de la ji-cuadrada lo siguiente

gl = 4
p = 0, 05
0,7107
gl = 4
p = 0, 95
9,488
con lo cual los valores buscado son 2c = 0, 711 y 2l = 9, 488.

3. Los estadsticos de la muestra son: X = 558 y S2 = 4176
4. Los lmites inferior y superior del intervalo buscado son respectivamente
nS2 (5)(4176)
=
= 2200, 67
l
9, 488
nS2 (5)(4176)
=
= 29367, 09
c
0, 711
Con lo cual el intervalo buscado para la varianza es (2200, 67 ; 29367, 09), que en
trmino de probabilidades se expresa como
P(2200, 67 < 2 < 29367, 09) = 0, 90
de que el verdadero valor de la varianza de la poblacin de secretarias que escriben
palabras por minuto, se encuentre entre los valores 2200,67 y 29367,09.
Del resultado anterior, el intervalo de confianza del 90 % para la desvicin estndar
poblacional estar dada por
46, 91 < < 171, 37
Este resultado se interpreta de la misma manera que para el caso anterior, esto es,
sustituyendo la palabra varianza por la de desiviacin estndar.
9.4.3.
Intervalos de confianza para estimar Proporciones
Sea una poblacin con una distribucin Bernoulli cuyo parmetro P es desconocido y se
desea estimar estableciendo un intervalo de confianza con un cierto grado de fiabilidad. Para
esta finalidad se utilizarar la distribucin muestral de proporciones.
Recordemos que si el tamao de la muestra es lo suficientemente grande (n 30) por
aplicacin del teorema central del lmite la distribucin muestral de proporciones se aproxima
P(1 P)
. Por lo tanto la v.a.
a una distribucin normal con media p = P y varianza 2p =
n
Z=
p p
N(0, 1)
p
192
Si establecemos un nivel de confianza de 1 para la estimacin del intervalo de confianza para P y realizamos los mismos pasos hechos en el caso de medias con muestras grandes,
tendremos que
P( p Zc p < p < p + Zc p ) = 1
r
r
P(1 P)
p(1
p)
, en su lugar se utilizar a
.
Como no se conoce el valor p =
n
n
Entonces tendremos que
r
r
p(1
p)
p(1
p)

P p Zc
< P < p + Zc
= 1
n
n
Por lo que el intervalo buscado estar dada por
!
r
r
p(1
p)
p(1
p)
p Zc
; p + Zc
n
n
Ejemplo 9.4.4 Se pregunta a 2000 votantes cul ser la actitud respecto a una determinada
propuesta poltica; 800 se oponen. Suponiendo que la muestra fuese aleatoria y procedente de
una poblacin Bernoulli. Construya un intervalo de confianza para la proporcin de votantes
a favor de la propuesta poltica para un 95 % de confianza.
Desarrollo
1. El nivel de confianza fijado es 1 = 0, 95.
2. Como se trata de estimar una proporcin y adems n = 60 > 30, la variable aleatoria
estndar a utilizar es Z de la distribucin normal estndar. Como 1 = 0, 95, ya
vimos anteriormente que Zc = 1, 96.
3. Para realizar la estimacin de la proporcin P de votantes que estn a favor de la propX

uesta poltica bajo un intervalo necesitamos calcular el estadstico muestral p = ,
n
donde X es el nmero de votantes que estn a favor de la propuesta poltica, entonces
p =
r
p =
1200
= 0, 6
2000
0, 6(1 0, 4)
= 0, 01095
2000
193

E = Zc p = (1, 96)(0, 01095) = 0, 0215
6. Los lmites inferior y superior sern respectivamente
p E = 0, 6 0, 0215 = 0, 5785 y p + E = 0, 6 + 0, 0215 = 0, 6215
Por lo que el intervalo buscado es (0, 5785 ; 0, 6215), que en trminos de probabilidades se expresa como
P(0, 5785 < P < 0, 6215) = 0, 95
que la proporcin de votantes que estn a favor de la propuesta poltica, se encuentre
entre los valores 0,5785 y 0,6215.
9.4.4.
Intervalos de confianza para estimar Diferencias de Medias
Si tenemos dos poblaciones, de las cuales extraemos muestras de ciertos tamaos, hay
que tener en cuenta que se puede construir una distribucin muestral para la diferencia de las
medias muestrales. Si las medias poblaciones son desconocidas; en esta seccin se estimar
un intervalo de confianza para la diferencia de estas medias utilizando la distribucin muestral
de diferencias de medias.
Intervalos de confianza para Diferencias de Medias utilizando la distribucin normal
Si de la poblacin uno con media 1 desconocida y varianza 21 extraemos muestras de
tamao n1 , y de la poblacin dos con media 2 desconocida y varianza 22 extraemos muestras
de tamao n2 ; y tenemos que n1 + n2 2 30 por aplicacin del teorema central del lmite
la variable aleatoria
(X Y ) XY
N(0, 1)
Z=
XY
s
21 22
donde XY = 1 2 y XY =
+ .
n1 n2
Por lo tanto si la estimacin del intervalo de confianza ser hecho con un nivel de confianza de 1 y se sigue un razonamiento anlogo al hecho en el caso de una poblacin con
media desconocida; se tendr la siguiente relacin
(X Y ) XY
P Zc <
< Zc = 1
XY
que se transforma en
P[(X Y ) Zc XY < XY < (X Y ) + Zc XY ] = 1
Por lo que el intervalo de confianza para diferencias de medias est dada por
s
s
!
2
2
1 2
21 22
X Y Zc
+
; X Y + Zc
+
n1 n2
n1 n2
194
Observacin: Si n1 + n2 2 30 y se desconocen
las varianzass
poblaciones se utilizan
s
las varianzas muestrales; dicho de otro modo
S12 S22
+
en lugar de
n1 n2
21 22
+ .
n1 n2
Ejemplo 9.4.5 En un laboratorio, se experimenta con dos drogas que reducen el tiempo de
respuesta a cierto estmulo. Se administra a 35 ratas la droga 1 y a 30 la droga 2. La reduccin
del tiempo de reaccin al estmulo de cada rata fue registrada como sigue:
Reduccin del tiempo con la droga 1
28
31
33
23
20
30
22
34
32
35
30
33
36
34
43
26
28
27
23
29
28
33
33
29
38
27
26
21
24
24
27
15
28
19
27
Reduccin del tiempo con la droga 2

11
21
7
21
23
23
24
27
23
30
17
17
16
16
25
37
29
22
12
26
27
15
23
29
19
16
17
33
36
14
Encuentre un intervalo de confianza del 90 % para estimar la diferencia entre los tiempos
de respuesta promedio al estmulo de los grupos e interprete el resultado.
Desarrollo
El nivel de confianza ya establecido es 1 = 0, 90.
Como n1 + n2 2 = 35 + 30 2 = 63 > 30, la variable aleatoria a utilizar es Z de la
normal tipificada. Como 1 = 0, 90, buscando en la tabla de Z, encontraremos que
Zc = 1, 645.
Los estadsticos muestrales a utilizar son
X = 28, 457
S12 = 32, 3053
n1 = 35
Y = 21, 867
S22 = 51, 3156
n2 = 30
El error estandar de estimacin es

r
XY =
32, 3053 51, 3156

+
= 1, 623
35
30
El error mximo de estimacin estar dada por

E = (1, 645)(1, 623) = 2, 67
Los lmites inferior y superior sern respectivamente
X Y E = 28, 457 21, 867 2, 67 = 3, 92 y
X Y + E = 28, 457 21, 867 + 2, 67 = 9, 26
Por lo tanto el intervalo de confianza buscado es (3, 92 ; 9, 26), que en trmino de
probabilidades se expresa como
P(3, 92 < 1 2 < 9, 26) = 0, 90
Entonces hay una probabilidades de 0,90 de que la diferencia entre los tiempos de
respuesta promedio al estmulo de los grupos est entre 3,92 y 9,26.
195
Intervalos de confianza para Diferencias de Medias utilizando la distribucin t

Si las poblaciones tienen varianzas desconocidas y adems, de ellas se extraen muestras
cuyos tamaos cumplen con la condicin n1 + n2 2 < 30; suponiendo igualdad de varianzas poblacionales se puede utilizar la distribucin t de Student para establecer intervalos de
confianza para la diferencia de medias.
Si el grado de fiabilidad es igual a 1 y la varianza combinada de las muestras es define
n1 SX2 + n2 SY2
2
por S p =
; entonces
n1 + n2 2
!
(X Y ) XY
r
P tc <
< tc = 1
1
1
Sp
+
n1 n2
que con aplicaciones algebraicas se transforma en la relacin
!
r
r
1
1
1
1
P X Y tc S p
+ < 1 2 < X Y + tc S p
+
= 1
n1 n2
n1 n2
con lo cual; el intervalo de confianza buscado en estas condiciones est dada por la expresin
!
r
r
1
1
1
1
X Y tc S p
+
; X Y + tc S p
+
n1 n2
n1 n2
donde tc es el valor de t con n1 + n2 2 grados de libertad.
Ejemplo 9.4.6 Durante varios aos se han cultivado, en diversos lugares de un rea, dos
variedades de cebada y est en discusin su adaptacin. Cul se seleccionar para el rea,
basandose en las siguientes cosechas por hectrea?
Trebi
120,6
Svanota 115,4
56,5
90,2
133,2
130,3
187,1
147,9
186,9
120,3
129,4
77,6
155,2
104,5
Localice los lmites de confianza de la diferencia entre las medias con un grado de confianza
del 99 % e interprete el resultado.
Desarrollo
El nivel de confianza establecido es 1 = 0, 99
Como n1 + n2 2 = 7 + 7 2 = 12 < 30 y las varianzas poblacionales son desconocidas, la variable aleatoria estndar a usar es la t de la distribucin t de Student, que
en este caso tendr 12 grados de libertad. El valor de t de la tabla para este caso
corresponde al valor
0, 01
= 0, 005
t = =
2
2
Por lo que se busca en la tabla t lo siguiente
n1 + n2 2 = 12
con lo cual el valor buscado es tc = 3, 055.
/2 = 0, 005
3,055
196
Los estadisticos muestrales a utilizar son:

X = 138, 4143
SX2 = 1734, 09551
n1 = 7
Y = 112, 3143
SY2 = 488, 329796
n2 = 7
con lo cual la diferencia entre las medias y la varianza combinada de las muestras son
respectivamente
X Y = 138, 4143 112, 3143 = 26, 1
S2p
n1 SX2 + n2 SY2
7(1734, 09551) + 7(488, 329796)
=
=
= 1296, 4148
n1 + n2 2
7 + 7 12
El error estndar de estimacin est dada por

r
r
p
1
1
1 1
Sp
+ = 1296, 4148
+ = 19, 2459
n1 n2
7 7
El error mximo de estimacin es
r
1
1
+ = (3, 055)(19, 2459) = 58, 8
E = tc S p
n1 n2
Los lmites inferior y superior sern respectivamente
X Y E = 26, 1 58, 8 = 32, 7 y X Y + E = 26, 1 + 58, 8 = 84, 9
Por lo que el intervalo buscado es (32, 7 ; 84, 9), que en trminos de probabilidades
se expresa como
P(32, 7 < X Y < 84, 9) = 0, 99
que la diferencias entre los promedios de los dos tipos de cebadas, se encuentre entre
los valores -32,7 y 84,9.
9.4.5.
Intervalos de confianza para Relaciones de Varianzas
Sean dos muestras aleatorias independientes de tamaos m y n, con varianzas S12 y S22 , que
se extraen de dos poblaciones distribuidas normalmente con varianzas desconocidas 21 y 22
respectivamente. Con base a estas informacionesse puede
! estimar un intervalo de confianza
2
1
para la relacin de estas varianzas desconocidas
. Como primer paso para conseguirlo
22
se toma en cuenta las siguientes variables aleatorias con sus distribuciones asociadas
mS12
nS22
2
(m
1)
y
2 (n 1)
2
2
1
2
Suponiendo independencia entre estas variables aleatorias; entonces por lo ya visto anteriormente el cociente entre dos variables con distribuciones ji-cuadradas divididas por sus
197
grados de libertad correspondientes constituye una variable aleatoria con distribucin F de

Snedecor con m 1 y n 1 grados de libertad; esto es
mS12
(m1)21
nS22
(n1)22
F(m 1; n 1)
Por lo tanto si se establece un nivel de confianza de 1 , se tiene que
P F1 <
mS12
(m1)21
nS22
(n1)22
!
< F2
m(n 1)S12 22
< F2 = 1
= P F1 <
n(m 1)S22 21
que por medio de procedimientos algebricos se transforma en

1 m(n 1)S2 2
1 m(n 1)S12
1
1
P
<
<
= 1
F2 n(m 1)S22 22 F1 n(m 1)S22
Por conveniencia se podra tomar a F1 = F[ 2 ; m1 ; n1] y F2 = F[1 2

de tener en cuenta que
mS12
nS22
S12 =
y S22 =
m1
n1
la ultima expresin se transforma en
1
F[1 2
; m1 ; n1]
S12 21
<
<
S22 22 F[ 2
; m1 ; n1]
; m1 ; n1] ;
S12
= 1
S2
2
Finalmente el intervalo buscado est dado por
1
F[1 2
; m1 ; n1]
S12
;
S22 F[ 2
; m1 ; n1]
S12
S22
En la realizacin de los clculos resulta til recordar que

F[1 2
; m1 ; n1]
1
F[ 2
; n1 ; m1]
F[ 2
; m1 ; n1]
1
F[1 2
; n1 ; m1]
adems
198
Ejemplo 9.4.7 La poblacin A tiene una varianza de 3,4 segn se determin con una muestra de 21 elementos, mientras que la poblacin B tena una varianza de 5,2 segn se determin
por una muestra de 16 elementos. Determinar los lmites de confianza del
a) 90 %
b) 95 %
de la razn de las varianzas de las dos poblaciones.
Desarrollo
El nivel de confianza ya establecido es
a) 1 = 0, 90
b) 1 = 0, 95
Como se busca un intervalo de confianza para relaciones de varianzas, la variable
aleatoria estandar a usar es la F de la distribucin F de Snedecor, que en este caso
tendr m 1 = 21 1 = 20 y n 1 = 16 1 = 15 grados de libertad. El valor t de la
tabla corresponde al valor
0, 10
=
= 0, 05
2
2
0, 05
b) t = =
= 0, 025
2
2
a) t =
por lo que para cada caso se busca en la tabla F lo siguiente

a)
P(X x) = 0, 95
m = 20
n = 15
2,33
P(X x) = 0, 95
m = 15
n = 20
2,20
F[0,95 ; 20 ; 15] = 2, 33
y F[0,05 ; 20 ; 15] =
Con lo cual
b)
P(X x) = 0, 975
m = 20
n = 15
2,76
1
F[0,95 ; 15 ; 20]
1
= 0, 455
2, 20
P(X x) = 0, 975
m = 15
n = 20
2,57
Con lo cual
F[0,975 ; 20 ; 15] = 2, 76 y F[0,025 ; 20 ; 15] =
1
F[0,975 ; 15 ; 20]
Los estadsticos muestrales a utilizar en cada caso son

S12 =
m 2 21
S = (3, 4) = 3, 57
m 1 1 20
S22 =
n 2 16
S = (5, 2) = 5, 547
n 1 1 15
1
= 0, 39
2, 57
199
Los lmites inferior y superior para cada caso son respectivamente

a)
1
F[0,95 ; 20 ; 15]
1
F[0,05 ; 20 ; 15]
S12
1
3, 57
=
= 0, 2762
2
S2 2, 33 5, 547
S12
1
3, 57
=
= 1, 4145
2
S2 0, 455 5, 547
Por lo tanto el intervalo de confianza buscado es (0, 2762 ; 1, 4145); que en trmino probabilstico se expresa como
21
P 0, 2762 < 2 < 1, 4145 = 0, 90
2
b)
1
F[0,975 ; 20 ; 15]
1
F[0,05 ; 20 ; 15]
S12
1
3, 57
=
= 0, 2332
S22 2, 76 5, 547
S12
1
3, 57
=
= 1, 6502
S22 0, 39 5, 547
Por lo tanto el intervalo de confianza buscado es (0, 2332 ; 1, 6502); que en trmino probabilstico se expresa como
2
P 0, 2332 < 12 < 1, 6502 = 0, 95
2
9.4.6.
Intervalos de confianza para Diferencias de Proporciones
Sean dos muestras aleatorias de tamaos n1 y n2 que se extraen de dos poblaciones

Bernoulli con parmetros P1 y P2 respectivamente, sean adems las proporciones muestrales
p1 y p2 . Si se desconocen los valores de dichos parmetros, se podra estimar un intervalo
de confianza para la diferencia de proporciones utilizando la distribucin muestral de diferencias de proporciones. La estimacin de este intervalo se har en base a muestras grandes,
por lo que se aplicar una aproximacin a la distribucin normal. Entonces
donde p1 p2 = P1 P2
( p1 p2 ) p1 p2
N(0, 1)
p1 p2
y p1 p2 = p1 + p2 .
Por lo tanto si establece un nivel de confianza de 1 y se toman consideraciones anlogas al caso de diferencias de medias para el caso normal se tendr que
( p1 p2 ) p1 p2
P Zc <
< Zc = 1
p1 p2
que con procedimientos algebricos se tranforma en
P ( p1 p2 ) Zc p1 p2 < p1 p2 < ( p1 p2 ) + Zc p1 p2 = 1
200
Por lo que el intervalo de confianza buscado es
( p1 p2 ) Zc p1 p2 ; ( p1 p2 ) + Zc p1 p2
Recordemos que p1 p2 depende de los parmetros P1 y P2 , que en este caso son desconocidos, razn por la cual para su clculo se reemplaza a P1 por p1 y a P2 por p2 .
Ejemplo 9.4.8 De una cierta ciudad se extrae una muestra aleatoria de 100 personas y
se encuentra que 50 usan una cierta marca de jabn. De la misma ciudad se extrae otra
muestra de 100 personas y se encuentra que 20 usan una marca de jabn distinta a la primera.
Construya un intervalo de confianza del 95 % para la diferencia de proporciones de personas
que usan las respectivas marcas de jabn e interprete el resultado.
Desarrollo
1. El nivel de confianza fijado es 1 = 0, 95.
2. Como se trata de estimar diferencias de proporciones y adems las muestras son grandes,
la variable aleatoria estndar a utilizar es Z de la distribucin normal estndar. Como
1 = 0, 95, ya se vi que Zc = 1, 96.
3. Para realizar la estimacin de la diferencia entre las proporciones P1 y P2 de personas

que usan las respectivas marcas de jabones bajo un intervalo necesitamos calcular los
X
Y
estadsticos muestrales p1 =
y p2 = , donde X es el nmero de personas en
n1
n2
n1 que usan la primera marca de jabn e Y el nmero de personas en n2 que usan la
segunda marca de jabn, entonces
p1 =
50
= 0, 5 y
100
p2 =
20
= 0, 2
100

r
0, 5(1 0, 5) 0, 2(1 0, 2)
+
= 0, 06403
p1 p2 =
100
100
E = Zc p = (1, 96)(0, 06403) = 0, 1255
9.5. PROBLEMAS
201
6. Los lmites inferior y superior sern respectivamente

p1 p2 E = 0, 5 0, 2 0, 1255 = 0, 1745 y p + E = 0, 5 0, 2 + 0, 1255 = 0, 4255
Por lo que el intervalo buscado es (0, 1745 ; 0, 4255), que en trmino de probabilidad
se expresa como
P(0, 1755 < P1 P2 < 0, 4255) = 0, 95
de que la diferencia de proporciones de personas que usan las marcas de jabones, se
encuentre entre los valores 0,1755 y 0,4255.
9.5.
Problemas
Estimadores y sus propiedades
1. Sean 1 y 2 dos estimadores insesgados para el parmetro , y sea una constante.

Demuestre que = 1 + (1 ) 2 es tambin un estimador insesgado para .
2. Sea X1 , X2 , . . . , Xn una m.a. de una poblacin con media desconocida . Probar que la
estadstica X
a) es un estimador insesgado de la media problacional
b) es un estimador convergente o consistente de
3. Sea X1 , X2 , . . . , Xn una m.a. de una poblacin con media desconocida y varianza 2
desconocida. Probar que
a) S2 es un estimador sesgado pero ser un estimador consistente para 2
b) S2 es un estimador insesgado de 2
4. Sea X1 , X2 , . . . , Xn una m.a. de una poblacin con media conocida y varianza 2 desconocida. Demuestra que la siguiente estadstica es un estimador insesgado para 2 ,
2 =
1 n
(Xi )2
n i=1
5. Sea X1 , X2 , . . . , Xn una m.a. de una poblacin con media desconocida y varianza finita
2 desconocida. Demuestra que la siguiente estadstica es un estimador insesgado para
2 ,
n1
1
2 =
(Xi+1 Xi)2
2(n 1) i=1
6. Sea X1 , X2 , X3 , X4 una muestra aleatoria de una poblacin distribuida segn la ley una
ley de Poissn con parmetro . Considere los siguientes estadsticos para .
1 =
X1 + X2 + X3 + X4
4
X1 + 2X2 + 3X3 + 4X4

10
9.5. PROBLEMAS
202
Verifique la condicin de insesgamiento en ambos estadsticos y halla la eficiencia

relativa.
Estimacin Puntual
Mtodo de mxima verosimilitud
7. Supngase que X1 , X2 , . . . , Xn constituye una muestra aleatoria de tamao n de una
distribucin Bernoulli con parmetro P desconocido, pero se sabe que P pertenece al
intervalo abierto (0, 1).
a) Determinar el estimador de mxima verosimilitud de P, suponiendo que no todos
los valores observados son 0 o todos los valores observados son 1.
b) Probar que el estimador de mxima verosimilitud de P no existe si todo valor
observado es 0 o si todo valor observado es 1.
8. No se sabe que proporcin P de la compra de cierta marca de cereal es realizada por
mujeres y que proporcin es realizada por hombres. En una muestra de 70 compras
de este cereal, se encontr que 58 fueron realizadas por mujeres y 12 por hombres.
Determine el estimador de mxima verosimilitud para P.
9. Supngase que X1 , X2 , . . . , Xn constituye una muestra aleatoria de tamao n de una
distribucin normal con media desconocida y varianza 2 tambin desconocida. Determnense los estimadores de mxima verosimilitud para y 2 .
10. Supngase que X1 , X2 , . . . , Xn constituye una m.a. de una distribucin cuya funcin de
densidad de probabilidad f (x|) es la siguiente
1
si 0 < x < 1
x
f (x|) =
0
en otro caso
Adems, supngase que el valor de es desconocido ( > 0). Determnese el estimador
de mxima verosimilitud para .
11. Supngase que X1 , X2 , . . . , Xn constituye una m.a. de una distribucin cuya funcin de
densidad de probabilidad f (x|) es la siguiente
1
f (x|) = e|x|
2
para < x <
Adems, supngase que el valor de es desconocido ( < < ). Determnese el

estimador de mxima verosimilitud para .
12. Supngase que X1 , X2 , . . . , Xn constituye una m.a. de una distribucin uniforme sobre el
intervalo (1 , 2 ), donde 1 y 2 son desconocidos ( < 1 < 2 < ). Determnense
los estimadores de mxima verosimilitud para 1 y 2 .
13. Una poblacin tiene una funcin de densidad de probabilidad dada por
r
2 x2
f (x|) = 2
x e
para < x <
9.5. PROBLEMAS
203
Si se toman n observaciones de esta poblacin, hallar la estima de maxima verosimilitud de .

14. Supongase que , el tiempo para fallas (en horas) de un instrumento elctronico, tiene
la siguiente funcin de densidad de probabilidad
e(tt0 ) si t > t0 > 0

f (t|) =
0
en otro caso
Supngase que se prueban n artculos y que se anotan los tiempos de fallas t1 ,t2 , . . . ,tn .
suponiendo que t0 es conocido, obtener el estimador de maxima verosimilitud para .
15. Supngase que X1 , X2 , . . . , Xn constituye una m.a. de una distribucin de Poisson con
media desconocida ( > 0).
a) Determnese el estimador de mxima verosimilitud de , suponiendo que al menos
uno de los valores observados es distinto de cero.
b) Demestrese que el estimador de mxima verosimilitud de no existe si todo
valor observado es cero.
Mtodo de momentos
16. Dada una muestra aleatoria de tamao n de una poblacin uniforme en el intervalo
[0, a], use el mtodo de momentos para encontrar un estimador para el parmetro a.
17. Dada una muestra aleatoria de tamao n de una poblacin Poisson con parmetro desconocido > 0, use el mtodo de momentos para encontrar un estimador del parmetro
.
18. Dada una muestra aleatoria de tamao n de una poblacin exponencial con parmetro
desconocido > 0, use el mtodo de momentos para encontrar un estimador del parmetro
.
19. Dada una muestra aleatoria de tamao n de una poblacin con funcin de densidad de
probabilidad
si 0 < x <
f (x) =
0 otro caso
Estimar por el mtodo de los momentos.
probabilidad
(1 )x si 0 < x < 1
f (x) =
0
otro caso
9.5. PROBLEMAS
204
probabilidad
2 ( x) si 0 < x <
f (x) =
0
otro caso
Estimacin por intervalos

Para medias cuando 2 es conocida o la muestra es grande
22. Las estaturas en centmetros de una muestra aleatoria de 50 estudiantes universitarios
son:
180 160 174 172 186 171 169 179 175 175
178 184 167 170 174 175 182 188 176 169
183 171 164 179 162 175 166 174 175 177
183 171 184 182 159 171 175 179 160 175
176 178 180 167 170 161 167 169 184 176
Construya un intervalo de confianza de 98 % para estimar la media de todos los estudiantes de la universidad e interprete el resultado.
23. Los siguientes datos son el nmero de kilmetros al ao que es manejado el automvil
por una muestra de 25 propietarios de automviles:
26597
23873
23719
23471
22977
20700
22974
25048
26798
27147
29174
23815
16818
24352
20340
19405
29588
25620
19455
25566
32501
18091
22581
30104
29236
Construya un intervalo de confianza del 99 % para estimar el nmero promedio de

kilmetros al ao que es manejado un automvil e interprete el resultado.
24. Se toma una muestra aleatoria de 81 observaciones de una poblacin normal. La media
de la muestra es 40 y la desviacin estndar de la muestra es 5. Encuentre el intervalo
de confianza de 95 % para la media de la poblacin e inteprete el resultado.
25. Se toma una muestra aleatoria de 49 observaciones de una poblacin normal. La media
de la muestra es 55 y la desviacin estndar de la muestra es 10. Encuentre el intervalo
de confianza de 99 % para la media de la poblacin.
26. Una empresa de investigacin realiz una encuesta para determinar la cantidad media
que los fumadores continuos gastan en cigarrillos cada semana. Una muestra de 49
fumadores continuos revel que X = 20 dlares y S = 5 dlares.
a) Cul es la estimacin puntual de la media poblacional?. Explique que indica.
b) Utilizando un nivel de confianza de 95 %, determine el intervalo de confianza para
la media poblacional e interprete el resultado.
9.5. PROBLEMAS
205
27. Un profesor de ingles cont el nmero de palabras mal escritas en su ensayo que asign
hace poco a sus alumnos. Para una clase de 40 alumnos, el nmero medio de palabras
mal escritas fue de 6, 05 y la desviacin estndar fue de 2, 44. Construya un intervalo
de confianza de 95 % para el nmero medio de palabras mal escritas en la poblacin de
estudiantes e interprete el resultado.
28. Una empresa elctrica fabrica focos que tienen una duracin aproximadamente distribuida de forma normal con una desviacin estndar de 40 horas. Si una muestra de
30 focos tienen una duracin promedio de 780 horas. Encuentre un intervalo de confianza de 95 % para la media de la poblacin de todos los focos que producen esta
empresa e interprete el resultado.
29. A muchos pacientes con problemas cardiacos se les implant un marca pasos para controlar su ritmo cardiaco. Se monta un modulo conector de plstico sobre la parte superior del marca pasos. Suponga una desviacin estndar de 0,0015 y una distribucin
aproximadamente normal. Encuentre un intervalo de confianza de 95 % para la media
de todos los mdulos conectores que fabrica cierta compaa e interprete el resultado.
Una muestra aleatoria de 75 mdulos tiene un promedio de 0,310 pulgadas.
30. En un proceso qumico se fabrica cierto polmero. Normalmente se hacen mediciones
de la viscosidad despus de cada corrida, y la experiencia acumulada indica que la variabilidad en el paso es muy estable, con = 20. La siguiente son 15 mediciones de la
viscosidad por corrida: 724, 718, 776, 760, 745, 759, 795, 756, 742, 740, 761, 749, 739, 747
y 742. Encuentre un intervalo de confianza de 90 % para la viscosidad media de polmeros
e interprete el resultado.
31. Para una muestra de 50 empresas tomadas de una industria determinada, se encuentra
que el nmero promedio de empleados por empresas es de 420,5 con una desviacin
muestral de 55,7. Existe un total de 380 empresas en esa rama industrial. Encuentre
un intervalo de confianza de 95 % para media de la poblacin de los empleados por
empresa e interprete el resultado.
32. Una fabrica produce anillos para los pistones de un motor de automvil. Se sabe que
el dimetro del anillo esta distribuida aproximadamente en forma normal y que tiene
una desviacin estndar de 0, 001 mm. Una muestra aleatoria de 15 anillos tiene un
dimetro promedio de 74, 036 mm.
a) Construye un intervalo de confianza de 99 % para el dimetro promedio del anillo
e interprete el resultado.
b) Construya un limite inferior de confianza de 95 % para el dimetro promedio del
anillo e inteprete el resultado.
33. Se toma una muestra al azar de 45 alumnos, tomados sin reposicin de una clase de
estadstica de 221 alumnos que muestra una media de 70 puntos y una desviacin estndar de 9 puntos en las calificaciones finales. Compruebe que el intervalo de confianza
del 98 % para la media de las 221 calificaciones varia de 72, 8 a 97, 2 puntos.
34. La media y la desviacin tpica de las cargas mximas soportadas por 60 cables estn
dadas respectivamente por 11, 9 ton. y 0, 73 ton. Hallar los limites de confianza de:
9.5. PROBLEMAS
206
a) 95 %
b) 99 % para la media de las cargas mximas de todos los cables producidos por la
compaa e interprete los resultados.
35. La municipalidad necesita adquirir lamparitas elctricas en una fbrica. Se toma una
muestra de 100 lmparas con las cuales se hace que se mida el tiempo en que tardan
en quemarse. Los resultados son: media 2080 horas de vida y desviacin tpica de 300
horas. Hallar un intervalo de confianza para con un nivel de significacin de 1 % e
interprete el resultado.
36. Se desea estimar el precio promedio de cierto artculo de consumo. Para tal fin se
realiza una muestra en 101 comercios seleccionados al azar, que indica un precio medio
de 120 dlares, con una desviacin muestral de 16 dlares. Construir un intervalo de
confianza que con 95 % de seguridad contenga el parmetro poblacional e interprete el
resultado.
37. La estatura de 1000 estudiantes estn distribuidas aproximadamente de forma normal,
con una media de 174, 5 cm y una desviacin estndar de 6, 9 cm. Si se extraen 200
muestras aleatorias de tamao 25 de esta poblacin y las medidas se registran al dcimo
de centmetros ms cercanos. Determine:
a) La media y la desviacin estndar de la distribucin muestral de medias
b) Construya un intervalo de confianza de 90 % para la media de estaturas de esta
poblacin e interprete el resultado.
Para medias cuando 2 es desconocida y la muestra es pequea
38. las cantidades de pesetas, destinadas por un total de 15 familias a diversiones tales
como cine, teatro y otros espectculos pblicos durante un periodo de tiempo determinado fueron los siguientes:
134
143
146
136
144
146
137
144
147
138
145
148
138
146
153
Construya un intervalo de confianza de 90 % para la media de las cantidades de pesetas

destinadas por las familias de la poblacin para diversiones e interprete el resultado.
39. Se realizan 20 pruebas de resistencia de un cierto material obtenindose los siguientes
datos:
2225
2272
2300
2231
2217
2223
2190
2211
2295
2219
2285 2195
2231 2218
2255 2232
2262 2257
2252
2261
Construya un intervalo de confianza del 98 % para la resistencia media de este material

e interprete el tesultado.
40. Una empresa de investigacin realiz una encuesta para determinar la cantidad media
que los fumadores continuos gastan en cigarrillos cada semana. Una muestra de 25
fumadores continuos revel que X = 20 dlares y S = 5 dlares. Elabora un intervalo
de confianza del 99 % para la media poblacional e interprete el resultado.
9.5. PROBLEMAS
207
41. Un profesor de ingls cont el nmero de palabras mal escritas en un ensayo que asign
hace poco a sus alumnos. Para una clase de 24 alumnos, el nmero medio de palabras
mal escritas fue de 6,05 y la desviacin estndar fue de 2,44. Construya un intervalo
de confianza de 95 % para el nmero medio de palabras mal escritas en la poblacin de
estudiantes e interprete el resultado.
Captulo 10
Prueba de Hiptesis
10.1.
Introduccin
En el captulo 8 se inici el estudio de la inferencia estadstica. Se describi la manera

de seleccionar una muestra aleatoria y, con base a sta, estimar el valor de un parmetro
poblacional.
En este captulo se continuar con el estudio de la inferencia estadstica. Pero ya no se
realizarn estimaciones puntuales sobre el valor de un parmetro se establecer un intervalo
de valores dentro del cual se espera que se encuentre el parmetro poblacional, sino que se
realizar una prueba de hiptesis acerca de una afimacin sobre un parmetro poblacional.
10.2.
En esta seccin se definir y luego se describirn los pasos a seguir para la realizacin de
un contraste de hiptesis. Comenzaremos el estudio de esta parte de la inferencia estadstica
dando la definicin de hiptesis.
10.2.1.
Qu es una hiptesis?
Definicin 10.2.1 Hiptesis estadstica o simplemente hiptesis es una afirmacin o suposicin respecto al valor de un parmetro poblacional. Una vez hecha la afirmacin, se utilizan
los datos para verificar que tan razonable es dicha afirmacin.
Son ejemplos de hiptesis, o afirmaciones hechas sobre un parmetro poblacional las
siguientes:
El ingreso mensual promedio de todos los ciudadanos paraguayos es de 1.500.000
guaranies.
El 20 % de los delincuentes capturados son sentenciados a prisin.
El 90 % de las formas fiscales son llenadas correctamente.
Todas estas hiptesis tienen algo en comn, las poblaciones de inters son tan grandes
que no es factible estudiar todos sus elementos. Como ya sabemos, una alternativa a estudiar
208
209
la poblacin entera es tomar una muestra de la poblacin de inters. De esta manera podemos
probar una afirmacin para determinar si la evidencia soporta o no la afirmacin.
10.2.2.
Hipotesis nula y alternativa
En esta seccin se considerarn de nuevo los problemas estadsticos que involucran un

parmetro cuyo valor es desconocido, pero que debe pertenecer a un cierto espacio paramtrico . Si se puede descomponer en dos subconjuntos disjuntos 0 y 1 , entonces el investigador debe decidir si el valor desconocido de pertenece a 0 1 .
Se define H0 como la hiptesis de que 0 y H1 como la hiptesis de que 1 .
Puesto que los subconjuntos 0 y 1 son disjuntos y 0 1 = , exactamente una de las
hiptesis, H0 H1 , debe ser cierta. El investigador debe decidir si acepta la hiptesis H0
o acepta la hiptesis H1 . Un problema de este tipo, en el cual existen slo dos decisiones
posibles, se denomina un problema de contraste de hiptesis. Si el investigador toma un
adecisin errnea sufrir una cierta prdida o pagar un cierto costo. En muchos problemas,
el investigador podr analizar muestras aleatorias antes de tomar su decisin, y los valores
observados en las muestras le proporcionarn informacin acerca del valor de . Un procedimiento para decidir si aceptar la hiptesis H0 aceptar la hiptesis H1 se denomina
procedimiento de contraste o simplemente contraste.
En la mayora de los problemas las dos hiptesis, H0 y H1 , se tratan de manera totalmente
distinta. Para distinguir entre ellas, la hiptesis H0 se denomina hiptesis nula y la hiptesis
H1 se denomina hiptesis alternativa.
Definicin 10.2.2 La prueba de hiptesis es un procedimiento de contraste basado en una
evidencia muestral y en la teora de la probabilidad, usado para determinar si la hiptesis nula
H0 es una afirmacin razonable para no ser rechazada, o es una afirmacin poco razonable y
ser rechazada en favor de la hiptesis alternativa H1 .
10.2.3.
Dos tipos de errores
Cuando se toma la decisin de acptar o rechazar la hiptesis nula H0 en un procedimiento

de constraste se corre el riesgo de cometer errores. A continuacin se darn las definiciones
de los posibles errores que se pueden cometer en una prueba de hiptesis.
Definicin 10.2.3 Si en un procedimiento de contraste se rechaza la hiptesis nula cuando
sta es verdadera, entonces se dice que se comete un error tipo I, y la probabilidad de cometer
este primer tipo de error est dada por la relacin
= P(rechazar H0 | H0 es cierta)
En cambio, la aceptacin de la hiptesis nula cuando sta es falsa recibe el nombre de error
tipo II, y la probabilidad de cometer este segundo tipo de error est dada por la relacin
= P(aceptar H0 | H0 es f alsa)
Todas las decisiones posibles en un contrastes de hiptesis se resumen en la siguiente
tabla:
Rechazar H0
Aceptar H0
210
H0 cierta
H0 falsa
Error tipo I
Decisin correcta
con probabilidad
con probabilidad 1
Decisin correcta
Error tipo II
con probabilidad 1
con probabilidad
La informacin para obtener una regla de decisin que nos lleve a rechazar o no rechazar
un hiptesis estadstica provendr de una muestra aleatoria X1 , . . . , Xn de la distribucin de
que se trate. Observe adems que al aceptar una hiptesis no se afirma que sta sea absolutamente cierta, sino simplemente que es consistente con los datos de la muestra aleatoria. Si la
muestra cambia, posiblemente la decisin de rechazar o no rechazar tambin.
10.2.4.
Regin Crtica
Considrese un problema de contraste de hiptesis que tiene la siguiente forma:

H0 : 0
H1 : 1
Supngase que antes de que el investigador tenga que decidir que hiptesis aceptar, puede
observar una muestra aleatoria X1 , X2 , . . . , Xn seleccionada de una poblacin cuya distribucin
tiene un parmetro desconocido . Se definir a S como el espacio muestral de la n-upla
X = (X1 , X2 , . . . , Xn ). En otras palabras, S es el conjunto de todos los resultados posibles de
la muestra aleatoria.
En un problema de este tipo, el investigador especifica un procedimiento de contraste
dividiendo el espacio muestral S en dos subconjuntos disjuntos S0 y S1 . El subconjunto S0
contiene los valores de X para los cuales aceptar H0 y el otro subconjunto S1 contiene los
valores de X para los cuales rechazar H0 y, por lo tanto aceptar H1 .
Definicin 10.2.4 El subconjunto S1 del espacio muestral S para el cual H0 sera rechazada
se denomina regin crtica del contraste y a la probabilidad de cometer el error tipo I, esto
es , se le llama tamao de la regin crtica. A esta probabilidad se le conoce tambin con el
nombre de nivel de significancia.
En resumen, un procedimiento de contraste se determina especificando la regin crtica
del contraste. Por lo tanto, el espacio parmetrico queda dividido en dos subconjuntos
disjuntos:
A denominada zona de aceptacin y que contiene todos los resultados para para los
cuales H0 ser aceptada;
y R denominada zona de rechazo y que contiene todos los resultados para para los
cuales H0 ser rechazada.
10.2.5.
Funcin de Potencia
Las caractersticas de un procedimiento de constraste se pueden describir especificando,

para cada valor de , la probabilidad () de que el procedimiento conducir al rechazo
211
de H0 , o la probabilidad 1 () de que conducir a la aceptacin de H0 . La funcin ()

se denimina funcin de potencia del contraste. Por lo tanto, si C denota la regin crtica del
contraste, entonces la funcin de potencia () se determina por la relacin
() = P(X C|) para
Sea = 0 1 , donde 0 1 = 0/ y sean adems las hiptesis
H0 : 0
H1 : 1
Para esta prueba, si H0 es falsa, es decir 1 , la funcin de potencia se define como
() = P(Rechazar H0 |H0 es f alsa) = P( R| = i i 1 ) = 1
que constituye la probabilidad de evitar un error de tipo II. Por lo que la potencia de la prueba,
para cualquier valor en H1 , es la probabilidad de rechazar H0 , dado que H1 es cierta.
Por el contrario si H0 es cierta, la funcin de potencia es
() = P(Rechazar H0 |H0 es cierta) = P( R| = i i 0 ) =
que constituye la probabilidad de cometer el error de tipo I. Por lo que la potencia de la
prueba, para cualquier valor en H0 , es la probabilidad de rechazar H0 , dado que H0 es cierta.
Funcin de Potencia Ideal
Puesto que la funcin de potencia () especifica para cada valor posible del parmetro
la probabilidad de que H0 sea rechazada, resulta que la funcin de potencia ideal sera una
para la cual () = 0 para todo valor de 0 y () = 1 para todo valor de 1 .
Si la funcin de potencia tuviera realmente estos dos valores, entonces, independientemente
del verdadero valor de , el contraste conducira a la decisin correcta con probabilidad 1.
En un problema prctico, sin embargo, rara vez podra exixtir un procedimiento de contraste
que tubiera esta funcin de potencia ideal.
10.2.6.
Funcin Caracterstica de Operacin
Adems de la funcin potencia existe otra forma de describir las caractersticas de un

procedimiento de constraste, que tambin se basa en una funcin de probabilidad denominada
funcin caracterstica de operacin, cuya definicin se da a continuacin.
Definicin 10.2.5 El complemento de la funcin potencia 1 () se denomina funcin
caracterstica de operacin. Se define como una funcin de probabilidad. Por lo tanto, si B
denota el comlemento de la regin crtica, la funcin caracterstica de operacin estar dada
por la relacin
1 () = P(X B|) para
Si H0 es cierta, la funcin de caracterstica de operacin ser
P(X B|) = P(Aceptar H0 |H0 es cierta) = P( A| = i i 0 ) = 1
212
que constituye la probabilidad de evitar un error de tipo I. Por lo tanto, constituye la probabilidad de tomar la decisin correcta de aceptar H0 cunado esta es cierta.
Cuando H0 es falsa, la funcin caracteristica de operacin est dada por la relacin
P(X A|) = P(Aceptar H0 |H0 es f alsa) = P( A| = i i 1 ) =
que constituye la probabilidad de cometer un error de tipo II.
10.2.7.
Hiptesis simples y compuestas
Supngase que X1 , X2 , . . . , Xn constituyen una muestra aleatoria de una distribucin cuya

funcin de probabilidad o de densidad de probabilidad es f (x|), donde el valor del parmetro
debe pertenecer al espacio paramtrico , que 0 y 1 son conjuntos disjuntos tal que
0 1 = y que se desea contrastar las siguientes hiptesis:
H0 : 0
H1 : 1
Si el conjunto i , i = 0, 1, solo puede contener un valor de , se dice entonces que la
hiptesis Hi es una hiptesis simple. Si el conjunto i , i = 0, 1, contiene ms de un valor de
, se dice entonces que la hiptesis Hi es una hiptesis compuesta. Con una hiptesis simple,
la distribucin de las observaciones queda completamente especificada. Con una hiptesis
compuesta, slo se especifica que la distribucin de las observaciones pertenece a cierta
clase. Por ejemplo, supngase que en un problema dado la hiptesis nula H0 tiene la siguiente
forma:
H0 : = 0 .
Puesto que esta hiptesis es simple, el tamao de cualquier procedimiento de contraste
ser presisamente = (0 ).
10.2.8.
Procedimiento de 4 pasos para contraste de hiptesis
Hay un procedimiento de cuatro pasos que sistematizan la prueba de hiptesis. Estas son:
1. Establecer las hiptesis nula y alterna
El primer paso para un contraste de hiptesis es establecer las hiptesis nula y alternativa; esto es
H0 : = 0 contra una de las tres alternativas siguientes
H1 : < 0 (1)
H1 : > 0 (2)
H1 : 6= 0 (3)
Si estamos ante el caso (1) o (2) decimos que el contraste es unilateral o de una cola;
por el contrario si estamos ante el caso (3) el contraste es bilateral o de dos colas.
10.3. PRUEBAS DE HIPTESIS PARA GRANDES MUESTRAS (N 30)
213
2. Determinar el criterio de contraste

La determinacin del criterio de contraste consiste en especificar el nivel de significancia, el tipo de distribucin, y los valores crticos.
Nivel de significancia: como ya se mencion es la probabilidad de rechazar una
hiptesis nula verdadera y es simbolizado por . No hay un nivel de significancia
para todos los estudios, se puede utilizar cualquier valor de probabilidad entre 0
y 1; y esto depende exclusivamente del investigador antes de colectar la muestra.
El tipo de distribucin se determinar dependiendo de la naturaleza de la hiptesis
y del tamao de la muestra.
Los valores crticos son los valores de la variable que en la distribucin limitan el
rea crtica, que es la parte de la curva que corresponde al nivel de significancia.
3. Calcular el estadstico de prueba
El estadstico de prueba es un valor obtenido de la informacin de la muestra para
compararlo con el criterio de contraste y rechazar o aceptar la hiptesis. El estadstico
de prueba cambia de acuerdo a la distribucin que se utilice.
4. Tomar decisin y conclusin
Una regla de decisin es establecer las condiciones sobre las cuales la hiptesis nula
deber ser rechazada o no rechazada. Si el estadstico de prueba queda dentro de la
zona crtica la hiptesis nula deber ser rechazada. Si por el contrario, el estadstico de
prueba queda fuera de la zona crtica la hiptesis nula no deber ser rechazada.
La conclusin deber reflejar la exixtencia o no de evidencia suficiente para aceptar o
no la hiptesis nula bajo el mivel de significancia establecido.
10.3.
Pruebas de hiptesis para grandes muestras (n 30)
10.3.1.
Prueba de hiptesis para Medias
Sea X1 , X2 , . . . , Xn una muestra aleatoria de una poblacin con media desconocida y

varianza 2 que puede ser conocida o no. En caso de que la varianza 2 no sea conocida se
2
utiliza la varianza muestral S2 como su estimador. Sabemos que X tiene distribucin N(, n )
y
(X ) n
N(0, 1)
Z=
Sea 0 un nmero real particular. Adems se desea contrastar las hiptesis H0 : = 0

contra H1 , que dependiendo de la naturaleza de la prueba podra ser cualquiera de las siguientes alternativas
H1 : < 0 (1)
H1 : > 0 (2)
H1 : 6= 0 (3)
214
El problema es encontrar una regla para decidir cundo rechazar H0 en favor de H1 con
base en los datos de la muestra X1 , X2 , . . . , Xn . Cuando H0 es cierta, esto es, cuando es
2
efectivamente 0 , se tendr que X N(0 , n ) y por lo tanto
(X 0 ) n
Z=
N(0, 1)
La variable aleatoria Z es una medida natural de la distancia entre X (un estimador de

) y su valor esperado 0 cuando H0 es cierta. Es entonces razonable rechazar H0 cuando la
variable |Z| sea grande. Es por ello que se puede tomar como criterio de decisin rechazar
H0 cuando |Z| k, para cierta constante k. Cmo encontramos el nmero k?, es la pregunta
a contestar. Si estamos ante una prueba unilateral (caso (1) el caso(2)); en una tabla de la
distribucin normal podemos encontrar un valor z talque P(Z z ) = P(Z z ) = ,
de la misma forma si estamos ante una prueba bilateral (caso (3)) podemos encontrar z/2 tal
que P(|Z| z/2 ) = , en todos los casos que se pueden presentar el valor de lo determina
la persona que lleva a cabo la prueba de hiptesis. Este valor z z/2 es precisamente la
constante k buscada pues con ello se logra que la regin de rechazo sea de tamao .
La variable aleatoria Z constituye la estadstica de la prueba. Llevar a cabo esta prueba
de hiptesis consiste en usar los datos de la muestra para encontrar el valor de Z, si |Z| z
caso unilateral |Z| z/2 caso bilateral, entonces se rechaza H0 , en caso contrario no se
rechaza H0 . En la siguiente tabla se muestra resumida la informacin de este anlisis.
Ejemplo 10.3.1 La experiencia de varios aos ha demostrado que los focos marca A tienen
una vida media de 1180 hs, con una desviacin estndar de 90hs. Para probar la pretencin
de los vendedores de la marca B, se probaron 100 de esos focos comprados en almacenes
ordinarios. La muestra arroj X = 1220 hs. y S = 80 hs. Probar la hiptesis de que la media
marca B es igual a la media marca A, contra la alternativa de que tenga un valor mayor. Usar
un nivel de significancia del 5 %.
Desarrollo
Paso 1: Formulacin de las hipteisis nula y alternativa
H0 : = 1180 hs
H1 : > 1180 hs
Paso 2: Determinacin del criterio de contraste
Segn las especificaciones del problema, el nivel de significancia establecido es del
5 %, esto es = 0, 05 y como se trata de una prueba de hiptesis para medias con varianza poblacional conocida, el tipo de distribucin a utilizar es la distribucin normal
estndar. Como la prueba es unilateral se busca en la tabla Z, el valor crtico correspondiente.
Z
0,04
0,045
0,05
1,6 0,4495 0,45 0,4505
por lo que el valor crtico buscado es Z = 1, 645.
215
Paso 3: Calculo del estadstico de prueba

El estadstico de prueba en este caso tendra un valor de
(1220 1180) 100

= 4, 44
Zc =
90
Paso 4:Toma de desicin y conclusin

El siguiente paso consiste en establecer un criterio de decisin, que en este caso ser
1. Si Zc < Z no se puede rechazar H0
2. Si Zc Z se rechaza H0
Como Zc = 4, 44 > 1, 645, se observa que el estadstico de prueba queda localizado
dentro de la zona crtica, entonces podemos rechazar la hiptesis nula (H0 ), de tal
suerte que se concluye lo siguiente:
Con un nivel de significancia de 0,05 se puede afirmar que son distintos los promedios
de la marca A y la marca B, presumiblemente mayor el de la marca B.
Captulo 11
Anlisis de la Varianza (ANOVA)
Adems de probar hiptesis relativas a dos varianzas, un segundo uso de la distribucin F involucra la tcnica de Anlisis de la Varianza, abreviado ANOVA (Analysis of variance). Bsicamente, el anlisis de la varianza utiliza informaciones provenientes de muestras para determinar si tres o ms tratamientos producen diferentes resultados. El uso de la
palabra tratamiento tiene su origen en la investigacin agrcola. Las tierras se trataron con
diferentes fertilizantes, para determinar si habra una diferencia significativa en las producciones. Nosotros podramos probar la hiptesis de que cinco diferentes aditivos de gasolina
(tratamientos) resultan en un diferente kilometraje por litro. Tambin podramos contestar
la pregunta, son cuatro mtodos de capacitacin y entrenamiento (tratamientos) igualmente
efectivos?.
11.1.
Suposiciones de ANOVA
En la tcnica del anlisis de varinza consiste en la comparacinde tres o ms medias

muestrales para determinar si provienen de poblaciones con medias iguales. Para utilizar esta
tcnica, se supone lo siguiente:
1. Las poblaciones tienen una distribucin normal
2. Las poblaciones tienen desviaciones estndar () iguales.
3. Las muestras se seleccionan de manera independiente
Cuando se cumplen estas condiciones, se utiliza la distribucin F como estadstico de
prueba. En particular, se emplea el trmino tratamiento para identificar las diferentes poblaciones que se examinan.
Definicin 11.1.1 : Tratamiento
Fuente especfica de variacin en un conjunto de datos.
11.2.
Procedimiento del anlisis de la varianza
El procedimiento ANOVA puede ser ilustrado usando un ejemplo. Se quiere probar la

hiptesis, en el nivel de significancia de 0,05; de que la cantidad de tabletas de alimento
216
11.2. PROCEDIMIENTO DEL ANLISIS DE LA VARIANZA
217
que un grupo de ratas consume est en relacin con el tiempo transcurrido desde su ltima
comida. Para comprobar esta hiptesis, se selecciona al azar tres grupos de ratas con seis
ratas en cada grupo. Despus de someter a cada grupo a un entrenamiento preliminar, prueba
al grupo A, tres horas despus de comer; el grupo B, doce horas despus de comer y al grupo
C, veinticuatro horas despus de comer. La cantidad de tabletas consumidas por cada animal
en un periodo de diez minutos fueron las siguientes:
Grupo A
0
7
2
1
1
7
Grupo B
5
2
3
9
6
5
Grupo C
5
11
9
9
4
10
x = 18
x = 30
x = 48
x2 = 104 x2 = 180 x2 = 424
Captulo 12
Anlisis de regresin y de correlacin
12.1.
Introduccin
En muchas investigaciones estadsticas, el principal objetivo es establecer relaciones que

permitan pronosticar una o ms variables en trminos de otras. Por ejemplo, se han efectuado
estudios para pronosticar las ventas futuras de un producto en trminos de su precio, de la
reduccin de peso de una persona en trminos del nmero de semanas que ha seguido una
dieta de 800 caloras por da, de los gastos familiares en atencin mdica en trminos del
ingreso familiar, del consumo per cpita de ciertos artculos alimenticios en trminos de su
valor nutricional y el dinero que se gasta en su publicidad televisiva y as consecutivamente.
Es evidente que sera ideal si pudiramos pronosticar una cantidad exactamente en trminos de otra, pero esto rara vez es posible. En la mayoria de los casos debemos conformarnos
con pronosticar promedios o valores esperados. Por ejemplo, no podemos pronosticar con
exactitud la cantidad de dinero que un graduado universitario especfico ganar diez aos
despus de graduarse, pero considerando datos apropiados podemos pronosticar las ganancias promedio de todos los graduados univeristarios diez aos despus de su graduacin. Este
problema de pronstico del valor promedio de una variable en trminos del valor conocido de
otra variable (o de los valores conocidos de otras variables) se designa como el problema de
la regresin. Este trmino se remonta a Francis Galton (1822-1911), quien lo us por primera
vez en un estudio de la relacin entre las alturas de padres e hijos.
12.2.
Modelo Estadstico
Toda investigacin estadstica tiene por objeto encontrar una ecuacin matemtico que
ayude a explicar el comportamiento de un fenmeno fsico de inters en un estudio determinado. Dicha ecuacin matemtica recibe el nombre de medelo estadstico o simplemente
modelo.
Definicin 12.2.1 Modelo: Por un modelo entendemos una ecuacin matemtica que contiene variables aleatorias, variables matemticas (no aleatorias) y parmetros poblacionales.
Ejemplo 12.2.1 La siguiente ecuacin constituye un ejemplo de modelo estadstico
Yi = 1 X1i + 22 X2i + 3 X3i + i para i = 1, 2, . . . , n
218
12.2. MODELO ESTADSTICO
219
donde
1 , 22 y 3 son parmetros poblacionales desconocidos
X1i , X2i y X3i son variables matemticas
i son variables aleatorias
Dependiendo de la forma de la ecuacin matemtica podemos tener diferentes tipos de
modelos estadsticos. Uno de los ms utilizados es el modelo lineal.
Definicin 12.2.2 Modelo Lineal: Es una ecuacin que contiene variables aleatorias, variables matemticas (no aleatorias) y parmetros poblacionales y que el modelo es lineal en
los parmetros y en las variables aleatorias.
Ejemplo 12.2.2 La siguiente ecuacin constituye un ejemplo de modelo lineal
Yi = 1 X1i + 2 X2i + 3 X3i + i para i = 1, 2, . . . , n
donde
1 , 2 y 3 son parmetros poblacionales desconocidos
X1 , X2 y X3 son variables matemticas
i son variables aleatorias
Definicin 12.2.3 Modelo determinstico matemtico: Es un modelo matemtico en el
cual puede haber equivocacin pero no variabilidad
Ejemplo 12.2.3 La siguiente ecuacin matemtica constituye un modelo deterministico
Y = + X
Definicin 12.2.4 Modelo Probabilstico: Es un modelo determinstico ms una componente aleatoria debido a la variabilidad de las variables que no fueron incluidos en el modelo
y ser menor cada vez que se considere ms variables de inters en el estudio y mientras ms
se mantenga los requisitos de similitud de las variables.
Ejemplo 12.2.4 La siguiente ecuacin matemtica constituye un modelo probabilstico
Y = + X +
Definicin 12.2.5 Modelo de Regresin: Son aquellas en que las variables aleatorias independientes o predictoras son variables continuas; tales como la edad, peso, ingreso, demanda,
produccin, etc; que toman infinitos valores y sirven para cuantificar en lugar de indicar la
presencia de un efecto cualitativo.
Ejemplo 12.2.5 La siguiente ecuacin matemtica constituye un modelo de regresin
Yi = 0 + 1 X1i + 2 X2i + 3 X3i + i para i = 1, 2, . . . , n
12.3. MODELO DE REGRESIN SIMPLE
12.3.
220
Modelo de regresin simple
El anlisis de regresin es una rama de la teoria estadstica cuyom uso est muy difundido
en casi todas las disciplinas cientificas. Es una tcnica bsica para medir o estimar relaciones
entre las variables de inters consideradas en un estudio de investigacin.
El anlisis de regresin simple estudia la relacin entre dos grupos de datos desarrollando
una ecuacin matemtica que describa dicha relacin. La ecuacin nos permitir predecir el
valor de la variable dependiente Y basndonos en el valor de la variable independiente X. La
tcnica usada para desarrollar la ecuacin para la lnea de tendencia y hacer esta prediccin
es llamada anlisis de regresin simple.
Antes de estudiar el modelo de regresin simple veamos dos aspectos que sern de suma
importancia para el anlisis de dicho modelo. Estos dos aspectos consiten en el problema de
bondad de ajuste y el mtodo de mnimos cuadrados.
12.3.1.
Ajuste de curva
Siempre que es posible intentamos expresar o aproximar las relaciones entre cantidades
conocidas y cantidades que se deben pronosticar en trminos de ecuaciones matemticas.
esto ha tenido mucho xito en las ciencias naturales, donde se sabe, por ejemplo, que a una
temperatura constante la relacin entre el volumen y, y la presin x, de un gas se obtiene por
medio de la frmula:
k
y=
x
donde k es una constante numrica.
Siempre que usemos datos observados para llegar a una ecuacin matemtica que describe la relacin entre dos variables, un procedimiento conocido como el ajuste de curva,
debe enfrentar tres clases de problemas:
1. Debemos decidir qu clase de curva y por tanto qu clase de ecuacin de pronstico
queremos usar.
2. Debemos encontrar la ecuacin particular que es mejor en cierto sentido.
3. Debemos investigar ciertos aspectos referentes a los mtodos de la ecuacin particular
y de los pronsticos hechos a partir de sta.
En la seccin 12.3.2 estudiaremos detalladamente el segundo de estos problemas y en la
seccin 12.3.3 estudiaremos el tercero.
El primer problema por lo regular se decide mediante la revisin directa de los datos.
Ilustramos los datos en papel para grficas ordinarias (aritmticas), a veces en papel para
grficas especiales con escalas especiales y decidir mediante la revisin visual la clase de
curva (una linea recta, una parbola, etc.) que describe mejor el patrn general de los datos.
Existen mtodos por medio de los cuales se puede hacer esto de modo ms objetivo, pero son
bastante avanzados y no los analizaremos en este material.
En esta parte nos centraremos, en esencia, en ecuaciones lineales de dos incgnitas que
describan una posible relacin entre dos variables. Estas son de la forma
Y = a + bX
221
donde a se denomina coeficiente de interseccin intersecto (es la interseccin de Y con

el eje de las abscisas o eje horizontal) y b se denomina coeficiente de pendiente de la lnea
recta (el cambio en Y que acompaa un incremento de una unidad en X).
El coeficiente de interseccin o intersecto a nos dice cul es el valor de Y cuando X es
igual a cero.
El coeficiente de pendiente b equivale a la variacin de Y debido a la correspondiente
Y
variacin de X, en trminos matemticos esto corresponde a b =
.
X
12.3.2.
El mtodo de los mnimos cuadrados
Una vez que hemos decidido ajustar una lnea recta a un conjunto de datos determinado
{x1 , x2 , . . . , xn , y1 , y2 , . . . , yn }, enfrentemos la segunda clase de problema, especficamente, el
problema de encontrar la ecuacin de la lnea recta particular que en cierto sentido proporcione el mejor ajuste posible y posteriormente ofrezca los mejores pronsticos posibles de la
variable dependiente Y a partir de la variable independiente X. Lgicamente, no existe lmites
para el nmero de lneas rectas que se pueden trazar en un papel para grficas. Algunas de
estas lneas se ajustaran a los datos en forma tan deficiente que no las consideraramos con
seriedad, pero muchas otras pareceran proporcionar ms o menos buenos ajustes y el problema consiste en localizar la lnea que se ajuste mejor a los datos en sentido bien definido.
Si todos los puntos caen en una lnea recta no hay ningn problema, pero este es un caso
extremo que rara vez encontramos en la prctica. En general, debemos conformarnos con
una lnea recta que tiene ciertas propiedades deseables, faltas de perfeccin.
El criterio que en la actualidad se usa casi exclusivamente para definir un mejor ajuste
se remonta al inicio del siglo XIX y al trabajo del matemtico francs Andrien Legendre;
ste mtodo se conoce con el nombre de mtodo de los mnimos cuadrados. Este mtodo
implica que la linea que ajustamos para nuestros datos sea tal que la suma de los cuadrados
de las distancias verticales de los puntos a la lnea recta sea mnima.
Para demostrar como se ajusta en realidad una lnea de mnimos cuadrados a un conjunto
de datos {x1 , x2 , . . . , xn , y1 , y2 , . . . , yn }, que podra verse con un conjunto de n pares ordenados
{(x1 , x1 ), (x2 , x2 ), . . . , (xn , xn )}. Si expresamos la ecuacin de la lnea como y = a + bx, donde
el smbolo, y (y acento circunflejo), se usa para distinguir entre un valor observado de y
y el valor correspondiente y en la lnea, el criterio de los mnimos cuadrados implica que
reduzcamos al mnimo la suma de los cuadrados de las distancias entre las y s y las y s. Esto
implica que sedeben encontrar los valores numricos de las constantes a y b que aparecen en
la ecuacin y = a + bx para la cual
n
i=1
i=1
(yi yi)2 = (yi a bxi)2
sea tan baja como sea posible.

n
Para encontrar los resultados deseados de a y b, debemos minizar (yi yi )2 con respeci=1
to de a y b; para ello aplicaremos los conocimientos de los criterios sobre puntos mximos
y mnimos desarrollados en el clculo diferencial y procedimientos algebraicos. Por lo tanto
222
para minimizar
(yi yi)2 respecto de a y b; lo derivamos parcialmente con respecto de
i=1
ellos e igualemos dichas derivadas parciales a cero y obtendremos un sistema de dos ecuaciones con dos incgnitas denominados ecuaciones normales. Esto es
i
n
n
n
h n
2
(y
)
=
2
(y
bx
)
=
2
y
na
b
x
i
i
i
i
i
i
=0
a i=1
i=1
i=1
i=1
i
n
n
n
n
h n
2
2
(y
)
=
2
(y
bx
)x
=
2
x
y
a
x
b
x
i i
i i
i
i i i i =0
b i=1
i=1
i=1
i=1
i=1
con lo cual
i=1
i=1
yi = na + b xi
i=1
i=1
i=1
xiyi = a xi + b xi2
(12.3.1)
(12.3.2)
Ejemplo 12.3.1 Considerando los datos muestrales siguientes obtenidos en un estudio de la

realacin entre el nmero de aos que los solicitantes de ciertos trabajos en el servicio exterior
estudiaron alemn en preparatoria o universidad y las calificaciones que obtuvieron en una
prueba de dominio de lectura de ese idioma.
Nmero de aos (x)
3
4
4
2
5
3
4
5
3
2
Calificacin en la prueba (y)

57
78
72
58
89
63
73
84
75
48
Ajusta una lnea recta de mnimos cuadrados que relacione los nmeros de aos que los
solicitantes de trabajos en el servicio exterior estudiaron alemn en preparatoria o universidad con las calificaciones que obtuvieron en la prueba de dominio de ese idioma.
Desarrollo
Ilustrando los puntos correspondientes a estos diez pares de valores en un diagrama, observaremos que aunque no todos los puntos caen en una misma lnea recta, el patrn general
de la relacin se describira razonablemente bien por medio de una lnea recta adecuada aciertos criterios bien definidos.
El grfico 12.1 muestra el partrn de comportacin de la relacin entre los nmeros de
aos que los solicitantes de trabajos en el servicio exterior estudiaron alemn en preparatoria
o universidad con las calificaciones que obtuvieron en la prueba de dominio de ese idioma,
adems muestra la linea que mejor se ajusta a los diez pares de datos.
223
Figura 12.1: Grfico de la relacin entre el nmero de aos que se estudi alemn y la calificacin obtenida en la prueba.
Las sumas requeridas para la sustitucin en las ecuaciones normales se obtienen realizando los clculos que aparecen en la tabla siguiente:
x
3
4
4
2
5
3
4
5
3
2
y
57
78
72
58
89
63
73
84
75
48
x2
9
16
16
4
25
9
16
25
9
4
xy
171
312
288
116
445
189
292
420
225
96
xi = 35 yi = 697 xi2 = 133 xiyi = 2554

Sustituyendo xi = 35; yi = 697; xi2 = 133; xi yi = 2554 y n = 10 en las ecuaciones normales, obtenemos
697 = 10a + 35b
2544 = 35a + 133b
Resolviendo este sistema de ecuaciones, obtenemos a = 31, 55 y b = 10, 90. Entonces la
ecuacin de mnimos cuadrados est dada por
y = 31, 55 + 10, 90x
12.4. ANLISIS DE CORRELACIN
12.3.3.
224
Anlisis de regresin simple
Como ya se ha dicho el propsito fundamental del anlisis de regresin simple es estimar

la relacin que existe entre dos variables Y dependiente y X independiente, consideradas en
un estudio.
Una vez estimadas las relaciones entre las variables X e Y , interesa averiguar cun tan
estrechas son, as como tambin estimar la exactitud de las predicciones basadas en ellas.
Las respuestas a estos problemas pueden obtenerse utilizando las ideas bsicas en el anlisis
sobre pruebas de hiptesis e intervalos de confianza de los parmetros del modelo.
Supuestos bsicos del anlisis de regresin
Es posible que se descubra que una funcin lineal Y = f (X) no describe los datos con
que se esta trabajando. La funcin lineal Y = f (X) no deja margen para variaciones y por lo
tanto, no puede suministrar una descripcin adecuada de la relacin entre la variable X e Y .
Por lo cual necesitamos de un modelo que incluye ciertas variaciones.
Si suponemos que los datos observados fueron generados por una ecuacin lineal estocstica tal como
Y = + X +
donde es un trmino de error o perturbacin aleatoria, la ecuacin permite que Y sea
mayor o menor que + X, lo cul depende de que sea positivo o negativo. Lo ideal sera
que fuera pequeo y que no este correlacionado (relacionado) con la variable X, a fin de
poder cambiar X sin que se modifique y determinar asi lo que ocurre en promedio con Y .
En general, los datos observados para el anlisis de regresin simple pueden considerarse
como un conjunto de pares ordenados de nmeros {(X1 ,Y1 ), (X2 ,Y2 ), . . . , (Xn ,Yn )}, donde
Y1 ,Y2 , . . . ,Yn son variables aleatorias dependientes
X1 , X2 , . . . , Xn son variables matemticas independientes
El par (Xi ,Yi ) corresponde a la i-sima observacin de las variables X e Y . Adems para
cada par (Xi ,Yi ) existe un trmino de error i , esto es Yi = + Xi + i .
Si se conociera los valores de los parmetros poblacionales y podramos trazar en un
diagrama la funcin de regresin + X. Los trminos de error son iguales a la distancias
verticales u horizontales entre los puntos observados (Xi ,Yi ) y los puntos correspondientes
en la linea de regresin (Xi , + Xi ).
12.4.
Anlisis de correlacin
Definicin 12.4.1 Correlacin: es un grupo de tcnicas estadsticas usadas para medir la

fuerza de la relacin entre dos variables.
El estudio de la correlacin involucra cuestiones como: hay una relacin entre los promedios de la preparatoria y los promedios de primero en la universidad?. Hay una relacin entre
los gastos en publicidad de un negocio y sus ventas?. Hay una relacin entre el nmero de
aos en el trabajo y la productividad?, etc.
12.4. ANLISIS DE CORRELACIN
12.4.1.
225
Anlisis de correlacin simple
La idea bsica del anlisis de correlacin simple es dar la magnitud de la relacin entre
dos variables. Por lo tanto la correlacin simple mide la fuerza y la direccin de una relacin
lineal entre solo dos variables aleatorias.
El primer paso de la correlacin simple es normalmente graficar los datos es un diagrama
que recibe el nombre de diagrama de dispersin.
Definicin 12.4.2 Diagrama de dispersin: es un diagrama que refleja la relacin entre
dos variables aleatorias.
En el diagrama de dispersin debemos establecer cual es la variable dependiente y la
variable independiente.

Probabilidad y Estadistica PDF

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Probabilidad y Estadistica PDF

Uploaded by

Copyright:

Available Formats

Probabilidad y Estadstica

3. Medidas de tendencia central

8. Muestras aleatorias y distribuciones de muestreo.

10. Prueba de Hiptesis

11. Anlisis de la Varianza (ANOVA)

Representacin grfica de un histograma de frecuencia . . . .

Representacin grfica de la interseccin de dos eventos

Representacin grfica de la definicin de una variable aleatoria

Grfica de f (x) de la distribucin Poisson . . . . . . . . . . . . . . . . . . .

9.1. Grfica del proceso de eleccin de los valores 2c y 2l . . . . . . . . . . . . . 189

Qu significa la palabra estadstica?

1.2. DEFINICIONES Y EJEMPLOS

Definicin 1.2.1 Es la ciencia que se ocupa de la ordenacin y anlisis de datos procedentes

Otra faceta de las estadsticas es la estadstica inferencial tambin llamada estadstica

Definicin 1.2.2 : Individuo

Definicin 1.3.1 : Variables

Definicin 1.3.3 : Variable Cualitativa

Definicin 1.3.4 : Variable Cuantitativa

La estadstica no realiza sus funciones directamente sobre las modalidades observadas,

Definicin 1.3.8 : Escala Ordinal

Definicin 1.3.9 : Escala cuantitativa intervalar

Propiedades de la escala de intervalos

c) Diferencias iguales en la caracterstica estn representadas por diferencias iguales en

Definicin 1.3.10 : Escala cuantitativa Racional

Propiedades de la escala de Razn

1. Cul es el nivel de medicin de cada una de las siguientes variables?

c) Preferencia de color de cabello en las mujeres en tiempo de verano

Como su nombre lo indica, la estadstica descriptiva es la parte de la estadstica que

Una distribucin de frecuencias es una serie de datos agrupados en categoras, en las

1. Ordenacin de datos, que puede ser en orden ascendente o descendente

Nmero mximo de datos (2nic )

En este ejercicio, puesto que tenemos 40 datos el nic sera de 6.

= 5,16 que se redondea a 6

7. Lmite Superior Real (LSR)

8. Marca de clase (X)

9. Clasificacin de los datos y conteo de frecuencias

10. Distribucin de frecuencia relativa (FR)

11. Distribuciones de frecuencia acumulada

Figura 2.1: Representacin grfica de un histograma de frecuencia

Figura 2.2: Representacin grfica de un histograma de frecuencia relativa

Figura 2.3: Representacin grfica de un polgono de frecuencia

El polgono de frecuencia relativa

Figura 2.4: Representacin grfica de un polgono de frecuencia relativa

Ojivas de Frecuencia Acumulada

Figura 2.5: Representacin grfica de una ojiva de frecuencia acumulada

2. Una compaa de cambio de aceite tiene varias sucursales en la zona metropolitana. El

3. El gerente de una firma especializada en renta de condominios para vacacionistas,

Rentas mensuales de los condominios

4. Los siguientes datos representan la duracin de la vida en meses de 30 bombas de

5. Los siguientes datos representan la duracin de la vida, en segundos, de 50 moscas

7. El gerente de un negocio de comida rpida esta interesado en el nmero de veces que

9. Una cadena de tiendas de artculos deportivos al servicio de esquiadores principiantes,

La media geomtrica es til para encontrar el promedio de porcentajes, proporciones,

Propiedades de la media aritmtica

1. Puede ser calculada en distribuciones con escala relativa e intervalar.

Desventajas de la media aritmtica

1. Si alguno de los valores es extremadamente grande o extremadamente pequeo, la

La media para datos no agrupados

Xi : es la suma de todos los valores de la muestra

n : es el nmero de elementos de la muestra

85, 4 + 85, 3 + 84, 9 + 85, 4 + 84, 0

La media para datos agrupados

fiXi : es la suma de los productos de fi por Xi