Professional Documents
Culture Documents
Csar Amarilla
1 de agosto de 2011
ndice general
1. Estadstica y tipos de estadstica
1.1. Introduccin . . . . . . . . . .
1.2. Definiciones y ejemplos . . . .
1.2.1. Estadstica . . . . . .
1.2.2. Estadstica Descriptiva
1.2.3. Estadstica Inferencial
1.2.4. Poblacin y muestra .
1.3. Variables . . . . . . . . . . .
1.3.1. Tipos de variables . .
1.3.2. Escalas de medicin .
1.4. Problemas . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
8
8
9
9
9
9
9
10
10
12
14
2. Distribuciones de Frecuencia
2.1. Estadstica descriptiva . . . . .
2.2. Construccin . . . . . . . . .
2.2.1. Representacin Grfica
2.3. Problemas . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
16
16
16
20
22
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
25
25
25
26
26
26
26
27
28
28
29
29
31
31
31
31
32
33
33
NDICE GENERAL
4. Medidas de Variabilidad
4.1. Introduccin . . . . . . . . . . . . . . . . . . .
4.2. Variabilidad . . . . . . . . . . . . . . . . . . .
4.2.1. Rango y rango intercuartlico . . . . . .
4.2.2. Desviacin media . . . . . . . . . . . .
4.2.3. Desviacin media para datos agrupados
4.2.4. Varianza y desviacin estndar . . . . .
4.3. Problemas . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
5. Probabilidad
5.1. Introduccin . . . . . . . . . . . . . . . . . . . .
5.2. Definiciones y ejemplos . . . . . . . . . . . . . .
5.3. Operaciones entre eventos . . . . . . . . . . . .
5.4. Definciones de probabilidad . . . . . . . . . . .
5.4.1. Concepto Clsico de Probabilidad . . . .
5.4.2. Concepto frecuentista de probabilidad . .
5.4.3. Probabilidad subjetiva . . . . . . . . . .
5.4.4. Concepto axiomtico de probabilidad . .
5.5. Teoremas de Probabilidad . . . . . . . . . . . . .
5.5.1. Teorema 1: Regla de la Adicin . . . . .
5.5.2. Teorema 2: Regla de la complementacin
5.5.3. Teorema 3: Regla de Diferenciacin . . .
5.5.4. Probabilidad Condicional . . . . . . . .
5.5.5. Teorema 4: Reglas de Multiplicacin . .
5.6. Problemas . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
6. Variables aleatorias
6.1. Definiciones y ejemplos . . . . . . . . . . . . . . . . . . . . .
6.2. Distribucin de probabilidad . . . . . . . . . . . . . . . . . .
6.2.1. Propiedades de la funcin de probabilidad . . . . . . .
6.2.2. Propiedades de la funcin de densidad de probabilidad
6.2.3. Distribuciones discretas . . . . . . . . . . . . . . . .
6.2.4. Distribuciones continuas . . . . . . . . . . . . . . . .
6.3. Esperanza, varianza y momentos . . . . . . . . . . . . . . . .
6.3.1. Esperanza . . . . . . . . . . . . . . . . . . . . . . . .
6.3.2. Varianza . . . . . . . . . . . . . . . . . . . . . . . . .
6.3.3. Momentos . . . . . . . . . . . . . . . . . . . . . . .
6.4. Funcin generadora de momentos . . . . . . . . . . . . . . .
6.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7. Distribuciones de probabilidad
7.1. Distribuciones discretas de probabilidad
7.1.1. Distribucin Bernoulli . . . . .
7.1.2. Distribucin binomial . . . . .
7.1.3. Distribucin Poisson . . . . . .
7.1.4. Distribucin geomtrica . . . .
7.1.5. Distribucin binomial negativa .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
35
35
35
35
36
36
37
39
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
41
41
42
43
44
45
45
46
46
47
47
48
48
48
49
51
.
.
.
.
.
.
.
.
.
.
.
.
63
63
66
66
68
72
72
72
72
76
78
80
83
.
.
.
.
.
.
91
91
91
92
95
99
101
NDICE GENERAL
7.1.6. Distribucin hipergeomtrica . . . .
7.2. Distribuciones continuas de probabilidad . .
7.2.1. Distribucin uniforme continua . .
7.2.2. Distribucin Normal . . . . . . . .
7.2.3. Aproximacin normal a la binomial.
7.2.4. Distribucin ji-cuadrada . . . . . .
7.2.5. Distribucin t de Student . . . . . .
7.2.6. Distribucin exponencial . . . . . .
7.3. Problemas . . . . . . . . . . . . . . . . . .
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
9. Estimacin
9.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.2. Estimadores y sus propiedades . . . . . . . . . . . . . . . . . . . . . . . .
9.2.1. Propiedades de un buen estimador . . . . . . . . . . . . . . . . . .
9.3. Estimacin Puntual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.3.1. Estimadores de maxima verosimilitud . . . . . . . . . . . . . . . .
9.3.2. Estimadores por el mtodo de los momentos . . . . . . . . . . . .
9.4. Estimacin por Intervalos de Confianza . . . . . . . . . . . . . . . . . . .
9.4.1. Intervalos de confianza para estimar la media de una poblacin . . .
9.4.2. Intervalos de confianza para la varianza y la desviacin tpica de una
poblacin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.4.3. Intervalos de confianza para estimar Proporciones . . . . . . . . . .
9.4.4. Intervalos de confianza para estimar Diferencias de Medias . . . . .
9.4.5. Intervalos de confianza para Relaciones de Varianzas . . . . . . . .
9.4.6. Intervalos de confianza para Diferencias de Proporciones . . . . . .
9.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
103
107
107
110
117
120
122
125
128
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
150
150
150
151
152
153
154
155
155
155
156
158
161
164
166
169
173
173
174
.
.
.
.
.
.
.
.
175
175
175
176
179
179
181
182
183
.
.
.
.
.
.
188
191
193
196
199
201
NDICE GENERAL
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
208
208
208
208
209
209
210
210
211
212
212
213
213
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
218
218
218
220
220
221
224
224
225
ndice de figuras
2.1.
2.2.
2.3.
2.4.
2.5.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
20
20
21
21
22
5.1.
5.2.
5.3.
5.4.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
43
43
44
44
6.1.
6.2.
6.3.
6.4.
6.5.
6.6.
6.7.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
63
64
67
68
69
70
70
96
107
109
109
110
7.1.
7.2.
7.3.
7.4.
7.5.
7.6.
.
.
.
.
.
.
.
.
.
.
.
.
111
112
112
113
113
121
124
126
126
8.1. Grfica de f (x) cuando los parmetros m y n toman diferentes pares de valores.165
NDICE DE FIGURAS
ndice de cuadros
Captulo 1
Estadstica y tipos de estadstica
1.1.
Introduccin
1.2.
Definiciones y ejemplos
1.2.1.
Estadstica
1.2.2.
Estadstica Descriptiva
La primer parte de la definicin de estadsticas, es comnmente conocida como Estadstica Descriptiva. La definicin es la siguiente: Es el conjunto de procedimientos utilizados
para organizar, resumir y presentar grupos de datos numricos. Los grupos de datos numricos no organizados son de poca utilidad. Sin embargo, tcnicas estadsticas estn disponibles
para organizar estos datos en distribuciones de frecuencia, presentarlos en grficas, resumirlos en promedios y medidas de variabilidad o dispersin.
1.2.3.
Estadstica Inferencial
1.2.4.
Poblacin y muestra
1.3. VARIABLES
10
Por ejemplo una poblacin en estudio podra ser el conjunto de todos los estudiantes que
estudian administracin en la Facultad de Ciencias Econmicas de la Universidad Nacional
de Asuncin y una muestra podra consistir en el conjunto de estudiantes de primer ao de
dicha poblacin.
1.3.
Variables
1.3.1.
Tipos de variables
1.3. VARIABLES
11
1.3. VARIABLES
1.3.2.
12
Escalas de medicin
Seguidores
74 612 373
3 483 593
2 982 929
81 078 895
Calificacin ( %)
75,7
17,1
2
5,2
100
1.3. VARIABLES
13
Nmero de aspirantes
42
19
7
4
Nmero de empleados
12
25
32
17
10
Observacin
En la escala de medicin de una variable; sea cualitativa o cuantitativa; las categoras
deben ser mutuamente excluyentes. Esto significa que un individuo medicin pertenece
nicamente a una de las categorias. Adems las categoras deben ser exhaustivas, esto es
cada individuo medicin debe pertenecer a una de las categoras.
1.4. PROBLEMAS
1.4.
14
Problemas
1.4. PROBLEMAS
15
Captulo 2
Distribuciones de Frecuencia
2.1.
Estadstica descriptiva
2.2.
Construccin
41
16
43
31
38
35
31
34
37
32
45
33
36
44
26
32
38
29
32
39
16
37
31
33
41
30
30
47
39
19
42
26
37
31
34
35
2.2. CONSTRUCCIN
17
19
22
25
26
26
29
30
30
31
31
31
31
32
32
32
33
33
33
34
34
34
35
35
36
37
37
37
38
38
39
39
41
41
42
43
44
45
47
47
2. El rango (amplitud)
Rango = Dato mayor - Dato menor = 47 - 16 = 31
3. Nmero tentativo de los intervalos de clase (nic)
El nmero de intervalos (nic) puede ser como mnimo 5 y como mximo 15 de acuerdo
a la frmula : 2nic
Nmero de intervalos (nic)
5
6
7
8
9
10
Rango
nic
31
6
Para facilitar la clasificacin de los datos, el tic se redondea siempre al entero posterior.
5. Lmite inferior (LI)
Usualmente, el lmite inferior del primer intervalo de clase es el dato ms chico, que en
este ejemplo es 16.
El lmite inferior de los siguientes intervalos se calcula sumando el tic al lmite inferior
del intervalo anterior hasta llegar a un nmero no mayor al dato ms grande.
6. Lmite superior (LS)
El lmite superior se calcula con la siguiente frmula LS = LI + tic 1
2.2. CONSTRUCCIN
18
LI
16
22
28
34
40
46
LS
21
27
33
39
45
51
LS + LIsig
intervalo (LIsig), entonces LSR =
2
LI
16
22
28
34
40
46
LS
21
27
33
39
45
51
LSR
21,5
27,5
33,5
39,5
45,5
51,5
LS
21
27
33
39
45
51
LSR
21,5
27,5
33,5
39,5
45,5
51,5
X
18,5
24,5
30,5
36,5
42,5
48,5
2.2. CONSTRUCCIN
19
LI
16
22
28
34
40
46
LS
21
27
33
39
45
51
LSR
21,5
27,5
33,5
39,5
45,5
51,5
X
18,5
24,5
30,5
36,5
42,5
48,5
cuenta
//
////
///// ///// ///
///// ///// ///
///// /
//
F
2
4
13
13
6
2
F
las frecuencias de clase se dividen entre el nmero total de observaciones FR =
n
LI
16
22
28
34
40
46
LS
21
27
33
39
45
51
LSR
21,5
27,5
33,5
39,5
45,5
51,5
X
cuenta
18,5
//
24,5
////
30,5 ///// ///// ///
36,5 ///// ///// ///
42,5
///// /
48,5
//
F
2
4
13
13
6
2
FR
2/40 = 0, 05
4/40 = 0, 1
13/40 = 0, 325
13/40 = 0, 325
6/40 = 0, 15
2/40 = 0, 05
LSR
21,5
27,5
33,5
39,5
45,5
51,5
X
18,5
24,5
30,5
36,5
42,5
48,5
cuenta
//
////
///// ///// ///
///// ///// ///
///// /
//
F
2
4
13
13
6
2
FR
0,05
0,1
0,325
0,325
0,15
0,05
FA FRA
2
0,05
6
0,15
19 0,475
32
0,8
38 0,95
40
1
2.2. CONSTRUCCIN
2.2.1.
20
Representacin Grfica
Tres grficas que nos ayudarn a representar grficamente una distribucin de frecuencias
son el histograma, el polgono de frecuencia y la ojiva de frecuencia acumulada.
El histograma
El histograma es una de las grficas ms ampliamente utilizadas y una de las mas fciles
de entender. Un histograma describe una distribucin de frecuencia utilizando una serie de
rectngulos adyacentes donde la altura de cada rectngulo es proporcional a la frecuencia de
clase que representa.
2.2. CONSTRUCCIN
21
Polgono de frecuencia
El polgono de frecuencia consiste de segmentos de lnea conectando los puntos formados
por la interseccin de las marcas de clase y las frecuencias de clase.
2.3. PROBLEMAS
22
2.3.
Problemas
Elabore la distribucin de frecuencias de las siguientes series de datos, con sus respectivas
grficas:
1. Los resultados siguientes representan las calificaciones del examen final de un curso
de estadstica elemental.
23
80
52
41
60
34
60
77
10
71
78
67
79
81
64
83
89
17
32
95
75
54
76
82
57
41
78
64
84
69
74
65
25
72
48
74
52
92
80
88
84
63
70
85
98
62
90
80
82
55
81
74
15
85
36
76
67
43
79
61
2.3. PROBLEMAS
23
1207
1418
1399
1309
1421
1020
1340
1537
1500
1510
695
2051
1501
1981
1849
1671
1760
803
1677
1668
1091
36
72
48
4
66
71
40 16
78 3
22 57
5 18
28 67
9 54
6
72
4
30 60
15 3
12 72
20
14
18
7
10
10
6
8
18
5
9
9
13
7
14
23
13
3
10
15
13 12
6 7
32 9
4 27
10 9
19
10
7
19
6
18 24
13 7
10 11
16 8
7 15
6. Se aplic una encuesta donde se les pide indicar el nmero de amigos o parientes que
visitan cuando menos una vez al mes. Los resultados son los siguientes:
3
2
5
4
9
4
5
4
6
14
4
3
2
2
4
3
1
5
3
5
3
5
4
7
3
3
2
6
2
3
4
3
2
3
4
5
1
3
6
4
3
6
8
0
3
2
5
2
4
3
5
4
0
2
3
2
9
3
4
11
1
4
3
4
4
12
4
5
4
5
6
7
6
3
6
4 2
5 3
5 15
6
4
1
6 6
5 6
1 10
7 1
8 4
8 9
1
7
2
14
6
12
2.3. PROBLEMAS
24
8. El presidente de una agencia de viajes, quiere informacin sobre las edades de la gente
que toma cruceros por el Caribe. Una muestra de 40 clientes que tomaron un crucero
el ao pasado revel estas edades:
77
36
62
60
18
26
43
45
63
50
52
66
84
34
53
83
38
44
63
71
54
41
62
63
50
58
62
58
59
58
65
61
54
53
61
71
56
51
52
60
82
212
126
128
265
171
216
126
168
149
195
175
90
156
127
127
114
162
161
149
172
118
135
126
230
139
172
121
142
149
220
118
86
132
229
172
125
105
129
126
10. Se conduce un estudio de los efectos de fumar sobre los patrones de sueo. La medicin
que se observa es el tiempo, en minutos, que toma quedar dormido. Se obtienen estos
datos:
69 56 22 28 41 28 47 53 48
30 34 13 52 34 60 25 21 37
43 23 13 31 29 38 26 36 30
11. Un banco seleccion una muestra de 40 cuentas de cheques de estudiantes. Abajo
aparecen sus saldos de fin de mes.
404
87
703
968
74
234
125
712
234
68
350
503
149
489
440
498
279
57
37
327
215
185
252
608
123
141
27
358
55
758
521
425
43
72
302
303
321
863
127
203
12. Una compaa de luz seleccion una muestra de 20 clientes residenciales. Los siguientes datos son las cuentas que se les factur el mes pasado:
54
67
48
68
58
39
50 25
35 56
47 75
66 33
46
62
60 70
65 67
13. Una muestra de suscriptores de una compaa telefnica revel los siguientes nmeros
de llamadas recibidas en la ltima semana.
52
39
43
37
30 38
34 46
30 42
32 18
12
41
46
5
Captulo 3
Medidas de tendencia central
Promedios
A las medidas de tendencia central con frecuencia se les llama promedios. El propsito
de una medida de tendencia central es indicar con toda precisin el centro de un conjunto de
observaciones.
3.1.
La Media
3.1.1.
La Media Geomtrica
25
3.1. LA MEDIA
3.1.2.
26
La Media Aritmtica
La medida de tendencia central mas ampliamente usada es la media aritmtica, usualmente abreviada como media.
La media aritmtica de un conjunto de n valores (observaciones) es el resultado de la
suma de todos ellos dividido entre n.
3.1.3.
3.1.4.
3.1.5.
Para datos crudos, es decir datos no agrupados, la media es la suma de todos los valores
dividido entre el nmero total de valores. Para encontrar la media de una muestra se usa la
siguiente frmula:
n
Xi
X=
i=1
Donde:
X : es la media de la muestra
n
i=1
3.1. LA MEDIA
27
Xi
X=
3.1.6.
i=1
Frecuentemente los datos ests agrupados y presentados en forma de distribucin de frecuencias. Si esto sucede es normalmente imposible recuperar los datos crudos originales. Por
consiguiente si queremos calcular la media u otro estadstico es necesario estimarlo en base
a la distribucin de frecuencias.
La media aritmtica de una muestra de datos organizados en una distribucin de frecuencias se calcula de la siguiente manera:
X=
fi Xi
n
Donde:
X : simboliza la media de la muestra
Xi : es la marca de clase del intervalo i-simo
fi : es la frecuencia de clase del intervalo i-simo
Nmero de bateras
2
1
4
15
10
5
3
3.2. LA MEDIANA
28
3.1.7.
LS
19
24
29
34
39
44
49
Xi
17
22
27
32
37
42
47
fi
2
1
4
15
10
5
3
n =40
fi Xi
34
22
108
480
370
210
141
fiXi = 1365
X=
fi Xi 1365
=
= 34, 12
n
40
La media de la poblacin
Las medidas caractersticas de una muestra son llamadas estadsticos y las medidas caractersticas de una poblacin se denominan parmetros. La media de la poblacin se calcula
de la misma manera que la media de la muestra, que calculamos arriba, pero tiene diferente
notacin:
N
Xi
i=1
Donde:
: es la media de la poblacin
N
i=1
3.2.
La mediana
Cuando una serie de datos contiene uno o dos valores muy grandes o muy pequeos, la
media aritmtica no es representativa. El valor central en tales problemas puede ser mejor
descrito usando una medida de tendencia central llamada mediana.
La mediana es el punto medio de los valores de una serie de datos despus de haber
sido ordenados de acuerdo a su magnitud. Hay tantos valores antes que la mediana como
posteriores en el arreglo de datos.
Ejemplo 3.2.1 El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de
la lnea de produccin son (en ml): 85,4 ; 85,3 ; 84,9 ; 85,4 ; y 84,0. Cul es la mediana de
las observaciones muestreadas?
3.2. LA MEDIANA
29
85,9
85,4
85,4 X
84,3
84,0
Por lo que la mediana es X = 85, 4
Ejemplo 3.2.2 Una muestra de los honorarios de paramdicos cargados por la clnica Baltimore revel las siguientes cantidades: 35,29, 30,25, 32,35. Cul es la mediana?
25
29
30
32
35
35
En este caso la mediana se calcula obteniendo la media de las dos observaciones centrales
30 + 32
= 31
X =
2
3.2.1.
Propiedades de la mediana
3.2.2.
Cuando los datos se encuentran agrupados en una distribucin de frecuencia no conocemos los datos originales, por lo tanto es necesario estimar la mediana mediante los siguientes
pasos:
1. Calcular el valor
n
2
3.2. LA MEDIANA
30
( n2 FA)tic
F
Donde:
X : mediana de la muestra
LRI : Limite real inferior del intervalo mediano
FA : frecuencia acumulada anterior a la frecuencia del intervalo mediano
tic : tamao de los intervalos de clase
F : frecuencia del intervalo mediano
Ejemplo 3.2.3 Calcular mediana de la siguiente distribucin de frecuencia del nmero de
meses de duracin de una muestra de 40 bateras para coche.
Duracin de las bateras (meses)
15 - 19
20 - 24
25 - 29
30 - 34
35 - 39
40 - 44
45 - 49
Nmero de bateras
2
1
4
15
10
5
3
Para calcular la mediana de una distribucin de frecuencias necesitamos obtener el intervalo el intervalo mediano para luego obtener el lmite superior real (LSR), la frecuencia
acumulada anterior a la frecuencia de la mediana (FA) y la frecuencia absoluta de la mediana
(F).
Procedamos entonces a localizar el intervalo mediano a travs de los siguientes pasos
1. El valor de
n 40
=
= 20
2
2
LSR
19,5
24,5
29,5
34,5
39,5
44,5
49,5
X
17
22
27
32
37
42
47
F
2
1
4
15
10
5
3
FA
2
3
7
22 intervalo mediano
32
37
40
3.3. LA MODA
31
3.3.
( n2 FA)tic
(20 7)(5)
= 29, 5 +
= 33, 83
F
15
La moda
3.3.1.
Propiedades de la moda
1. La moda se puede determinar en todos los tipos de mediciones (nominal, ordinal, intervalar, y relativa).
2. La moda tiene la ventaja de no ser afectada por valores extremos.
3. Al igual que la mediana, puede ser calculada en distribuciones con intervalos abiertos.
3.3.2.
Desventajas de la moda
1. En muchas series de datos no hay moda porque ningn valor aparece ms de una vez.
2. En algunas series de datos hay ms de una moda, en este caso uno podra preguntarse
cual es el valor representativo de la serie de datos?
Ejemplo 3.3.1 El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de
la lnea de produccin son (en ml): 85,4 ; 85,3 ; 84,9 ; 85,4 ; y 84,0. Cul es la moda de las
observaciones muestreadas?
3.3.3.
Para datos agrupados en una distribucin de frecuencia, la moda puede ser estimada siguiendo los siguientes pasos:
1. Localizar la clase del intervalo que contenga la frecuencia de clase ms grande.
2. Aplicando la siguiente frmula con los valores del intervalo de la moda:
= LRI +
X
Donde:
: la moda de los datos de la muestra
X
LRI : Limite real inferior de la clase modal
1
tic
1 + 2
3.3. LA MODA
32
3.3.4.
F
4
3
15
9
10
7
15
X=
X =
F
4
4
4
4
4
4
(25+30)
2
= 27, 5
no hay moda
Si no hay ningn argumento de peso en contra, se preferir siempre la media. Hay dos
razones para apoyar esta norma general. La primera es que en ella se basan otros estadsticos
y la segunda es que es mejor estimador de su parmetro que la mediana y la moda.
Hay al menos tres situaciones en las que se preferir la mediana a la media:
Cuando la variable est medida en escala ordinal
Cuando haya valores extremos que distorsionen la interpretacin de la media
3.4. PROBLEMAS
33
Cuando haya intervalos abiertos, situaciones en las que el intervalo superior carece de
lmite superior, el intervalo inferior carece de lmite inferior o ambos.
La media es extremadamente sensible a las puntuaciones y un cambio en slo una de ellas
supone un cambio en la media aritmtica, mientras que la mediana slo se vera alterada por
cambios en los valores centrales.
La mediana ser la segunda candidata para representar la tendencia central y se preferir
la mediana a la moda, a menos de que:
a) Se trate de una variable medida en escala nominal
b) Haya intervalos abiertos y la mediana pertenezca a uno de ellos.
3.3.5.
1. Para una distribucin simtrica los valores de la media, la mediana y la moda coinciden
con lo cual la distribucin de datos no presenta sesgo.
es decir: X = X = X,
Observacin : Esta igualdad no es exacta, sino que se cumple con mayor o menor
aproximacin en funcin del grado de simetra de la curva que represente grficamente
la distribucin.
con lo cual la
2. Para una distribucin asimtrica negativa se tiene que: X < X < X,
distribucin de datos presenta un sesgo negativo.
< X < X, con lo cual la dis3. Para una distribucin asimtrica positiva se tiene que: X
tribucin de datos presenta un sesgo positivo.
Observacin: La regla emprica se acepta como vlida siempre que el grado de curva
no sea muy acentuado.
3.4.
Problemas
1. El departamento de agricultura, tiene los siguientes datos que representan el crecimiento mensual (en pulgadas) de muestras de maz recien plantados
0,4
0,9
1,9
0,7
1,5
0,9
0,9
0,7
0,3
0,7
1,6
1,5
0,4
0,5
1,5
1,5
1,2
1,7
0,8
1,8
572
573
568
569
575
565
570
3.4. PROBLEMAS
34
21
18
27
17
21
20
22
18
23
No de departamentos
3
8
10
13
33
40
35
30
16
12
200
No de personas
2
6
10
13
18
6
2
2
16
60
Captulo 4
Medidas de Variabilidad
4.1.
Introduccin
4.2.
Variabilidad
4.2.1.
4.2. VARIABILIDAD
36
Es parecida al rango, pero eliminando las observaciones ms extremas o sea las inferiores
y superiores. Por lo que no es tan sensible a valores extremos. Es la distancia entre primer y
tercer cuartil.
Rango intercuartil = Q3 Q1
4.2.2.
(4.2.1)
Desviacin media
La desviacin media mide la cantidad promedio que varan los datos respecto a su media.
Es la media aritmtica de los valores absolutos de las desviaciones de los datos respecto a su
media. La frmula de la desviacin media ( Dm ) es:
n
|Xi X|
Dm =
i=1
(4.2.2)
|X X|
0.4
0.4
0.3
0.1
1.0
|Xi X|
Dm =
4.2.3.
i=1
2, 2
= 0, 44
5
fi|Xi X|
n
(4.2.3)
4.2. VARIABILIDAD
37
Claramente observamos que la serie B tiene una dispersin mayor que la serie A, sin
embargo en ambos casos la desviacin media es cero.
4.2.4.
(Xi )2
i=1
2 =
Xi2
i=1
(4.2.4)
(4.2.5)
S2 =
(Xi X)2
i=1
Xi2
i=1
S2
(4.2.7)
4.2. VARIABILIDAD
38
X2
7293,16
7276,09
7208,01
7293.16
7056.00
2
X = 36126, 42
X
85,4
85,3
84.9
85.4
84.0
Xi = 425, 0
Con lo cual la media de la muestra es
X=
425, 0
= 85
5
S2 =
Xi2
i=1
X =
36126, 42
852 = 0, 284
5
2 =
fi (Xi )2
fiXi2
i=1
i=1
(4.2.8)
(4.2.9)
fiXi
S2 =
i=1
fi (Xi X)2
i=1
,y
fiXi2
i=1
fiXi
i=1
4.3. PROBLEMAS
39
S=
S2
(4.2.11)
Nmero de bateras
2
1
4
15
10
5
3
fi Xi2
LI
15
20
25
30
35
40
45
LS
19
24
29
34
39
44
49
X
17
22
27
32
37
42
47
fi
2
1
4
15
10
5
3
n =40
fi Xi
34
22
108
480
370
210
141
f
X
i i = 1365
fi Xi2
588
484
2916
15360
13690
8820
6627
fi Xi2 = 48475
1365
= 34, 125
40
S2 =
fiXi2
i=1
X =
48475
(34, 125)2 = 47, 359375
40
4.3.
Problemas
1. Se conduce un estudio de los efectos de fumar sobre los patrones de sueos. La medicin que se observa es el tiempo, en minutos, que toma quedar dormido. Se obtiene
4.3. PROBLEMAS
40
estos datos:
Fumadores
No fumadores
69,3 56,0
28,6 25,1
22,1
26,4
47,6
34,9
53,2 48,1
29,8 38,5
52,7
30,2
34,4
30,6
60,2 43,8
31,8 41,6
1973
1969
1970
1892
1972 1975
1893 1887
1976
1895
a) Calcula las mediadas de tendencia central para cada grupo e interprete los resultados obtenidos.
b) Calcula la desviacin media, la varianza, la desviacin tpica y el coeficiente de
variacin de cada grupo.
c) Diga cual de los grupos tiene mejor concentracin
Captulo 5
Probabilidad
5.1.
Introduccin
La teora de probabilidad tuvo como uno de sus primeros puntos de partida el intentar
resolver un problema particular concerniente a una apuesta de juego de dados entre dos personas. El problema al que nos referimos involucraba una gran cantidad de dinero y puede
plantearse de la siguiente forma: Dos jugadores escogen cada uno de ellos un nmero del 1
al 6, distinto uno del otro, y apuestan 32 doblones de oro a que el nmero escogido por uno
de ellos aparece en tres ocasiones antes que el nmero del contrario al lanzar sucesivamente
un dado. Suponga que el nmero de uno de los jugadores ha aparecido dos veces y el nmero
del otro una sola vez. Cmo debe dividirse el total de la apuesta si el juego se suspende?
Uno de los apostadores, Antonio de Gombaud, popularmente conocido como el caballero
De Mere, deseando conocer la respuesta al problema plantea a Blaise Pascal (1623-1662) la
situacin. Pascal a su vez consulta con Pierre de Fermat (1601-1665) e inician un intercambio
de cartas a propsito del problema. Esto sucede en el ao de 1654. Los historiadores de
la matemtica stan generalmente de acuerdo en considerar este hecho como el origen del
estudio de las probabilidades. Con lo anteriormente mencionado se inician algunos esfuerzos
por dar solucin a ste y otros problemas similares que se plantean. Con el paso del tiempo
se sientan las bases y las experiencias necesarias para la bsqueda de una teora matemtica
que sintetice los conceptos y los mtodos de solucin de los muchos problemas particulares
resueltos a lo largo de varios aos.
Las ideas de probabilidades permanecen circunscritas a los problemas de juegos de azar
hasta que Pierre Laplace (1749-1827) y Friedrich Gauss (1777-1855) hacen notar que las
teorias desarrolladas son aplicables tambin a otras actividades diferentes de los juegos de
azar. En el segundo congreso internacional de matemticas, celebrado en la ciudad de Paris
en el ao 1900, el matemtico David Hilbert (1862-1943) plantea 23 problemas matemticos
de importancia. Uno de estos problemas es el de encontrar axiomas o postulados a partir
de los cuales se pueda construir una teora matemtica de la probabilidad. Aproximadamente treinta aos despus, en 1933, el matemtico ruso Andrei Nikolaevich Kolmogorov
(1903-1987) propone ciertos axiomas basados en la teora de la medida desarrollada por
H. Lebesgue(1875-1941), que a la postre resultaron adecuados para la construccin de una
teora de la probabilidad. Esta teora prevalece hoy en da y ha adquirido el calificativo de
teora clsica. Actualmente la teora clsica de la probabilidad se ha desarrollado y exten41
42
5.2.
Definiciones y ejemplos
43
5.3.
Interseccin
La interseccin de dos eventos dados A y B de un espacio muestral ; es el conjunto de
resultados de un experimento aleatorio que pertenece a los dos eventos dados. El smbolo de
la interseccin es .
Unin
La unin de dos eventos dados A y B de un espacio muestral ; es el conjunto de resultados de un experimento aleatorio que pertenece a alguno de estos dos eventos dados. El
smbolo de la unin es .
44
Complemento
El complemento de un evento A de un espacio muestral ; es el conjunto de resultados de
un experimento aleatorio que no pertenece a dicho evento dado. El smbolo del complemento
es .
Diferencia
Diferencia de dos eventos A y B de un espacio muestral ; es el conjunto de resultados
de un evento dado que no pertenece a otro evento dado. El operador de la diferencia es el
signo "menos"().
5.4.
Definciones de probabilidad
5.4.1.
45
El primero en dar una definicin clsica de probabilidad fue Jakob Bernoulli en 1713,
reformulada despus por Abraham De Moivre como: una fraccin; en la que el numerador
es igual al nmero de apariciones del suceso dado y el denominador es igual al nmero total
de casos en los que es suceso pueda o no pueda ocurrir. Tal fraccin expresa la probabilidad
de que ocurra el suceso dado.
El enfoque clsico de la probabilidad est basado en la suposicin de que todos los resultados del experimento son igualmente posibles o tienen el mismo peso. La definicin clsica
de la probabilidad es la siguiente: Sea A un subconjunto de un espacio muestral de cardinalidad finita. Se define la probabilidad del evento A como el cociente:
P(A) =
#A
#
(5.4.1)
en donde el smbolo #A denota la cardinalidad o nmero de elementos del conjunto A. Claramente esta definicin es slo vlida para espacios muestrales finitos, pues forzosamente necesitamos suponer que el nmero de elementos en es finito. El espacio muestral debe ser
equiprobable como ya se mencion, pues para calcular la probabilidad de un evento A dado, nicamente necesitamos contar cuntos elementos tiene A respecto del total, sin importar
exactamente qu elementos particulares sean.
Ejemplo 5.4.1 El experimento consiste en el lanzamiento de un dado. Cul es la probabilidad de que se obtenga como resultado un dos?
Las caras del dado estn numeradas del 1 al 6, entonces hay solo una posibilidad de entre
un total de seis de que el resultado del experimento sea el nmero 2, entonces la probabilidad
de obtener el nmero 2 es
1
P(cae 2) = = 0, 16667
6
La principal dificultad que presenta esta interpretacin de la probabilidad es que se basa
en sucesos equiprobables (todos los posibles resultados tienen la misma probabilidad de ocurrencia ), siendo fcil para problemas sencillos, como los de cartas, dados o urnas, es casi
imposible para problemas ms complejos.
5.4.2.
46
De esta manera, Bernoulli introdujo el concepto de probabilidad frecuentista o estadstica que consiste en asignar como probabilidad de un suceso, el resultado que se obtendra
si el proceso se repitiera en condiciones similares un nmero grande de veces. Por lo tanto
supongamos que se realizan n repeticiones de un cierto experimento aleatorio y sea A un
evento cualquiera. Denotemos por n(A) el nmero de veces que ocurre el evento A en las
n realizaciones del experimento. Se define entonces la probabilidad frecuentista de A como
indica el siguiente lmite
n(A)
P(A) = lm
n n
En este caso, debemos hacer notar que no es humanamente posible llevar a cabo una infinidad de veces el experimento aleatorio, de modo que en la prctica no es posible encontrar
mediante este mecanismo la probabilidad de un evento cualquiera. Esta limitacin hace que
esta definicin de probabilidad no sea enteramente formal, pero tiene algunas ventajas.
Ejemplo 5.4.2 Se quiere saber si una moneda est cargada. Para determinar la probabilidad
de que caiga cara se lanza 60 veces la moneda al aire, de las cuales 25 veces cay cara. Si
aplicamos la frmula
25
= 0, 4167
P(cae cara) =
60
Algunas dificultades que presenta este enfoque de la probabilidad es que no dice cual es
el nmero grande de observaciones necesario, o que se entiende por condiciones similares,
porque si las condiciones son las mismas los resultados sern tambin los mismos.
5.4.3.
Probabilidad subjetiva
En el segundo cuarto del siglo XX surgi una nueva interpretacin de la probabilidad llamada subjetiva, segn la cual la probabilidad mide el grado de creencia de un individuo en
la verdad de una proposicin, variando entre 0 (el individuo cree que es falso) a 1 (cree que es
cierto), es decir de lo que el observador conoce del fenmeno en estudio. Esta interpretacin
fue propuesta por primera vez por el filsofo Frank P. Ramsey. Para los subjetivistas la probabilidad de un suceso debe variar en funcin de la nueva informacin recibida respecto del
suceso.
Segn este enfoque la probabilidad de que un evento en particular suceda es asignada
basndose en cualquier informacin disponible, como intuicin, opiniones etc.
Ejemplo 5.4.3 Cul es la probabilidad de que un cierto equipo de ftbol gane en su prximo partido?. Ciertas circunstancias internas del equipo, las condiciones del equipo rival o
cualquier otra condicin externa, son elementos que slo algunas personas conocen y que
podran darnos una idea ms exacta de esta probabilidad.
5.4.4.
En la definicin axiomtica de la probabilidad no se establece la forma explcita de calcular las probabilidades sino nicamente se proponen las reglas que el clculo de probabilidades
debe satisfacer. Esta teora axiomtica de la probabilidad fue desarrollada por el matemtico
ruso Andrei N. Kolmogorov basandose como dijimos en la introduccin de este captulo en
47
)=
n=1
P(Ai)
n=1
5.5.
Teoremas de Probabilidad
5.5.1.
48
1
6
Si aplicamos la regla de adicin:
5.5.2.
1 1 1 2
+ =
2 3 6 3
5.5.3.
1 1
=
2 2
La probabilidad de que un evento dado A ocurra pero no ocurra otro evento dado B
pertenecientes al mismo espacio muestral est dada por
P(A B) = P(A) P(A B)
Ejemplo 5.5.3 Si el evento A es cae un nmero par y si el evento B es cae un nmero
menor de 3, ambos pertenecientes al espacio muestral = {1, 2, 3, 4, 5, 6} que resulta del
experimento aleatorio consistente en el lanzamiento de un dado, entonces la probabilidad de
que caiga un nmero par pero no es menor que tres es:
P(A B) = P(A) P(A B) =
3 1
= 0, 3333
6 6
Y la probabilidad de que caiga un nmero menor que tres pero no sea par es:
P(B A) = P(B) P(AB) =
5.5.4.
2 1
= 0,167
6 6
Probabilidad Condicional
49
Ejemplo 5.5.4 Considere el experimento de extraer un naipe de un mazo de 40 (baraja espaola), sean los eventos A = {se extrae un as} y B = {el naipe extraido es de copas}. Calcular P(A|B)
Como en el mazo de 40 barajas hay un solo as de copas y 10 naipes de copas en total se
tiene que
1
10 1
P(A B) =
y P(B) =
=
40
40 4
entonces la probabilidad de que ocurra A dado que se sabe que ocurri B es
P(A|B) =
5.5.5.
P(A B)
=
P(B)
1
40
1
4
1
10
50
4
1
=
12 3
3
11
Segn el teorema de multiplicacin, la probabilidad de que los dos eventos ocurran es:
P(A B) = P(A) P(B|A) =
1 3
1
=
3 11 11
Teorema de Bayes
En el siglo XVIII el reverendo Thomas Bayes, un ministro presbiteriano ingls, se hizo esta pregunta: realmente existe Dios?. Siendo el, un entusiasta matemtico se evoc a
desarrollar una frmula para encontrar la probabilidad de que Dios existe, basndose en la
evidencia disponible sobre la tierra. Aos despus de la muerte de Bayes, Laplace desarroll el trabajo del reverendo, y por vez primera, se logra la determinacin de la probabilidad
de las causas a partir de los efectos que han podido ser observados. El clculo de dichas
probabilidades recibe el nombre de teorema de Bayes. La frmula del teorema de Bayes es:
P(A1 |B) =
P(A1 )P(B|A1 )
P(A1 )P(B|A1 ) + P(A2 )P(B|A2 ) + ... + P(An )P(B|An )
Ejemplo 5.5.7 : Don Pepe tiene una tienda, en el trabajan tres cajeras, Andrea, Bianca, y
Consuelo. Andrea realiza el 50 % de los cobros, Bianca el 30 % y Consuelo el 20 %. Cuando
cobra Andrea hay un 1 % de probabilidad de que lo haga mal, cuando lo hace Bianca hay un
2 % de que cobre mal, y si cobra Consuelo hay un 3 % de probabilidad de que se equivoque.
Un cliente se quej con Don Pepe porque le cobraron mal. Cul es la probabilidad de que
el mal cobro lo haya hecho Andrea?
5.6. PROBLEMAS
51
P(B) = 0, 3
P(C) = 0, 2
P(M|A) = 0, 01
P(M|B) = 0, 02
P(M|C) = 0, 03
P(A)P(M|A)
P(A)P(M|A) + P(B)P(M|B) + P(C)P(M|C)
5.6.
Problemas
1. Suponga que de un grupo de 500 estudiantes universitarios se encuentra que 300 fuman, que 350 consumen bebidas alcohlicas y que 250 tienen estos dos hbitos nocivos
para la salud. Cul es la probabilidad de que un estudiante seleccionado aleatoriamente
a) tenga alguno de estos dos malos hbitos?
b) no tenga ninguno de estos dos psimos hbitos?
c) fume pero no tome?
d) tome pero no fume?
e) No fume?
f) Fume dado que toma?
g) Toma dado que fuma?
h) No tenga alguno de estos nefastos hbitos?
2. La probabilidad de que una compaa norteamericana ubique una de sus plantas en
Jurez es 0,7, la probabilidad de que instale una planta en Chihuahua es 0,4, la probabilidad de que no se ubique ni en Jurez ni en Chihuahua es 0,20. Cul es la probabilidad
de que
a) Se ubique en alguna de estas dos ciudades?
5.6. PROBLEMAS
52
5.6. PROBLEMAS
53
6. El profesor Ramos tiene muchos aos impartiendo la clase de matemticas, por experiencia sabe que el 80 % de los estudiantes contestan los problemas que les encarga de
tarea. Tambin sabe que el 90 % de los estudiantes que hacen la tarea aprueban el curso
y que el 60 % de los estudiantes que no hacen la tarea reprueban. Manuel aprob el
curso, cual es la probabilidad de que hizo la tarea?
7. Un equipo de bisbol juega el 70 % de las veces de noche y el 30 % de da. Ellos ganan
el 50 % de los juegos nocturnos y el 90 % de los juegos diurnos. El da de ayer ganaron,
cual es la probabilidad de que el juego fue en la noche?
8. El 30 % de las ventas de una tienda departamental son en efectivo, el 30 % son pagadas
con cheque en el momento de la compra y el 40 % son a crdito. El 20 % de las compras
en efectivo, 90 % de las compras con cheque y el 60 % de las compras a crdito son
mayores a $500. En este momento se est realizando una compra por $1000, cual es la
probabilidad de que sea en efectivo?
9. Una urna contiene 5 bolillas blancas, 4 negras, 6 rojas y 10 verdes. Se extrae una bolilla
de la urna. Calcular la probabilidad de que:
a) la bolilla extrada sea blanca
Respuesta: 0,20
Respuesta: 0,60
Respuesta: 0,60
Respuesta: 0,16
10. Cierta poblacin de 1500 habitantes, fue clasificado, segn su nacionalidad, resultando:
950 paraguayos, 200 espaoles, 300 italianos y 50 franceses. Si se elige un habitante
al azar, calcular la probabilidad de que:
a) resulte de habla castellana
Respuesta: 0,77
b) resulte extranjero
Respuesta: 0,77
Respuesta: 0,50
b) dos caras
Respuesta: 0,25
Respuesta: 0,00
d) ninguna cara
Respuesta: 0,25
Respuesta: 0,33
b) un nmero impar
Respuesta: 0,5
Respuesta :0,375
b) 2 o mas caras
Respuesta :0,50
c) mas de 2 caras
Respuesta :0,125
5.6. PROBLEMAS
d) a lo sumo 2 caras
54
Respuesta :0,875
14. De un conjunto de 21 tarjetas numeradas del 1 al 21, se extrae una al azar. Calcular la
probabilidad de que la tarjeta extraida un nmero:
a) sea mltiplo de 3 o de 7
Respuesta: 0,4762
b) sea mltiplo de 5 o de 7
Respuesta: 0,3333
c) sea mltiplo de 4 o de 11
Respuesta: 0,2857
Respuesta: 0,8095
e) sea mltiplo de 3 o de 4
Respuesta: 0,5714
f) sea mltiplo de 3 o de 5
Respuesta: 0,5238
15. Supngase que el Seor Gmez planea salir la noche del sbado prximo. Las probabilidades de que baya a un juego de baloncesto, al cine o a una carrera de caballo son
0,35; 0,30 y 0,20 respectivamente. Determinar la probabilidad de que:
a) haga cual quiera de estas tres cosas
Respuesta: 0,85
Respuesta: 0,15
16. En un grupo de colegio han suspendido las matemticas el 60 % de los nios, fsica el
50 % y ambas asignaturas el 20 %. Calcular la probabilidad de que elegido un nio al
azar, haya suspendido las matemticas, la fsica o ambas.
Respuesta:0,90
17. Durante una semana dada las probabilidades de que unas acciones aumenten su precio,
permanezcan constantes o disminuyan su precio son estimados en 0,30; 0,20 y 0,50
respectivamente.
a) Cul es la probabilidad que estas acciones aumenten su precio o permanezcan
sin cambios?
Respuesta: 0,50
b) Cul es la probabilidad de que esas acciones, el precio cambie durante las semana?
Respuesta: 0,80
18. Suponga que el 80 % de los norteamericanos, que pasan vacaciones en Europa visitan
Paris, el 70 % Berln y el 60 % visitan Paris y Berln.
a) Cul es la probabilidad de que un norteamericano que pasa vacaciones en Europa visite Paris o Berln o ambos?
Respuesta: 0,90
b) Cul es la probabilidad de que no visite ninguna de esas ciudades?
Rta: 0,10
19. Suponga que la probabilidad de que llegue a asistir a una universidad es 0,60, la probabilidad de que trabaje tiempo completo es 0,70, la probabilidad de que llegue a asistir
a una universidad y trabaje tiempo completo es 0,50. Cul es la probabilidad de que
asista a una universidad o trabaje tiempo completo?
Respuesta: 0,80
20. Una caja contiene 10 esferas, 5 de ellas son blancas, 3 rojas y 2 negras. Se selecciona
aleatoriamente esferas de la caja sin reemplazo:
a) Si se extraen dos esferas de la caja. Cul es la probabilidad de que las 2 esferas
blancas?
Respuesta: 0,2222
5.6. PROBLEMAS
55
Respuesta: 0,091
Respuesta: 0,4242
22. Se tiene tres urnas, la primera contiene 50 bolas rojas y 50 bolas blancas; la segunda 60
bolas amarillas y 40 blancas, la tercera 70 bolas verdes y 30 blancas. Si se selecciona
aleatorimente una de las urnas y se extraen dos bolas con reposicin:
a) Cul es la probabilidad de que ninguna sea blanca?
Respuesta: 0,3667
Respuesta: 0,1667
Respuesta:0,1667
Respuesta:0,0833
Respuesta:0,1667
Respuesta:0,1667
24. De 100 individuos que presenten su solicitud para ocupar puestos de analista de sistemas en una gran empresa en el ultimo ao. 40 contaban con experiencia laboral
previa y 30 tenan titulo profesional. Sin embargo 20 de los solicitantes tenan tanto
experiencia laboral como titulo profesional, de modo que han sido incluidos en ambos
conteos.
a) Cul es la probabilidad de que un solicitante aleatoriamente elegido tenga ya sea
experiencia laboral o titulo profesional o ambos?
Respuesta: 0,50
b) Cul es la probabilidad de que un solicitante aleatoriamente elegido tenga ya sea
experiencia laboral o titulo profesional pero no ambos?
Respuesta: 0,30
25. De 300 estudiantes de administracin 100 estn actualmente inscritos en contabilidad
y 80 estn actualmente inscritos en estadstica aplicada a la administracin. Estas cifras
de inscripcin incluyen a 30 estudiantes inscritos en ambos cursos.
a) Cul es la probabilidad de que un estudiante aleatoriamente elegido este inscrito
ya sea en contabilidad o en estadstica o en ambos?
Respuesta: 0,50
b) Cul es la probabilidad de que un estudiante aleatoriamente elegido este inscrito
ya sea en contabilidad o en estadstica pero no en ambos?
Respuesta: 0,40
5.6. PROBLEMAS
56
26. En una caja hay 15 lapiceras con las plumas en buen estado, de los cuales 5 no tienen
tinta, adems 6 lapiceras con las plumas rotas. Al sacar una lapicera. Calcular la probabilidad de que la lapicera no escriba.
Respuesta: 0,5238
27. Para la sealizacin de emergencia se ha instalado dos indicadores que funcionan independientemente; la probabilidad de que un indicador se accione durante la avera es
igual a 0,95 para el primero y 0,90 para el segundo. Hallar las siguientes probabilidades
que durante una avera:
a) accione solo un indicador
Respuesta: 0,14
Respuesta: 0,995
28. Una caja contiene 20 unidades de cierto producto electrnico, 4 de ellos son defectuosos y 16 son buenas. Se seleccionarn aleatoriamente 4 unidades y se vendern.
Obtngase la probabilidad de que:
a) las cuatro unidades vendidas sean defectuosos
1
Respuesta: 4845
48
Respuesta: 323
13
Respuesta: 969
29. De 12 cuentas contables que se tienen en un archivo, 4 contienen un error de procedimientos en la elaboracin de los saldos:
a) Si el auditor elige al azar 2 cuentas. Cul es la probabilidad de que ninguna
cuenta contenga error de procesamiento? Respuesta: 14
33
b) Si el auditor elige al azar 3 cuentas. Cul es la probabilidad de que ninguna
cuenta contenga error de procesamiento? Respuesta: 14
55
c) Si el auditor muestrea 2 cuentas. Cul es la probabilidad de que las cuenta
1
elegidas contenga errores? Respuesta: 11
d) Si el auditor muestrea 2 cuentas. Cul es la probabilidad de que al menos una
de ellas contenga error? Respuesta: 19
33
e) Si el auditor muestrea 3 cuentas. Cul es la probabilidad de que al menos una
de ellas contenga error? Respuesta: 41
55
29. En un deposito hay 3000 cajas de plumas de las marcas A, B, C, D y E y en ellas hay
cajas de plumas deterioradas. Las cajas se distinguen de la siguiente manera:
Marca A: hay 200 cajas: 50 son deterioradas
Marca B: hay 300 cajas: 40 son deterioradas
Marca C: hay 1000 cajas: 300 son deterioradas
Marca D: hay 800 cajas: 80 son deterioradas
Marca E: hay 700 cajas: 30 son deterioradas
Si se elige una caja al azar, y resulta deteriorada, calcular la probabilidad de que
pertenezca:
a) a la marca A
Respuesta: 0,1
5.6. PROBLEMAS
57
b) a la marca B
Respuesta: 0,08
c) a la marca C
Respuesta: 0,6
d) a la marca A o D
Respuesta: 0,26
e) a la marca B o E
Respuesta: 0,24
30. La urna A tiene 2 boletines rojos y 3 azules; la urna B contiene 4 rojas y 1 azul y la urna
C 3 rojas y 4 azules. Se selecciona aleatoriamente una urna y un boletn es extrado y
que resulta ser rojo. Hallar la probabilidad de haber escogido:
a) la urna A
Respuesta: 14
57
b) la urna B
Respuesta: 28
57
c) la urna C
5
Respuesta: 19
d) la urna A o B
Respuesta: 14
19
e) la urna A o C
Respuesta: 29
57
31. Un agente de una compaa de seguros vende plizas a 5 personas, todas de edad idntica y con buena salud. De acuerdo con la tabla de los actuarios la probabilidad de que
una persona de esta edad especifica est viva en 30 aos es 23 . Hallar la probabilidad
de que en 30 aos estn vivas:
a) las 5 personas
32
Respuesta: 243
b) al menos 3 personas
Respuesta: 64
81
c) solamente 2 personas
40
Respuesta: 243
Respuesta: 242
243
32. En una exhibicin canina, 3 de los 10 perros premiados deben seleccionarse para que
aparezcan en un comercial de comida para perros. Se han otorgados premios a tres
cooles, cuatro pastores alemn, dos perros galeces y un perro de agua.
a) Cual es la probabilidad de que los tres perros elegidos sean de la misma raza?
Respuesta: 0,042
b) Cual es la probabilidad de que se seleccionen dos cooles y un pastor alemn?
Respuesta: 0,10
33. Una caja con guantes de bisbol contiene 2 guantes para jugadores zurdos y 7 para
diestros. Si se seleccionan 3 guantes al azar:
a) Cul es la probabilidad de que los tres sean para jugadores diestros?
Respuesta: 0,417
b) Cul es la probabilidad de que se escogiera un guante para un jugador diestro y
2 para zurdos?
Respuesta: 0,083
34. En una caja hay 18 artculos de los cuales cuatro son defectuosas. Si se extrae aleatoriamente tres artculos al mismo tiempo. Calcular las siguientes probabilidades
a) los tres artculos sean buenos
Respuesta: 0,4461
5.6. PROBLEMAS
58
Respuesta: 0,9951
Respuesta: 0,8922
Respuesta: 0,216
Respuesta: 0,9647
Respuesta: 0,0833
Respuesta: 0,50
Respuesta: 0,50
Respuesta: 0,25
39. La probabilidad de que en los hogares de una poblacin tengan lava vajilla es 0,40 y
de que tengan video es de 0,30. Calcular las siguientes probabilidades:
a) que tengan lava vajilla y video
Respuesta: 0,12
Respuesta: 0,58
Respuesta: 0,064
Respuesta: 0,25
40. Se extrae tres cartas de un mazo de 40. Calcular las siguientes probabilidades:
a) Que sean de distintos palos
Respuesta: 0,4049
Respuesta: 0,00108
Respuesta: 0,988
Respuesta: 0,000175
Respuesta: 0,000394
42. De una baraja de 40 naipes bien mezcladas, se sacan al azar 5 cartas. Hallar la probabilidad de que:
5.6. PROBLEMAS
59
a) 4 sean sotas
Respuesta: 0,000055
Respuesta: 0,4271
Respuesta: 0,0000365
1
54145
1
Respuesta: 649740
1
Respuesta: 108290
64
Respuesta: 162435
18472
Respuesta: 54145
Respuesta:
b) 4 aces y un rey
c) 3 dieses y dos jotas
d) un nueve, diez, jota, reina y rey en cualquier orden
e) al menos un as
Respuesta: 0,76
Respuesta: 0,56
45. En una zapatera hay tres estanteras A, B y C, la primera tiene 50 pares de zapatos
negros y 25 marrones, la segunda tiene 40 de cada color y la ultima 20 negros y 30
marrones. Si un cliente no tiene preferencia especial respecto a las estanteras ni respecto al color elige un par de zapatos y es marrn. Calcule la probabilidad de que
15
proceda de la estantera B.
Respuesta: 43
46. Dos seres humanos y ocho elefantes se sientan al azar entorno a una mesa circular.
Calcular la probabilidad de que los humanos esten juntos.
Respuesta:
47. Si A y B son dos sucesos tales que P(A) = 0, 6 y P(B) = 0, 7. Calcular: P(A B) y
P(A B) sabiendo que P(A B) P(A B) = 0, 4
Respuesta: P(A B) = 0, 8 y
P(A B) =0,5 o P(A B) = 0, 5 y P(A B) = 0, 8
48. Al lanzar un dado al aire, sea A el suceso de obtener un mltiplo de 3 y B el suceso de
obtener un nmero par. Justificar si los sucesos son o no independientes.
Respuesta:
Son independientes
49. Un jugador lleva en el bolsillo dos monedas, una normal y otras con dos caras. Elige al
azar una de las monedas y la lanza al aire.
Calcular la probabilidad de que caiga cara
Respuesta:
5.6. PROBLEMAS
60
Respuesta:
Re-
55. Una clase consta de 10 hombres y 20 mujeres de los cuales la mitad de los hombres y
la mitad de las mujeres tienen ojos castaos. Hallar la probabilidad de que una persona
escogida al azar sea un hombre o tenga los ojos castaos.
Respuesta:
56. La probabilidad de que A de en el blanco es 0,4 y la de B es 0,5. Si A y B disparan,
Cul es la probabilidad de que uno de ellos pegue en el blanco?
Respuesta:
5.6. PROBLEMAS
61
57. Se escogen al azar dos dgitos desde del conjunto {1, 2, 3, ...., 9}. Si la suma es par,
hallar la probabilidad de que ambos sean nmeros impares.
Respuesta:
58. Se escogen al azar tres lamparas entre 15 de las cuales 5 son defectuosos. Hallar la
probabilidad de que:
ninguna sea defectuosa
Respuesta:
Respuesta:
59. Se selecciona al azar dos cartas entre 10 cartas numeradas de 1 a 10. Hallar la probabilidad de que la suma sea impar si:
las dos cartas se sacan juntas
Respuesta:
Respuesta:
Respuesta:
60. Una clase tiene 12 nios y 4 nias. Se seleccionan tres estudiantes de la clase al azar.
Cul es la probabilidad de que todas sean nias?
Respuesta:
61. En cierta facultad, 4 % de los hombres y 1 % de las mujeres tienen ms de 6 pies de
estatura . Adems, 60 % de los estudiantes son mujeres. Ahora bien si se selecciona al
azar un estudiante y es ms alto que 6 pies, Cul es la probabilidad de que el estudiante
seleccionado sea mujer?
Respuesta:
62. Una caja contiene tres monedas; una de las monedas es corriente, otra tiene dos caras
y la tercera esta cargada de modo que la probabilidad de obtener cara sea 0,6 . Se
selecciona una de las monedas y se lanza al aire. Hallar la probabilidad de que salga
cara.
Respuesta:
63. Una urna contiene 3 bolas rojas y 7 blancas. Se saca una bola de la urna y se reemplaza
por una de otro color. Se saca de la urna una segunda bola.
Hallar la probabilidad de que la segunda bola sea roja
Respuesta:
Si ambas son del mismo color. Cul es la probabilidad de que las dos sean
blancas?
Respuesta:
64. Se nos da dos urnas como sigue: La urna A contiene 3 bolas rojas y 2 bolas blancas y la
urna B contiene 2 bolas rojas y 5 bolas blancas. Se selecciona al azar una urna; se saca
una bola y se coloca en la otra urna, luego se saca una bola de la segunda urna. Hallar
la probabilidad de que las dos bolas sacadas sean del mismo color.
Respuesta:
65. En una carretera entre las ciudades A y B hay tres semforos, a una distancia de unos
kilmetros entre si. Los ciclos de los mismos son de un minuto cada uno. Los tres
semforos estn prendidos en verde durante 30, 40 y 50 segundos respectivamente.
Suponiendo que un auto observa los reglamentos de transito. Calcular la probabilidad
de que el auto:
haga el viaje sin parar por causa del semforo
deba parar exactamente ante un semforo
Respuesta:
Respuesta:
5.6. PROBLEMAS
62
Respuesta:
Respuesta:
Re-
Respuesta: 0,99
Captulo 6
Variables aleatorias
6.1.
Definiciones y ejemplos
Definicin 6.1.1 Una variable aleatoria es aquella que toma un conjunto de valores numricos asociados a los resultados de nuestro inters que produce un experimento aleatorio, es
decir una funcin que asocia a cada evento del espacio muestral un nmero real.
La definicin anterior nos dice que dado un experimento aleatorio cualquiera, y el espacio
muestral asociado a dicho experimento, una variable aleatoria es una transformacin X del
espacio de resultados (espacio muestral) al conjunto de nmeros reales, esto es, asigna a cada
elemento , un nmero real X(). La expresin matemtica est dada por:
X : R
64
letras del alfabeto en maysculas, U,V,W, X,Y, Z, y para un valor cualquiera de ellas se usa
la misma letra pero en minscula.
Ejemplo 6.1.1 Si un experimento aleatorio consiste en lanzar una vez un dado equilibrado
y observar la cara superior del dado una vez que cae. Denotemos por 1,2,3,4,5 y 6 las
seis caras del dado. Es claro que el espacio muestral es = {1, 2, 3, 4, 5, 6}. Podemos definir
entonces la variable aleatoria X : R como X({1}) = 1 y X({2, 3, 4, 5, 6}) = 0 si
nuestro inters es el nmero de veces que se obtiene el 1 en este experimento.
Ejemplo 6.1.2 Consideremos el experimento aleatorio consistente en lanzar un dardo en
un tablero circular de radio uno. El espacio muestral o conjunto de posibles resultados del
experimento se puede escribir como sigue:
= {(x, y) : x2 + y2 1}
Los siguientes son ejemplos de funciones de en R, variables aleatorias, asociadas a este
experimento aleatorio:
a) X(x, y) = x, proyeccin sobre el eje horizontal.
b) Y (x, y) = y, proyeccin sobre el eje vertical.
p
c) Z(x, y) = x2 + y2 , distancia al centro del crculo.
d) V (x, y) = |x| + |y|, distancia del taxista.
e) W (x, y) = xy, producto de las coordenadas.
Figura 6.2: Representacin grfica del espacio muestral del ejemplo 6.1.2
Considerando el conjunto de valores que una variable aleatoria puede tomar, se puede
clasificar a las variables aleatorias en dos tipos: discretas o continuas.
Definicin 6.1.2 Una variable aleatoria es discreta cuando el conjunto de valores que sta toma es un conjunto discreto, es decir, un conjunto finito o numerable. Por ejemplo, el
conjunto {0, 1, 2, ..., n} es un conjunto discreto porque es finito, lo mismo N pues aunque es
infinito, es numerable y por lo tanto discreto.
65
66
Nota importante. A travs de una variable aleatoria se puede considerar que los posibles
resultados de un experimento aleatorio no son elementos en sino nmeros reales que la
variable aleatoria puede tomar. Esta es una consideracin radical pues ya no consideraremos
experimentos aleatorios particulares, ni espacios muestrales arbitrarios , ni eventos (subconjuntos) de , en lugar de ello consideraremos que una cierta variable aleatoria de inters
toma valores en un cierto subconjunto de nmeros reales. La probabilidad definida antes para
subconjuntos de se traslada, como explicamos antes, a probabilidades para subconjuntos
de R. Esta perspectiva permite estudiar modelos generales y despus aplicarlos a cualquier
situacin particular. A partir de ahora y en lo que resta del curso el trmino variable aleatoria
constituir un elemento frecuente en los enunciados.
6.2.
Distribucin de probabilidad
En esta seccin vamos a estudiar a las dos funciones que se asocian a cada variable aleatoria y que adems nos provean de informacin acerca de las caractersticas de dicha variable
aleatoria. Una de estas funciones es llamada funcin de distribucin y se asocia a una variable continua o discreta, la otra depende del tipo de variable estudiada, en el caso continuo se
denomina funcin de densidad de probabilidad y en caso discreto simplemente funcin de
probabilidad. Estas funciones nos permiten representar a un mismo tiempo tanto los valores
que pueden tomar la variable aleatoria como las probabilidades de los distintos eventos involucrados. Entonces en primer trmino defininamos primero la funcin de probabilidad para
una variable aleatoria discreta, despus la funcin de densidad para una variable continua, y
finalmente definamos la funcin de distribucin para ambos tipos de variables aleatorias.
Definicin 6.2.1 (Funcin de probabilidad para una variable discreta)
Sea X una variable aleatoria discreta que toma los valores x1 , x2 , . . . con probabilidades
respectivas P(X = x1 ), P(X = x2 ), . . . . Esta lista de valores numricos y sus probabilidades
puede ser finita o bien infinita, pero numerable. La funcin de probabilidad de la variable
aleatoria X denotada por f (x) : R [0, ) se define como sigue
P(X = x) si x = x1 , x2 , . . .
f (x) =
(6.2.1)
0
en otro caso
En palabras, la funcin de probabilidad es simplemente aquella funcin que indica los
valores de la probabilidad en los distintos valores que toma la variable aleatoria discreta.
Recordemos que es importante poder distinguir entre X y x, pues conceptualmente son cosas
muy distintas. Denotaremos generalmente a una funcin de probabilidad con la letra f minscula. A veces escribiremos fX (x) y el subndice nos ayudar a especificar que tal funcin es
la funcin de probabilidad de la variable aleatoria X. Esta notacin ser particularmente til
cuando consideremos varias variables aleatorias a la vez.
6.2.1.
Si toda funcin de la forma (6.2.1) cumple las siguientes dos propiedades la llamaremos
funcin de probabilidad.
1) f (x) 0 para todo x R
67
f (x) = 1
x
Ejemplo 6.2.1 Considere la variable aleatoria discreta X que toma los valores 1, 2 y 3, con
probabilidades 0,3; 0,5 y 0,2 respectivamente. Entonces la funcin de probabilidad de X es
0, 3 si x = 1
0, 5 si x = 2
f (x) =
0, 2 si x = 3
Esta funcin se muestra grficamente en la Figura 6.2. Alternativamente podemos tambin expresar esta funcin mediante la tabla mostrada ms abajo. En esta representacin se
entiende de manera implcita que f (x) es cero para cualquier valor de x distinto de 1, 2 y 3.
En particular, compruebe que las siguientes probabilidades son correctas:
P(X 2) = 0, 7
P(|X| = 1) = 0, 3
P(X < 1) = 0
1
0,3
2
0,5
3
0,2
Ejemplo 6.2.2 Encontremos el valor de la constante c que hace que la siguiente funcin sea
de probabilidad.
cx si x = 0, 1, 2, 3
f (x) =
0 en otro caso
Los posibles valores de la variable aleatoria discreta, no especificada, son 0, 1, 2 y 3, con
probabilidades 0, c, 2c y 3c, respectivamente. Como la suma de estas probabilidades debe ser
uno, obtenemos la ecuacin c + 2c + 3c = 1. De aqui obtenemos c = 16 . Este es el valor de c
que hace que f (x) sea no negativa y sume uno, es decir, una funcin de probabilidad.
Definicin 6.2.2 (Funcin de densidad para una variable aleatoria continua)
Sea X una variable aleatoria continua. Decimos que la funcin integrable y no negativa
f (x) : R [0, ) es la funcin de densidad de X si para cualquier intervalo (a, b) de R se
cumple la igualdad
P(X (a, b)) =
Z b
a
f (x)dx
68
Es decir, la probabilidad de que la variable tome un valor dentro del intervalo (a, b) se
puede calcular o expresar como el rea bajo la funcin de densidad en el intervalo (a, b).
De esta forma el clculo de una probabilidad se reduce al clculo de una integral. Vase
la Figura 6.4. No es difcil comprobar que toda funcin de densidad f (x) de una variable
aleatoria continua X cumple las dos propiedades que mencionamos a continuacin anlogas
al caso discreto.
6.2.2.
Si toda funcin de la forma f (x) : R [0, ) cumple las siguientes dos propiedades la
llamaremos funcin de densidad de probabilidad.
1) f (x) 0 para todo x R
2)
Z +
f (x)dx = 1
Toda funcin f (x) : R [0, ) que satisfaga estas dos propiedades, sin necesidad de
tener una variable aleatoria de por medio, se llamar funcin de densidad.
Ejemplo 6.2.3 La funcin f (x) dada por:
si x (1, 3)
2
f (x) =
0 en otro caso
es una funcin de densidad de una variable aleatoria continua que toma valores en el intervalo
(1, 3), y cuya grfica aparece en la Figura 6.5. Observe que se trata de una funcin no negativa
y cuya integral vale uno.
Ejemplo 6.2.4 Encontrar el valor de la constante c que hace que la siguiente funcin sea de
densidad.
c|x| si x [1, 1]
f (x) =
0
en otro caso
69
f (x)dx =
Z 1
1
c|x|dx = 2c
Z 1
0
x 2 1
=c
xdx = 2c
2 0
Por lo tanto, cuando tomamos c = 1 la funcin anterior resulta ser una funcin de densidad pues ahora cumple con ser no negativa e integrar uno.
Definicin 6.2.3 (Funcin de distribucin). Sea X una variable aleatoria discreta o continua. La funcin de distribucin de X, denotada por F(x) : R [0, 1], se define como
F(x) = P(X x)
Esto es, la funcin de distribucin evaluada en un nmero x cualquiera es simplemente la
probabilidad de que la variable aleatoria tome un valor menor o igual a x, o en otras palabras,
que tome un valor en el intervalo (, x]. Siendo F(x) una probabilidad, sus valores estn
siempre entre 0 y 1. Esta funcin resulta ser importante y se le conoce tambin, por razones
evidentes, con el nombre de funcin de acumulacin de probabilidad. Con un par de ejemplo mostraremos la forma de calcular esta funcin a partir de la funcin de probabilidad o de
la funcin de densidad.
Ejemplo 6.2.5 Consideremos la variable aleatoria discreta X del ejemplo 6.2.1. Tenemos que
la correspondiente funcin de distribucin evaluada en x se calcula sumando las probabilidades P(X = u) para valores de u menores o iguales a x, es decir,
0 si x < 1
0, 3 si 1 x < 2
F(x) = P(X x) = P(X = u) =
0, 8 si 2 x < 3
ux
1 si x 3
cuya grfica aparece en la Figura 6.6. Este es el comportamiento tpico de una funcin de
distribucin de una v.a. discreta, es no decreciente, constante por pedazos, y si la funcin
tiene una discontinuidad en x, entonces el tamao de tal discontinuidad es exactamente la
probabilidad de que la variable aleatoria tome ese valor.
70
F(x) = P(X x) =
Z x
0
si x 1
0
si x 1
Z x
1
x1
f (u)du =
du si 1 < x < 3 =
si 1 < x < 3
2
1 2
1
si x 3
1
si x 3
cuya grfica aparece en la Figura 6.7. Observe que esta funcin es continua y no decreciente.
Z x
f (u)du
d
(F(x)) =
dx
f (x). De este modo podemos encontrar f (x) a partir de F(x). En el caso discreto, f (x) =
de modo que por el teorema fundamental del clculo, y cuando F(x) es diferenciable,
71
Proposicin 6.2.1 . Toda funcin de distribucin F(x) satisface las siguientes propiedades:
1. 0 F(x) 1
2. lm F(x) = 1
x
3.
lm F(x) = 0
6.2.3.
72
Distribuciones discretas
6.2.4.
Distribuciones continuas
6.3.
Todos los seres humanos tenemos caractersticas numricas que nos identifican y nos
distinguen de otras personas, por ejemplo, la edad, estatura, talla, peso, etc. Si pudiramos
considerar la totalidad de todos estos nmeros para una persona en particular, la identificaramos de manera nica. Algo similar sucede con las variables aleatorias. En esta seccin
estudiaremos algunas caractersticas numricas asociadas a las variables aleatorias.
6.3.1.
Esperanza
73
en donde la suma se efecta sobre todos los posibles valores que pueda tomar la variable
aleatoria X, y se define cuando esta suma sea absolutamente convergente, es decir,
E(X) = |x| f (x)
x
El nmero de sumandos puede ser finito o infinito dependiendo del conjunto de valores
de la variable aleatoria.
2. Si X es una variable aleatoria continua con funcin de densidad de probabilidad f (x),
entonces la esperanza es
Z
E(X) =
x f (x)dx
|x f (x)|dx
Si la suma o la integral anteriores no cumplen la condicin de convergencia absoluta, entonces se dice que la esperanza no existe. La esperanza de una variable aleatoria es entonces
un nmero que indica el promedio ponderado de los diferentes valores que puede tomar la
variable aleatoria. A la esperanza se le conoce tambin con los nombre de: media, valor esperado o valor promedio. En general se usa la letra griega (mu) para denotarla. La integral
o suma arriba mencionados pueden no ser convergentes y en ese caso se dice que la variable
aleatoria no tiene esperanza finita. La situacin anterior se ilustra en los ejercicios 126 y 127.
La esperanza es uno de los conceptos ms importantes en probabilidad y tiene un amplio
uso en las aplicaciones y otras ramas de la ciencia. Ilustraremos a continuacin la forma de
calcular la esperanza.
Ejemplo 6.3.1 Sea X una variable aleatoria discreta con funcin de densidad dada por la
siguiente tabla.
x
-1
0
1
2
f(x) 1/8 4/8 1/8 2/8
La esperanza de X es el nmero
3
E(X) =
4
1
2 1
1
x f (x) = 1 + 0 + 1 + 2 =
8
8
8
8 2
x=1
Observe que la suma su efecta para todos los valores de x indicados en la tabla, es decir :
-1, 0, 1 y 2. Tambin es instructivo observar que la esperanza no es necesariamente uno de
los valores tomados por la variable aleatoria. En este ejemplo el valor 21 nunca es tomado por
la variable aleatoria, pero es su valor esperado.
74
2x si 0 < x < 1
f (x) =
0 en otro caso
La esperanza de X es
E(X) =
x f (x)dx =
Z 1
0
1
2
2 2
x 2x = x =
3
3
0
Observe que la integral slo es relevante en el intervalo (0, 1), pues fuera de dicho intervalo
la funcin de densidad se anula.
Esperanza de una funcin de una variable aleatoria
En algunos casos es necesario saber calcular la esperanza de una funcin de una variable
aleatoria. Por ejemplo, si X es una variable aleatoria, entonces es claro que Y = X 2 es una
funcin de X y es tambin una variable aleatoria. Si Zquisiramos calcular la esperanza de
Y = X 2 segun la definicin tendramos que calcular
(6.3.2)
2x si 0 < x < 1
f (x) =
0 en otro caso
75
g(x) f (x)dx =
Z 1
0
1
2 4
1
2
x 2x = x =
4
2
0
Ejemplo 6.3.4 Sea X una variable aleatoria con funcin de probabilidad dada por la tabla
que aparece abajo. Encuentre la funcin de probabilidad de Y = X 2 usando la ecuacin(6.3.2).
x
f(x)
-1
1/8
0
4/8
1
1/8
2
2/8
Si X es una v.a. continua por definicin de esperanza para caso continuo tenemos que:
E(c) =
c f (x)dx = c
f (x)dx = c
b) Si X es una v.a. discreta por definicin de esperanza para caso discreto tenemos que:
E(cX) = (cx)P(X = x) = c xP(X = x) = cE(X)
x
Si X es una v.a. continua por definicin de esperanza para caso continuo tenemos que:
E(cX) =
(cx) f (x)dx = c
x f (x)dx = cE(X)
76
c) Este inciso es muy evidente pues cuando se cumple la hiptesis (E(X) 0), en la
integral o suma correspondiente solo aparecern trminos que son no negativos.
d) Esta ltima propiedad, en cambio, no es sencilla de demostrar y an en el caso discreto
requiere de detalles tcnicos que preferimos omitir.
Oservaciones:
Observe que la segunda y la cuarta propiedad establecen que la esperanza es lineal, es
decir, separa sumas y tambin separa multiplicaciones por constantes; esto es
E(c1 X + c2Y ) = c1 E(X) + c2 E(Y )
Adems si X1 , X2 , . . . , Xn son v.a. y c1 , c2 , . . . , cn son constantes arbitrarias se tiene que:
ciXi
k=1
ciE(Xi)
k=1
i=1
6.3.2.
Varianza
[x E(X)]2 f (x)
si X es una v.a. discreta
x
Var(X) = E[X E(X)]2 =
Z
La varianza es una medida del grado de dispersin de los diferentes valores tomados por
la variable aleatoria. Se le denota regularmente por la letra 2 (sigma cuadrada). A la raz
cuadrada positiva de la varianza, esto es , se le llama desviacin estndar. Nuevamente la
anterior suma o integral puede no existir y en ese caso decimos que la variable aleatoria
no tiene varianza finita. Observemos que para calcular Var(X) necesitamos conocer primero
E(X). Veamos algunos ejemplos sencillos.
Ejemplo 6.3.5 Calcularemos la varianza de la variable aleatoria discreta X con funcin de
probabilidad dada por la siguiente tabla.
x
f(x)
-1
1/8
0
4/8
1
1/8
2
2/8
77
1
Recordemos primeramente que por clculos previos, E(X) = . Aplicando la definicin de
2
varianza para v.a. discreta Var(X) = [x E(X)]2 f (x), tenemos que:
x
1 2 4
1 2 1
1 2 2
1 2 1
Var(X) = 1
+ 0
+ 1
+ 2
=1
2
8
2
8
2
8
2
8
Ejemplo 6.3.6 Calcularemos la varianza de la variable aleatoria continua X con funcin de
densidad f (x) = 2x para x (0, 1) y cero en otro caso. En un clculo previo habamos encon2
trado que E(X) = . Aplicando la definicin de varianza para una v.a. continua Var(X) =
3
Z
2
[x E(X)] f (x)dx, tenemos que
Var(X) =
Z 1
2 2
2xdx =
3
Z 1
0
x4 8
8
8
4 1
1
2x3 x2 + x dx =
x3 + x2 =
3
9
2 9
9
18
0
Propiedades de la varianza
Ahora enunciamos algunas propiedades de la varianza.
Proposicin 6.3.3 Sean X y Y dos variables aleatorias, y sea c una constante. Entonces
a) Var(X) 0
b) Var(c) = 0
c) Var(cX) = c2Var(X)
d) Var(X + c) = Var(X)
e) Var(X) = E(X 2 ) (E(X))2
f) Var(X +Y ) 6= V (X) +V (Y )
Demostracin
a) Este inciso es evidente a partir de la definicin de varianza pues en ella aparece una
suma o integral de trminos no negativos.
b) Para este inciso la constante c es una v.a. con un nico valor, de modo que E(c) = c,
entonces
Var(X) = E(c c)2 = E(0)2 = E(0) = 0
c) Para este inciso tenemos que:
Var(cX) = E[cX E(cX)]2 = E[cX cE(X)]2 = E[c2 (X E(X))2 ]
= c2 E[X E(X)]2 = c2Var(X)
78
Var
c
X
=
i
i
k=1
c2i Var(Xi)
k=1
Nota: En este curso no entraremos en detalles con respecto a las v.a. independientes por
eso no demostraremos las propiedades que este hecho implica en la esperanza y la varianza
de la suma de v.a. de este tipo mencionadas anteriormente.
6.3.3.
Momentos
Los momentos de una variable aleatoria son nmeros que representan algunas caractersticas de la distribucin de probabilidad asociada. Bajo ciertas condiciones el conjunto de
momentos determinan de manera nica a la distribucin de probabilidad. A continuacin
definiremos los momentos si existen de una variable aleatoria alrededor del origen y alrededor de la media tambin llamada momento central.
Definicin 6.3.3 (Momentos)
Se define el n-simo momento de una variable aleatoria X alrededor del origen, cuando
existe, como el nmero E(X n ), para cualquier valor natural de n. El n-simo momento central
de X, cuando existe, es el nmero E[(X ]n , en donde = E(X).
79
xn f (x)
si X es una v.a. discreta
x
E(X n ) =
Z
El n-simo momento central de X se calcula, para variables aleatorias discretas y continuas respectivamente, como indican las siguientes frmulas:
(x )n f (x)
si X es una v.a. discreta
x
E[X ]n =
Z
Ejemplo 6.3.7 Sea la variable aleatoria discreta X con funcin de probabilidad dada por la
siguiente tabla.
x
0
1
2
f(x) 1/4 2/4 1/4
a) Hallar el primer, segundo y tercer momento alrededor del origen
b) Calcular el primer, segundo y tercer momento alrededor de la media
Desarrollo de los incisos
a) Por definicin de momentos alrededor del origen tenemos que
2
E(X) =
x f (x) = 0 4 + 1 4 + 2 4 = 1
x=0
E(X 2 ) =
x2 f (x) = 02 4 + 12 4 + 22 4 = 2
x=0
E(X 3 ) =
x3 f (x) = 03 4 + 13 4 + 23 4 = 2
x=0
E(X ) =
(x 1) f (x) = (0 1) 4 + (1 1) 4 + (2 1) 4 = 0
x=0
2
E[(X ) ] =
x=0
3
E[(X 1) ] =
x=0
80
Ejemplo 6.3.8 Una variable aleatoria X tiene funcin de densidad de probabilidad dada por:
x
si 0 < x < 2
2
f (x) =
0 en otro caso
a) Hallar el primer, segundo y tercer momento alrededor del origen
b) Calcular el primer y segundo momento alrededor de la media
Desarrollo de los incisos
a) Por definicin de momentos alrededor del origen tenemos que
Z 2
x
x3 2 4
E(X) =
x dx = =
6 0 3
0 2
Z 2
x
x4 2
E(X 2 ) =
x2 dx = = 2
2
8 0
0
Z 2
5
x
x 2 16
x3 dx = =
E(X 3 ) =
2
10 0
5
0
b) Por definicin de momentos alrededor de la media tenemos que
4 4 4
4
= E(X) E
= =0
E(X ) = E X
3
3
3 3
Z
Z
h
2
4 2x
4 2
1 2 3 8 2 16
x
=
x x + x dx
E[(X )2 ] = E X
dx =
3
3 2
2 0
3
9
0
4
2
1 x
8
8
2
=
x3 + x2 =
2 4 9
9
9
0
6.4.
etx f (x)
si X es una v.a. discreta
x
MX (t) =
Z
81
Ejemplo 6.4.1 Sea X la variable aleatoria discreta del ejemplo 6.3.7, es decir, con funcin de
probabilidad dada por la tabla.
x
f(x)
0
1/4
1
2/4
2
1/4
e2t + 2et + 1
tx
0 1
1t 2
2t 1
e
f
(x)
=
e
+
e
+
e
4
4
4
4
x=0
Ejemplo 6.4.2 Una variable aleatoria X tiene funcin de densidad de probabilidad dada por:
2x
si x 0
2e
f (x) =
0
en otro caso
Obtener su funcin generadora de momentos.
Por la definicin de funcin generadora de momentos tenemos
MX (t) = E(etX ) =
=
etx f (x)dx =
Z
0
etx 2e2x dx = 2
Z
0
e(2t)x dx
2
2
e(2t)x =
(2 t)
2t
0
dn
MX (0) = E(X n )
n
dt
Demostracin
Por definicin de funcin generadora de momentos, MX (t) = E(eXt ) y por serie de Taylor,
(tX)k
e(Xt) =
. Por lo tanto
k=0 k!
k
t
(tX)k
= E(X k )
MX (t) = E
k=0 k!
k=0 k!
d
t k1
t k1
MX (t) =
E(X k ) =
E(X k1 X) = E(XetX )
dt
(k
1)!
(k
1)!
k=1
k=1
82
t k2
t k2
d2
k
MX (t) =
E(X ) =
E(X k2 X 2 ) = E(X 2 etX )
2
dt
k=2 (k 2)!
k=2 (k 2)!
..
.
t kn
t kn
dn
k
M
(t)
=
E(X
)
=
E(X kn X n ) = E(X n etX )
X
dt n
(k
n)!
(k
n)!
k=n
k=n
Por lo que finalmente
dn
M
(0)
= E(X n )
X
dt n
Ejemplo 6.4.3 Tomemos nuevamente a la variable aleatoria discreta X del ejemplo 6.4.1
junto con su funcin generadora de momentos y calculemos los cuatro primeros momentos
de la variable alrededor del origen. Entonces
et + et + 1
MX (t) =
2
d
e2t + et
1+1
E(X) =
Mx (t) =
=1
=
dx
2
2
t=0
t=0
d2
2e2t + et
2+1 3
E(X 2 ) = 2 Mx (t) =
=
=
dx
2
2
2
t=0
t=0
3
2t
t
d
4e + e
4+1 5
E(X) = 3 Mx (t) =
=
=
dx
2
2
2
t=0
t=0
4
2t
t
d
8e + e
8+1 9
E(X) = 4 Mx (t) =
=
=
dx
2
2
2
t=0
t=0
Ejemplo 6.4.4 Tomemos ahora la variable aleatoria continua X del ejemplo 6.4.2 junto con
su funcin generadora de momentos y calculemos los cuatro primeros momentos de la variable alrededor del origen. Entonces
MX (t) =
2
2t
d
2
2
1
Mx (t) =
= 2=
2
dx
(2 t) t=0 2
2
t=0
4
4
d2
1
E(X 2 ) = 2 Mx (t) =
= 3=
3
dx
(2 t) t=0 2
2
t=0
12
12 3
d3
E(X) = 3 Mx (t) =
= 4 =
4
dx
(2 t) t=0 2
4
t=0
48
d4
48 3
E(X) = 4 Mx (t) =
= 5 =
5
dx
2
t=0
(2 t) t=0 2
E(X) =
Xi
i=1
6.5. PROBLEMAS
83
Demostracin
Por definicin de funcin generadora de momentos se tiene que
n
Xi
Xit
n
n
n
Xi t
Xi t
i=1
=
E
e
=
E
e
=
E(e
)
=
(t)
MXi (t)
i=1
i=1
i=1
i=1
Notese que para esta demostracin utilizamos la propiedad de la esperanza para v.a. independientes.
6.5.
Problemas
Variables Aleatorias
1. Determine en cada caso si la variable aleatoria en cuestin es discreta o continua.
Cules son sus posible valores?
a) Tiempo de vida de una persona escogida al azar.
b) Nmero de errores tipogrficos en una pgina escogida al azar de un libro.
c) Tiempo de servicio en una transaccin escogida al azar realizada por una persona
en un cajero automtico.
d) Monto de una reclamacin por accidente automovilstico escogida al azar del
conjunto de reclamaciones efectuadas a una compaa aseguradora.
2. Considere el experimento aleatorio de escoger un nmero al azar dentro del intervalo
unitario (0, 1). Suponga que cada resultado de este experimento se escribe en su expansin decimal como = 0, x1 x2 x3 . . . . Determine en los siguientes casos el conjunto de
valores de la variable aleatoria definida y clasifique sta como discreta o continua.
a) X() =
b) X() = x1
c) X() = 1
d) X() = 0, 0x1 x2 x3 . . .
3. Considere un experimento aleatorio con espacio muestral equiprobable = {1, 2, 3, 4, 5, 6}.
Defina la variable aleatoria X() = 2( 3). Cules son los posibles valores de X?.
Calcule P(X = 0), P(X {2, 3}), P(X 0), P(X < 0), P(X 2 = 1), P(2X 4 = 0), y
P(X 2 = 4).
4. Considere el ejemplo del experimento aleatorio de lanzar un dardo en un tablero circular de radio p
uno, Figura 1.13, junto con las variables aleatorias X(x, y) = x,Y (x, y) = y
y Z(x, y) = x2 + y2 . Suponga que para cada regin A cuya rea puede ser calcurea(A)
lada se define por P(A) =
.
rea()
1
1
1
Calcule P(X 0), P(X < 0), P(X +Y 1), P(Y > X), P Z <
yP
<Z<
.
2
3
2
6.5. PROBLEMAS
84
x2
si x = 2, 1, 0, 1, 2
10
a) f (x) =
0 en otro caso
(2x 5)2
si x = 1, 2, 3, 4, 5
70
b) f (x) =
0
en otro caso
2. Grafique y compruebe que las siguientes funciones son de densidad
x+1
si x (1, 1)
2
a) f (x) =
0
en otro caso
x
e
si x > 0
b) f (x) =
0 si x 0
3. Encuentre el valor de la constante c para que f (x) sea una funcin de probabilidad.
Grafique esta funcin y calcule P(X 2, 3, 4) y P(X < 3) en cada caso.
cx si x = 1, 2, . . . , 10
a) f (x) =
0 en otro caso
2
cx si x = 1, 2, . . . , 10
b) f (x) =
0 en otro caso
4. Determine si la siguiente funcin es de probabilidad. Grafique la funcin y justifique
su respuesta.
si x = 0, 1
2
f (x) =
si x = 2
0 otro caso
5. Determine si la siguiente funcin es de probabilidad. Grafique la funcin y justifique
su respuesta.
3 x 1 4x
4
si x = 0, 1, 2, 3, 4
x!(4 x)! 4
4
f (x) =
0
otro caso
6.5. PROBLEMAS
85
0
en otro caso
7. Encuentre el valor de la constante c para que la siguiente funcin sea de densidad.
Grafique f (x) y calcule P(X (1, )).
f (x) = ce|x| para < x <
8. Determine si cada una de las siguientes funciones es de densidad. Grafique la funcin
en cada caso y justifique su respuesta.
4x
si x [0, 2]
5
a) f (x) =
0
otro caso
2x2
4
2x +
si x [0, 3]
3
3
b) f (x) =
0
en otro caso
9. Explique porqu no es posible encontrar un valor de la constante c para que la siguiente
funcin sea de probabilidad o de densidad.
cx si x = 2, 1, 0, 1, 2
a) f (x) =
0
otro caso
c senx si x [, ]
b) f (x) =
0
en otro caso
10. Sea X una v.a. discreta con funcin de probabilidad dada por la siguiente tabla. Grafique
f (x) y calcule P(X 0), P(X < 0) y P(X 2 = 1).
x
-1
f(x) 0,2
0
0,3
1
0,5
11. Dadas las variables aleatorias con funciones de probabilidad dada por las tablas
x
f(x)
0
1/210
x
f(x)
2
1/36
1
4/35
3
1/18
2
3
3/7 8/21
4
1/12
5
1/9
4
1/14
6
5/36
7
1/6
8
5/36
9
1/9
10
1/12
11
1/18
12
1/36
6.5. PROBLEMAS
86
-2
0,1
-1
0,15
0
0,4
2
0,1
3
0,15
5
0,1
13. Sea X discreta con funcin de probabilidad dada por la tabla que aparece abajo. Encuentre el valor de c y grafique f (x). Calcule y grafique la funcin de probabilidad de
la variable Y = X 2 .
x
-2 0 2
f(x) 0,1 c 0,1
14. Sea X una variable aleatoria con la siguiente funcin de distribucin. Encuentre y
grafique f (x). Calcule P(0 X < 10).
1 x+1
1
si x = 0, 1, 2, 3, . . .
2
F(x) =
0
otro caso
15. Sea X una v.a. continua con funcin de densidad
si k x 4k
10
f (x) =
0
otro caso
a) Determine el valor de la constante k y grafique f (x)
b) Calcule y grafique F(x)
c) Calcule P(1 X 3), P(X 2) y P(X 0)
1
d) Encuentre m tal que P(|X 1| m) =
2
16. Sea X una variable aleatoria continua con la funcin de densidad que aparece abajo.
Encuentre el valor de la constante c y grafique la funcin f (x). Encuentre y grafique
adems la funcin de distribucin F(x).
2x
si 0 < x < c
9
f (x) =
0 si en otro caso
ce3x si x > 0
0
si x 0
a) Obtenga el valor de c que haga que esta funcin sea de densidad para X
6.5. PROBLEMAS
87
2 si 0 < t < 1
1
f (t) =
4 si 2 < t < 4
0
para x < 1
1
F(x) =
si 1 x < 2
1
para x 2
21. Sea X una variable aleatoria con la funcin de distribucin que aparece abajo. Es X
discreta o continua? Grafique F(x). Encuentre y grafique la correspondiente funcin
1
1
de densidad f (x). Calcule adems P(X = ) y P(X > ).
2
2
0 para x < 0
x si 0 x < 1
F(x) =
1 para x 1
6.5. PROBLEMAS
88
22. Una urna contiene cuatro bolas numeradas 1, 2, 3 y 4. Se extraen dos bolas al azar, una
a la vez y sin reemplazo. Sea X la variable aleatoria que denota la suma de los nmeros
de las dos bolas seleccionadas.
a)
b)
c)
d)
Determine
Calcule y grafique f (x)
Calcule y grafique F(x)
Calcule P(X 6), P(3 < X 5) y P(X = 6)
si x = 0, 1
1
a) f (x) =
si x = 2, 3
0 otro caso
si x = 1, 1
1
b) f (x) =
si x = 0
0 otro caso
3. Calcule la esperanza de la variable aleatoria continua X cuya funcin de densidad es
a) f (x) = ex , para x > 0
b) f (x) = 6x(1 x), para 0 < x < 1
4. Sea X una variable aleatoria discreta con la funcin de probabilidad que aparece abajo.
Demuestre que f (x) es efectivamente una funcin de probabilidad y que la esperanza
de X no existe. Este es un ejemplo de una variable aleatoria discreta que no tiene
esperanza finita.
para x = 1, 2, 3, . . .
x(x + 1)
f (x) =
0
para otros casos
5. Sea X una variable aleatoria continua con la funcin de densidad que aparece abajo.
Demuestre que esta funcin es efectivamente una funcin de densidad. Compruebe
adems que la esperanza de X no existe. Este es un ejemplo de una variable aleatoria
continua que no tiene esperanza finita. Es un caso particular de la distribucin Cauchy.
1
, para < x <
f (x) =
2
(x + 1)
6.5. PROBLEMAS
89
2 para x > 1
x
f (x) =
0 para x 1
7. Encuentre la esperanza y luego demuestre que la varianza de una variable aleatoria con
la siguiente funcin de densidad no existe.
3 para x > 1
x
f (x) =
0 para x 1
8. Diga falso o verdadero. Justifique en cada caso.
a) La esperanza de una v.a. puede ser cero.
b) No hay dos v.a.s distintas con la misma esperanza.
c) La esperanza de una v.a. nunca es negativa.
d) La varianza de una v.a. puede ser cero.
e) La varianza de una v.a. nunca es negativa.
f) No hay dos v.a.s distintas con la misma varianza.
9. Demuestre que
a) E(E(X)) = E(X)
b) Var(Var(X)) = 0
10. Sea X la variable aleatoria constante c. Compruebe que
a) E(X) = c
b) E(X n ) = cn
c) Var(X) = 0
11. Calcule la media y varianza de la variable aleatoria X con funcin de probabilidad
si x = 0, 1, 2
2
f (x) =
si x = 3, 4, 5
0 otro caso
12. Calcule la media y varianza de la variable aleatoria X cuya funcin de probabilidad es
x+1
1
si x = 0, 1, 2, 3, . . .
2
f (x) =
0
otro caso
6.5. PROBLEMAS
90
Captulo 7
Distribuciones de probabilidad
Estudiaremos a continuacin algunas distribuciones de probabilidad de variables aleatorias importantes. Estas distribuciones son modelos particulares para asignar probabilidades
a subconjuntos de nmeros reales. Empezaremos con las distribuciones de tipo discreto y
continuaremos despus con las de tipo continuo. Es importante sealar que sta es slamente
una lista parcial de algunas distribuciones de probabilidad de mayor uso.
7.1.
7.1.1.
Distribucin Bernoulli
Un ensayo Bernoulli se define como aquel experimento aleatorio con nicamente dos
posibles resultados, llamados genricamente xito y fracaso, con probabilidades respectivas P(xito) = p y P(Fracaso) = 1 p.
Construccin de una distribucin de Bernoulli
Sea un experimento aleatorio que arroja nicamente dos posibles resultados, denominados xito y fracaso. Si se define la variable aleatoria X como aquella funcin que lleva el
resultado xito al nmero 1 y el resultado fracaso al nmero 0, entonces decimos que X tiene
una distribucin Bernoulli con parmetro p (0, 1), y escribimos X Ber(p). La funcin de
probabilidad es
x
p (1 p)1x si x = 0, 1
f (x) =
0
para otro caso
Proposicin 7.1.1 Sea X Ber(p), entonces tenemos que
a) E(X) = p
b) Var(X) = p(1 p)
c) MX (t) = 1 p + pet
Demostracin
a) A partir de la definicin de esperanza se tiene que
E(X) = x f (x) = 0 (1 p) + 1 p = p
x
91
92
Ejemplo 7.1.1 Considere el experimento aleatorio de lanzar una moneda al aire. Calcula la
esperanza, la varianza y la funcin generadora de momentos.
Suponga que 1 = cara y 2 = cruz son los dos resultados posibles, con probabilidades
1
1
p = y 1 p = , respectivamente. Sea X la variable aleatoria dada por X(1 ) = 1, y
2
2
1
X(2 ) = 0. Entonces X tiene distribucin Ber
, por lo tanto
2
E(X) = p =
1
2
1
1
1
Var(X) = p(1 p) = (1 ) =
2
2
4
1 1
1
MX (t) = 1 + et = (1 + et )
2 2
2
7.1.2.
Distribucin binomial
f (x) =
93
n!
px (n p)1x si x = 0, 1, . . . , n
x!(n x)!
X=
X j , donde X j Ber(p),
j=1
E(X) = E
X
j =
n
j=1
E(X j ) =
j=1
p = np
j=1
Var(X) = Var( X j ) =
j=1
Var(X j ) =
j=1
p(1 p) = np(1 p)
j=1
Xj
j=1
j=1
j=1
Ejemplo 7.1.2 El experimento consiste en lanzar cuatro veces al aire una moneda. Nuestro
inters es el nmero de caras obtenidas en los cuatro lanzamientos. Como es evidente, la
probabilidad de obtener un xito ( cara ), en una de las pruebas ( lanzamiento ) es 0,50 y la
de obtener un fracaso es tambin 0,50.
a) Cul es la probabilidad de no obtener caras en los cuatro lanzamientos?
94
1 x 1 4x
4!
si x = 0, 1, 2, 3, 4
x!(4 x)! 2
2
f (x) =
0
para otro caso
1 4
4!
si x = 0, 1, 2, 3, 4
x!(4 x)! 2
0
a) La probabilidad de no obtener caras en los cuatro lanzamientos es P(X = 0), esto es,
P(X = 0) =
1 4
4!
1
=
0!(4 0)! 2
16
b) La probabilidad de obtener dos caras en los cuatro lanzamientos es P(X = 2), esto es,
1 4
4!
6
3
P(X = 2) =
=
=
2!(4 2)! 2
16 8
c) La distribucin de probabilidad est dada por la siguiente tabla
x
p(x)
0
1/16
1
4/16
2
3/8
3
1/4
4
1/16
1
=2
2
1 1
Var(X) = 4 = 1
2 2
1 1 4
1
MX (t) = 1 + et = (et + 1)4
2 2
16
7.1.3.
95
Distribucin Poisson
Esta distribucin fue descubierta por Simen Denis Poisson (1781-1840) en 1837 como
lmite de la distribucin binomial. En 1838 en su trabajo Recherches sur la probabilit des
jugements en matires criminelles et matire civile (Investigacin sobre la probabilidad de
los juicios en materias criminales y civiles). El trabajo estaba enfocado en ciertas variables aleatorias N que cuentan, entre otras cosas, un nmero de ocurrencias discretas (muchas
veces llamadas arribos) que tienen lugar durante un intervalo de tiempo de duracin determinada.
La distribucin de Poisson tiene conexin con los procesos de Poisson. Se aplica a varios
fenmenos discretos de la naturaleza (esto es, aquellos fenmenos que ocurren 0, 1, 2, 3, . . .
veces durante un periodo definido de tiempo o en una rea determinada) cuando la probabilidad de ocurrencia del fenmeno es constante en el tiempo o el espacio.
Ejemplos de eventos que pueden ser modelados por la distribucin de Poisson
a) El nmero de autos que pasan a travs de un cierto punto en una ruta (suficientemente
distantes de los semforos) durante un periodo definido de tiempo.
b) El nmero de errores de ortografa que uno comete al escribir una nica pgina.
c) El nmero de llamadas telefnicas en una central telefnica por minuto.
d) El nmero de servidores web accedidos por minuto.
e) El nmero de animales muertos encontrados por unidad de longitud de ruta.
f) El nmero de mutaciones de determinada cadena de ADN despus de cierta cantidad
de radiacin.
g) El nmero de ncleos atmicos inestables que decayeron en un determinado periodo
de tiempo en una porcin de sustancia radiactiva.
h) La radiactividad de la sustancia se debilitar con el tiempo, por lo tanto el tiempo total
del intervalo usado en el modelo debe ser significativamente menor que la vida media
de la sustancia.
i) El nmero de estrellas en un determinado volumen de espacio.
j) La distribucin de receptores visuales en la retina del ojo humano.
k) La inventiva de un inventor a travs de su carrera
La distribucin de Poisson surge cuando estamos interesados en medir el nmeros de
sucesos aleatorios que suceden en un intervalo de tiempo fijo. La variable aleatoria se distribuye a lo largo del tiempo o del espacio. Las condiciones para que se trate de una distribucin de Poisson son:
Los eventos de inters deben ocurrir independientemente unos de otros
La probabilidad de que suceda un evento en un intervalo depende de la longitud del
intervalo y no de su posicin.
96
e x
si x = 0, 1, 2, . . .
x!
f (x) =
0
para otro caso
c) MX (t) = e(e 1)
97
Demostracin
a) A partir de la definicin de esperanza se tiene que
E(X) =
x=0
x1
e x
e x
e
=
=
=
x!
x=1 (x 1)!
x=1 (x 1)!
b) Segn una de las propiedades de la varianza se tiene, Var(X) = E(X 2 ) [E(X)]2 , entonces calculemos primero E(X 2 )
E(X 2 ) =
x2
x=0
e x
e x
e x
= x
= (x 1 + 1)
x!
(x 1)!
x=1 (x 1)!
x=1
x1
e x
e x
e x
e
= (x 1)
+
=
+
(x 1)! x=1 (x 1)! x=2 (x 2)!
x=1
x=1 (x 1)!
x1
e x2
e
+
= 2 +
(x
2)!
(x
1)!
x=2
x=1
= 2
Entonces:
Var(X) = 2 + 2 =
MX (t) =
etx
x=0
t
t
e x
(et )x
= e
= e ee = e(e 1)
x!
x=0 x!
Hallar
a) P(X = 1), P(X 2) y P(X 3)
b) E(X),Var(X) y MX (t)
Desarrollo
a) Tomando la funcin de probabilidad tenemos que
P(X = 1) =
98
MX (t) = e1,8(e 1)
enp (np)0
0, 9
0!
0, 1 enp
ln|0, 1| np
n 2303 llamadas
7.1.4.
99
Distribucin geomtrica
p(1 p)x si x = 0, 1, 2, . . .
P(X = x) =
0
para otro caso
El nombre de esta distribucin proviene del hecho de que cuando escribimos la suma
de todas las probabilidades, obtenemos una suma geomtrica. La inspeccin sucesiva de
artculos hasta encontrar una defectuoso, posiblemente en un proceso de control de calidad,
puede modelarse usando una distribucin geomtrica.
Proposicin 7.1.4 Si X es la v.a. que muestra el nmero de fracasos antes del primer xito
esto es; X geo(p) entonces:
a) E(X) =
(1 p)
p
b) Var(X) =
(1 p)
p2
1
p
, con t < ln
c) MX (t) =
t
1 e (1 p)
1 p
Demostracin
a) A partir de la definicin de esperanza se tiene que
E(X) =
x=0
x=0
x=0
100
i
d h
d
x
[(1 p)x ] = p(1 p)
(1
p)
d p x=1
x=1 d p
= p(1 p)
= p(1 p)
d 1
(1) 1 p
1 = p(1 p) 2 =
dp p
p
p
b) Segn una de las propiedades de la varianza se tiene, Var(X) = E(X 2 ) [E(X)]2 , entonces calculemos primero E(X 2 )
E(X 2 ) =
x=0
x=1
x=1
i
d
d h
x
[x(1 p)x ] = p(1 p)
x(1
p)
d p x=1
x=1 d p
= p(1 p)
= p(1 p)
i
d h1
d h1 pi
x
px(1
p)
=
p(1
p)
d p p x=1
d p p2
h p2 (1 p)2p i
p 2 (1 p)(2 p)
= p(1 p)
=
p(1
p)
=
p4
p3
p2
Entonces:
Var(X) =
(1 p)(2 p) (1 p)2 1 p
= 2
p2
p2
p
t
1 e (1 p)
1 p
x=0
x=0
tx
rx1 y converge a 1 r
x=1
Ejemplo 7.1.5 Supongamos que un dado ordinario (equilibrado) es lanzado repetidas veces
hasta que aparece el resultado 1 por primera vez. Calcular
a) obtener la distribucin de probabilidad de la v.a. que se ajuste a este experimento y
calcular la probabilidad de obtener el 1 en el cuarto lanzamiento
b) la esperanza, la varianza y la funcin generadora de momentos
Desarrollo
a) Sea X la v.a que represente el nmero de lanzamientos necesarios del dado para obtener
por primera vez el resultado 1. Entonces X geo(P = 16 ), con lo cual
x
si x = 0, 1, 2, . . .
16 56
P(X = x) =
0
para otro caso
101
1
5 3
125
1
=
6
6
1296
1 16
1
6
=5
1 1
V (X) = 52 = 30
1
6
MX (t) =
7.1.5.
1
1
6
=
6 5et
1 et 1 16
n1
P(An ) =
pr1 (1 p)(n1)(r1) p
r1
con lo cual
P(An ) =
n1
r1
pr (1 p)nr
(7.1.1)
Si decimos que X es la v.a. que cuenta el nmero de fracasos antes de obtener el r-simo
xito, entonces X puede tomar los valores del conjunto {0, 1, 2, . . . }. Adems recordemos
que n por definicin de An es nmero de fracasos (x) ms nmero de xitos (r), esto es
n = x + r. Entonces se entiende la v.a. X podra caracterizar numricamente al suceso An
como X(An ) = x, por lo que tendremos;
P(An ) = P(Ax+r ) = P(X = x)
(7.1.2)
102
r+x1
pr (1 p)x si x = 0, 1, 2, . . .
x
P(X = x) =
0
para otro caso
donde
r+x1
(r + x 1)!
x!(r 1)!
finalmente el factor
r+x1
que nos dice las diferentes formas en que los r xitos pueden
aparecer en los r + x 1 ensayos realizados antes del ltimo que necesariamente fue un xito.
Es claro que esta distribucin es una generalizacin de la distribucin geomtrica, la cual
se obtiene tomando r = 1.
Proposicin 7.1.5 Si X es la v.a. que muestra el nmero de fracasos antes del r xito esto
es; X bin neg(r, p) entonces:
a) E(X) =
r(1 p)
p
b) Var(X) =
r(1 p)
p2
1
ir
p
c) MX (t) =
, con t < ln
t
1 e (1 p)
1 p
h
Demostracin
Si X es la v.a que cuenta el nmero de fracasos antes del r-simo xito en sucesin
r
i=1
1 p
1 p
entre si y cada Xi geo(p), i = 1, 2, . . . , r; con lo cual E(Xi ) =
,Var(Xi ) =
p
p2
p
. Esto resulta del hecho de que para cada xito se tubo que haber
y MXi (t) =
1 et (1 p)
tenido un cierto nmero de fracasos, que es la caracterstica de la distribucin geomtrica.
Entonces
a) la esperanza de X es
E(X) = E
r
r
1 p r(1 p)
=
X
E(X
)
=
i i p = p
i=1
i=1
i=1
r
b) la varianza de X es
Var(X) = Var
Xi
i=1
1 p r(1 p)
=
2
p2
i=1 p
= Var(Xi ) =
i=1
103
MX (t) = M
Xi
i=1
Ejemplo 7.1.6 Se lanza repetidas veces una moneda honesta, cuyos dos resultados son cara
y cruz.
a) Cul es la probabilidad de obtener la tercera cruz en el quinto lanzamiento?
b) Obtener la esperanza, varianza y la funcin generadora de momentos para esta distribucin
Desarrollo
a) Sea X la v.a. que represente el nmero de caras (fracasos) necesarias astes de obtener
por tercera vez cruz. Entonces X bin neg(3, 21 ), con lo cual
2+x
3
x
1
1
si x = 0, 1, 2, . . .
2
2
x
P(X = x) =
0
para otro caso
Por lo que
P(X = 2) =
2+2
1 3 1 2
2
=6
1 5
2
6
= 0, 1875
32
1
3 1 2
1
2
=3
1
3 1 2
V (X) = 2 = 6
1
2
MX (t) =
7.1.6.
1
1
=
2
2 et
1 et 1 12
Distribucin hipergeomtrica
104
N
n
aleatoria X como el nmero de objetos de la primera clase contenidos en la muestra seleccionada, entonces X puede tomar los valores 0, 1, 2, . . . , n; suponiendo n k. La probabilidad
de que X tome un valor x estar dada por la frmula que enunciamos a continuacin. Decimos que X tiene una distribucin hipergeomtrica con parmetros N, k y n, y escribimos
X hipergeo(N, k, n) si
!
!
k
N k
x
nx
!
si x = 0, 1, 2, . . . , n
N
P(X = x) =
0
para otro caso
k
El trmino
nos dice las diferentes formas en que de los k objetos de la primera clase
x
N k
se pueden escoger x de ellos, y el trmino
es nuevamente las diferentes formas de
nx
nk
N
b) Var(X) =
k N n
nk
1
N
N N 1
Demostracin
Como primer paso seleccionemos n objetos de la poblacin de tamao N que contiene
n
Xi
i=1
como la v.a aleatoria que cuenta el nmero de objetos de la primera clase en la muestra
seleccionada; en donde cada Xi , i = 1, 2, . . . , n es una v.a que presenta las siguientes caractersticas:
Xi = 1 si se selecciona un objeto de la primera clase en la i-sima extraccin
105
k
N
k k 2 k
k
=
1
N
N
N
N
E(X) = E
n
n
k
nk
X
=
E(X
)
=
i
i
N = N
i=1
i=1
i=1
n
b) la varianza de X es
X
i = E(X 2) E(X)
n
Var(X) = Var
i=1
calculemos entonces:
k
N k
k1
N k
2
x
n x
nk n
x
nx
x1
nx
2
E(X ) =
=
N
N
1
N x=1
x=0
n
nk
N x=1
(x 1 + 1)
k1
x1
N 1
nk (k 1)(n 1) n
=
N
N 1
x=2
"
k2
x2
n1
nx
n1
"
N k
N k
nx
N 2
x1
x=1
n2
"
k1
nk (k 1)(n 1)
nk (k 1)(n 1) + N 1
+1 =
N
N 1
N
N 1
N k
nx
N 1
n1
Por lo tanto
"
#
"
#
nk 2 nk N 2 (k + n)N + nk
nk (k 1)(n 1) + N 1
Var(X) =
=
N
N 1
N
N
N(N 1)
=
nk N k N n
N
N
N
106
Ejemplo 7.1.7 Supngase que una urna contiene cinco bolas rojas y diez azules. Si se seleccionan bolas de la urna sin reemplazamiento; sea X la v.a que cuenta el nmero de bolas rojas
extraidas. Si se extraen al azar sin reemplazamiento siete bolas
a) Cul es la probabilidad de seleccionar exactamente cuatro bolas rojas?
b) Cul es la probabilidad de seleccionar almenos tres bolas rojas?
c) Calcular la esperanza y la varianza de esta distribucin
Desarrollo
Como X es la v.a que cuenta el nmero de bolas rojas extraidas en un muestreo sin reemplazmiento; se tiene que X hipergeo(15, 5, 7). Por lo tanto
!
!
5
10
x
7x
!
si x = 0, 1, 2, 3, 4, 5
15
P(X = x) =
0
para otro caso
a) Para contestar la pregunta de este item basta calcular P(X = 4), esto es;
10
P(X = 4) =
15
5 120
40
=
6435
429
b) Para contestar esta parte debemos calcular P(X 3); que equivale a decir,
P(X 3) = P(X = 3) + P(X = 4) + P(X = 5)
Por lo tanto
P(X 3) =
10
4
15
10
3
15
10
15
V (X) =
15
15
15 1
8
9
140 40
1
61
+
+
=
429 429 143 143
7.2.
7.2.1.
107
si a < x < b
ba
f (x) =
0
en otro caso
La grfica general de esta funcin se muestra en la Figura 7.1, y es evidente que se
trata de una funcin de densidad pues es no negativa e integra uno. Los parmetros de esta
distribucin son los nmeros a y b.
a+b
2
b) Var(X) =
c) MX (t) =
(b a)2
12
ebt eat
(b a)t
d) F(x) =
108
si x > a
x
ba
si a x < b
si x b
Demostracin
Como X es una v.a. continua con distribucin uniforme en el intervalo (a, b) entonces su
funcin de densidad de probabilidad es
si a < x < b
ba
f (x) =
0
en otro caso
con lo cual
a) por definicin de esperanza para v.a. continua
E(X) =
x f (x)dx =
Z b
a
b
1
1
a+b
1
dx =
x2 =
(b2 a2 ) =
ba
2(b a) a 2(b a)
2
a + b 2 1
a + b 3 b
1
x
x
Var(X) =
dx =
2
ba
3(b a)
2
a
h
h b a 3 a b 3 i
a + b 3
1
1
a + b 3 i
b
=
=
a
3(b a)
2
2
3(b a)
2
2
=
1 (b a)2 (b a)2
=
3
4
12
etx
1
1
dx =
ba
ba
Z b
a
etx dx =
b ebt eat
1
etx =
t(b a) a (b a)t
0
si x < a
0
x
Z x 1
F(x) = P(X x) =
du si a x < b =
ba
0 ba
1
1
si x > b
si x < a
si a x < b
si x b
Ejemplo 7.2.1 Supongase que tenemos una cuerda de 2m de longitud que queremos cortar
por un punto al azar a una cierta distancia de uno de los extremos. Sea X la v.a. que represente
el punto elegido; entonces
109
si 0 < x < 2
2
f (x) =
0 en otro caso
110
Z 0,7
1
0
1 0,7 1
dx = x = (0, 7 0) = 0, 35
2
2 0
2
Z 2
1
1 2 1
1
dx = x = (2 1) =
2 1 2
2
1 2
Z 1,25
1
1 1,25 1
P(0, 5 X 1, 25) =
dx = x
= (1, 25 0, 5) = 0, 375
2 0,5
2
0,5 2
P(X 1) =
0+2
=1
2
x
F(x) =
2
Var(X) =
(2 0)2 1
=
12
3
MX (t) =
e2t e0t
e2t 1
=
(2 0)t
2t
si x < 0
si 0 x < 2
si x 2
7.2.2.
Distribucin Normal
La distribucin normal fue reconocida por primera vez por el francs Abraham de Moivre
(1667-1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elabor desarrollos ms profundos y formul la ecuacin de la curva; de ah que tambin se la conozca, ms comnmente,
como la campana de Gauss. La distribucin de una variable normal est completamente
determinada por dos parmetros, su media smbolizada por y su desviacin estndar simbolizada por .
La distribucin continua de probabilidad ms importante de toda la estadstica es la distribucin de probabilidad normal.
111
Definicin 7.2.2 Decimos que una v.a. X tiene distribucin de probabilidad normal si su
funcin de densidad de probabilidad est definida por la siguiente ecuacin:
f (x) =
1
22
1 x 2
)
e 2 (
, para
< x <
Figura 7.6: Representacin grfica de f (x) para ciertos valores de y 2 de una variable
aleatoria normal.
No es inmediato pero es posible demostrar que E(X) = , y ello significa que la campana
esta centrada en este valor, el cual puede ser negativo, positivo o cero. Tambin puede demostrarse que Var(X) = 2 , y que la distancia del punto a cualquiera de los dos puntos en
donde la funcin tiene puntos de inflexin es , por lo tanto la campana se abre o se cierra de
acuerdo a la magnitud de este parmetro. El papel que desempean y puede apreciarse
en la grfica 7.7.
Caractersticas de la distribucin de probabilidad normal
La distribucin de probabilidad normal con su curva tiene las siguientes caractersticas:
1. La curva normal tiene forma de campana. La media, la moda y la mediana de la distribucin son iguales y se localizan en el centro de la distribucin.
2. La distribucin de probabilidad normal es simtrica alrededor de su media. Por o tanto,
la mitad del rea bajo la curva est antes del punto central y la otra mitad despus. El
rea total bajo la curva es igual a 1.
3. La curva normal se aproxima de manera asinttica al eje horizontal conforme se aleja
de la media en cualquier direccin. Esto significa que la curva se acerca al eje horizontal conforme se aleja de la media, pero nunca lo llega a tocar.
112
Figura 7.8: Curvas normales que tienen medias iguales y desviaciones estndar diferentes
Si las curvas tienen desviaciones estndar iguales y medias diferentes, las curvas sern
idnticas pero centradas en diferentes posiciones sobre el eje horizontal, as como lo
muestra la Figura 7.9.
113
Figura 7.9: Curvas normales que tienen medias diferentes y desviaciones estndar iguales
Si las curvas tienen medias diferentes y tambin sus desviaciones estndar son diferentes entonces aparte de estar centradas en diferentes lugares del eje x, tendr formas
diferentes; as como lo muestra la Figura 7.10.
Figura 7.10: Curvas normales que tienen medias diferentes y desviaciones estndar diferentes
La distribucin normal estndar
En particular, decimos que la variable aleatoria X tiene una distribucin normal estndar
si tiene una distribucin normal con parmetros E(X) = = 0 y Var(X) = 2 = 1. En este
caso la funcin de densidad se reduce a la siguiente expresin
x2
1
f (x) = e 2
2
Para facilitar los clculos se decidi tabular las diferentes probabilidades para variable
aleatoria que sigue una distribucin normal. Pero, puesto que sera imposible tener una tabla
para cada posible distribucin normal, se elabor solamente una, la tabla de la distribucin
normal estndar.
De esta manera solo se tiene que transformar o estandarizar una distribucin normal especfica, se revisa la tabla, y se conoce la probabilidad. Para la estandarizacin se debe realizar la siguiente operacin.
114
Proposicin 7.2.2 Sea X una variable aleatoria con distribucin normal con parmetros
y 2 . Entonces la siguiente variable aleatoria tiene una distribucin normal estndar
Z=
(7.2.3)
Demostracin
Para probar que Z sigue una distribucin normal estandar debemos mostrar que E(Z) = 0
y Var(Z) = 1. Recordemos adems que si X N(, 2 ) entonces E(X) = y Var(X) = 2 .
Para realizar la demostracin de esta proposicin recordemos adems las propiedades de la
esperanza y la varianza de una v.a. Por lo tanto
X 1
1
1
E(Z) = E
= E(X ) = [E(X) ] = [ ] = 0
x
1
1
1
Var(Z) = Var
= 2 Var(X ) = 2 Var(X) = 2 2 = 1
A la operacin anterior se le conoce con el nombre de estandarizacin, y bajo tal transformacin se dice que la variable X ha sido estandarizada. Es comn usar la letra Z para denotar
una variable aleatoria con distribucin normal estndar, y seguiremos nosotros tambin esa
costumbre.
La proposicin anterior parece muy modesta pero tiene una gran importancia operacional pues establece que el clculo de las probabilidades de una variable aleatoria normal
cualquiera se reduce al clculo de las probabilidades para la normal estndar. Explicaremos
esta situacin con ms detalles. Suponga que X es una variable aleatoria con distribucin
N(, 2 ), y que deseamos calcular, por ejemplo, P(a < X < b), para a < b nmeros dados.
Tenemos entonces que
a X b
P(a < X < b) = P(a < X < b ) = P
<
<
por lotanto
<Z<
115
Ejemplo 7.2.2 Los coeficientes intelectuales de 600 aspirantes de cierta universidad se distribuyen aproximadamente de forma normal con una media de 115 y una desviacin estndar
de 12. Si se selecciona un aspirante al azar, encuentre la probabilidad de que:
a) tenga un coeficiente mayor de 120
b) tenga un coeficiente menor de 100
c) tenga un coeficiente menor de 122
d) tenga un coeficiente entre 115 y 125
e) tenga un coeficiente entre 90 y 105
Desarrollo
Segn las condiciones del problema la v.a. X representa el coeficiente intelectual del
estudiante elegido y adems X N(115, 144).
Para calcular las probabilidades de los distintos itens debemos transformar esta distribucin normal en una distribucin normal estndar (con media cero y desviacin estndar 1),
x 115
para lo cual hay que cambiar el valor de x por un valor z con la frmula z =
. Entonces
12
la probabilidad de que:
120 115
= P(Z > 0, 41)
12
La distribucin ya transformada se observa en el siguiente grfico:
Se busca el valor del rea para 0 Z 0, 41 en la tabla de reas bajo la curva normal
estandar; que corresponde al valor 0,1591. Como el rea a la derecha del valor z = 0, 41
es el que corresponde a la probabilidad pedida, entonces la probabilidad de que un
aspirante a la universidad tenga un coeficiente intelectual mayor de 120 es:
P(X > 120) = P(Z > 0, 41) = 0, 5 0, 1591 = 0, 3409
b) tenga un coeficiente menor de 100 es:
100 115
= P(Z < 1, 25)
P(X < 100) = Z <
12
La distribucin ya transformada queda as:
116
122 115
P(X < 122) = Z <
= P(Z < 0, 58)
12
La distribucin ya transformada queda as:
Se busca el valor del rea para 0 Z 0, 58 en la tabla de reas bajo la curva normal
estandar, que es el valor 0,2190. Y como el rea a la izquierda del valor z = 0, 58 es el
rea que buscamos, entonces el resultado a buscar es:
P(X < 122) = P(Z < 0, 58) = 0, 5 + 0, 2190 = 0, 7190
d) tenga un coeficiente entre de 115 y 125 es:
P(115 < X < 125) =
115 115
12
<Z<
125 115
= P(0 < Z < 0, 83)
12
117
Se busca el valor del rea para 0 Z 0, 83 en la tabla de reas bajo la curva normal
estandar, que es el valor 0,2967. Y como el rea a buscar es el rea entre z = 0 y z = 0, 83,
entonces el resultado a buscar es:
P(115 < X < 125) = P(0 < Z < 0, 83) = 0, 2967
e) tenga un coeficiente entre de 90 y 105 es:
90 115
105 115
<Z<
= P(2, 08 < Z < 0, 83)
P(90 < X < 105) =
12
12
7.2.3.
Cuando las muestras son pequeas, en una distribucin binomial se obtienen fcilmente
probabilidades asociadas a un evento mediante la frmula de la binomial. Cuando las muestras son grandes, el clculo nos llevara bastante tiempo. La distribucin normal es a menudo
una buena aproximacin a una distribucin binomial cuando np y nq son ms grandes que 5.
118
29, 5 40
= P(Z < 2, 14)
P(X < 30) = P Z <
4, 899
119
Recordemos que en la tabla de reas bajo la curva normal no se tabulan valores negativos de z y que la distribucin normal es simtrica; estos A(z) = A(z). Se busca el
valor del rea para 0 Z 2, 14 en la dicha tabla, que corresponde al valor 0,48382.
Y como el rea a la izquierda del valor z = 2, 14 es el rea que buscamos, entonces el
resultado a buscar es:
P(X < 30) = P(Z < 2, 14) = 0, 5 0, 48382 = 0, 01618
b) P(X = 35)
En este caso se pide una probabilidad cuando la variable aleatoria X toma un valor
exacto. En una distribucin continua la probabilidad de que la variable aleatoria sea
exactamente un determinado valor no se puede calcular y se estima que es cero, mientras que en una distribucin discreta aproximada a una distribucin normal (continua)
la probabilidad de X sea igual a un valor puntual se calcula sumando y restando el factor de correccin de continuidad a dicho valor puntual y estimar el rea entre ambos
puntos.
Por lo tanto
34, 5 40
35, 5 40
P(X = 35) = P
Z
= P(1,12 Z 0, 92)
4, 899
4, 899
120
30, 5 40
P(x 30) = P Z
= P(Z 1, 94)
4, 899
Como A(1, 94) = A(1, 94); se busca el valor del rea para 0 Z 1, 94 en la tabla,
que corresponde al valor 0,4738. Y como el rea a la izquierda del valor z = 1, 94 es
el rea que buscamos, entonces el resultado a buscar es:
P(X 30) = P(Z < 1, 94) = 0, 5 0, 4738 = 0, 0262
7.2.4.
Distribucin ji-cuadrada
121
Definicin 7.2.3 Decimos que la variable aleatoria continua X tiene una distribucin jicuadrada con k grados de libertad (k entero positivo), si su funcin de densidad est dada por
la siguiente expresin:
k
1
1 x
2k ( k ) x 2 e 2 si 0 < x <
2
f (x) =
0
si x 0
Figura 7.11: Grfica de f (x) cuando el parmetro k toma los valores 1,2,3,4 y 5
Por la definicin anterior; ji-cuadrada es una variable aleatoria continua con posibles
valores en el intervalo (0, ). Esta distribucin tiene un solo parmetro denotado aqui por
la letra k, y al cual se le llama grados de libertad. Tambin al parmetro de ji-cuadrado se
denota por la letra griega . A pesar de la aparente expresin complicada de f (x), no es difcil
comprobar que es efectivamente una funcin de densidad de probabilidad. La grfica de esta
funcin para varios valores del parmetro k aparece en la Figura 7.9.
Escribiremos simplemente X 2 (k), en donde la letra griega se pronuncia ji o
tambin chi. Puede demostrarse que E(X) = k y Var(X) = 2k. La distribucin ji-cuadrada
puede obtenerse como indican los siguientes resultados que dejaremos sin demostrar.
Proposicin 7.2.3 Si X es una v. a. que sigue una distribucin normal tipificada (X
N(0, 1)), entonces la v.a. X 2 sigue una distribucin ji-cuadrada con un grado de libertad
(X 2 2 (1)).
Es decir, el cuadrado de una variable aleatoria con distribucin normal estndar tiene
distribucin ji-cuadrada con un grado de libertad. Por otro lado, el siguiente resultado establece que la suma de dos variables aleatorias independientes con distribucin ji-cuadrada
tiene distribucin nuevamente ji-cuadrada con grado de libertad igual a la suma de los grados
de libertad de los sumandos.
122
i=1
con n grados de libertad.
Caractersticas de la distribucin ji-cuadrada
La distribucin ji-cuadrada es un caso particular de la distribucin gamma.
Las distribuciones ji-cuadradas son positivamente asimtricas.
Est distribucin esta estrechamente ligada con muestras aleatorias de una distribucin
normal.
En la prctica, las probabilidades ji-cuadradas, cuando k 30, pueden calcularse empleando aproximaciones normales en la forma usual.
La distribucin ji-cuadrado tiene muchas aplicaciones en inferencia estadstica, por
ejemplo en el test ji-cuadrado que consiste en una prueba de independencia y bondad
de ajuste, adems en la estimacin de varianzas.
Tambin est involucrada en el problema de estimar la media de una poblacin normalmente distribuida y en el problema de estimar la pendiente de una recta de regresin
lineal, a travs de su papel en la distribucin t de Student que veremos ms adelante,
y participa en todos los problemas de anlisis de varianza, por su papel en la distribucin F de Snedecor, que es la distribucin del cociente de dos variables aleatorias de
distribucin ji-cuadrada e independientes.
7.2.5.
Distribucin t de Student
Esta distribucin fue desarrollada por William Sealy Gossett, que trabajaba en el departamento de fermentacin de la cervecera Guinness en Irlanda. Las circunstancias en las que
se llevan a cabo los procesos de fermentacin en la produccin de cerveza demostraron a
Gosset las limitaciones de la teora de muestras grandes y le enfatizaron la necesidad de un
mtodo correcto para el tratamiento de muestras pequeas. Estas circunstancias de su trabajo
dirigieron a Gosset al descubrimiento de la distribucin t, quin public sus estudios sobre
esta distribucin en 1908 con el seudnimo Student.
Gossett se interes en el comportamiento del valor de una v.a. Y N(0, 1) cuando se
utilizaba S en vez de , y particularmente en la discrepancia entre S y cuando S se calcula
de muestras muy pequeas.
123
n+1
2
x2 n+1
2
1
+
f (x) =
para < x <
n
n
n ( 2 )
en tal caso se escribe X t(n)
Es posible demostrar que E(X) = 0, y Var(X) =
n
para n > 2.
(n 2)
(X ) n
Y=
y W=
(Xi X)2
i=1
nS2
2
libertad. Entonces
(X ) n
(X ) n
(X
)
n1
T= s
=
=
2
nS
S
nS
2
n 1
n1
124
(X ) n 1
t(n 1)
T=
S
1 n
1 n
2
donde X = Xi y S = (Xi X)2 .
n i=1
n i=1
7.2.6.
125
Distribucin exponencial
ex si x > 0
f (x) =
0
si x 0
La grfica de esta funcin cuando el parmetro toma los valores particulares 0,5; 1,0 y
1,5 se muestra en la Figura 7.11.
La correspondiente funcin de distribucin de esta v.a. est dada por
0
si x 0
F(x) = P(X x) =
1 ex si x > 0
La grfica de esta funcin cuando el parmetro toma los valores particulares 0,5; 1,0 y
1,5 se muestra en la Figura 7.12.
Proposicin 7.2.8 Sea X la v.a. continua con distribucin exponencial, entonces X tiene las
siguientes caractersticas
a) E(X) =
b) Var(X) =
c) MX (t) =
1
2
Demostracin
Figura 7.13: Grfica de f (x) cuando el parmetro toma los valores 0,5;1,0 y 1,5
Figura 7.14: Grfica de F(x) cuando el parmetro toma los valores 0,5;1,0 y 1,5
126
127
1 1
E(X) =
x f (x)dx =
xe dx = e
x+ =
0
0
Z
Z
2x 2
2
2
2
2 x
x 2
E(X ) =
x f (x)dx =
x e dx = e
x + + 2 = 2
0
0
Entonces la varianza est dada por
Var(X) =
2 1 2
1
= 2
2
xt
e f (x)dx =
Z
0
xt x
e e
dx =
Z
0
e(t)x dx =
e(t)x
=
( t) 0
t
Ejemplo 7.2.4 Suponga que el tiempo en minutos que un usuario cualquiera permanece re1
visando su correo electrnico sigue una distribucin exponencial de parmetro = . Calcule
5
la probabilidad de que un usuario cualquiera permanezca conectado al servidor de correo
a) menos de un minuto
b) ms de un ahora
c) Calcula la esperanza, varianza y la funcin generadora de momentos
Solucin
a) Para este primer inciso tenemos que
P(X < 1) =
Z 1
1 1
1
1 1x
1
e 5 dx = 5e 5 x = 1 e 5 = 0, 1813
0
b) Siguiendo el mismo razonamiento del inciso anterior y teniendo en cuenta que una
hora equivale a 60 minutos se tiene que
Z
1 1 x
1 1x
5
e dx = 5e 5 = e12 = 6, 14 106
P(X > 60) =
5
60
60 5
c) Tomando en cuenta la proposicin 7.2.3
1
E(X) 1 = 5
5
Var(X) =
1
= 25
( 51 )2
MX (t) =
1
5
1
5
1
1 5t
7.3. PROBLEMAS
7.3.
128
Problemas
Distribucin binomial
1. Sea X una variable aleatoria con distribucin bin(n, p) tal que E(X) = 4 y Var(X) = 2.
Cules son los valores de n y p?
2. Sea X una variable aleatoria con distribucin bin(n, p). Demuestre que la variable Y =
n X tiene distribucin bin(n, 1 p). Proporcione una explicacin probabilsta de este
resultado.
3. Sea X con distribucin bin(n, p). Demuestre que para x = 0, 1, . . . , n 1, se cumple la
siguiente frmula. Esta expresin permite calcular las probabilidades de esta distribucin de una forma iterativa.
P(X = x + 1) =
p(n x)
P(X = x)
(1 p)(x + 1)
4. Se lanza una moneda equilibrada 6 veces. Calcule la probabilidad de que cada cara
caiga exactamente 3 veces.
5. Se lanza una moneda equilibrada 2n veces. Calcule la probabilidad de que ambas caras
caigan el mismo nmero de veces.
6. Sea X una variable aleatoria con distribucin bin(n, p). Demuestre que
0 Var(X) E(X)
7. Suponiendo que es igualmente probable que nazca un hombre (H) o una mujer (M), y
considerando la observacin de 6 nacimientos. Cul de los siguientes eventos es ms
probable que ocurra?
a) MHHMHM
b) MMMMHM
c) HMHMHM
8. La probabilidad de que un paciente se recupere de una extraa enfermedad es 0, 4. Si
se sabe que 15 personas contraen esa enfermedad,
a) Haga un histograma donde represente la distribucin binomial para este caso.
b) Cul es la probabilidad de que sobrevivan al menos 10?
c) Cul es la probabilidad de que sobrevivan de 3 a 8?
d) Calcule la media y la varianza de esta distribucin binomial.
9. En la ciudad la necesidad de dinero para comprar drogas se establece como la razn del
75 % de los robos. Encuentre la probabilidad de que entre los siguientes cinco casos de
robo:
a) dos resulten de la necesidad de dinero para comprar drogas
7.3. PROBLEMAS
129
7.3. PROBLEMAS
130
7.3. PROBLEMAS
131
7.3. PROBLEMAS
132
7.3. PROBLEMAS
133
28. Una cadena de moteles ha adoptado la poltica de hacer un descuento del 3 % a los
clientes que paguen en efectivo en vez de hacerlo con tarjeta de crdito. Su experiencia
indica que el 30 % de los clientes aceptan el descuento. Sea Y el nmero de personas
que aceptan el descuento entre los prximos 20 clientes.
a) Suponiendo que las probabilidades binomiales sean aplicables, encuentre la probabilidad de que exactamente 5 entre los prximos 20 clientes acepten el descuento.
b) Encuentre P(5o menos clientes acepten el descuento)
c) Cul es el valor esperado y la desviacin estndar del nmero de personas que
aceptarn el descuento?
29. Un fabricante de medicamentos afirma que solo el 10 % que resultan efectivas en las
pruebas con animales pasan el resto de las que se le exige para su comercializacin.
Actualmente, el fabricante tiene 8 nuevos medicamentos de probada efectividad en
experimentos con animales y que esperan pasar en las siguientes pruebas.
a) Encuentre la probabilidad de que ninguno de los 8 medicamentos sea comercializado.
b) Encuentre la probabilidad de que al menos 2 de ellos sean comercializados.
c) Encuentre el nmero esperado de medicamentos comercializados entre los 8 nuevos
medicamentos
30. Una compaa pequea utiliza un servicio de paquetera para enviar los pedidos de
quesos especiales que son para obsequios. La compaa ha encontrado que el 90 %
de los paquetes se entregan a tiempo. Se enva un embarque de 20 paquetes. Sea Y =
nmero de paquetes embarcados a tiempo. Suponiendo que las hiptesis binomiales se
cumplen calcular:
a) la probabilidad de que de al menos un paquete se entregue a tiempo
b) la probabilidad de que a lo sumo 6 paquetes no se entreguen a tiempo
c) la probabilidad de que por lo menos 7 paquetes se entreguen a tiempo
d) el valor esperado y la varianza del numero de paquetes embarcados a tiempo
31. La revista Statistical Adstrac (U.S) informa que la mediana del ingreso familiar en
Estados Unidos durante 1985 fue 27755 dlares. En cuatro familias seleccionadas al
azar, calcular la probabilidad de que:
a) las cuatro tuvieron ingresos mayores que 27755 dlares en 1985
b) una de las cuatro haya tenido ingresos menores 27755 dlares en 1985
32. Entre personas que donan sangre en una clnica, 80 % tienen RH+, es decir el factor
Rhesus en su sangre. Cinco personas donan sangre en al clnica en determinado da.
a) Calcular la probabilidad de que al menos una de las cinco no tenga el factor RH+.
b) Calcular la probabilidad de que cuando mucho 4 de las 5 tenga sangre del tipo
RH+.
7.3. PROBLEMAS
134
Distribucin Geomtrica
1. Considere una urna con 3 bolas negras y 5 bolas blancas. Se escoge una bola al azar,
se registra su color, y despues se regresa a la urna. Cuntas extracciones en promedio
se necesitan realizar hasta obtener una bola negra por primera vez?
2. Sea X una variable aleatoria con distribucin geo(p). Demuestre que para cualesquiera
a, b = 0, 1, 2, . . . se cumple la siguiente propiedad llamada de prdida de memoria:
P(X a + b|X a) = P(X b).
Distribucin Poisson
1. Sea X una variable aleatoria con distribucin Poisson(). Demuestre que para todo
x = 0, 1, 2, . . . se cumple la siguiente frmula. Esta expresin permite calcular las probabilidades Poisson de una forma iterativa.
P(X = x + 1) =
P(X = x)
(x + 1)
2. Sea X una variable aleatoria con distribucin Poisson(). Demuestre que la probabili(1 + e2 )
.
dad de que X tome un valor par es
2
3. El nmero de computadoras que fallan por mes en un laboratorio de cmputo tiene
una distribucin Poisson con un promedio mensual de = 2 mquinas descompuestas.
El laboratorio tiene capacidad para reparar hasta dos mquinas por mes. Cuando se
descomponen ms de dos mquinas, las restantes se envan fuera del laboratorio para
su reparacin.
a) Cul es la probabilidad de que en un mes cualquiera sea necesario enviar mquinas
fuera del laboratorio para su reparacin?
b) Responda al inciso anterior cuando se reduce la capacidad de reparacin del laboratorio a una computadora por mes.
c) Cul es el nmero de computadoras con falla ms probable en un mes?
4. Sea Y una variable aleatoria que tiene una distribucin de Poisson cuyo promedio es
de 2. Calcular:
a) P(Y = 4)
b) P(Y 4)
c) P(Y 4)
5. Si la probabilidad de que un tornillo sea defectuosa es 0,008. Cul es la probabilidad
de que en una caja con 100 tornillos contenga uno o ms defectuosos?
6. Supongamos que la probabilidad de que una persona reciba una inyeccin de penicilina
y sufra una reaccin desfavorable es de 0,0002. Si 3000 personas reciben aplicaciones
de este medicamento. Cul es la probabilidad de que 0,1,2,3,4 o 5 personas reaccionen mal?
7.3. PROBLEMAS
135
7.3. PROBLEMAS
136
12. Los autos llegan al lavadero 22 con una tasa promedio de 9 por hora. Si la llegada por
hora sigue una distribucin de Poisson, averige la probabilidad de que lleguen 15 o
ms autos durante una hora dad de operacin.
13. Se estima que el nmero de taxis que esperan recoger un pasajero delante de la terminal
de mnibus de Asuncin tiene una distribucin de Poisson con una media de 5,5 taxis.
a) Averige la probabilidad de, en una observacin aleatoria haya exactamente 6
taxis esperando.
b) Averige la probabilidad de, en una observacin aleatoria haya mas de 10 taxis
esperando.
c) Averige la probabilidad de, en una observacin aleatoria no haya taxis esperando.
14. La concertista de piano Donna Prima se preocupa cada vez ms por el nmero de
tosidos que se presentan en la audiencia justo antes que empiece a tocar. Durante su
ultima gira, Donna estimo un promedio de 8 tosidos justo antes de empezar su concierto. La seora prima le ha prometido a su director que si escucha ms de 5 tosidos en
el concierto esa noche, se rehusar a tocar. Cul es la probabilidad de que la artista
toque esa noche?
15. En promedio cinco pjaros chocan contra el monumento en Washington y mueren por
este motivo cada semana. Bill Garey, un oficial del Servicio del Parque Nacional de Estados Unidos, ha solicitado que el congreso estadounidense asigne fondos para adquirir
equipos que alejen a los pjaros de dicho monumento. Un subcomit del congreso le
ha respondido que pueden asignarle fondos para tal fin a menos que la probabilidad de
que mueran ms de tres pjaros cada semana sea mayor que 0,70. Se destinaran los
fondos para la compra de los equipos que alejen a los pjaros del monumento?
16. El nmero de nudos en un tipo particular de madera tiene una distribucin de Poisson
con una media de 1,5 nudos de 10 pies cbicos de madera. Encuentre la probabilidad
de que un bloque de esta madera de 10 pies cbico tenga a lo ms un nudo.
17. El 3 % de las calculadoras de bolsillo de un modelo en particular fallan durante el
primer mes de operacin. F Mart acaba de recibir un lote de 100 de estas calculadoras.
a) Averige la probabilidad de que ninguna calculadora falle
b) Averige la probabilidad de que fallen ms de tres calculadoras
c) Averige la probabilidad de que menos de 2 calculadoras fallen
18. La Articulate Corporation espera que el 99 % de los saldos de sus cuentas por cobrar
sean correctas. Se seleccion una muestra aleatoria de 200 cuentas para auditarlas.
a) Cul es la probabilidad de que ninguna de las cuentas tenga errores ?
b) Cul es la probabilidad de que 5 de las cuentas tenga errores ?
c) Cul es la probabilidad de que ms de 5 cuentas tenga errores ?
7.3. PROBLEMAS
137
19. En los ltimos 20 aos, solo el 2 % en promedio de los cheques endosados a la American Herat Association fueron rechazados. Este mes, la asociacin recibi 200 cheques.
Cul es la probabilidad de que:
a) exactamente 10 de ellos sean rechazadas
b) exactamente 5 de ellos sean rechazadas
20. El centro contencioso del condado de Orange, en California maneja varios tipos de
litigios, pero casi todos ellos son del tipo conyugal. De hecho 96 % de los pleitos que
atiende el centro son de esta naturaleza. Cul es la probabilidad de que de 80 litigios
atendidos por el centro exactamente 7 no sean del tipo conyugal?
Distribucin Uniforme
1. Sea X una variable aleatoria con distribucin uniforme en el intervalo (1, 4).
a) Obtener la funcin de densidad para esta distribucin uniforme
b) Calcular la probabilidad de que X este entre 1 y 3
c) Calcular la probabilidad de que X sea mayor que 2
d) Obtener la esperanza y la varianza de esta distribucin
2. Se escoge al azar un nmero del intervalo (0, 2)
a) Obtener la funcin de densidad para esta distribucin uniforme
b) Calcular la probabilidad de que el nmero elegido este entre 1 y 1,5
c) Calcular la probabilidad de que el nmero elegido sea mayor que 0,5
d) Obtener la esperanza y la varianza de esta distribucin
3. Se escogen al azar dos nmeros del intervalo (0, 3). Sea X la variable aleatoria que
indica la suma de los dos nmeros elegidos. Si X sigue una distribucin uniforme
a) Obtener la funcin de densidad para X
b) Calcular la probabilidad de que X este entre 2 y 4
c) Calcular la probabilidad de que el nmero elegido sea menor que 4
d) Obtener la esperanza y la varianza de X
Distribucin Normal
1. Sea X con distribucin N(10, 25). Calcule
a) P(X 10)
b) P(X < 0)
c) P(0 < X 10)
d) P(X 20)
e) P(20 < X 10)
2. Sea X con distribucin N(0, 100). Calcule
7.3. PROBLEMAS
138
a) P(X 10)
b) P(X > 0)
c) P(0 < X 40)
d) P(X 30)
e) P(10 < X 10)
3. Encuentre x tal que
a) F(x) = 0, 8666
b) 1 F(x) = 0, 9154
4. Un investigador reporta que unos ratones vivirn un promedio de 40 meses cuando sus
dietas se restringen drsticamente y despus se enriquecen con vitaminas y protenas.
Suponga que la vida de tales ratones se distribuye normalmente con una desviacin
estndar de 6,3 meses, encuentre la probabilidad de que un ratn viva:
a) Ms de 32 meses
b) Menos de 28 meses
c) Entre 37 y 49 meses
d) Entre 45 y 50 meses
e) Entre 40 y 43 meses
f) Cul es la probabilidad de que de seis ratones 4 vivan ms de 30 meses?
5. Las barras de centeno que cierta panadera distribuye a las tiendas locales tienen una
longitud promedio de 30 centmetros y una desviacin estndar de 2 centmetros.
Suponga que las longitudes se distribuyen normalmente, qu porcentaje de las barras son
a) Ms largas de 31,7 cm?
b) Entre 29,3 cm. y 33,5 cm de longitud?
c) Entre 32 cm y 35 cm?
d) Ms cortas de 38 cm?
e) Entre 27,5 cm. y 30 cm?
f) Cul es la probabilidad de que de 4 barras, tres midan ms de 35 cm?
6. Un abogado va todos los das de su casa a su oficina en el centro de la ciudad. El tiempo
promedio del viaje es 24 minutos, con una desviacin estndar de 3,8 minutos. Si las
duraciones de los viajes estn distribuidas normalmente:
a) Cul es la probabilidad de que un viaje tome al menos
1
2
hora?
b) Si la oficina abre a las 9:00 a.m. y l sale de su casa diariamente a las 8:45 a.m.,
qu porcentaje de las veces llega tarde al trabajo?
c) Si sale de su casa a las 8:35 a.m. y el caf se sirve en la oficina de las 8:50 a.m. a
las 9:00 a.m., cul es la probabilidad de que llegue a la hora del caf?
7.3. PROBLEMAS
139
d) Encuentre cual es el tiempo a partir del cual que duran el 15 % de los viajes ms
lentos?
e) Encuentre la probabilidad de que dos de los siguientes tres viajes tomen como
mximo 12 hora.
7. Las alturas de 1000 estudiantes se distribuyen normalmente con una media de 174,5
cm y una desviacin estndar de 6,9 cm., cuntos de estos estudiantes se esperara
que tuvieran alturas
a) Menores de 160 cm?
b) Entre 171,5 cm y 182 cm?
c) Mayores a 165 cm?
d) Entre 174,5 cm y 180 cm?
e) Entre 180 cm y 195 cm?
f) Menores de 185 cm?
g) Cul es la probabilidad de que de cinco estudiantes, al menos 3 midan ms de
180 cm?
h) Cul es la probabilidad de que de 3 estudiantes, ninguno mida menos de 160
cm?
8. Una estacin de radio encontr que el tiempo promedio que una persona sintoniza esa
estacin es de 15 minutos con una desviacin estndar de 3,5 minutos. Cual es la
probabilidad de que un radioescucha sintonice la estacin por:
a) ms de 20 minutos?
b) entre 15 y 18 minutos?
c) entre 10 y 12 minutos?
d) Cuantos minutos como mximo sintonizan la estacin el 70 % de los radioescuchas?
e) Cul es la probabilidad de que de 8 radioescuchas, al menos 7 sintonicen la
estacin por ms de 5 minutos?
9. Un analista financiero seala que (conforme a su probabilidad subjetiva) el precio Y de
los bonos de gobierno a largo plazo, con un valor de 1000 dlares, tendr al cabo de un
ao una distribucin normal con un valor esperado de 980 dlares y desviacin tpica
de 40 dlares.
a) Encuentre P(Y 1000)
b) Encuentre P(Y 940)
c) Encuentre P(960 Y 1060)
10. Suponga que el salario por hora de un trabajador en una fabrica de ropa (que se basa
en un sistema de pago a destajo) tiene una distribucin normal con un valor esperado
de 5,10 dlares y una desviacin estndar de 0,40 dlares.
7.3. PROBLEMAS
140
7.3. PROBLEMAS
141
17. Si los ingresos mensuales de mdicos Norteamericanos estn distribuidos normalmente, con media 15000 dlares y con un desvo estndar de 3500 dlares . Cul
es la probabilidad de que un medico elegido al azar tenga un ingreso anual de :
a) superior a 16260 dlares
b) entre 16260 y 18500 dlares
c) entre 11500 y 18500 dlares
d) entre 8000 y 11500 dlares
18. Los puntos logrados por los candidatos en una prueba de actitud estn distribuidos
normalmente con una media de 500 y una desviacin 100. Qu porcentaje de los
candidatos reciben puntajes
a) superiores a 700
b) entre 400 y 600
19. Si la estatura de los estudiantes de una universidad estn normalmente distribuidos con
media de 70 pulgadas, con un desvo estndar de 3 pulgadas.
a) Si la estatura mnima para ser probado en el equipo de baloncesto es de 72 pulgadas. Que proporcin de los estudiantes estaran en condiciones de someterse
a la prueba?
b) Si para ocupar la posicin de centro hay que tener una estatura de 76 pulgadas.
Que proporcin de los estudiantes aptos para jugar baloncesto podran ocupar
dicho lugar?
20. El examen dado por un grupo de estudiantes arroja una media de 65 con una desviacin
tpica de 10. Si quisiramos dar al 15 % superior una calificacin A , al 20 % siguiente
B, al 30 % del medio C, al siguiente 25 % D y al 10 % ms bajo F. Qu calificaciones
numricas siguen el trazado de la curva?.
21. Las distribucin de los salarios de 2000 trabajadores tiene una media de 70 dlares y
una varianza de 36 dlares. Suponga que la distribucin es normal aproximada. Calcular la probabilidad que ganen:
a) entre 65 y 77 dlares
b) 82 dlares y mas
c) Cuantos trabajadores ganan 60 dlares o menos?
22. Un especialista en ictiologa tropical esta interesado en estimar cuanto tiempo puede
sobrevivir cierto tipo de pez en agua con determinado porcentaje de toxicidad. Luego
de una serie de experimentos llega a estimar que la vida media de este tipo de pez
alcanza 100 das con un desvi estndar de 20 das.
a) Cul es la probabilidad de un pez sobreviva ms de 110 das?
b) Cul es la probabilidad de un pez sobreviva entre 95 y 105 das?
7.3. PROBLEMAS
142
23. Dos estudiantes fueron informados de que haban recibido referencias tipificadas de
0,8 y -0,4 respectivamente, en un examen de ingls. Si sus puntuaciones fueron de 88
y 64 respectivamente. Hallar la media y la desviacin tpica de las puntuaciones.
24. La media de los pesos de 500 estudiantes de un cierto colegio es 151 libras y la
desviacin tpica 15 libras. Suponiendo que los pesos se distribuyen normalmente,
hallar
a) el nmero de estudiantes que pesan entre 120 y 155 libras
b) la probabilidad de que un estudiante pese ms de 185 libras
25. Una fabrica de productos para televisores vende transistores de vida media de 1000
horas y desviacin estndar de 100 horas. Suponiendo que la distribucin de vida en
horas de los transistores es normal, calcular:
a) la probabilidad de que un transistor elegido al azar tenga una duracin de vida
comprendida entre 875 y 1075 horas
b) la probabilidad de que un transistor elegido al azar tenga una duracin de vida
mayor a 1020 horas
26. La cantidad semanal que una compaa gasta en mantenimiento y reparaciones tiene
una distribucin normal aproximada cuyo promedio es de 400 dlares y su desviacin
estndar 20 dlares. Si el presupuesto para cubrir los gastos de reparacin para la semana siguiente es de 450 dlares.
a) Cul es la probabilidad de que los costos reales sean mayores que la cantidad
supuesta?
b) De cuanto debe ser el presupuesto semanal para mantenimientos y reparaciones
para que tan solo se rebase con una probabilidad de 0,1.
27. Los conductores que se fabrican para utilizar en determinado sistema de computo necesitan tener resistencias que varen entre 0,12 y 0,14 ohm. Las resistencias reales medidas de los conductores que producen la compaa A tiene una distribucin normal con
un promedio de 0,13 ohm y una desviacin estndar de 0,005 ohm.
a) Cul es la probabilidad de que un conductor seleccionado al azar de la produccin de la compaa A cumpla con las especificaciones?
b) Si se usan cuatro de estos conductores en el sistema y son de la compaa A .
Cul es la probabilidad de que los cuatro conductor cumplan con las especificaciones?
28. A una temperatura de 25C, las resistencias de un termistor de determinado tipo tiene
una distribucin normal con un promedio de 10000 ohm y una desviacin tpica de
4000 ohm. Los termistores se clasificaran para enviar a un cliente, los que tengan resistencias entre 8000 y 15000 ohm. Qu fraccin de los termistores se debe enviar?
29. Los tiempos de las primera avera de una unidad de cierta marca de impresoras de
chorro de tinta tienen aproximadamente una distribucin normal con un promedio de
1500 horas y una desviacin estndar de 200 horas.
7.3. PROBLEMAS
143
7.3. PROBLEMAS
144
7.3. PROBLEMAS
145
7. La Articulate Corporation espera que el 99 % de los saldos de sus cuentas por cobrar
sean correctas. Se selecciono una muestra de 200 cuentas para auditarlas.
a) Cul es la probabilidad de que ninguna de las cuentas tengan errores?
b) Cul es la probabilidad de que 5 de las cuentas tengan errores?
c) Cul es la probabilidad de que ms de 5 cuentas tengan errores?
8. En los ltimos 20 aos, solo 3 % de los cheques endosados a la American Herat Association fueron rechazados. Este mes, la asociacin recibi 200 cheques . Cul es la
probabilidad de que:
a) exactamente 10 de ellos sean rechazadas?
b) exactamente 5 de ellos sean rechazadas?
c) ms de 20 sean rechazadas?
d) a lo sumo 30 sean rechazadas?
9. Suponga que el 10 % de los habitantes de una ciudad son pelirrojos. Un grupo de encuestadores selecciona 200 personas al azar y les pregunta confidencialmente por quien
votaran en las prximas elecciones.
a) Cul es la probabilidad de que 15 o ms sean pelirrojos?
b) Cul es la probabilidad de que 30 o menos sean pelirrojos?
c) Cul es la probabilidad de que 20 sean pelirrojos?
10. Supngase que se sabe que la probabilidad de recuperacin de cierta enfermedad es de
40
a) la probabilidad de que ms de 20 personas se recuperen
b) la probabilidad de que se recuperen entre 10 y 25 personas inclusive
c) el valor esperado de personas que se recuperan
11. Si el 15 % de motores elctricos producidos por una lnea de montaje son defectuosos,
determinar la probabilidad de que entre 100 motores elegidos al azar :
a) haya a lo sumo 20 defectuosos
b) por lo menos 80 no defectuosos
c) hayas entre 15 y 25 defectuosos
12. La proporcin de familias que usan el jabn A en cierta ciudad es de 0,3. Se toma una
muestra aleatoria de 40 familias. Determinar
a) el numero esperado de familias que usen el jabn A
b) la probabilidad de que mas de 12 familias usen el jabn A
c) la probabilidad de que menos de 30 familias usen el jabn A
13. La proporcin de estudiantes que reciben calificacin C es de 0,7. Se toma una muestra
aleatoria de 150 estudiantes.
7.3. PROBLEMAS
146
7.3. PROBLEMAS
147
e) Si no ha sucedido falla en 3 horas despus de la ltima falla, cul es la probabilidad de que el tiempo entre fallas sea de 4 horas cuando mucho?.
5. El tiempo entre llegadas en una dependencia del Banco Mercan es exponencial con
valor medio de 0,05 hora. La oficina abre a las 8:00 A.M.
a) Escriba la distribucin exponencial que describa el tiempo entre llegadas.
b) Determine la probabilidad de que no lleguen clientes a la oficina hasta las 8:15
A.M.
c) Son las 8:35 A.M. El ltimo cliente entr a las 8:26. Cul es la probabilidad de
que el siguiente cliente llegue antes de las 8:38 A.M.? Y de que no llegue hasta
las 8:40?.
d) Cul es la cantidad promedio de clientes que llegan entre las 8:10 y las 8:45
A.M.?
6. Suponga que el tiempo entre descomposturas de una mquina es exponencial, con
promedio de 6 horas. Si la mquina ha trabajado sin fallar durante las ltimas tres
horas, cul es la probabilidad de que continue sin fallar durante la prxima hora? De
que se descomponga durante la siguiente 0,5 hora?.
7. El tiempo entre llegadas a una sala de juego en la sociedad de alumnos es exponencial,
con una media de 10 minutos.
a) Cul es la frecuencia de llegadas por hora?
b) Cul es la probabilidad de que no lleguen alumnos a esa sala durante los 15
minutos siguientes?.
c) Cul es la probabilidad de que al menos un alumno visite la sala de juegos durante los prximos 20 minutos?
8. El gerente de un nuevo restaurante de comida rpida desea cuantificar el proceso de
llegadas de clientes, estimando la fraccin del intervalo de tiempo entre llegadas que
sea:
a) menor que 2 minutos,
b) entre 2 y 3 minutos y
c) ms de 3 minutos.
Las llegadas en restaurantes parecidos tienen una frecuencia de 35 clientes por hora.
El tiempo entre llegadas tiene distribucin exponencial.
9. Ana y Pedro, dos empleados de un restaurante de comida rpida, juegan lo siguiente
mientras esperan la llegada de clientes. Pedro le paga 2 dlares a Ana si el prximo
cliente no llega en menos de 1 minuto; en caso contrario, Ana le paga a Pedro 2 dlares.
Calcule la recompensa promedio de Pedro en un perodo de 8 horas. El tiempo entre
llegadas es exponencial, con una media de 1,5 minutos.
7.3. PROBLEMAS
148
10. Si un cliente llega a McDonalds en menos de 4 minutos despus del cliente inmediato
anterior, recibir un descuento del 10 %. Si el tiempo entre llegadas es entre 4 y 5
minutos, el descuento, es del 6 %. Si el tiempo entre llegadas es mayor que 5 minutos,
el cliente tiene 2 % de descuento. El tiempo entre llegadas es exponencial, con media
de 6 minutos.
a) Determine la probabilidad de que un cliente que llegue reciba el mximo descuento.
b) Determine el descuento promedio a cada cliente que llega
11. Se sabe que el tiempo entre fallas de un refrigerador Kencore es exponencial, con una
media de 9000 horas (ms o menos 1 ao de funcionamiento), y la empresa otorga una
garanta de 1 ao con el refrigerador. Cul es la probabilidad de que la garanta cubra
una reparacin por descompostura?.
12. Los nios nacen en un estado poco poblado, con una frecuencia de un nacimiento cada
12 minutos. El tiempo entre nacimientos sigue una distribucin exponencial. Determinar
a) La cantidad promedio de nacimientos por ao
b) La probabilidad de que no haya nacimientos en cualquier da
c) La probabilidad de emitir 50 certificados de nacimientos en 3 horas, cuando se
emitieron 40 certificados durante las primeras 2 horas del perodo de 3 horas.
d) Suponga que el empleado que pasa la informacin de los certificados de nacimiento a la computadora suele esperar hasta que se hayan acumulado 5 certificados.
Calcule la probabilidad de que el empleado capture un nuevo lote en cada hora.
13. Un coleccionista de arte viaja una vez al mes, en promedio, para asistir a subastas.
En cada viaje se garantiza una compra. El tiempo entre los viajes tiene distribucin
exponencial. Determine lo siguiente:
a) La probabilidad de que el coleccionista no compre obras de arte en un perodo de
3 meses.
b) La probabilidad de que el coleccionista no compre ms de 8 obras de arte por
ao.
c) La probabilidad de que el tiempo entre viajes sucesivos sea mayor que 1 mes.
14. En un banco, la frecuencia de llegadas es de 2 clientes por minuto. Determine lo siguiente:
a) La cantidad promedio de llegadas durante 5 minutos.
b) La probabilidad de que no haya llegadas durante el prximo 0,5 minuto.
c) La probabilidad de que haya al menos una llegada durante el siguiente 0,5 minuto.
d) La probabilidad de que el tiempo entre dos llegadas sucesivas sea de 3 minutos,
cuando menos.
15. El tiempo entre llegadas al restaurante Juan Arepa es exponencial con media de 5
minutos. El restaurante abre a las 11:00 A.M. Determine:
7.3. PROBLEMAS
149
Captulo 8
Muestras aleatorias y distribuciones de
muestreo.
8.1.
Introduccin
Supongamos que tenemos una poblacin de inters, esto es, un conjunto arbitrario de individuos (personas, animales, plantas objetos en general) cualesquiera, y deseamos conocer
cierta informacin de esta poblacin. Debido a la imposibilidad o no conveniencia de tener
informacin de todos y cada uno de los elementos de la poblacin, generalmente tomamos un
pequeo subconjunto de ella, al cual llamamos muestra. Con base en esta muestra trataremos
de inferir la informacin de la poblacin en su totalidad.
8.2.
Definicin 8.2.1 Una muestra aleatoria (escribimos simplemente m.a.) es una coleccin de
variables aleatorias X1 , X2 , . . . , Xn que son independientes e idnticamente distribuidas.
De este modo, cuando se diga, por ejemplo, que una muestra aleatoria es tomada de una
poblacin normal con media y varianza 2 , ello significa que las variables aleatorias que
forman la m.a. son independientes entre s, y todas ellas tienen la misma distribucin normal
y los mismos parmetros que la poblacin. Una muestra aleatoria constituye el elemento
bsico para llevar a cabo inferencias estadsticas.
Definicin 8.2.2 Una estadstica o estadstico muestral es una funcin cualquiera de una
muestra aleatoria X1 , X2 , . . . , Xn , y por lo tanto es tambin una variable aleatoria.
150
151
Una estadstica es entonces cualquier funcin de las variables aleatorias que se observaron
en la muestra; de manera que esta funcin no contiene cantidades desconocidas.
Veremos a continuacin dos ejemplos de estadsticas que sern usados con frecuencia
ms adelante. Considere una muestra aleatoria X1 , X2 , . . . , Xn . La funcin X definida como
sigue
1 n
X = Xi
n i=1
es una estadstica, y se le conoce con el nombre de media muestral. El otro ejemplo es el de
la varianza muestral, que se puede expresar de dos maneras distintas y se definen por
S2 =
8.3.
1 n
1 n
2
2
(X
X)
y
S
=
i
(Xi X)2
n i=1
n 1 i=1
Mtodos de Muestreo
Por qu muestrear?
Muestreo es la actividad por la cual se toman ciertas muestras de una poblacin de elementos de los cuales vamos a tomar ciertos criterios de decisin, el muestreo es importante
porque a travs de l podemos hacer anlisis de situaciones de una empresa o de algn campo
de la sociedad.
Y porque no se estudia la poblacin completa? se preguntaran algunos, pero en ocasiones no es factible, veamos algunas razones por las cuales conviene muestrear:
1. La naturaleza destructiva de algunas pruebas.
Por ejemplo se quiere conocer la resistencia de los tornillos que se fabrica en una planta, para conocerla es necesario destruir el producto, lgicamente no podemos probar
toda la poblacin porque nos quedaramos sin productos.
2. La imposibilidad fsica de chequear todos los elementos de la poblacin.
Por ejemplo se quiere conocer el efecto de un nuevo insecticida en las moscas, como se
puede comprender no es posible contactar a todas las moscas para realizar el estudio.
3. El costo de estudiar a toda la poblacin es muy alto.
Por ejemplo se quiere conocer la opinin de la poblacin sobre cierto personaje de la
poltica, si en el pas hay 100 millones de habitantes, se tendra que contratar mucho
personal y equipo para realizar el estudio.
4. El tiempo para contactar a toda la poblacin es inviable.
En ocasiones se necesita informacin rpida para tomar una decisin importante, tal
vez estudiar a toda la poblacin nos lleve ms tiempo del que disponemos.
152
Por las razones anteriores, en muchos casos es conveniente el uso de muestras, pero
para que podamos extraer conclusiones, es importante que elijamos bien las muestras para
nuestros estudios. Hay cuestiones que debemos especificar a la hora de elegir una muestra:
a) El tipo de muestreo que se va a utilizar.
b) El tamao de la muestra.
c) El nivel de confianza de las conclusiones que vamos a presentar.
Clasificacin de los mtodos de muestreo
Los mtodos de muestreo pueden dividirse en dos grandes grupos: mtodos de muestreo
probabilsticos y mtodos de muestreo no probabilsticos.
Muestreos no probabilsticos
No sirven para realizar generalizaciones, pues no se tiene certeza de que la muestra extrada sea representativa, ya que no todos los sujetos de la poblacin tienen la misma probabilidad de se elegidos. En general se seleccionan a los sujetos siguiendo determinados criterios
procurando que la muestra sea representativa.
Muestreo intencional u opinativo: en el que la persona que selecciona la muestra es
quien procura que sea representativa, dependiendo de su intencin u opinin, siendo
por tanto la representatividad subjetiva.
Muestreo sin norma: se toma la muestra sin norma alguna, la muestra podra ser
representativa si la poblacin es homognea y no se producen sesgos de seleccin.
Muestreos probabilsticos
Los muestreos probabilsticos son aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra. Dentro de los mtodos de
muestreo probabilsticos encontramos los siguientes tipos:
1. Muestreo aleatorio simple
2. Muestreo sistemtico
3. Muestreo estratificado
4. Muestreo por conglomerados
8.3.1.
Una muestra seleccionada de modo que cada uno de los individuos en la poblacin tengan
las mismas posibilidades de ser seleccionados.
El procedimiento de seleccin consiste en:
primeramente se asigna un nmero a cada elemento de la poblacin,
153
despus al azar (como una urna, tablas de nmeros aleatorios, nmeros aleatorios generados electrnicamente, etc.) se eligen los elementos necesarios para la muestra.
La ventaja de este mtodo de muestreo es que es sencillo y de fcil comprensin. Sus
desventajas son:
requiere que se posea de antemano un listado completo de toda la poblacin y
que cuando se trabaja con muestras pequeas es posible que no represente a la poblacin
adecuadamente.
Ejemplo 8.3.1 En una compaa con 150 trabajadores se quiere obtener una muestra aleatoria de 15 elementos para un chequeo mdico. Se sigue el siguiente procedimiento:
1) Los trabajadores fueron numerados del 1 al 150
2) Mediante una tabla de nmeros aleatorios se procede a seleccionarlos.
3) El punto de arranque en la tabla se fija mediante la hora en ese momento, 4:03, por lo
tanto se inicia en la fila 4, columna 3.
4) Como los nmeros de los trabajadores van desde 1 hasta 150 solo se toman en cuenta las
primeras 3 cifras de cada nmero y se registran los nmeros que se vayan encontrando
en ese rango.
El primer nmero encontrado fue el 054 en la fila 4 columna 5, se siguen revisando
los nmeros horizontalmente, el siguiente seleccionado fue el 095 y as sucesivamente. La
muestra de 15 nmeros fue la siguiente:
054
005
041
8.3.2.
095
050
021
080
024
105
004
046
009
147
018
146
154
8.3.3.
En un muestreo aleatorio estratificado se divide la poblacin en subgrupos denominados estratos, y se selecciona una muestra de cada uno de ellos. En ciertas ocasiones resultar
conveniente estratificar la muestra segn ciertas variables de inters. Para ello debemos conocer la composicin estratificada de la poblacin objetivo a muestrear. Una vez calculado el
tamao muestral apropiado, este se reparte de cierta manera que puede ser proporcional o no
proporcional entre los distintos estratos definidos en la poblacin. Como el nombre lo indca,
un procedimiento o afijacin de muestreo proporcional requiere que el nmero de individuos
de cada estrato est en la misma proporcin que la problacin.
Entre sus ventajas, este mtodo asegura que la muestra represente adecuadamente a la
poblacin en funcin de ciertas variables seleccionadas, adems de obtener estimaciones
ms precisas.
La desventaja es que se ha de conocer como se distribuye la poblacin de acuerdo a las
variables utilizadas para la estratificacin.
Ejemplo 8.3.3 Se quiere obtener una muestra de 50 estudiantes de la universidad. Se pretende que la muestra sea representativa en relacin al lugar de origen de los estudiantes (si
son de la localidad o son forneos). Se sabe que en esta universidad el 30 % de los estudiantes son forneos. Primero debemos identificar los estratos de la poblacin y sus respectivas
proporciones:
Estududiantes locales 0.70
Estudiantes forneos 0.30
La muestra deber mantener esas mismas proporciones, para lo cual es preciso multiplicar
el tamao de la muestra (n) por las proporciones de los estratos y obtenemos el nmero de
elementos que sern selecionados de cada estrato:
Estudiantes locales
Estudiantes forneos
(0,70)(50) = 35
(0,30)(50) = 15
8.3.4.
155
El muestreo por conglomerados consiste en dividir la poblacin en sectores o conglomerados, seleccionar una muestra aleatoria de esos sectores, y finalmente obtener una muestra
aleatoria de cada uno de los sectores seleccionados. Muchas veces se le emplea para reducir
el costo de realizar un muestreo de una poblacin dispersa en una gran rea geogrfica.
Entre sus ventajas se encuentra que es muy eficiente cuando la poblacin es muy grande
y dispersa, adems de que no es preciso tener un listado de toda la poblacin, slo de las
unidades primarias de muestreo.
Su desventaja radica en que una muestra de conglomerados, usualmente produce un mayor error muestral (por lo tanto, da menor precisin de las estimaciones acerca de la poblacin)
que una muestra aleatoria simple del mismo tamao.
Ejemplo 8.3.4 Se quiere conocer la opinin de los padres de familia sobre los temas de educacin sexual tratados en los libros de texto de primaria en la Repblica Mexicana. Como la
poblacin est muy dispersa y es muy grande, es necesario hacer un muestreo por conglomerados en varias etapas.
Primero dividimos la Repblica en sectores geogrficos, que podran ser los estados, y
seleccionamos una muestra aleatoria de ellos. Luego en cada uno de ellos hacemos una seleccin aleatoria de escuelas primarias. Y por ltimo en las escuelas seleccionadas obtenemos
una muestra aleatoria de padres de familia.
8.3.5.
Error de Muestreo
Al seleccionar una muestra aleatoria, sin importar por cual de los cuatro mtodos, es
poco probable que la media de la muestra sea idntica a la media de la poblacin de donde
fue obtenida. De la misma forma, es probable que la desviacin estndar de la muestra no
sea exactamente igual al valor correspondiente de la poblacin. Por lo tanto podemos esperar
alguna diferencia entre un estadstico muestral y el correspondiente parmetro poblacional.
Esta diferencia es llamada error de muestreo.
8.4.
Distribuciones Muestrales
Las distribuciones muestrales constituyen distribuciones de probabilidad de los estadsticos muestrales. Por ejemplo si tomamos una muestra aleatoria X1 , X2 , . . . , Xn de una poblacin
con cierta distribucin y calculamos X y S2 ; podramos establecer una distribucin muestral
de medias y una distribucin muestral de varianzas. Adems si tenemos dos poblaciones
podemos extraer muestras aleatorias de cada poblacin, calcular ciertos extadsticos muestrales de cada poblacin, establecer relaciones entre ellos y finalmente obtener una distribucin para dicha relacin. Por ejemplo si tenemos dos poblaciones y extraemos muestras
aleatorias de ciertos tamaos de cada poblacin, luego calculamos las medias muestrales
correspondientes, adems de las respectivas varianzas, podramos establecer una distribucin muestral de sumas o de diferencias medias y una distribucin muestral de relaciones de
varianzas.
156
8.4.1.
La poblacin en este ejemplo son los ingresos por hora de los cinco parrilleros. Si calculamos
la media de esta poblacin obtendramos
9+8+8+8+7
=8
5
Para facilitar la explicacin y comenzar a elaborar la distribucin muestral de medias,
vamos a fijar el tamao de muestra (n) en 2. Formamos todas las posibles muestras de tamao
2, y como vemos en el siguiente cuadro son 10, y a cada una le calculamos la media.
=
muestra
1
2
3
4
5
6
7
8
9
10
parrilleros
A-B
A-C
A-D
A-E
B-C
B-D
B-E
C-D
C-E
D-E
percepciones
9,00 8,00
9,00 8,00
9,00 8,00
9,00 7,00
8,00 8,00
8,00 8,00
8,00 7,00
8,00 8,00
8,00 7,00
8,00 7,00
media
8,50
8,50
8,50
8,00
8,00
8,00
7,50
8,00
7,50
7,50
A continuacin elaboramos una distribucin de probabilidad con las medias de las muestras, quedando de la siguiente manera:
Distribucin Muestral de Medias para n=2
media muestral frecuencia Probabilidad
7,50
3
0,3
8,00
4
0,4
8,50
3
0,3
10
1,0
157
n i=1
Xi
1 n
1
= E(Xi ) = n =
n i=1
n
2
n
1 n
1 2 2
=
n =
X
Var(X
)
=
i
i
n i=1
n2 i=1
n2
n
n
8.4.2.
158
El Teorema del Lmite Central consiste en un conjunto de resultados acerca del comportamiento de las distribuciones muestrales. En el que se afirma, bajo ciertas hiptesis, que la
distribucin de las medias de un nmero muy grande de muestras se aproxima a una distribucin normal.
El trmino Central, debido a Poly (1920), significa fundamental, o de importancia central, este describe el rol que cumple este teorema en la teora de la probabilidad.
Muchos grandes matemticos colaboraron para desarrollar el teorema del lmite central,
sin embargo Laplace ocupa un lugar fundamental, a pesar de que nunca enunci formalmente
este resultado, ni lo demostr rigurosamente, a l le debemos este importante descubrimiento.
Teorema 8.4.1 Teorema del Lmite Central:
Para una poblacin con una media y una varianza 2 , la distribucin de las medias
de todas las muestras posibles de tamao n generadas de la poblacin estar distribuida de
forma aproximadamente normal asumiendo que el tamao de la muestra es lo suficientemente
grande.
Con relacin al teorema del lmite central debemos enfatizar en:
1. Si el tamao de la muestra n es suficientemente grande (n 30) la distribucin de las
medias ser aproximadamente normal. No importa si la poblacin es normal, sesgada
u uniforme, si la muestra es grande el teorema se aplicar.
2. La media de la poblacin y la media de la distribucin de todas las posibles muestras sern iguales. Si la poblacin es grande y un gran nmero de muestras son seleccionadas de esa poblacin entonces la media de las medias muestrales se aproximar a
la media poblacional.
3. La desviacin estndar de la distribucin muestral de las medias, a la que llamaremos
error estndar, es determinado por:
159
Desarrollo
Segn las condiciones del problema; la media y la desviacin estndar poblacional son
respectivamente = 300 libras y = 50 libras. Como no se conoce el tamao de la poblacin
se asume que es infinita, por lo que los parmetros de la distribucin muestral de medias
50
sern: X = = 300 libras y X = = libras. Entonces la probabilidad de que
n
n
a) el peso medio de 35 paquetes recibidos aleatoriamente sea menor que 320 libras es
320 300
P(X < 320) = P Z <
= P(Z < 2, 37) = 0, 5 + A(2, 37)
50
35
290 300
= P(Z > 1, 26) = 0, 5+A(1, 26) = 0, 5+A(1, 26)
P(X > 290) = P Z >
50
40
Buscando nuevamente en la tabla de Z encontramos que A(1, 26) = 0, 3962 por lo que
la probabilidad buscada esta dada por
P(X > 290) = 0, 5 + 0, 3962 = 0, 8962
160
8200
328 300
P X>
=P Z>
= P(Z > 2, 8) = 0, 5 A(2, 8)
50
25
25
=
= 0, 2373 kg. Entonces la probabilidad de que
X =
n
N 1
1000 1
100
la media muestral
a) sea mayor que 68, 9 kg es
68, 9 68, 2
= P(Z > 2, 95) = 0, 5 A(2, 95)
P(X > 68, 9) = P Z >
0, 2373
Buscando en la tabla de la distribucin Z encontramos que A(2, 95) = 0, 4984 por lo
que la probabilidad buscada est dada por
P(X > 328) = 0, 5 0, 4984 = 0, 0016
161
8.4.3.
1 n
(Xi )2
n i=1
i
i
i=1
i=1
2
2
S =
y S =
n1
n
162
1 n
1 n
2
(X
X)
=
[(Xi ) (X )]2
i
n i=1
n i=1
n
i=1
n
i=1
n
i=1
i=1
= (Xi )2 n(X )2
i=1
Por lo tanto
i=1
(Xi )2
i=1
nS2 n(X )2
+
2
2
2
n
(Xi )2
i=1
n(X )2
dos de libertad, adems por la proposicin 7.2.3 la v.a.
tiene una distribucin
2
ji-cuadrada con un grado de libertad, por lo que finalmente por la proposicin 7.2.4 la v.a.
nS2
tiene una distribucin ji-cuadrada con n 1 grados de libertad.
2
Probamos entonces que la distribucin muestral de varianzas para muestras de tamao
n provenientes de una distribucin normal con media y varianza 2 tiene una distribucin
ji-cuadrada con n 1 grados de libertad.
Proposicin 8.4.3 Si se extraen muestras de tamao n de una poblacin normal con media
y varianza 2 , entonces la esperanza y la varianza de S2 son respectivamente
S 2 =
.
n1 2
2(n 1) 4
y S 2 =
n
n2
163
Desarrollo
Para realizar la demostracin primeramente recordemos que la esperanza y la varianza
de una distribucin ji-cuadrada con con k grados de libertad estn dadas por k y 2k respectinS2
vamente. Adems tomemos en cuenta que la v.a. 2 tiene una distribucin ji-cuadrada con
nS2
2
= n 1 y Var
nS2
2
= 2(n 1)
n
n2
2
E(S
)
=
n
1
y
Var(S2 ) = 2(n 1)
2
4
con lo cual
E(S2 ) =
n1 2
2(n 1) 4
y Var(S2 ) =
n
n2
Ejemplo 8.4.3 Una poblacin normal tiene una varianza de 15. Si se extraen muestras de
tamao 5 de esta poblacin; qu porcentajes pueden tener varianzas
a) menores que 10?
b) mayores que 20?
Calcule adems la media y la varianza de esta distribucin muestral de varianzas.
Desarrollo
Segn las condiciones del problema; 2 = 15 y n = 5. Adems el grado de libertad ser
n 1 = 5 1 = 4, entonces
a) para responder este inciso debemos calcular primeramente 21 que viene dada por la
siguiente relacin
nS2 (5)(10)
21 = 21 =
= 3, 3333
15
164
b) para responder a este inciso se debe realizar un procedimiento anlogo al anterior; esto
es
nS2 (5)(20)
22 = 22 =
= 6, 667
15
Luego en la tabla 2 se observa que el valor 6,667 con 4 grados de libertad est ente los
valores 2[0,80 ;4] = 5, 99 y 2[0,90 ;4] = 7, 78; con lo cual podramos tomar al promedio
de estos valores como el valor ms cercano. Entonces
2[0,80 ;4] + 2[0,90 ;4]
5, 99 + 7, 78
= 6, 885
2
2
con lo cual la probabilidad buscada es de aproximadamente 1 0, 85 = 0, 15.
2[0,85 ;4]
La esperanza y la varianza para esta distribucin vienen dadas por la siguientes relaciones
n1 2 4
= 15 = 12
n
5
2(n 1) 2 2(4)
Var(S2 ) =
= 2 15 = 4, 8
n2
5
E(S2 ) =
8.4.4.
Distribucin F
Esta distribucin de probabilidad es usada en varias situaciones. Es usada cuando queremos probar si dos varianzas muestrales provienen de la misma poblacin o de poblaciones
con caractersticas idnticas, adems es aplicada cuando se quiere comparar las medias de
ms de dos poblaciones simultneamente.
La distribucin F se define como la razn entre dos distribuciones ji-cuadrada independientes, dividida cada una de ellas entre sus respectivos grados de libertad.
Consideremos dos variables aleatorias independientes Y y W tales que Y tiene una distribucin 2 con m grados de libertad y W una distribucin 2 com n grados de libertad,
donde m y n son enteros positivos. Se define una nueva variable aleatoria como sigue:
X=
Y
m
W
n
nY
mW
165
m 2 n2
2
x 2 1
si x > 0
m+n
n
m
2
(mx
+
n)
f (x) =
2
2
0
si x 0
Figura 8.1: Grfica de f (x) cuando los parmetros m y n toman diferentes pares de valores.
Caractersticas de la distribucin F
Hay una familia de distribuciones F. Cada miembro de esta familia est determinado
por los grados de libertad del numerador (varianza mayor) y por los del denominador
(varianza menor).
La distribucin F es una distribucin continua y no puede tomar valores negativos.
La curva que representa la distribucin F est sesgada hacia la derecha.
Su rango de valores va desde 0 hasta infinito, cuanto ms se incrementa F, la curva se
aproxima al eje X, pero nunca lo toca.
Inferencias con respecto a las varianzas de dos distribuciones normales independientes.
Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin normal con media X y varianza 2X , sea adems Y1 ,Y2 , . . . ,Ym otra muestra aleatoria de una distribucinb normal con
media Y y varianza Y2 . Si se supone independencia entre las variables aleatorias X e Y , las
(n 1)SX2
(m 1)SY2
estadsticas uX =
y
u
=
son distribuciones ji-cuadradas con n 1 y
Y
2X
Y2
166
ux
n1
uY
m1
SX2
2X
SY2
Y2
8.4.5.
SX2
SY2
k N n P(1 P) N n
2p = Var
=
=
= 1
2
2
2
n
n
n N (N 1)
n N
N N 1
n
N 1
Cuando el muestreo es efectuado ya sea con o sin reemplazamiento, si el tamao de las
muestras es n 30, la distribucin muestral de las proporciones en las muestras se aproxima a
la normal por aplicacin del teorema central del lmite. A continuacin se enuncia el teorema
central del lmite para este caso.
167
p0 P
P( p p0 ) = P Z
p
Cuando n no es tan grande, pueden obtenerse aproximaciones normales muy satisfac1
torias, introduciendo un factor de correccin de continuidad dada por
. La funcin de
2n
distribucin de p para este caso ser
1
P
p0 2n
P( p p0 ) = P Z
p
Ejemplo 8.4.4 De un total de 1000 muestras de 200 nios cada uno, en cuanto cabe esperar que
a) menos del 40 % sean nios?
b) entre el 40 % y el 60 % sean nias
c) el 53 % o ms sean nias
Desarrollo
Segn las especificaciones de este problema tenemos 1000 muestras, cada una de tamao
n = 200. Como la poblacin del cual provienen las muestras est constituido por dos caracteres: nio y nia, con lo cual se tiene
1
1
= 0, 5 y P(nia) = = 0, 5
2
2
Para responder a los tres incisos calculemos primeramente p ; que ser el mismo para
los tres incisos ya que los dos acontecimientos involucrados tienen las misma probabilidad
de ocurrencia. Por lo tanto
r
r
P(1 P)
(0, 5)(0, 5)
=
= 0, 0354
p =
n
200
P(nio) =
1
; que se le suma o se le resta a
Adems se tendr en cuenta el factor de correccin
2n
los lmites en los clculos de acuerdo a si se quiere que influya o no las probabilidades de
ocurrencia de tales valores lmites. Esta consideracin lo hacemos debido a que n = 200 no
es tan grande.
168
1
0, 40 2(200)
0, 5
P(pnio < 0, 40) = P Z <
= P(Z < 2, 90) = 0, 5 A(2, 90)
0, 0354
Se rest el factor de correccin al lmite superior 0,4 debido a que pnio < 0, 4. Esta
resta garantiza que la probabilidad de ocurrencia de este valor extremo no forme parte
del resultado final. Luego en la tabla de Z se observa que A(2, 90) = A(2, 90) =
0, 4981, con lo cual
P(pnio < 0, 40) = 0, 5 0, 4981 = 0, 0019
Finalmente (1000)(0, 0019) = 1, 9. Por lo que en aproximadamente 2 muestras cabe
esperar que menos del 40 % sean nios.
b) La probabilidad de que entre el 40 % y 60 % sean nias esta dada por
!
1
1
0, 40 + 2(200)
0, 5
0, 60 2(200)
0, 5
P(0, 4 < pnia < 0, 6) = P
<Z<
0, 0354
0, 0354
= P(2, 75 < Z < 2, 75) = A(2, 75) + A(2, 75) = 2A(2, 75)
169
!
1
0, 53 2(200)
0, 5
P(pnia 0, 53) = P Z
= P(Z 0, 78) = 0, 5 A(0, 78)
0, 0354
Se rest el factor de correccin al lmite inferior 0,53 debido a que pnia 0, 53. Esta
resta garantiza que la probabilidad de ocurrencia de este valor extremo forme parte del
resultado final. Luego en la tabla de Z se observa que A(0, 78) = 0, 2823, con lo cual
P(pnia 0, 53) = 0, 5 0, 0, 2823 = 0, 2177
Con lo cual (1000)(0, 2177) = 217, 7. Por lo que en aproximadamente 218 muestras
cabe esperar que 53 % o ms sean nias.
8.4.6.
Proposicin 8.4.4 Sean X e Y dos variables aleatorias independientes y normalmente distribuidas con medias X y Y , adems de varianzas 2X y Y2 respectivamente. Si todos los
posibles pares de muestras se extraen de estas poblaciones, tanto la suma como la diferencia
entre las medias muestrales estarn normalmente distribuidas con medias X+Y = X + Y
y XY = X Y respectivamente, y adems las varianzas de estas dos distribuciones sern
2
iguales, esto es X+Y
= 2XY = X2 + Y2 .
170
Demostracin
Recordemos primeramente que por la proposicin 8.4.1 la media de toda distribucin
muestral de medias coincide con la media de la poblacin del cual se extraen las muestras.
Entonces la media de la distribuciones muestral de sumas y la media de la distribucin muestral de diferencias sern respectivamente
E(X +Y ) = E(X) + E(Y ) = X + Y
E(X Y ) = E(X) E(Y ) = X Y
Como las variables aleatorias X e Y son independientes se tendr que tambin X e cY ,
con c 6= 0 sern independientes entonces
Var(X +Y ) = Var(X) +Var(Y ) = 2X + Y2
Var(X Y ) = Var[X + (Y )] = Var(X) +Var(Y ) = Var(X) +Var(Y ) = X2 + Y2
Observacin: Si las poblaciones son infinitas o los muestreos son sin reemplazamiento
entonces
2 2
2X+Y = 2XY = X + Y
nX nY
de lo contrario si almenos uno de ellos por ejemplo la poblacin 1 es finita o el muestreo fue
hecho sin reemplazamiento se tiene
2X2 =
2X NX nX
nX NX 1
171
b) Halllar la probabilidad de que la suma de los promedios de los dos grupos sea mayor
que 670 das.
Desarrollo
Si nombramos por X a los acumuladores del automvil de manufactura XY y por Y a los
acumuladores del automvil de manufactura ZW tendremos: X = 360 das, X = 45 das,
nX = 50, Y = 300 das, Y = 30 das y nY = 50.
a) La probabilidad de que los acumuladores de la marca XY tenga una duracin promedio de a lo ms 40 das sobre los de la marca ZW, se puede calcular estableciendo una
distribucin muestral de diferencias de medias sobre las dos poblaciones de acumuladores. Adems n1 + n2 2 = 50 + 50 2 = 98, con lo cual
!
(X Y ) (X Y )
q
P(X Y + 40) = P(X Y 40) = P Z
2X + Y2
entonces se tiene que
40 (360 300)
P(X Y 40) = P Z q
452
302
50 + 50
!
= P(Z 2, 61) = 0, 5 A(2, 61)
!
(X +Y ) (X + Y )
q
P(X +Y > 670) = P Z >
2X + Y2
172
!
= P(Z > 1, 31) = 0, 5 A(1, 31)
n1 SX2 n2 SY2
+ 2 2 (n1 + n2 2); entonces
2X
Y
(X Y ) XY
XY
T=v
t(n1 + n2 2)
u
u n1 SX2 n2 SY2
u 2 + 2
t X
Y
n1 + n2 2
Si se asume que las varianzas poblacionales son iguales; esto es 2X = Y2 = 2 ; se tendr
las siguientes relaciones
s
r
1
2 2
1
+
=
+
XY =
n1 n2
n1 n2
v
u
u n1 SX2 n2 SY2
s
u 2 + 2
t X
Y
1 n1 SX2 + n2 SY2
=
n1 + n2 2
n1 + n2 2
173
+
(X Y ) XY
(X Y ) XY
n
n2
r
=
T= s 1
=s
r
1
1
2
2
2
2
1
n1 SX + n2 SY
1
1 n1 SX + n2 SY
Sp
+
+
n1 n2
n1 + n2 2 n1 n2
n1 + n2 2
s
n1 SX2 + n2 SY2
donde SP =
recibe el nombre de varianza combinada de las muestras.
n1 + n2 2
Como se puede observar tanto T como su distribucin no dependen de las varianzas
poblaciones. Esto es caracterstico de las distribuciones t.
8.4.7.
8.4.8.
Sean dos poblaciones con distribuciones de Bernoulli, tal que la primera tiene parmetro
P1 y la segunda parmetro P2 . De la poblacin uno se extraen muestras aleatorias de tamao
n1 , y de la poblacin dos muestras de tamao n2 . Sean las proporciones muestrales
p1 =
X
Y
y p2 =
n1
n1
donde X es la v.a. que indica el nmero de unidades de la muestra n1 que posee cierto rasgo y
Y la v.a. que indica el nmero de unidades en la muestra n2 que posee tambin un cierto rasgo.
Si las proporciones muestrales se relacionan a pares de tal forma que establescan diferencias
( p1 p2 ); se tendr una nueva v.a. formada por el conjunto de dichas diferencias.
Si X e Y son independientes la distribucin muestral de diferencias de proporciones estarn dadas respectivamente por
p1 p2 = E( p1 p2 ) = E( p1 ) E( p2 ) = p1 p2
2p1 p2 = Var( p1 p2 ) = Var( p1 ) +Var( p2 ) = 2p1 + 2p2
Si las poblaciones son infinitas o el muestreo en cada poblacin se realiza con sustitucin
la distribucin muestral de proporciones en cada poblacin seguir una ley bimonial y se
tendr que
p1 p2 = P1 P2
P1 (1 P1 ) P2 (1 P2 )
+
n1
n2
Por el contrario si almenos una de las poblaciones es finita o el muestreo en l se realiza
sin reemplazamiento, la distribucin muestral de proporciones obtenida obedecer a la ley
hipergeomtrica y se tendr que
2p1 p2 =
2p1 =
P2 (1 P2 ) N2 n2
P1 (1 P1 ) N1 n1
2p2 =
n1
N1 1
n2
N2 1
8.5. PROBLEMAS
174
p1 p2 = P1 P2 = 0, 6 0, 6 = 0
s
p1 p2 =
P1 (1 P1 ) P2 (1 P2 )
+
=
n1
n2
X Y
0, 2667
8
= P( p1 p2 0, 2667) = P Z
P(X Y 8) = P
30
30
0, 1265
= P(Z 2, 11) = 0, 5 A(2, 11)
8.5.
Problemas
Captulo 9
Estimacin
9.1.
Introduccin
9.2.
Definicin 9.2.1 Sea X una v.a. con una distribucin de probabilidad que depende de un
parmetro desconocido perteneciente a un espacio parmetrico . Sea X1 , X2 , . . . , Xn una
muestra aleatoria de X. Adems sean x1 , x2 , . . . , xn los valores muestrales correspondientes.
Si g(X1 , X2 , . . . , Xn ) es una funcin de la muestra que va a ser usada para estimarle a , nos
referimos a g como un estimador de .
175
176
El valor que toma g, es decir g(x1 , x2 , . . . , xn ) ser mencionado como una estimacin de
y habitualmente es escrito como: = g(x1 , x2 , . . . , xn )
9.2.1.
Insesgado
Se dice que un estimador para un parmetro poblacional es insesgado si su valor esperado es igual al verdadero valor del parmetro poblacional. Esto es; si es el estimador
y es el parmetro entonces:
=
E()
X
un estimacin del parmetro P; donde X es una v.a. binon
mial con parmetros P y n. Probar que p es un estimador insesgado de P.
Desarrollo
Recordemos que si X bin(P, n) tendremos que E(X) = nP. Entonces
X 1
1
E( p)
=E
= E(X) = nP = P
n
n
n
por lo que p es un estimador insesgado de P.
Eficiente
La eficiencia se refiere al tamao de la varianza del estadstico. Si comparamos dos
estadsticos; 1 y 2 ambos insesgados con varianzas Var( 1 ) y Var( 2 ) respectivamente; y tratamos de decidir cual de ellos es un estimador ms eficiente, escogeramos
al que tuviese la menor varianza, es decir se preferir a 1 si Var( 1 ) < Var( 2 ). El
estadstico eficiente recibe el nombre estadstico estimador insesgado de varianza
mnima.
Ejemplo 9.2.2 Sea una poblacin con media y varianza 2 . La distribucin mues2
y la distral de medias tiene media dada por E(X) = y varianza Var(X) =
n
tribucin muestral de medianas tiene tambin media E(Xmediana ) = , pero varianza
2
Var(Xmediana ) =
. Vemos que X y Xmediana son estimadores insesgados del parmetro
2n
y adems Var(X) < Var(Xmediana ), por lo que X es un estimador eficiente de .
Eficiencia relativa
Tambin se pueden comparar dos estimadores en base a su eficiencia relativa. Sean 1 y
2 dos estimadores diferentes del parmetro . La eficiencia relativa de 2 , comparada
con 1 , se define por la rezn:
E( 1 )2
(9.2.1)
R=
E( 2 )2
177
cuando
Proposicin 9.2.1 Sea una estimacin del parmetro basada en una muestra de
= , y si lm Var()
= 0; entonces es una estimacin convertamao n; si lm E()
gente de .
178
Criterio de Fisher-Neyman
Un estadstico Y1 = Y1 (X1 , X2 , . . . , Xn ) es suficiente, si y slo si:
n
donde h no contiene a .
Ejemplo 9.2.4 Sea X1 , X2 , . . . , Xn una muestra aleatoria tomada de una distribucin
Bernoulli con parmetro 0 < p < 1. Verificar que el estadstico Y1 = X1 + X2 + + Xn
es suficiente.
Como la poblacin tiene distribucin Bernoulli con parmetro 0 < p < 1, la distribucin conjunta de X1 , X2 , . . . , Xn est dada por
n
i=1
pxi (1 p)1xi
xi
pi=1
(1 xi)
(1 p)i=1
n!
py1 (1 p)ny1
y1 !(n y1 )!
donde y1 = xi .
i=1
y1 !(n y1 )!
n!
n
Invariante
Un estimador de un parmetro se dice invariante, respecto a una clase de transfor es un estimador de g() con propiedades anlogas a .
macin g, si g()
Ejemplo 9.2.5 Consideremos una distribucin normal con media y varianza 2 .
2
Sean X un estimador de y X un estimador de 2 .
Como la distribucin muestral de medias tiene media E(X) = tenemos que X es un
2
y por una
estimador insesgado de , adems la varianza viene dada por Var(X) =
n
de las propiedades de varianza
2
2
2
= E(X ) [E(X)]2 = E(X ) 2
n
179
2
2
+ 2 . Entonces X no es un estimador insesgado de 2 , con lo
n
cual X no es un estimador invariante de .
2
9.3.
Estimacin Puntual
2,15
1,85
1,83 2,04
2,05 1,99
2,02
1,95
1 10
xi = 1, 96
10 i=1
Como es una estimacin puntual, se establece que la estatura promedio de los jugadores
de baloncesto de esta liga es aproximadamente igual a 1, 96 metros.Esto es = 1, 96.
Supongamos ahora que extraemos una muestra aleatoria de una poblacin con cierta distribucin de probabilidad y queremos estimar un cierto parmetro de est poblacin a traves
de la muestra tomada. Existen dos metodos de estimacin puntual de un parmetro poblacional:
Mtodo de mxima verosimilitud
Mtodo de los momentos
9.3.1.
Consideremos una distribucin de probabilidad concreta sobre la recta real que puede
ser representada por una funcin de probabilidad o una funcin de densidad de probabilidad
f . Recordemos que n variables aleatorias X1 , X2 , . . . , Xn constituyen una muestra aleatoria
de est distribucin si son independientes y estn idnticamente distribuidas, es decir que
cada Xi , i = 1, 2, . . . , n tiene funcin de probabilidad o funcin de densidad de probabilidad
dada por f . En otras palabras, las variables aleatorias X1 , X2 , . . . , Xn constituyen una muestra
aleatoria de la distribucin representada por f si su funcin de probabilidad o funcin de
densidad de probabilidad conjunta g para los puntos reales x1 , x2 , . . . , xn se especifica como
sigue:
g(x1 , x2 , . . . , xn ) = f (x1 ) f (x2 ) f (xn )
180
Considrese un problema de inferencia estadstica en el que se van a seleccionar observaciones de una distribucin cuya funcin de probabilidad o de densidad de probabilidad
es f (x|), donde es un parmetro desconocido. Se supone que el valor desconocido del
parmetro debe pertenecer a un espacio paramtrico . El problema de estimacin consiste en intentar determinar donde es probable que se encuentre el verdadero valor de en ,
partiendo de las observaciones de f (x|).
Funcin de verosimilitud
Si las variables aleatroias X1 , X2 , . . . , Xn constituyen una muestra aleatoria de una distribucin cuya funcin de probabilidad o de densidad de probabilidad es f (x|), entonces
la funcin de probabilidad o de densidad de probabilidad conjunta de las varables aleatorias
X1 , X2 , . . . , Xn , est dada por:
L(x1 , x2 , . . . , xn |) = f (x1 |) f (x2 |) f (xn |)
Cuando la funcin de probabilidad o de densidad de probabilidad conjunta L(x1 , x2 , . . . , xn |)
de las observaciones de una muestra aleatoria se considera como una funcin de para los
valores x1 , x2 , . . . , xn se llama funcin de verosimilitud.
Ejemplo 9.3.2 Supongamos que las variables aleatorias X1 , X2 , . . . , Xn constituyen una muestra aleatoria de una distribucin de Bernoulli con parmetro p desconocido (0 p 1).
Encontrar la funcin de verosimilitud.
Desarrollo
Como cada Xi ; i = 1, 2, . . . , n; tiene distribucin de Bernoulli entonces
x
si x = 0, 1
p i (1 p)1xi
f (x) =
0
en otro caso
por lo que la funcin de verosimilitud es
n
xi
(1 xi)
181
Ejemplo 9.3.3 Suponiendo que el tiempo para fallar T , de una componente tiene una distribucin exponencial con parmetro desconocido. Si se extrae una mustra aleatoria de
tamao n de esta poblacin, hallar el estimador de verosimilitud de .
Desarrollo
Como cada Ti , i = 1, 2, . . . , n tiene distribucin exponencial con prmetro por ser una
muestra aleatoria proveniente de una poblacin exponencial con dicho parmetro entonces
si ti > 0
eti
f (ti ) =
0
en otro caso
por lo que la funcin de verosimilitud es
n
ti
L(x1 , x2 , . . . , xn |p) = e
ti
i=1
= e
i=1
ti
i=1
1
(log L(x1 , x2 , . . . , xn |p)) = n ti = 0
i=1
con lo cual
n
1
= n =
t
ti
i=1
1
Entonces el estimador verosimil de es = .
t
9.3.2.
Recordemos que la definicin del r-simo momento alrededor del origen de una v.a. X
est dada por E(X r ).
Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribucin con funcin de probabilidad
o de densidad de probabilidad f (X|). El r-simo momento muestral alrededor del origen se
define por
1 n
mr = Xir
n i=1
182
si X es discreta
xt f (x|1, 2, . . . , k )
x
t =
Z
xt f (x|1 , 2 , . . . , k )dx
si X es continua
para t = 1, 2, . . . , k.
En general t ser funcin de los k parmetros. Sea ahora X1 , X2 , . . . , Xn una muestra
aleatoria de tamao n de f (x|1 , 2 , . . . , k ). A partir de esta muestra formamos los k primeros
momentos muestrales m1 , m2 , . . . , mn . Sean 1 , 2 , . . . , k las soluciones que resultan de las k
ecuaciones mt = t , para t = 1, 2, . . . , k. Las soluciones 1 , 2 , . . . , k constituyen los estimadores por el metodo de los momentos.
Ejemplo 9.3.4 Sea una poblacin normal con parmetros y 2 , ambas desconocidas. Sea
X1 , X2 , . . . , Xn una muestra aleatoria de tamao n de esta distribucin. Obtener por el metodo
de los momentos las estimaciones de y de 2 .
Desarrollo
Como la distribucin es normal entonces E(X) = y Var(X) = 2 . Adems recordemos
que Var(X) = E(X 2 ) [E(X)]2 , entonces E(X 2 ) = 2 + 2 . Por otro lado los momentos
1 n
1 n
muestrales se definen como m1 = Xi y m2 = Xi2 . Tomando en consideracin la
n i=1
n i=1
n
1
1 n
relacin mt = t temdremos que : = Xi = X y 2 + 2 = Xi2 , entonces
n i=1
n i=1
1 n
1 n
1 n 2
2
2
2 = Xi2 X =
X
nX
= (Xi X)2
i
n i=1
n i=1
n i=1
Entonces los estimadores por el mtodo de los momentos son
1 n
2
= X y = (Xi X)2
n i=1
9.4.
183
Definicin 9.4.1 Sea (0, 1). Un intervalo de confianza para un parmetro desconocido
de una distribucin de probabilidad es un intervalo aleatorio de la forma ( 1 , 2 ), en donde
1 y 2 son estadsticas muestrales tales que:
P( 1 < < 2 ) = 1
A las estadsticas 1 y 2 se les conoce como lmites inferior y superior, respectivamente,
del intervalo de confianza. A los nmeros y 1 se les conoce como nivel se significacin
y grado o nivel de confianza, respectivamente. En general, se toma el valor de cercano a 0
de tal forma que el grado de confianza, 1, es cercano a 1. Entonces el nivel de confianza es
la probabilidad de que el parmetro poblacional se encuentre dentro del intervalo encontrado.
Los niveles de confianza ms ampliamente usados son 0, 95 y 0, 99, sin embargo puede usarse
cualquier probabilidad cercana a 1.
Interpretacin de un intervalo de confianza
Segn la definicin anterior; podramos realizar la interpretacin de dos maneras distintas, que son:
el verdadero valor del parmetro desconocido se encuentre entre los valores 1 y 2
con un grado de confiabilidad de 1 ; o tambin
la probabilidad de que el verdadero valor del parmetro desconocido se encuentre
entre los valores 1 y 2 es igual a 1 .
Para entender mejor el concepto de intervalo de confianza vamos a suponer que seleccionamos 100 muestras de una poblacin y calculamos la media de las muestras e intervalos
de confianza del 95 % para cada muestra. Descubriremos que cerca de 95 de los 100 intervalos de confianza contienen la media poblacional.
Pasos para construir un intervalo de confianza
1. Establecer el nivel de confianza.
2. Determinar el valor de la variable aleatoria estndar.
3. Calcular los estadsticos de la muestra.
4. Calcular el error estndar.
5. Calcular el error mximo de estimacin.
6. Determinar los lmites del intervalo de confianza e interpretar.
9.4.1.
Para la estimacin de la media de una poblacin se deben tener en cuenta las siguientes
condiciones:
Tomar una muestra aleatoria de tamao n de la poblacin cuya media se quiere estimar.
El estadstico a utilizar es la media muestral X.
La distribucin muestral a considerar es la distribucin muestral de medias.
184
Intervalos de confianza para estimar la media de una poblacin con muestras grandes
Recordemos que si la muestra es lo suficientemente grande, esto es n 30, la distribucin muestral de medias por aplicacin del teorema central del lmite se aproxima a una
distribucin normal con media X = y varianza 2X . Entonces la v.a.
Z=
X X
N(0, 1)
X
X X
P(Z1 < Z < Z2 ) = P Z1 <
< Z2 = 1
X
X X
< Z2
X
se tendr
X Zc X < X < X + Zc X
que generalmente se abrevia como
X Zc X
con lo cual el intervalo buscado para la media poblacional es
(X Zc X , X + Zc X )
Finalmente la expresin para el intervalo de confianza en trmino de probabilidad est
dada por la relacin
P(X Zc X < < X + Zc X ) = 1
2
2 N n
, de lo contrario 2X =
,
n
n N 1
donde N es el tamao de la poblacin. Si se desconoce el valor de la varianza poblacional 2 ,
se ha de utilizar la varianza muestral S2 para encontrar el intervalo.
Nota: Recordar que si la poblacin es infinita 2X =
185
Ejemplo 9.4.1 Los resultados siguientes representan las calificaciones de una muestra aleatoria de estudiantes en el primer examen de estadstica elemental. Elaborar un intervalo de
confianza del 95 % para estimar la media poblacional.
23
80
52
41
60
34
60
77
10
71
78
67
79
81
64
83
89
17
32
95
75
54
76
82
57
41
78
64
84
69
74
65
25
72
48
74
52
92
80
88
84
63
70
85
98
62
90
80
82
55
81
74
15
85
36
76
67
43
79
61
Desarrollo
1. El nivel de confianza ya est establecido como 95 %. Entonces 1 = 0, 95
2. Como se trata de estimar la media poblacional y n = 60 > 30, la variable aleatoria
estndar a utilizar es Z de la distribucin normal estndar. Como 1 es la probabilidad de que la media poblacional se encuentre dentro del intervalo buscado (centro de
la curva), es la probabilidad de que no se encuentre en el intervalo (extremos de la
1 60
3929
Xi =
= 65, 483
60 i=1
60
En el caso de la varianza muestral se puede optar por S2 S2 , la eleccin es del investigador, pero generalmente se prefiere usar S2 ya que es un estimador insesgado de la
varianza poblacional 2 . Para fines comparativos calculemos los dos
S2 =
283635 3929 2
60 2
1 60 2
2
X
=
= 439, 183 y S2 =
S = 446, 627
X
i
60 i=1
60
60
60 1
186
5. A continuacin se calcula el error mximo de estimacin denotado por E para las dos
situaciones, entonces
E = Zc X = (1, 96)(2, 705) = 5, 302 y E = Zc X = (1, 96)(2, 728) = 5, 347
6. Finalmente se calculan los lmites del intervalo de confianza de la siguiente manera:
Restando a la media de la muestra el error mximo de estimacin se obtiene el
lmite inferior.
Sumando a la media de la muestra el error mximo de estimacin se obtiene el
lmite superior.
Entonces si ulitizamos S como estimacin de , los lmites inferior y superior sern
respectivamente
X E = 60, 181 y X + E = 70, 785
por lo que el intervalo de confianza buscado ser (60, 181 ; 70, 785), es decir
P(60, 181 < < 70, 785) = 0, 95
Este resultado se interpreta de la siguiente manera: La calificacin media de los estudiantes en el primer examen de estadstica elemental, se encuentre entre 60,181 y
70,785 con un grado de confianza del 95 %.
los lmites inferior y superior sern respectivamente
Si por el contrario utilizamos S,
X E = 60, 136 y X + E = 70, 83
por lo que el intervalo de confianza buscado ser (60, 136 ; 70, 83), es decir
P(60, 136 < < 70, 83) = 0, 95
Este resultado se interpreta de la siguiente manera: Hay una probabilidad de 0,95
de que la calificacin media de los estudiantes en el primer examen de estadstica
elemental, se encuentre entre 60,136 y 70,83.
Si comparamos los intervalos obtenidos vemos que hay muy poca diferencia, pero la
obtenida con S es un poco ms ancha y por lo tanto un poco ms fiable.
Intervalos de confianza para estimar la media de una poblacin con muestras pequeas
Si la muestra es de tamao menor que 30 y la varianza poblacional es desconocida, entonces para calcular el intervalo de confianza que contiene a la media poblacional se utiliza
la distribucin t de Student en vez de la distribucin normal. Luego se siguen los mismos
pasos de los intervalos de confianza para muestras grandes.
Tomando en consideracin que cuando se tienen muestras paqueas (n < 30) y la varianza
poblacional es desconocida, la distribucin muestral de medias puede ser relacionada con una
distribucin t de Studens. Por lo tanto la v.a.
(X X ) n 1
t(n 1)
T=
S
187
(X X ) n 1
P(tc < T < tc ) = P tc <
< tc = 1
S
S
S
X tc
, X + tc
n1
n1
S
n1
S
S
P X tc
< < X + tc
= 1
n1
n1
Ejemplo 9.4.2 Una muestra aleatoria de 12 secretarias que escriben a mquina arroj un
promedio 85,2 palabras por minuto con una desviacin estndar de 9,3 palabras por minuto. Encuentre un intervalo de confianza de 95 % para el nmero promedio de palabras por
minuto escritas por todas las secretarias.
Desarrollo
1. El nivel de confianza establecido es 1 = 0, 95.
2. Como la muestra es pequea (n = 12 < 30) y la varianza poblacional es desconocida
se procede a determina el valor de t, para lo cual antes se debe determinar los grados
de libertad, que estn dadas por n 1 = 12 1 = 11. El valor de t de la tabla de la
188
0, 05
=
= 0, 025
2
2
/2 = 0, 025
2,201
=
= 2, 804
n1
12 1
5. El error mximo de estimacin ser
S
= (2, 201)(2, 804) = 6, 172
E = tc
n1
6. Finalmente los lmites inferior y superior sern respectivamente
X E = 85, 2 6, 172 = 79, 028 y X + E = 85, 2 + 6, 172 = 91, 372
Por lo tanto el intervalo de confianza buscado es (79, 028 ; 91, 372), que en trmino de
probabilidades se expresa como
P(79, 028 < < 91, 372) = 0, 95
Este resultado se interpreta de la siguiente manera: Hay una probabilidad de 0,95 de
que el nmero promedio de palabras por minuto escritas por todas las secretarias, se
encuentre entre 79,028 y 91,372.
9.4.2.
en cuenta que esta v. a. se distribuye como una ji-cuadrada con n 1 grados de libertad,
puede seleccionarse dos valores de esta distribucin (2c y 2l ), tales que la probabilidad de
189
nS2
que 2 est entre estos dos valores sea igual al grado de fiabilidad propuesto, tal como lo
nS2
P 2c < 2 < 2l = 1
nS2
< 2c y despejando en ella a 2 , se tendr
2
2l
2c
1
nS2
nS2
2
<
<
<
<
nS2 2 nS2
2c
2l
Entonces la probabilidad de que la varianza poblacional est entre los valores
estar dada por la relacin
nS2 nS2
y 2
c
2l
nS2
nS2
P 2 < 2 < 2 = 1
c
l
con lo cual el intervalo de confianza de 2 con un nivel de confianza de 1 estar dada por
nS2
2l
nS2
2c
; n1]
y 2c = 2[
2
; n1]
190
se obtiene lo siguiente
[1 2
nS
<<
; n1]
nS
[ 2
; n1]
nS
nS2
nS
nS
2
P 2
< < 2
=P
<<
= 1
[1 2 ; n1]
[ 2 ; n1]
[1 ; n1]
[ ; n1]
2
nS
nS
;
)
[1 2 ; n1] [ 2 ; n1]
Ejemplo 9.4.3 Las resistencias a la rotura, expresada en libras, de 5 ejemplares de cuerdas
estn dadas por los siguientes valores:
460
540
660
580
550
191
; n1]
= 2[0,95 ; 4] y 2c = 2[
2
; n1]
= 2[0,05 ; 4]
p = 0, 05
0,7107
gl = 4
p = 0, 95
9,488
nS2 (5)(4176)
=
= 29367, 09
c
0, 711
Con lo cual el intervalo buscado para la varianza es (2200, 67 ; 29367, 09), que en
trmino de probabilidades se expresa como
P(2200, 67 < 2 < 29367, 09) = 0, 90
Este resultado se interpreta de la siguiente manera: Hay una probabilidad de 0,90
de que el verdadero valor de la varianza de la poblacin de secretarias que escriben
palabras por minuto, se encuentre entre los valores 2200,67 y 29367,09.
Del resultado anterior, el intervalo de confianza del 90 % para la desvicin estndar
poblacional estar dada por
46, 91 < < 171, 37
Este resultado se interpreta de la misma manera que para el caso anterior, esto es,
sustituyendo la palabra varianza por la de desiviacin estndar.
9.4.3.
Sea una poblacin con una distribucin Bernoulli cuyo parmetro P es desconocido y se
desea estimar estableciendo un intervalo de confianza con un cierto grado de fiabilidad. Para
esta finalidad se utilizarar la distribucin muestral de proporciones.
Recordemos que si el tamao de la muestra es lo suficientemente grande (n 30) por
aplicacin del teorema central del lmite la distribucin muestral de proporciones se aproxima
P(1 P)
. Por lo tanto la v.a.
a una distribucin normal con media p = P y varianza 2p =
n
Z=
p p
N(0, 1)
p
192
Si establecemos un nivel de confianza de 1 para la estimacin del intervalo de confianza para P y realizamos los mismos pasos hechos en el caso de medias con muestras grandes,
tendremos que
P( p Zc p < p < p + Zc p ) = 1
r
r
P(1 P)
p(1
p)
, en su lugar se utilizar a
.
Como no se conoce el valor p =
n
n
Entonces tendremos que
r
r
p(1
p)
p(1
p)
P p Zc
< P < p + Zc
= 1
n
n
Por lo que el intervalo buscado estar dada por
!
r
r
p(1
p)
p(1
p)
p Zc
; p + Zc
n
n
Ejemplo 9.4.4 Se pregunta a 2000 votantes cul ser la actitud respecto a una determinada
propuesta poltica; 800 se oponen. Suponiendo que la muestra fuese aleatoria y procedente de
una poblacin Bernoulli. Construya un intervalo de confianza para la proporcin de votantes
a favor de la propuesta poltica para un 95 % de confianza.
Desarrollo
1. El nivel de confianza fijado es 1 = 0, 95.
2. Como se trata de estimar una proporcin y adems n = 60 > 30, la variable aleatoria
estndar a utilizar es Z de la distribucin normal estndar. Como 1 = 0, 95, ya
vimos anteriormente que Zc = 1, 96.
1200
= 0, 6
2000
0, 6(1 0, 4)
= 0, 01095
2000
193
9.4.4.
Si tenemos dos poblaciones, de las cuales extraemos muestras de ciertos tamaos, hay
que tener en cuenta que se puede construir una distribucin muestral para la diferencia de las
medias muestrales. Si las medias poblaciones son desconocidas; en esta seccin se estimar
un intervalo de confianza para la diferencia de estas medias utilizando la distribucin muestral
de diferencias de medias.
Intervalos de confianza para Diferencias de Medias utilizando la distribucin normal
Si de la poblacin uno con media 1 desconocida y varianza 21 extraemos muestras de
tamao n1 , y de la poblacin dos con media 2 desconocida y varianza 22 extraemos muestras
de tamao n2 ; y tenemos que n1 + n2 2 30 por aplicacin del teorema central del lmite
la variable aleatoria
(X Y ) XY
N(0, 1)
Z=
XY
s
21 22
donde XY = 1 2 y XY =
+ .
n1 n2
Por lo tanto si la estimacin del intervalo de confianza ser hecho con un nivel de confianza de 1 y se sigue un razonamiento anlogo al hecho en el caso de una poblacin con
media desconocida; se tendr la siguiente relacin
(X Y ) XY
P Zc <
< Zc = 1
XY
que se transforma en
P[(X Y ) Zc XY < XY < (X Y ) + Zc XY ] = 1
Por lo que el intervalo de confianza para diferencias de medias est dada por
s
s
!
2
2
1 2
21 22
X Y Zc
+
; X Y + Zc
+
n1 n2
n1 n2
194
Observacin: Si n1 + n2 2 30 y se desconocen
las varianzass
poblaciones se utilizan
s
las varianzas muestrales; dicho de otro modo
S12 S22
+
en lugar de
n1 n2
21 22
+ .
n1 n2
Ejemplo 9.4.5 En un laboratorio, se experimenta con dos drogas que reducen el tiempo de
respuesta a cierto estmulo. Se administra a 35 ratas la droga 1 y a 30 la droga 2. La reduccin
del tiempo de reaccin al estmulo de cada rata fue registrada como sigue:
Reduccin del tiempo con la droga 1
28
31
33
23
20
30
22
34
32
35
30
33
36
34
43
26
28
27
23
29
28
33
33
29
38
27
26
21
24
24
27
15
28
19
27
Encuentre un intervalo de confianza del 90 % para estimar la diferencia entre los tiempos
de respuesta promedio al estmulo de los grupos e interprete el resultado.
Desarrollo
El nivel de confianza ya establecido es 1 = 0, 90.
Como n1 + n2 2 = 35 + 30 2 = 63 > 30, la variable aleatoria a utilizar es Z de la
normal tipificada. Como 1 = 0, 90, buscando en la tabla de Z, encontraremos que
Zc = 1, 645.
Los estadsticos muestrales a utilizar son
X = 28, 457
n1 = 35
Y = 21, 867
n2 = 30
195
!
(X Y ) XY
r
P tc <
< tc = 1
1
1
Sp
+
n1 n2
que con aplicaciones algebraicas se transforma en la relacin
!
r
r
1
1
1
1
P X Y tc S p
+ < 1 2 < X Y + tc S p
+
= 1
n1 n2
n1 n2
con lo cual; el intervalo de confianza buscado en estas condiciones est dada por la expresin
!
r
r
1
1
1
1
X Y tc S p
+
; X Y + tc S p
+
n1 n2
n1 n2
donde tc es el valor de t con n1 + n2 2 grados de libertad.
Ejemplo 9.4.6 Durante varios aos se han cultivado, en diversos lugares de un rea, dos
variedades de cebada y est en discusin su adaptacin. Cul se seleccionar para el rea,
basandose en las siguientes cosechas por hectrea?
Trebi
120,6
Svanota 115,4
56,5
90,2
133,2
130,3
187,1
147,9
186,9
120,3
129,4
77,6
155,2
104,5
Localice los lmites de confianza de la diferencia entre las medias con un grado de confianza
del 99 % e interprete el resultado.
Desarrollo
El nivel de confianza establecido es 1 = 0, 99
Como n1 + n2 2 = 7 + 7 2 = 12 < 30 y las varianzas poblacionales son desconocidas, la variable aleatoria estndar a usar es la t de la distribucin t de Student, que
en este caso tendr 12 grados de libertad. El valor de t de la tabla para este caso
corresponde al valor
0, 01
= 0, 005
t = =
2
2
Por lo que se busca en la tabla t lo siguiente
n1 + n2 2 = 12
con lo cual el valor buscado es tc = 3, 055.
/2 = 0, 005
3,055
196
n1 = 7
Y = 112, 3143
n2 = 7
con lo cual la diferencia entre las medias y la varianza combinada de las muestras son
respectivamente
X Y = 138, 4143 112, 3143 = 26, 1
S2p
n1 SX2 + n2 SY2
7(1734, 09551) + 7(488, 329796)
=
=
= 1296, 4148
n1 + n2 2
7 + 7 12
9.4.5.
Sean dos muestras aleatorias independientes de tamaos m y n, con varianzas S12 y S22 , que
se extraen de dos poblaciones distribuidas normalmente con varianzas desconocidas 21 y 22
respectivamente. Con base a estas informacionesse puede
! estimar un intervalo de confianza
2
1
para la relacin de estas varianzas desconocidas
. Como primer paso para conseguirlo
22
se toma en cuenta las siguientes variables aleatorias con sus distribuciones asociadas
mS12
nS22
2
(m
1)
y
2 (n 1)
2
2
1
2
Suponiendo independencia entre estas variables aleatorias; entonces por lo ya visto anteriormente el cociente entre dos variables con distribuciones ji-cuadradas divididas por sus
197
F(m 1; n 1)
P F1 <
mS12
(m1)21
nS22
(n1)22
!
< F2
m(n 1)S12 22
< F2 = 1
= P F1 <
n(m 1)S22 21
<
<
= 1
F2 n(m 1)S22 22 F1 n(m 1)S22
1
F[1 2
; m1 ; n1]
S12 21
<
<
S22 22 F[ 2
; m1 ; n1]
; m1 ; n1] ;
S12
= 1
S2
2
1
F[1 2
; m1 ; n1]
S12
;
S22 F[ 2
; m1 ; n1]
S12
S22
; m1 ; n1]
1
F[ 2
; n1 ; m1]
F[ 2
; m1 ; n1]
1
F[1 2
; n1 ; m1]
adems
198
Ejemplo 9.4.7 La poblacin A tiene una varianza de 3,4 segn se determin con una muestra de 21 elementos, mientras que la poblacin B tena una varianza de 5,2 segn se determin
por una muestra de 16 elementos. Determinar los lmites de confianza del
a) 90 %
b) 95 %
de la razn de las varianzas de las dos poblaciones.
Desarrollo
El nivel de confianza ya establecido es
a) 1 = 0, 90
b) 1 = 0, 95
Como se busca un intervalo de confianza para relaciones de varianzas, la variable
aleatoria estandar a usar es la F de la distribucin F de Snedecor, que en este caso
tendr m 1 = 21 1 = 20 y n 1 = 16 1 = 15 grados de libertad. El valor t de la
tabla corresponde al valor
0, 10
=
= 0, 05
2
2
0, 05
b) t = =
= 0, 025
2
2
a) t =
P(X x) = 0, 95
m = 20
n = 15
2,33
P(X x) = 0, 95
m = 15
n = 20
2,20
F[0,95 ; 20 ; 15] = 2, 33
y F[0,05 ; 20 ; 15] =
Con lo cual
b)
P(X x) = 0, 975
m = 20
n = 15
2,76
1
F[0,95 ; 15 ; 20]
1
= 0, 455
2, 20
P(X x) = 0, 975
m = 15
n = 20
2,57
Con lo cual
F[0,975 ; 20 ; 15] = 2, 76 y F[0,025 ; 20 ; 15] =
1
F[0,975 ; 15 ; 20]
m 2 21
S = (3, 4) = 3, 57
m 1 1 20
S22 =
n 2 16
S = (5, 2) = 5, 547
n 1 1 15
1
= 0, 39
2, 57
199
1
F[0,95 ; 20 ; 15]
1
F[0,05 ; 20 ; 15]
S12
1
3, 57
=
= 0, 2762
2
S2 2, 33 5, 547
S12
1
3, 57
=
= 1, 4145
2
S2 0, 455 5, 547
Por lo tanto el intervalo de confianza buscado es (0, 2762 ; 1, 4145); que en trmino probabilstico se expresa como
21
P 0, 2762 < 2 < 1, 4145 = 0, 90
2
b)
1
F[0,975 ; 20 ; 15]
1
F[0,05 ; 20 ; 15]
S12
1
3, 57
=
= 0, 2332
S22 2, 76 5, 547
S12
1
3, 57
=
= 1, 6502
S22 0, 39 5, 547
Por lo tanto el intervalo de confianza buscado es (0, 2332 ; 1, 6502); que en trmino probabilstico se expresa como
2
P 0, 2332 < 12 < 1, 6502 = 0, 95
2
9.4.6.
donde p1 p2 = P1 P2
( p1 p2 ) p1 p2
N(0, 1)
p1 p2
y p1 p2 = p1 + p2 .
Por lo tanto si establece un nivel de confianza de 1 y se toman consideraciones anlogas al caso de diferencias de medias para el caso normal se tendr que
( p1 p2 ) p1 p2
P Zc <
< Zc = 1
p1 p2
que con procedimientos algebricos se tranforma en
P ( p1 p2 ) Zc p1 p2 < p1 p2 < ( p1 p2 ) + Zc p1 p2 = 1
200
( p1 p2 ) Zc p1 p2 ; ( p1 p2 ) + Zc p1 p2
Recordemos que p1 p2 depende de los parmetros P1 y P2 , que en este caso son desconocidos, razn por la cual para su clculo se reemplaza a P1 por p1 y a P2 por p2 .
Ejemplo 9.4.8 De una cierta ciudad se extrae una muestra aleatoria de 100 personas y
se encuentra que 50 usan una cierta marca de jabn. De la misma ciudad se extrae otra
muestra de 100 personas y se encuentra que 20 usan una marca de jabn distinta a la primera.
Construya un intervalo de confianza del 95 % para la diferencia de proporciones de personas
que usan las respectivas marcas de jabn e interprete el resultado.
Desarrollo
1. El nivel de confianza fijado es 1 = 0, 95.
2. Como se trata de estimar diferencias de proporciones y adems las muestras son grandes,
la variable aleatoria estndar a utilizar es Z de la distribucin normal estndar. Como
1 = 0, 95, ya se vi que Zc = 1, 96.
50
= 0, 5 y
100
p2 =
20
= 0, 2
100
9.5. PROBLEMAS
201
9.5.
Problemas
Estimadores y sus propiedades
1 n
(Xi )2
n i=1
5. Sea X1 , X2 , . . . , Xn una m.a. de una poblacin con media desconocida y varianza finita
2 desconocida. Demuestra que la siguiente estadstica es un estimador insesgado para
2 ,
n1
1
2 =
(Xi+1 Xi)2
2(n 1) i=1
6. Sea X1 , X2 , X3 , X4 una muestra aleatoria de una poblacin distribuida segn la ley una
ley de Poissn con parmetro . Considere los siguientes estadsticos para .
1 =
X1 + X2 + X3 + X4
4
9.5. PROBLEMAS
202
Estimacin Puntual
Mtodo de mxima verosimilitud
7. Supngase que X1 , X2 , . . . , Xn constituye una muestra aleatoria de tamao n de una
distribucin Bernoulli con parmetro P desconocido, pero se sabe que P pertenece al
intervalo abierto (0, 1).
a) Determinar el estimador de mxima verosimilitud de P, suponiendo que no todos
los valores observados son 0 o todos los valores observados son 1.
b) Probar que el estimador de mxima verosimilitud de P no existe si todo valor
observado es 0 o si todo valor observado es 1.
8. No se sabe que proporcin P de la compra de cierta marca de cereal es realizada por
mujeres y que proporcin es realizada por hombres. En una muestra de 70 compras
de este cereal, se encontr que 58 fueron realizadas por mujeres y 12 por hombres.
Determine el estimador de mxima verosimilitud para P.
9. Supngase que X1 , X2 , . . . , Xn constituye una muestra aleatoria de tamao n de una
distribucin normal con media desconocida y varianza 2 tambin desconocida. Determnense los estimadores de mxima verosimilitud para y 2 .
10. Supngase que X1 , X2 , . . . , Xn constituye una m.a. de una distribucin cuya funcin de
densidad de probabilidad f (x|) es la siguiente
1
si 0 < x < 1
x
f (x|) =
0
en otro caso
Adems, supngase que el valor de es desconocido ( > 0). Determnese el estimador
de mxima verosimilitud para .
11. Supngase que X1 , X2 , . . . , Xn constituye una m.a. de una distribucin cuya funcin de
densidad de probabilidad f (x|) es la siguiente
1
f (x|) = e|x|
2
9.5. PROBLEMAS
203
0
en otro caso
Supngase que se prueban n artculos y que se anotan los tiempos de fallas t1 ,t2 , . . . ,tn .
suponiendo que t0 es conocido, obtener el estimador de maxima verosimilitud para .
15. Supngase que X1 , X2 , . . . , Xn constituye una m.a. de una distribucin de Poisson con
media desconocida ( > 0).
a) Determnese el estimador de mxima verosimilitud de , suponiendo que al menos
uno de los valores observados es distinto de cero.
b) Demestrese que el estimador de mxima verosimilitud de no existe si todo
valor observado es cero.
Mtodo de momentos
16. Dada una muestra aleatoria de tamao n de una poblacin uniforme en el intervalo
[0, a], use el mtodo de momentos para encontrar un estimador para el parmetro a.
17. Dada una muestra aleatoria de tamao n de una poblacin Poisson con parmetro desconocido > 0, use el mtodo de momentos para encontrar un estimador del parmetro
.
18. Dada una muestra aleatoria de tamao n de una poblacin exponencial con parmetro
desconocido > 0, use el mtodo de momentos para encontrar un estimador del parmetro
.
19. Dada una muestra aleatoria de tamao n de una poblacin con funcin de densidad de
probabilidad
si 0 < x <
f (x) =
0 otro caso
Estimar por el mtodo de los momentos.
20. Dada una muestra aleatoria de tamao n de una poblacin con funcin de densidad de
probabilidad
(1 )x si 0 < x < 1
f (x) =
0
otro caso
Estimar por el mtodo de los momentos.
9.5. PROBLEMAS
204
21. Dada una muestra aleatoria de tamao n de una poblacin con funcin de densidad de
probabilidad
2 ( x) si 0 < x <
f (x) =
0
otro caso
Estimar por el mtodo de los momentos.
20700
22974
25048
26798
27147
29174
23815
16818
24352
20340
19405
29588
25620
19455
25566
32501
18091
22581
30104
29236
9.5. PROBLEMAS
205
27. Un profesor de ingles cont el nmero de palabras mal escritas en su ensayo que asign
hace poco a sus alumnos. Para una clase de 40 alumnos, el nmero medio de palabras
mal escritas fue de 6, 05 y la desviacin estndar fue de 2, 44. Construya un intervalo
de confianza de 95 % para el nmero medio de palabras mal escritas en la poblacin de
estudiantes e interprete el resultado.
28. Una empresa elctrica fabrica focos que tienen una duracin aproximadamente distribuida de forma normal con una desviacin estndar de 40 horas. Si una muestra de
30 focos tienen una duracin promedio de 780 horas. Encuentre un intervalo de confianza de 95 % para la media de la poblacin de todos los focos que producen esta
empresa e interprete el resultado.
29. A muchos pacientes con problemas cardiacos se les implant un marca pasos para controlar su ritmo cardiaco. Se monta un modulo conector de plstico sobre la parte superior del marca pasos. Suponga una desviacin estndar de 0,0015 y una distribucin
aproximadamente normal. Encuentre un intervalo de confianza de 95 % para la media
de todos los mdulos conectores que fabrica cierta compaa e interprete el resultado.
Una muestra aleatoria de 75 mdulos tiene un promedio de 0,310 pulgadas.
30. En un proceso qumico se fabrica cierto polmero. Normalmente se hacen mediciones
de la viscosidad despus de cada corrida, y la experiencia acumulada indica que la variabilidad en el paso es muy estable, con = 20. La siguiente son 15 mediciones de la
viscosidad por corrida: 724, 718, 776, 760, 745, 759, 795, 756, 742, 740, 761, 749, 739, 747
y 742. Encuentre un intervalo de confianza de 90 % para la viscosidad media de polmeros
e interprete el resultado.
31. Para una muestra de 50 empresas tomadas de una industria determinada, se encuentra
que el nmero promedio de empleados por empresas es de 420,5 con una desviacin
muestral de 55,7. Existe un total de 380 empresas en esa rama industrial. Encuentre
un intervalo de confianza de 95 % para media de la poblacin de los empleados por
empresa e interprete el resultado.
32. Una fabrica produce anillos para los pistones de un motor de automvil. Se sabe que
el dimetro del anillo esta distribuida aproximadamente en forma normal y que tiene
una desviacin estndar de 0, 001 mm. Una muestra aleatoria de 15 anillos tiene un
dimetro promedio de 74, 036 mm.
a) Construye un intervalo de confianza de 99 % para el dimetro promedio del anillo
e interprete el resultado.
b) Construya un limite inferior de confianza de 95 % para el dimetro promedio del
anillo e inteprete el resultado.
33. Se toma una muestra al azar de 45 alumnos, tomados sin reposicin de una clase de
estadstica de 221 alumnos que muestra una media de 70 puntos y una desviacin estndar de 9 puntos en las calificaciones finales. Compruebe que el intervalo de confianza
del 98 % para la media de las 221 calificaciones varia de 72, 8 a 97, 2 puntos.
34. La media y la desviacin tpica de las cargas mximas soportadas por 60 cables estn
dadas respectivamente por 11, 9 ton. y 0, 73 ton. Hallar los limites de confianza de:
9.5. PROBLEMAS
206
a) 95 %
b) 99 % para la media de las cargas mximas de todos los cables producidos por la
compaa e interprete los resultados.
35. La municipalidad necesita adquirir lamparitas elctricas en una fbrica. Se toma una
muestra de 100 lmparas con las cuales se hace que se mida el tiempo en que tardan
en quemarse. Los resultados son: media 2080 horas de vida y desviacin tpica de 300
horas. Hallar un intervalo de confianza para con un nivel de significacin de 1 % e
interprete el resultado.
36. Se desea estimar el precio promedio de cierto artculo de consumo. Para tal fin se
realiza una muestra en 101 comercios seleccionados al azar, que indica un precio medio
de 120 dlares, con una desviacin muestral de 16 dlares. Construir un intervalo de
confianza que con 95 % de seguridad contenga el parmetro poblacional e interprete el
resultado.
37. La estatura de 1000 estudiantes estn distribuidas aproximadamente de forma normal,
con una media de 174, 5 cm y una desviacin estndar de 6, 9 cm. Si se extraen 200
muestras aleatorias de tamao 25 de esta poblacin y las medidas se registran al dcimo
de centmetros ms cercanos. Determine:
a) La media y la desviacin estndar de la distribucin muestral de medias
b) Construya un intervalo de confianza de 90 % para la media de estaturas de esta
poblacin e interprete el resultado.
Para medias cuando 2 es desconocida y la muestra es pequea
38. las cantidades de pesetas, destinadas por un total de 15 familias a diversiones tales
como cine, teatro y otros espectculos pblicos durante un periodo de tiempo determinado fueron los siguientes:
134
143
146
136
144
146
137
144
147
138
145
148
138
146
153
2300
2231
2217
2223
2190
2211
2295
2219
2285 2195
2231 2218
2255 2232
2262 2257
2252
2261
9.5. PROBLEMAS
207
41. Un profesor de ingls cont el nmero de palabras mal escritas en un ensayo que asign
hace poco a sus alumnos. Para una clase de 24 alumnos, el nmero medio de palabras
mal escritas fue de 6,05 y la desviacin estndar fue de 2,44. Construya un intervalo
de confianza de 95 % para el nmero medio de palabras mal escritas en la poblacin de
estudiantes e interprete el resultado.
Captulo 10
Prueba de Hiptesis
10.1.
Introduccin
10.2.
Definiciones y ejemplos
En esta seccin se definir y luego se describirn los pasos a seguir para la realizacin de
un contraste de hiptesis. Comenzaremos el estudio de esta parte de la inferencia estadstica
dando la definicin de hiptesis.
10.2.1.
Qu es una hiptesis?
Definicin 10.2.1 Hiptesis estadstica o simplemente hiptesis es una afirmacin o suposicin respecto al valor de un parmetro poblacional. Una vez hecha la afirmacin, se utilizan
los datos para verificar que tan razonable es dicha afirmacin.
Son ejemplos de hiptesis, o afirmaciones hechas sobre un parmetro poblacional las
siguientes:
El ingreso mensual promedio de todos los ciudadanos paraguayos es de 1.500.000
guaranies.
El 20 % de los delincuentes capturados son sentenciados a prisin.
El 90 % de las formas fiscales son llenadas correctamente.
Todas estas hiptesis tienen algo en comn, las poblaciones de inters son tan grandes
que no es factible estudiar todos sus elementos. Como ya sabemos, una alternativa a estudiar
208
209
la poblacin entera es tomar una muestra de la poblacin de inters. De esta manera podemos
probar una afirmacin para determinar si la evidencia soporta o no la afirmacin.
10.2.2.
10.2.3.
Rechazar H0
Aceptar H0
210
H0 cierta
H0 falsa
Error tipo I
Decisin correcta
con probabilidad
con probabilidad 1
Decisin correcta
Error tipo II
con probabilidad 1
con probabilidad
La informacin para obtener una regla de decisin que nos lleve a rechazar o no rechazar
un hiptesis estadstica provendr de una muestra aleatoria X1 , . . . , Xn de la distribucin de
que se trate. Observe adems que al aceptar una hiptesis no se afirma que sta sea absolutamente cierta, sino simplemente que es consistente con los datos de la muestra aleatoria. Si la
muestra cambia, posiblemente la decisin de rechazar o no rechazar tambin.
10.2.4.
Regin Crtica
10.2.5.
Funcin de Potencia
211
10.2.6.
212
que constituye la probabilidad de evitar un error de tipo I. Por lo tanto, constituye la probabilidad de tomar la decisin correcta de aceptar H0 cunado esta es cierta.
Cuando H0 es falsa, la funcin caracteristica de operacin est dada por la relacin
P(X A|) = P(Aceptar H0 |H0 es f alsa) = P( A| = i i 1 ) =
que constituye la probabilidad de cometer un error de tipo II.
10.2.7.
10.2.8.
Hay un procedimiento de cuatro pasos que sistematizan la prueba de hiptesis. Estas son:
1. Establecer las hiptesis nula y alterna
El primer paso para un contraste de hiptesis es establecer las hiptesis nula y alternativa; esto es
H0 : = 0 contra una de las tres alternativas siguientes
H1 : < 0 (1)
H1 : > 0 (2)
H1 : 6= 0 (3)
Si estamos ante el caso (1) o (2) decimos que el contraste es unilateral o de una cola;
por el contrario si estamos ante el caso (3) el contraste es bilateral o de dos colas.
213
10.3.
10.3.1.
(X ) n
N(0, 1)
Z=
H1 : < 0 (1)
H1 : > 0 (2)
H1 : 6= 0 (3)
214
El problema es encontrar una regla para decidir cundo rechazar H0 en favor de H1 con
base en los datos de la muestra X1 , X2 , . . . , Xn . Cuando H0 es cierta, esto es, cuando es
2
efectivamente 0 , se tendr que X N(0 , n ) y por lo tanto
(X 0 ) n
Z=
N(0, 1)
215
Captulo 11
Anlisis de la Varianza (ANOVA)
Adems de probar hiptesis relativas a dos varianzas, un segundo uso de la distribucin F involucra la tcnica de Anlisis de la Varianza, abreviado ANOVA (Analysis of variance). Bsicamente, el anlisis de la varianza utiliza informaciones provenientes de muestras para determinar si tres o ms tratamientos producen diferentes resultados. El uso de la
palabra tratamiento tiene su origen en la investigacin agrcola. Las tierras se trataron con
diferentes fertilizantes, para determinar si habra una diferencia significativa en las producciones. Nosotros podramos probar la hiptesis de que cinco diferentes aditivos de gasolina
(tratamientos) resultan en un diferente kilometraje por litro. Tambin podramos contestar
la pregunta, son cuatro mtodos de capacitacin y entrenamiento (tratamientos) igualmente
efectivos?.
11.1.
Suposiciones de ANOVA
11.2.
217
que un grupo de ratas consume est en relacin con el tiempo transcurrido desde su ltima
comida. Para comprobar esta hiptesis, se selecciona al azar tres grupos de ratas con seis
ratas en cada grupo. Despus de someter a cada grupo a un entrenamiento preliminar, prueba
al grupo A, tres horas despus de comer; el grupo B, doce horas despus de comer y al grupo
C, veinticuatro horas despus de comer. La cantidad de tabletas consumidas por cada animal
en un periodo de diez minutos fueron las siguientes:
Grupo A
0
7
2
1
1
7
Grupo B
5
2
3
9
6
5
Grupo C
5
11
9
9
4
10
x = 18
x = 30
x = 48
Captulo 12
Anlisis de regresin y de correlacin
12.1.
Introduccin
12.2.
Modelo Estadstico
Toda investigacin estadstica tiene por objeto encontrar una ecuacin matemtico que
ayude a explicar el comportamiento de un fenmeno fsico de inters en un estudio determinado. Dicha ecuacin matemtica recibe el nombre de medelo estadstico o simplemente
modelo.
Definicin 12.2.1 Modelo: Por un modelo entendemos una ecuacin matemtica que contiene variables aleatorias, variables matemticas (no aleatorias) y parmetros poblacionales.
Ejemplo 12.2.1 La siguiente ecuacin constituye un ejemplo de modelo estadstico
Yi = 1 X1i + 22 X2i + 3 X3i + i para i = 1, 2, . . . , n
218
219
donde
1 , 22 y 3 son parmetros poblacionales desconocidos
X1i , X2i y X3i son variables matemticas
i son variables aleatorias
Dependiendo de la forma de la ecuacin matemtica podemos tener diferentes tipos de
modelos estadsticos. Uno de los ms utilizados es el modelo lineal.
Definicin 12.2.2 Modelo Lineal: Es una ecuacin que contiene variables aleatorias, variables matemticas (no aleatorias) y parmetros poblacionales y que el modelo es lineal en
los parmetros y en las variables aleatorias.
Ejemplo 12.2.2 La siguiente ecuacin constituye un ejemplo de modelo lineal
Yi = 1 X1i + 2 X2i + 3 X3i + i para i = 1, 2, . . . , n
donde
1 , 2 y 3 son parmetros poblacionales desconocidos
X1 , X2 y X3 son variables matemticas
i son variables aleatorias
Definicin 12.2.3 Modelo determinstico matemtico: Es un modelo matemtico en el
cual puede haber equivocacin pero no variabilidad
Ejemplo 12.2.3 La siguiente ecuacin matemtica constituye un modelo deterministico
Y = + X
Definicin 12.2.4 Modelo Probabilstico: Es un modelo determinstico ms una componente aleatoria debido a la variabilidad de las variables que no fueron incluidos en el modelo
y ser menor cada vez que se considere ms variables de inters en el estudio y mientras ms
se mantenga los requisitos de similitud de las variables.
Ejemplo 12.2.4 La siguiente ecuacin matemtica constituye un modelo probabilstico
Y = + X +
Definicin 12.2.5 Modelo de Regresin: Son aquellas en que las variables aleatorias independientes o predictoras son variables continuas; tales como la edad, peso, ingreso, demanda,
produccin, etc; que toman infinitos valores y sirven para cuantificar en lugar de indicar la
presencia de un efecto cualitativo.
Ejemplo 12.2.5 La siguiente ecuacin matemtica constituye un modelo de regresin
Yi = 0 + 1 X1i + 2 X2i + 3 X3i + i para i = 1, 2, . . . , n
12.3.
220
El anlisis de regresin es una rama de la teoria estadstica cuyom uso est muy difundido
en casi todas las disciplinas cientificas. Es una tcnica bsica para medir o estimar relaciones
entre las variables de inters consideradas en un estudio de investigacin.
El anlisis de regresin simple estudia la relacin entre dos grupos de datos desarrollando
una ecuacin matemtica que describa dicha relacin. La ecuacin nos permitir predecir el
valor de la variable dependiente Y basndonos en el valor de la variable independiente X. La
tcnica usada para desarrollar la ecuacin para la lnea de tendencia y hacer esta prediccin
es llamada anlisis de regresin simple.
Antes de estudiar el modelo de regresin simple veamos dos aspectos que sern de suma
importancia para el anlisis de dicho modelo. Estos dos aspectos consiten en el problema de
bondad de ajuste y el mtodo de mnimos cuadrados.
12.3.1.
Ajuste de curva
Siempre que es posible intentamos expresar o aproximar las relaciones entre cantidades
conocidas y cantidades que se deben pronosticar en trminos de ecuaciones matemticas.
esto ha tenido mucho xito en las ciencias naturales, donde se sabe, por ejemplo, que a una
temperatura constante la relacin entre el volumen y, y la presin x, de un gas se obtiene por
medio de la frmula:
k
y=
x
donde k es una constante numrica.
Siempre que usemos datos observados para llegar a una ecuacin matemtica que describe la relacin entre dos variables, un procedimiento conocido como el ajuste de curva,
debe enfrentar tres clases de problemas:
1. Debemos decidir qu clase de curva y por tanto qu clase de ecuacin de pronstico
queremos usar.
2. Debemos encontrar la ecuacin particular que es mejor en cierto sentido.
3. Debemos investigar ciertos aspectos referentes a los mtodos de la ecuacin particular
y de los pronsticos hechos a partir de sta.
En la seccin 12.3.2 estudiaremos detalladamente el segundo de estos problemas y en la
seccin 12.3.3 estudiaremos el tercero.
El primer problema por lo regular se decide mediante la revisin directa de los datos.
Ilustramos los datos en papel para grficas ordinarias (aritmticas), a veces en papel para
grficas especiales con escalas especiales y decidir mediante la revisin visual la clase de
curva (una linea recta, una parbola, etc.) que describe mejor el patrn general de los datos.
Existen mtodos por medio de los cuales se puede hacer esto de modo ms objetivo, pero son
bastante avanzados y no los analizaremos en este material.
En esta parte nos centraremos, en esencia, en ecuaciones lineales de dos incgnitas que
describan una posible relacin entre dos variables. Estas son de la forma
Y = a + bX
221
12.3.2.
Una vez que hemos decidido ajustar una lnea recta a un conjunto de datos determinado
{x1 , x2 , . . . , xn , y1 , y2 , . . . , yn }, enfrentemos la segunda clase de problema, especficamente, el
problema de encontrar la ecuacin de la lnea recta particular que en cierto sentido proporcione el mejor ajuste posible y posteriormente ofrezca los mejores pronsticos posibles de la
variable dependiente Y a partir de la variable independiente X. Lgicamente, no existe lmites
para el nmero de lneas rectas que se pueden trazar en un papel para grficas. Algunas de
estas lneas se ajustaran a los datos en forma tan deficiente que no las consideraramos con
seriedad, pero muchas otras pareceran proporcionar ms o menos buenos ajustes y el problema consiste en localizar la lnea que se ajuste mejor a los datos en sentido bien definido.
Si todos los puntos caen en una lnea recta no hay ningn problema, pero este es un caso
extremo que rara vez encontramos en la prctica. En general, debemos conformarnos con
una lnea recta que tiene ciertas propiedades deseables, faltas de perfeccin.
El criterio que en la actualidad se usa casi exclusivamente para definir un mejor ajuste
se remonta al inicio del siglo XIX y al trabajo del matemtico francs Andrien Legendre;
ste mtodo se conoce con el nombre de mtodo de los mnimos cuadrados. Este mtodo
implica que la linea que ajustamos para nuestros datos sea tal que la suma de los cuadrados
de las distancias verticales de los puntos a la lnea recta sea mnima.
Para demostrar como se ajusta en realidad una lnea de mnimos cuadrados a un conjunto
de datos {x1 , x2 , . . . , xn , y1 , y2 , . . . , yn }, que podra verse con un conjunto de n pares ordenados
{(x1 , x1 ), (x2 , x2 ), . . . , (xn , xn )}. Si expresamos la ecuacin de la lnea como y = a + bx, donde
el smbolo, y (y acento circunflejo), se usa para distinguir entre un valor observado de y
y el valor correspondiente y en la lnea, el criterio de los mnimos cuadrados implica que
reduzcamos al mnimo la suma de los cuadrados de las distancias entre las y s y las y s. Esto
implica que sedeben encontrar los valores numricos de las constantes a y b que aparecen en
la ecuacin y = a + bx para la cual
n
i=1
i=1
Para encontrar los resultados deseados de a y b, debemos minizar (yi yi )2 con respeci=1
to de a y b; para ello aplicaremos los conocimientos de los criterios sobre puntos mximos
y mnimos desarrollados en el clculo diferencial y procedimientos algebraicos. Por lo tanto
222
para minimizar
i=1
ellos e igualemos dichas derivadas parciales a cero y obtendremos un sistema de dos ecuaciones con dos incgnitas denominados ecuaciones normales. Esto es
i
n
n
n
h n
2
(y
)
=
2
(y
bx
)
=
2
y
na
b
x
i
i
i
i
i
i
=0
a i=1
i=1
i=1
i=1
i
n
n
n
n
h n
2
2
(y
)
=
2
(y
bx
)x
=
2
x
y
a
x
b
x
i i
i i
i
i i i i =0
b i=1
i=1
i=1
i=1
i=1
con lo cual
i=1
i=1
yi = na + b xi
i=1
i=1
i=1
xiyi = a xi + b xi2
(12.3.1)
(12.3.2)
Ajusta una lnea recta de mnimos cuadrados que relacione los nmeros de aos que los
solicitantes de trabajos en el servicio exterior estudiaron alemn en preparatoria o universidad con las calificaciones que obtuvieron en la prueba de dominio de ese idioma.
Desarrollo
Ilustrando los puntos correspondientes a estos diez pares de valores en un diagrama, observaremos que aunque no todos los puntos caen en una misma lnea recta, el patrn general
de la relacin se describira razonablemente bien por medio de una lnea recta adecuada aciertos criterios bien definidos.
El grfico 12.1 muestra el partrn de comportacin de la relacin entre los nmeros de
aos que los solicitantes de trabajos en el servicio exterior estudiaron alemn en preparatoria
o universidad con las calificaciones que obtuvieron en la prueba de dominio de ese idioma,
adems muestra la linea que mejor se ajusta a los diez pares de datos.
223
Figura 12.1: Grfico de la relacin entre el nmero de aos que se estudi alemn y la calificacin obtenida en la prueba.
Las sumas requeridas para la sustitucin en las ecuaciones normales se obtienen realizando los clculos que aparecen en la tabla siguiente:
x
3
4
4
2
5
3
4
5
3
2
y
57
78
72
58
89
63
73
84
75
48
x2
9
16
16
4
25
9
16
25
9
4
xy
171
312
288
116
445
189
292
420
225
96
12.3.3.
224
12.4.
Anlisis de correlacin
12.4.1.
225
La idea bsica del anlisis de correlacin simple es dar la magnitud de la relacin entre
dos variables. Por lo tanto la correlacin simple mide la fuerza y la direccin de una relacin
lineal entre solo dos variables aleatorias.
El primer paso de la correlacin simple es normalmente graficar los datos es un diagrama
que recibe el nombre de diagrama de dispersin.
Definicin 12.4.2 Diagrama de dispersin: es un diagrama que refleja la relacin entre
dos variables aleatorias.
En el diagrama de dispersin debemos establecer cual es la variable dependiente y la
variable independiente.