Professional Documents
Culture Documents
Csar Amarilla
1 de agosto de 2011
ndice general
2. Distribuciones de Frecuencia 16
2.1. Estadstica descriptiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2. Construccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2.1. Representacin Grfica . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1
NDICE GENERAL 2
4. Medidas de Variabilidad 35
4.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.2. Variabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.2.1. Rango y rango intercuartlico . . . . . . . . . . . . . . . . . . . . . . 35
4.2.2. Desviacin media . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4.2.3. Desviacin media para datos agrupados . . . . . . . . . . . . . . . . 36
4.2.4. Varianza y desviacin estndar . . . . . . . . . . . . . . . . . . . . . 37
4.3. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
5. Probabilidad 41
5.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
5.2. Definiciones y ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
5.3. Operaciones entre eventos . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
5.4. Definciones de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . 44
5.4.1. Concepto Clsico de Probabilidad . . . . . . . . . . . . . . . . . . . 45
5.4.2. Concepto frecuentista de probabilidad . . . . . . . . . . . . . . . . . 45
5.4.3. Probabilidad subjetiva . . . . . . . . . . . . . . . . . . . . . . . . . 46
5.4.4. Concepto axiomtico de probabilidad . . . . . . . . . . . . . . . . . 46
5.5. Teoremas de Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
5.5.1. Teorema 1: Regla de la Adicin . . . . . . . . . . . . . . . . . . . . 47
5.5.2. Teorema 2: Regla de la complementacin . . . . . . . . . . . . . . . 48
5.5.3. Teorema 3: Regla de Diferenciacin . . . . . . . . . . . . . . . . . . 48
5.5.4. Probabilidad Condicional . . . . . . . . . . . . . . . . . . . . . . . 48
5.5.5. Teorema 4: Reglas de Multiplicacin . . . . . . . . . . . . . . . . . 49
5.6. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
6. Variables aleatorias 63
6.1. Definiciones y ejemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
6.2. Distribucin de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . 66
6.2.1. Propiedades de la funcin de probabilidad . . . . . . . . . . . . . . . 66
6.2.2. Propiedades de la funcin de densidad de probabilidad . . . . . . . . 68
6.2.3. Distribuciones discretas . . . . . . . . . . . . . . . . . . . . . . . . 72
6.2.4. Distribuciones continuas . . . . . . . . . . . . . . . . . . . . . . . . 72
6.3. Esperanza, varianza y momentos . . . . . . . . . . . . . . . . . . . . . . . . 72
6.3.1. Esperanza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
6.3.2. Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
6.3.3. Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
6.4. Funcin generadora de momentos . . . . . . . . . . . . . . . . . . . . . . . 80
6.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
7. Distribuciones de probabilidad 91
7.1. Distribuciones discretas de probabilidad . . . . . . . . . . . . . . . . . . . . 91
7.1.1. Distribucin Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . 91
7.1.2. Distribucin binomial . . . . . . . . . . . . . . . . . . . . . . . . . 92
7.1.3. Distribucin Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . 95
7.1.4. Distribucin geomtrica . . . . . . . . . . . . . . . . . . . . . . . . 99
7.1.5. Distribucin binomial negativa . . . . . . . . . . . . . . . . . . . . . 101
NDICE GENERAL 3
9. Estimacin 175
9.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
9.2. Estimadores y sus propiedades . . . . . . . . . . . . . . . . . . . . . . . . . 175
9.2.1. Propiedades de un buen estimador . . . . . . . . . . . . . . . . . . . 176
9.3. Estimacin Puntual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
9.3.1. Estimadores de maxima verosimilitud . . . . . . . . . . . . . . . . . 179
9.3.2. Estimadores por el mtodo de los momentos . . . . . . . . . . . . . 181
9.4. Estimacin por Intervalos de Confianza . . . . . . . . . . . . . . . . . . . . 182
9.4.1. Intervalos de confianza para estimar la media de una poblacin . . . . 183
9.4.2. Intervalos de confianza para la varianza y la desviacin tpica de una
poblacin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
9.4.3. Intervalos de confianza para estimar Proporciones . . . . . . . . . . . 191
9.4.4. Intervalos de confianza para estimar Diferencias de Medias . . . . . . 193
9.4.5. Intervalos de confianza para Relaciones de Varianzas . . . . . . . . . 196
9.4.6. Intervalos de confianza para Diferencias de Proporciones . . . . . . . 199
9.5. Problemas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201
NDICE GENERAL 4
8.1. Grfica de f (x) cuando los parmetros m y n toman diferentes pares de valores.165
5
NDICE DE FIGURAS 6
7
Captulo 1
1.1. Introduccin
Qu significa la palabra estadstica?
La encontramos frecuentemente en nuestro lenguaje cotidiano. En su uso ms comn,
estadstica se refiere a informaciones numricas. Ejemplos seran; el salario inicial promedio
de un graduado de una escuela superior, el nmero de decesos anuales debido al alcoholismo,
el porcentaje de alumnos no graduados que estudian en la Universidad Nacional de Asuncin,
la variacin de ayer a hoy de los precios de los productos de la canasta familiar, etc. En estos
ejemplos la estadstica consiste en nmeros o porcentajes. A estos nmeros se les denomina
estadsticos.
La Estadstica se divide en dos grandes reas (descripcin de datos y realizacin de infer-
encias) que reflejan la propia historia del desarrollo de esta ciencia. La Estadstica actual es el
producto del encuentro de dos ramas distintas del saber, la antigua estadstica y el clculo de
probabilidades, que se encontraron en el siglo XIX. Etimolgicamente, la palabra estadstica
procede de la palabra estado, ya que desde la antigedad los romanos hicieron recolecciones
de datos que posteriormente tenan que resumir de una forma comprensiva y que permitiera
proporcionar informaciones tiles. Este tipo de estudios dio lugar a la estadstica descriptiva
cuya misin consiste en describir situaciones y procesos dados; para ello se sirve de tablas,
representaciones grficas, proporciones, nmeros ndice y medidas tpicas.
Sin embargo las conclusiones extradas se agotan en el propio conjunto de datos obser-
vados, pues el objetivo consista en hacerse una idea clara de lo que haba, y lo que haba se
contaba y se meda. Lo que posibilit el clculo de probabilidades fue, precisamente, el desar-
rollo de un conjunto de mtodos para extrapolar las conclusiones a entidades no observadas.
Es decir, proporcion el instrumento adecuado para poder hacer inferencias acerca de grandes
cantidades de observaciones potenciales a partir de unas pocas observaciones reales. Estas
tcnicas tuvieron su fundamento en el desarrollo de la curva normal por Gauss, en su apli-
cacin por Galton a los problemas de herencia, etc. Sin embargo los autnticos fundadores
de estas tcnicas fueron Karl Pearson (1857-1936) y Sir Ronald Fisher (1890-1962). As se
ha desarrollado la estadstica analtica o inferencial basada en la teora de probabilidades que
trata de obtener leyes generales a partir de la observacin de algunos datos. Precisamente
este fundamento probabilstico condiciona el que los resultados obtenidos se vean sujetos a
unos mrgenes de error. Ahora se puede dar una definicin de Estadstica en la que aparecen
algunos trminos no definidos lo cual no impedir entender su significado.
8
1.2. DEFINICIONES Y EJEMPLOS 9
Por ejemplo una poblacin en estudio podra ser el conjunto de todos los estudiantes que
estudian administracin en la Facultad de Ciencias Econmicas de la Universidad Nacional
de Asuncin y una muestra podra consistir en el conjunto de estudiantes de primer ao de
dicha poblacin.
1.3. Variables
Definicin 1.3.1 : Variables
Es una caracterstica que puede tomar diferentes valores. Las variables son caractersticas
observables, susceptibles de adoptar distintos valores o ser expresados en categoras. Variable
es un aspecto especifico de la realidad referido a la unidad del anlisis y puede ser medidos
o cuantificados. La variable adquiere un valor determinado en cada unidad de anlisis. Si
una caracterstica, se encuentra que toma valores diferentes en personas, lugares o cosas
diferentes, se dice que esta caracterstica es variable, es decir la caracterstica no es la misma
cuando se observa en diferentes poseedoras de ellas.
lugar de nacimiento
religin
color de ojos
1.3. VARIABLES 11
Note que cada una de estas variables puede valer un nmero entero (por ejemplo: 1,2,3,
etc.) pero no puede valer nmeros fraccionarios (por ejemplo: 1,5). Tpicamente, las variables
discretas resultan de un conteo.
Ejemplo 1.3.7 Religiones en Mxico (poblacin con 5 aos o ms, censo del 2000)
Categora Seguidores
Religin Catlica 74 612 373
Religin no catlica 3 483 593
Sin religin 2 982 929
total 81 078 895
Categora Calificacin ( %)
Buena / muy buena 75,7
regular 17,1
mala / muy mala 2
no sabe / no contesta 5,2
total 100
b) Las categoras de datos estn ordenadas de acuerdo con la cantidad de las caractersti-
cas que poseen.
Observacin
En la escala de medicin de una variable; sea cualitativa o cuantitativa; las categoras
deben ser mutuamente excluyentes. Esto significa que un individuo medicin pertenece
nicamente a una de las categorias. Adems las categoras deben ser exhaustivas, esto es
cada individuo medicin debe pertenecer a una de las categoras.
1.4. PROBLEMAS 14
1.4. Problemas
1. Cul es el nivel de medicin de cada una de las siguientes variables?
3. En cada uno de los siguientes puntos determine si el grupo es una muestra o una
poblacin
11. A una muestra aleatoria de 500 clientes se le pidi probar una nueva pasta dental. De
los 500, 400 dijeron que era excelente, 32 pensaron que era buena y el resto de los
clientes no dieron ninguna opinin. Basandose en lo encontrado en la muestra haga
una diferencia de la reaccin de todos los clientes a la nueva pasta dental.
12. Una muestra aleatoria de 300 ejecutivos de los 2500 empleados en una empresa grande
mostr que 270 se mudaran a otro sitio si ello significara un ascenso importante.
Basndose en los hallazgos en la muestra describa la reaccin de todos los ejecuti-
vo de la empresa.
Distribuciones de Frecuencia
1. La forma de la distribucin. Para describir como estn distribuidos los datos utiliza una
herramienta llamada distribucin de frecuencia y presenta la informacin por medio
de tablas y grficas.
2. Las medidas de tendencia central: que resumen la informacin a una cifra que es rep-
resentativa de la serie de datos.
3. Las medidas de variabilidad: que nos indican que tan variables son los datos respecto
a las medidas de tendencia central.
2.2. Construccin
Una distribucin de frecuencias es una serie de datos agrupados en categoras, en las
cuales se muestra el nmero de observaciones que contiene cada categora.
Los pasos para la construccin de una distribucin de frecuencias son mejor explicados
con un ejemplo.
Ejemplo 2.2.1 Los siguientes datos son el nmero de meses de duracin de una muestra de
40 bateras para coche.
22 41 35 45 32 37 30 26
34 16 31 33 38 31 47 37
25 43 34 36 29 33 39 31
33 31 37 44 32 41 19 34
47 38 32 26 39 30 42 35
16
2.2. CONSTRUCCIN 17
16 19 22 25 26 26 29 30
30 31 31 31 31 32 32 32
33 33 33 34 34 34 35 35
36 37 37 37 38 38 39 39
41 41 42 43 44 45 47 47
2. El rango (amplitud)
El nmero de intervalos (nic) puede ser como mnimo 5 y como mximo 15 de acuerdo
a la frmula : 2nic
Para facilitar la clasificacin de los datos, el tic se redondea siempre al entero posterior.
Usualmente, el lmite inferior del primer intervalo de clase es el dato ms chico, que en
este ejemplo es 16.
El lmite inferior de los siguientes intervalos se calcula sumando el tic al lmite inferior
del intervalo anterior hasta llegar a un nmero no mayor al dato ms grande.
LI LS
16 21
22 27
28 33
34 39
40 45
46 51
Los lmites anteriores son los lmites nominales pero no son los reales. Los lmites
reales son el punto medio entre el lmite superior (LS) y el lmite inferior del siguiente
LS + LIsig
intervalo (LIsig), entonces LSR =
2
LI LS LSR
16 21 21,5
22 27 27,5
28 33 33,5
34 39 39,5
40 45 45,5
46 51 51,5
La marca de clase, tambin llamada punto medio del intervalo es la mitad de la distancia
entre los lmites inferior y superior de cada intervalo. La marca de clase es el valor ms
LI + LS
representativo de los valores del intervalo. Con lo cual X =
2
LI LS LSR X
16 21 21,5 18,5
22 27 27,5 24,5
28 33 33,5 30,5
34 39 39,5 36,5
40 45 45,5 42,5
46 51 51,5 48,5
Clasificar las observaciones en los intervalos. La prctica usual es marcar con una lnea
( / ) que representa una observacin. En el ejemplo la observacin 22 se clasifica en el
intervalo 20 - 24 porque se encuentra entre el 20 y el 24 inclusive. Una vez clasificados
todos los datos se cuentan las lneas de cada intervalo y el resultado es la frecuencia de
cada intervalo de clase.
2.2. CONSTRUCCIN 19
LI LS LSR X cuenta F
16 21 21,5 18,5 // 2
22 27 27,5 24,5 //// 4
28 33 33,5 30,5 ///// ///// /// 13
34 39 39,5 36,5 ///// ///// /// 13
40 45 45,5 42,5 ///// / 6
46 51 51,5 48,5 // 2
LI LS LSR X cuenta F FR
16 21 21,5 18,5 // 2 2/40 = 0, 05
22 27 27,5 24,5 //// 4 4/40 = 0, 1
28 33 33,5 30,5 ///// ///// /// 13 13/40 = 0, 325
34 39 39,5 36,5 ///// ///// /// 13 13/40 = 0, 325
40 45 45,5 42,5 ///// / 6 6/40 = 0, 15
46 51 51,5 48,5 // 2 2/40 = 0, 05
El histograma
El histograma es una de las grficas ms ampliamente utilizadas y una de las mas fciles
de entender. Un histograma describe una distribucin de frecuencia utilizando una serie de
rectngulos adyacentes donde la altura de cada rectngulo es proporcional a la frecuencia de
clase que representa.
Polgono de frecuencia
El polgono de frecuencia consiste de segmentos de lnea conectando los puntos formados
por la interseccin de las marcas de clase y las frecuencias de clase.
2.3. Problemas
Elabore la distribucin de frecuencias de las siguientes series de datos, con sus respectivas
grficas:
1. Los resultados siguientes representan las calificaciones del examen final de un curso
de estadstica elemental.
23 60 79 32 57 74 52 70 82 36
80 77 81 95 41 65 92 85 55 76
52 10 64 75 78 25 80 98 81 67
41 71 83 54 64 72 88 62 74 43
60 78 89 76 84 48 84 90 15 79
34 67 17 82 69 74 63 80 85 61
17 20 10 9 23 13 12 19 18 24
12 14 6 9 13 6 7 10 13 7
16 18 8 13 3 32 9 7 10 11
13 7 18 7 10 4 27 19 16 8
7 10 5 14 15 10 9 6 7 15
6. Se aplic una encuesta donde se les pide indicar el nmero de amigos o parientes que
visitan cuando menos una vez al mes. Los resultados son los siguientes:
3 5 2 3 3 4 1 8 4
2 4 2 5 3 3 3 0 3
5 6 4 3 2 2 6 3 5
4 14 3 5 6 3 4 2 4
9 4 1 4 2 4 3 5 0
4 3 5 7 3 5 6 2 2
8. El presidente de una agencia de viajes, quiere informacin sobre las edades de la gente
que toma cruceros por el Caribe. Una muestra de 40 clientes que tomaron un crucero
el ao pasado revel estas edades:
77 18 63 84 38 54 50 59 54 56
36 26 50 34 44 41 58 58 53 51
62 43 52 53 63 62 62 65 61 52
60 45 66 83 71 63 58 61 71 60
10. Se conduce un estudio de los efectos de fumar sobre los patrones de sueo. La medicin
que se observa es el tiempo, en minutos, que toma quedar dormido. Se obtienen estos
datos:
69 56 22 28 41 28 47 53 48
30 34 13 52 34 60 25 21 37
43 23 13 31 29 38 26 36 30
12. Una compaa de luz seleccion una muestra de 20 clientes residenciales. Los sigu-
ientes datos son las cuentas que se les factur el mes pasado:
54 48 58 50 25 47 75 46 60 70
67 68 39 35 56 66 33 62 65 67
13. Una muestra de suscriptores de una compaa telefnica revel los siguientes nmeros
de llamadas recibidas en la ltima semana.
52 43 30 38 30 42 12 46
39 37 34 46 32 18 41 5
Captulo 3
Promedios
A las medidas de tendencia central con frecuencia se les llama promedios. El propsito
de una medida de tendencia central es indicar con toda precisin el centro de un conjunto de
observaciones.
3.1. La Media
3.1.1. La Media Geomtrica
La media geomtrica es til para encontrar el promedio de porcentajes, proporciones,
ndices, o tasas de crecimiento. Tiene mucha aplicacin en el comercio y la economa porque
nos interesa encontrar el porcentaje de cambio en ventas, salarios o datos econmicos como el
producto nacional bruto. La media geomtrica de un conjunto de "n"nmeros enteros positivo
se define como la n-sima raz del producto de los n valores es decir:
p
n
X1 , X2 , . . . , Xn
Ejemplo 3.1.2 Las ganancias obtenidas por Atkins Construction Company en cuatro proyec-
tos recientes fueron 3 %, 2 %, 4 % y 6 %. Cul es la media de las ganancias?
Por lo que la media de ganancias obtenidas por Atkins Construction Company en los
cuatro proyectos esta dada por
p4
(0, 03)(0, 2)(0, 4)(0, 6) = 0, 03464
o sea 3,464 %
25
3.1. LA MEDIA 26
n
Xi 85, 4 + 85, 3 + 84, 9 + 85, 4 + 84, 0
i=1
X= = = 85, 0
n 5
fi Xi
X=
n
Donde:
X : simboliza la media de la muestra
Xi : es la marca de clase del intervalo i-simo
fi : es la frecuencia de clase del intervalo i-simo
LI LS Xi fi fi Xi
15 19 17 2 34
20 24 22 1 22
25 29 27 4 108
30 34 32 15 480
35 39 37 10 370
40 44 42 5 210
45 49 47 3 141
n =40 fiXi = 1365
fi Xi 1365
X= = = 34, 12
n 40
3.2. La mediana
Cuando una serie de datos contiene uno o dos valores muy grandes o muy pequeos, la
media aritmtica no es representativa. El valor central en tales problemas puede ser mejor
descrito usando una medida de tendencia central llamada mediana.
La mediana es el punto medio de los valores de una serie de datos despus de haber
sido ordenados de acuerdo a su magnitud. Hay tantos valores antes que la mediana como
posteriores en el arreglo de datos.
85,9
85,4
85,4 X
84,3
84,0
Ejemplo 3.2.2 Una muestra de los honorarios de paramdicos cargados por la clnica Balti-
more revel las siguientes cantidades: 35,29, 30,25, 32,35. Cul es la mediana?
25
29
30 X
32
35
35
En este caso la mediana se calcula obteniendo la media de las dos observaciones centrales
30 + 32
X = = 31
2
( n2 FA)tic
X = LRI +
F
Donde:
X : mediana de la muestra
LI LS LSR X F FA
15 19 19,5 17 2 2
20 24 24,5 22 1 3
25 29 29,5 27 4 7
30 34 34,5 32 15 22 intervalo mediano
35 39 39,5 37 10 32
40 44 44,5 42 5 37
45 49 49,5 47 3 40
3.3. LA MODA 31
3.3. La moda
La moda es la medida de tendencia central especialmente til para describir mediciones
de tipo ordinal y nominal. Es el valor de la observacin que aparece ms frecuentemente.
3. Al igual que la mediana, puede ser calculada en distribuciones con intervalos abiertos.
2. En algunas series de datos hay ms de una moda, en este caso uno podra preguntarse
cual es el valor representativo de la serie de datos?
Donde:
Si hay dos intervalos contiguos con frecuencia mxima la moda ser la media aritmtica
de las dos marcas de clases. Si hay dos o ms intervalos no contiguos con frecuencia de clase
mxima habr dos o ms modas que sern las marcas de clases de dichos intervalos.
X F
5 4
10 3
15 15 15
X=
20 9
25 10
30 7
X F no hay moda
5 4
10 4
15 4
20 4
25 4
30 4
Cuando haya intervalos abiertos, situaciones en las que el intervalo superior carece de
lmite superior, el intervalo inferior carece de lmite inferior o ambos.
Observacin : Esta igualdad no es exacta, sino que se cumple con mayor o menor
aproximacin en funcin del grado de simetra de la curva que represente grficamente
la distribucin.
con lo cual la
2. Para una distribucin asimtrica negativa se tiene que: X < X < X,
distribucin de datos presenta un sesgo negativo.
< X < X, con lo cual la dis-
3. Para una distribucin asimtrica positiva se tiene que: X
tribucin de datos presenta un sesgo positivo.
Observacin: La regla emprica se acepta como vlida siempre que el grado de curva
no sea muy acentuado.
3.4. Problemas
1. El departamento de agricultura, tiene los siguientes datos que representan el crecimien-
to mensual (en pulgadas) de muestras de maz recien plantados
0,4 1,9 1,5 0,9 0,3 1,6 0,4 1,5 1,2 0,8
0,9 0,7 0,9 0,7 0,7 1,5 0,5 1,5 1,7 1,8
5. las edades de 60 personas que trabajan en una fbrica textil se han tabulado dando la
siguiente tabla de frecuencias:
Edades No de personas
13-17 2
18-22 6
23-27 10
28-32 13
33-37 18
38-42 6
43-47 2
48-52 2
53-57 16
Total 60
Medidas de Variabilidad
4.1. Introduccin
Qu son las medidas de variabilidad?
Las medidas de variabilidad de una serie de datos, muestra o poblacin, permiten iden-
tificar que tan dispersos o concentrados se encuentran los datos respecto a una medida de
tendencia central.
Hay varias razones para analizar la variabilidad en una serie de datos. Primero, al aplicar
una medida de variabilidad podemos evaluar la medida de tendencia central utilizada. Una
medida de variabilidad pequea indica que los datos estn agrupados muy cerca, digamos, de
la media. La media, por lo tanto es considerada bastante representativa de la serie de datos.
Inversamente, una gran medida de variabilidad indica que la media no es muy representativa
de los datos.
Una segunda razn para estudiar la variabilidad de una serie de datos es para comparar
como estn esparcidos los datos en dos o ms distribuciones. Por ejemplo, la calificacin
promedio de dos estudiantes, A = {90, 80, 75, 75} y B = {90, 55, 85, 90}, es de 80. Basados
en esto podramos pensar que sus calificaciones son idnticas. Pero si revisamos el detalle de
sus calificaciones vemos que esta conclusin no es correcta.
4.2. Variabilidad
4.2.1. Rango y rango intercuartlico
Definicin 4.2.1 : Amplitud o Rango
Es la diferencia entre observaciones extremas, es decir la diferencia entre el mayor y el
menor valor. Es muy sensible a los valores extremos.
R = 81 = 7
35
4.2. VARIABILIDAD 36
Es parecida al rango, pero eliminando las observaciones ms extremas o sea las inferiores
y superiores. Por lo que no es tan sensible a valores extremos. Es la distancia entre primer y
tercer cuartil.
X X X |X X|
85,4 + 0.4 0.4
85,4 + 0.4 0.4
85,3 + 0.3 0.3
84,9 - 0.1 0.1
84,0 - 1.0 1.0
n
|Xi X| 2, 2
i=1
Dm = = = 0, 44
n 5
Dm =
fi|Xi X| (4.2.3)
n
Claramente observamos que la serie B tiene una dispersin mayor que la serie A, sin
embargo en ambos casos la desviacin media es cero.
Varianza
Es la media aritmtica de las desviaciones cuadradas de los datos respecto a la media.
Desviacin estndar
Es la raz cuadrada de la varianza.
X X2
85,4 7293,16
85,3 7276,09
84.9 7208,01
85.4 7293.16
84.0 7056.00
2
Xi = 425, 0 X = 36126, 42
S = 0, 595818764
S= S2 (4.2.11)
desviacin estndar de una muestra
LI LS X fi fi Xi fi Xi2
15 19 17 2 34 588
20 24 22 1 22 484
25 29 27 4 108 2916
30 34 32 15 480 15360
35 39 37 10 370 13690
40 44 42 5 210 8820
45 49 47 3 141 6627
n =40 i i = 1365
f X fi Xi2 = 48475
S = 6, 881814804
4.3. Problemas
1. Se conduce un estudio de los efectos de fumar sobre los patrones de sueos. La medi-
cin que se observa es el tiempo, en minutos, que toma quedar dormido. Se obtiene
4.3. PROBLEMAS 40
estos datos:
Fumadores 69,3 56,0 22,1 47,6 53,2 48,1 52,7 34,4 60,2 43,8
No fumadores 28,6 25,1 26,4 34,9 29,8 38,5 30,2 30,6 31,8 41,6
2. La compaa National Tire tiene fondos de reserva en valores negociable a corto plazo.
El saldo diario de cierre (en millones de dlares) de la cuenta de valores negociables
en lapso de dos semanas es el que mostramos a continuacin
a) Calcula las mediadas de tendencia central para cada grupo e interprete los resul-
tados obtenidos.
b) Calcula la desviacin media, la varianza, la desviacin tpica y el coeficiente de
variacin de cada grupo.
c) Diga cual de los grupos tiene mejor concentracin
Captulo 5
Probabilidad
5.1. Introduccin
La teora de probabilidad tuvo como uno de sus primeros puntos de partida el intentar
resolver un problema particular concerniente a una apuesta de juego de dados entre dos per-
sonas. El problema al que nos referimos involucraba una gran cantidad de dinero y puede
plantearse de la siguiente forma: Dos jugadores escogen cada uno de ellos un nmero del 1
al 6, distinto uno del otro, y apuestan 32 doblones de oro a que el nmero escogido por uno
de ellos aparece en tres ocasiones antes que el nmero del contrario al lanzar sucesivamente
un dado. Suponga que el nmero de uno de los jugadores ha aparecido dos veces y el nmero
del otro una sola vez. Cmo debe dividirse el total de la apuesta si el juego se suspende?
Uno de los apostadores, Antonio de Gombaud, popularmente conocido como el caballero
De Mere, deseando conocer la respuesta al problema plantea a Blaise Pascal (1623-1662) la
situacin. Pascal a su vez consulta con Pierre de Fermat (1601-1665) e inician un intercambio
de cartas a propsito del problema. Esto sucede en el ao de 1654. Los historiadores de
la matemtica stan generalmente de acuerdo en considerar este hecho como el origen del
estudio de las probabilidades. Con lo anteriormente mencionado se inician algunos esfuerzos
por dar solucin a ste y otros problemas similares que se plantean. Con el paso del tiempo
se sientan las bases y las experiencias necesarias para la bsqueda de una teora matemtica
que sintetice los conceptos y los mtodos de solucin de los muchos problemas particulares
resueltos a lo largo de varios aos.
Las ideas de probabilidades permanecen circunscritas a los problemas de juegos de azar
hasta que Pierre Laplace (1749-1827) y Friedrich Gauss (1777-1855) hacen notar que las
teorias desarrolladas son aplicables tambin a otras actividades diferentes de los juegos de
azar. En el segundo congreso internacional de matemticas, celebrado en la ciudad de Paris
en el ao 1900, el matemtico David Hilbert (1862-1943) plantea 23 problemas matemticos
de importancia. Uno de estos problemas es el de encontrar axiomas o postulados a partir
de los cuales se pueda construir una teora matemtica de la probabilidad. Aproximada-
mente treinta aos despus, en 1933, el matemtico ruso Andrei Nikolaevich Kolmogorov
(1903-1987) propone ciertos axiomas basados en la teora de la medida desarrollada por
H. Lebesgue(1875-1941), que a la postre resultaron adecuados para la construccin de una
teora de la probabilidad. Esta teora prevalece hoy en da y ha adquirido el calificativo de
teora clsica. Actualmente la teora clsica de la probabilidad se ha desarrollado y exten-
41
5.2. DEFINICIONES Y EJEMPLOS 42
Unin
La unin de dos eventos dados A y B de un espacio muestral ; es el conjunto de re-
sultados de un experimento aleatorio que pertenece a alguno de estos dos eventos dados. El
smbolo de la unin es .
Complemento
El complemento de un evento A de un espacio muestral ; es el conjunto de resultados de
un experimento aleatorio que no pertenece a dicho evento dado. El smbolo del complemento
es .
Diferencia
Diferencia de dos eventos A y B de un espacio muestral ; es el conjunto de resultados
de un evento dado que no pertenece a otro evento dado. El operador de la diferencia es el
signo "menos"().
Ejemplo 5.4.2 Se quiere saber si una moneda est cargada. Para determinar la probabilidad
de que caiga cara se lanza 60 veces la moneda al aire, de las cuales 25 veces cay cara. Si
aplicamos la frmula
25
P(cae cara) = = 0, 4167
60
Algunas dificultades que presenta este enfoque de la probabilidad es que no dice cual es
el nmero grande de observaciones necesario, o que se entiende por condiciones similares,
porque si las condiciones son las mismas los resultados sern tambin los mismos.
Ejemplo 5.4.3 Cul es la probabilidad de que un cierto equipo de ftbol gane en su prx-
imo partido?. Ciertas circunstancias internas del equipo, las condiciones del equipo rival o
cualquier otra condicin externa, son elementos que slo algunas personas conocen y que
podran darnos una idea ms exacta de esta probabilidad.
Axioma 2: P() = 1
Ejemplo 5.5.1 Si el experimento es lanzar un dado una vez, el espacio muestral es:
S = {1, 2, 3, 4, 5, 6}
A = {2, 4, 6}
B = {1, 2}
A B = {2}
5.5. TEOREMAS DE PROBABILIDAD 48
1
por lo que P(A B) =
6
Si aplicamos la regla de adicin:
1 1 1 2
P(A B) = + =
2 3 6 3
1 1
P(A) = 1 P(A) = 1 =
2 2
3 1
P(A B) = P(A) P(A B) = = 0, 3333
6 6
Y la probabilidad de que caiga un nmero menor que tres pero no sea par es:
2 1
P(B A) = P(B) P(AB) = = 0,167
6 6
Ejemplo 5.5.5 Una maquina empaca vegetales en una bolsa de plstico. Experiencias ante-
riores revelan que en ocasiones los paquetes tienen menos del peso correcto, y en otras ms,
pero la mayora de las veces tiene el peso satisfactorio. Como muestra la siguiente tabla:
Peso Probabilidad
debajo del correcto 0,025
correcto 0,900
arriba del correcto 0,075
Supongamos que queremos saber la probabilidad de que al inspeccionar tres paquetes, los
tres pesen correctamente. Establezcamos los siguientes eventos:
P(A) = 0, 900
P(B) = 0, 900
P(C) = 0, 900
Segn el teorema de multiplicacin la probabilidad de que los tres eventos ocurran es:
P(A B C) = P(A) P(B) P(C) = (0, 900) (0, 900) (0, 900) = 0, 729
5.5. TEOREMAS DE PROBABILIDAD 50
Ejemplo 5.5.6 Cierto departamento de una compaa esta compuesto por 8 hombres y 4
mujeres, de entre ellos se va elegir al nuevo jefe del departamento, para lo cual se entrevistar
a dos de ellos. Si todos tienen la misma probabilidad de ser elegidos, cual es la probabilidad
de que las dos personas entrevistadas sean mujeres?
Teorema de Bayes
En el siglo XVIII el reverendo Thomas Bayes, un ministro presbiteriano ingls, se hi-
zo esta pregunta: realmente existe Dios?. Siendo el, un entusiasta matemtico se evoc a
desarrollar una frmula para encontrar la probabilidad de que Dios existe, basndose en la
evidencia disponible sobre la tierra. Aos despus de la muerte de Bayes, Laplace desarrol-
l el trabajo del reverendo, y por vez primera, se logra la determinacin de la probabilidad
de las causas a partir de los efectos que han podido ser observados. El clculo de dichas
probabilidades recibe el nombre de teorema de Bayes. La frmula del teorema de Bayes es:
P(A1 )P(B|A1 )
P(A1 |B) =
P(A1 )P(B|A1 ) + P(A2 )P(B|A2 ) + ... + P(An )P(B|An )
Ejemplo 5.5.7 : Don Pepe tiene una tienda, en el trabajan tres cajeras, Andrea, Bianca, y
Consuelo. Andrea realiza el 50 % de los cobros, Bianca el 30 % y Consuelo el 20 %. Cuando
cobra Andrea hay un 1 % de probabilidad de que lo haga mal, cuando lo hace Bianca hay un
2 % de que cobre mal, y si cobra Consuelo hay un 3 % de probabilidad de que se equivoque.
Un cliente se quej con Don Pepe porque le cobraron mal. Cul es la probabilidad de que
el mal cobro lo haya hecho Andrea?
5.6. PROBLEMAS 51
P(A)P(M|A)
P(A|M) =
P(A)P(M|A) + P(B)P(M|B) + P(C)P(M|C)
5.6. Problemas
1. Suponga que de un grupo de 500 estudiantes universitarios se encuentra que 300 fu-
man, que 350 consumen bebidas alcohlicas y que 250 tienen estos dos hbitos nocivos
para la salud. Cul es la probabilidad de que un estudiante seleccionado aleatoria-
mente
6. El profesor Ramos tiene muchos aos impartiendo la clase de matemticas, por expe-
riencia sabe que el 80 % de los estudiantes contestan los problemas que les encarga de
tarea. Tambin sabe que el 90 % de los estudiantes que hacen la tarea aprueban el curso
y que el 60 % de los estudiantes que no hacen la tarea reprueban. Manuel aprob el
curso, cual es la probabilidad de que hizo la tarea?
9. Una urna contiene 5 bolillas blancas, 4 negras, 6 rojas y 10 verdes. Se extrae una bolilla
de la urna. Calcular la probabilidad de que:
10. Cierta poblacin de 1500 habitantes, fue clasificado, segn su nacionalidad, resultando:
950 paraguayos, 200 espaoles, 300 italianos y 50 franceses. Si se elige un habitante
al azar, calcular la probabilidad de que:
21. Se tiene un grupo de 12 tornillos, de los cuales 4 son defectuosos. Se recogen 2 tornillos
al azar. Cul es la probabilidad de que:
22. Se tiene tres urnas, la primera contiene 50 bolas rojas y 50 bolas blancas; la segunda 60
bolas amarillas y 40 blancas, la tercera 70 bolas verdes y 30 blancas. Si se selecciona
aleatorimente una de las urnas y se extraen dos bolas con reposicin:
24. De 100 individuos que presenten su solicitud para ocupar puestos de analista de sis-
temas en una gran empresa en el ultimo ao. 40 contaban con experiencia laboral
previa y 30 tenan titulo profesional. Sin embargo 20 de los solicitantes tenan tanto
experiencia laboral como titulo profesional, de modo que han sido incluidos en ambos
conteos.
26. En una caja hay 15 lapiceras con las plumas en buen estado, de los cuales 5 no tienen
tinta, adems 6 lapiceras con las plumas rotas. Al sacar una lapicera. Calcular la pro-
babilidad de que la lapicera no escriba. Respuesta: 0,5238
27. Para la sealizacin de emergencia se ha instalado dos indicadores que funcionan in-
dependientemente; la probabilidad de que un indicador se accione durante la avera es
igual a 0,95 para el primero y 0,90 para el segundo. Hallar las siguientes probabilidades
que durante una avera:
28. Una caja contiene 20 unidades de cierto producto electrnico, 4 de ellos son defec-
tuosos y 16 son buenas. Se seleccionarn aleatoriamente 4 unidades y se vendern.
Obtngase la probabilidad de que:
1
a) las cuatro unidades vendidas sean defectuosos Respuesta: 4845
48
b) entre las cuatro unidades vendidas 2 sean buenas Respuesta: 323
13
c) se vendan al menos tres unidades defectuosas Respuesta: 969
29. En un deposito hay 3000 cajas de plumas de las marcas A, B, C, D y E y en ellas hay
cajas de plumas deterioradas. Las cajas se distinguen de la siguiente manera:
30. La urna A tiene 2 boletines rojos y 3 azules; la urna B contiene 4 rojas y 1 azul y la urna
C 3 rojas y 4 azules. Se selecciona aleatoriamente una urna y un boletn es extrado y
que resulta ser rojo. Hallar la probabilidad de haber escogido:
a) la urna A Respuesta: 14
57
b) la urna B Respuesta: 28
57
5
c) la urna C Respuesta: 19
d) la urna A o B Respuesta: 14
19
e) la urna A o C Respuesta: 29
57
31. Un agente de una compaa de seguros vende plizas a 5 personas, todas de edad idn-
tica y con buena salud. De acuerdo con la tabla de los actuarios la probabilidad de que
una persona de esta edad especifica est viva en 30 aos es 23 . Hallar la probabilidad
de que en 30 aos estn vivas:
32
a) las 5 personas Respuesta: 243
b) al menos 3 personas Respuesta: 64
81
40
c) solamente 2 personas Respuesta: 243
d) al menos una persona Respuesta: 242
243
32. En una exhibicin canina, 3 de los 10 perros premiados deben seleccionarse para que
aparezcan en un comercial de comida para perros. Se han otorgados premios a tres
cooles, cuatro pastores alemn, dos perros galeces y un perro de agua.
a) Cual es la probabilidad de que los tres perros elegidos sean de la misma raza?
Respuesta: 0,042
b) Cual es la probabilidad de que se seleccionen dos cooles y un pastor alemn?
Respuesta: 0,10
33. Una caja con guantes de bisbol contiene 2 guantes para jugadores zurdos y 7 para
diestros. Si se seleccionan 3 guantes al azar:
34. En una caja hay 18 artculos de los cuales cuatro son defectuosas. Si se extrae aleatori-
amente tres artculos al mismo tiempo. Calcular las siguientes probabilidades
39. La probabilidad de que en los hogares de una poblacin tengan lava vajilla es 0,40 y
de que tengan video es de 0,30. Calcular las siguientes probabilidades:
40. Se extrae tres cartas de un mazo de 40. Calcular las siguientes probabilidades:
42. De una baraja de 40 naipes bien mezcladas, se sacan al azar 5 cartas. Hallar la proba-
bilidad de que:
5.6. PROBLEMAS 59
45. En una zapatera hay tres estanteras A, B y C, la primera tiene 50 pares de zapatos
negros y 25 marrones, la segunda tiene 40 de cada color y la ultima 20 negros y 30
marrones. Si un cliente no tiene preferencia especial respecto a las estanteras ni re-
specto al color elige un par de zapatos y es marrn. Calcule la probabilidad de que
15
proceda de la estantera B. Respuesta: 43
46. Dos seres humanos y ocho elefantes se sientan al azar entorno a una mesa circular.
Calcular la probabilidad de que los humanos esten juntos. Respuesta:
47. Si A y B son dos sucesos tales que P(A) = 0, 6 y P(B) = 0, 7. Calcular: P(A B) y
P(A B) sabiendo que P(A B) P(A B) = 0, 4 Respuesta: P(A B) = 0, 8 y
P(A B) =0,5 o P(A B) = 0, 5 y P(A B) = 0, 8
49. Un jugador lleva en el bolsillo dos monedas, una normal y otras con dos caras. Elige al
azar una de las monedas y la lanza al aire.
50. De los 250 empleados de una compaa, 130 fuman cigarrillos. Hay 150 hombres que
trabajan en esta compaa de los cuales 85 fuman cigarrillos. Cul es la probabilidad
de que un empleado seleccionado en forma aleatoria,
no fume cigarrillo?
5.6. PROBLEMAS 60
51. Se desea determinar si hay una relacin entre el inters de un estudiante por la estads-
tica y su capacidad para las matemticas, se selecciona una muestra aleatoria de 200
estudiantes y se les pregunta si su capacidad para las matemticas y su inters por la
estadstica es bajo, promedio o alto. Los resultados fueron como sigue:
52. Una moneda esta cargada de modo que la posibilidad de salir cara (H) sea el doble de
salir sello (S). Hallar P(H) y P(T ) Respuesta:
54. Dos hombres y tres mujeres intervienen en un torneo de ajedrez. Los del mismo sexo
tienen igual probabilidad de ganar pero cada hombre tiene el doble de probabilidad de
ganar que una mujer.
55. Una clase consta de 10 hombres y 20 mujeres de los cuales la mitad de los hombres y
la mitad de las mujeres tienen ojos castaos. Hallar la probabilidad de que una persona
escogida al azar sea un hombre o tenga los ojos castaos. Respuesta:
57. Se escogen al azar dos dgitos desde del conjunto {1, 2, 3, ...., 9}. Si la suma es par,
hallar la probabilidad de que ambos sean nmeros impares. Respuesta:
58. Se escogen al azar tres lamparas entre 15 de las cuales 5 son defectuosos. Hallar la
probabilidad de que:
59. Se selecciona al azar dos cartas entre 10 cartas numeradas de 1 a 10. Hallar la proba-
bilidad de que la suma sea impar si:
60. Una clase tiene 12 nios y 4 nias. Se seleccionan tres estudiantes de la clase al azar.
Cul es la probabilidad de que todas sean nias? Respuesta:
62. Una caja contiene tres monedas; una de las monedas es corriente, otra tiene dos caras
y la tercera esta cargada de modo que la probabilidad de obtener cara sea 0,6 . Se
selecciona una de las monedas y se lanza al aire. Hallar la probabilidad de que salga
cara. Respuesta:
63. Una urna contiene 3 bolas rojas y 7 blancas. Se saca una bola de la urna y se reemplaza
por una de otro color. Se saca de la urna una segunda bola.
64. Se nos da dos urnas como sigue: La urna A contiene 3 bolas rojas y 2 bolas blancas y la
urna B contiene 2 bolas rojas y 5 bolas blancas. Se selecciona al azar una urna; se saca
una bola y se coloca en la otra urna, luego se saca una bola de la segunda urna. Hallar
la probabilidad de que las dos bolas sacadas sean del mismo color. Respuesta:
65. En una carretera entre las ciudades A y B hay tres semforos, a una distancia de unos
kilmetros entre si. Los ciclos de los mismos son de un minuto cada uno. Los tres
semforos estn prendidos en verde durante 30, 40 y 50 segundos respectivamente.
Suponiendo que un auto observa los reglamentos de transito. Calcular la probabilidad
de que el auto:
Sin importar cual de los componentes funcione o no. Cules son los posibles
resultados? ( Puede suponer independencia en la operacin de los componentes).
Cul es la probabilidad de que el aparato no funcione Respuesta: 0,99
Captulo 6
Variables aleatorias
La definicin anterior nos dice que dado un experimento aleatorio cualquiera, y el espacio
muestral asociado a dicho experimento, una variable aleatoria es una transformacin X del
espacio de resultados (espacio muestral) al conjunto de nmeros reales, esto es, asigna a cada
elemento , un nmero real X(). La expresin matemtica est dada por:
X : R
A menudo se escribe simplemente v.a. en lugar del trmino variable aleatoria. En sen-
tido estricto una variable aleatoria es una funcin de en R que satisface adems cierta
condicin de medibilidad, pero omitiremos tales tecnicismos pues no son de utilidad para los
propsitos de este curso. Suponga entonces que se efecta el experimento aleatorio una vez
y se obtiene un resultado en R. Al transformar este resultado con la variable aleatoria X
se obtiene un nmero real X() = x. Podemos entonces suponer que los posibles resultados
del experimento aleatorio son los diferentes nmeros reales x que la funcin X puede tomar.
Haremos aqui la siguiente observacin importante. Seguiremos la notacin usual de usar la
letra mayscula X para denotar una variable aleatoria cualquiera, es decir, X es una funcin
de en R, mientras que la letra minscula x denota un nmero real y que es un posible valor
de la variable aleatoria. En general, las variables aleatorias se denotan usando las ltimas
63
6.1. DEFINICIONES Y EJEMPLOS 64
letras del alfabeto en maysculas, U,V,W, X,Y, Z, y para un valor cualquiera de ellas se usa
la misma letra pero en minscula.
Ejemplo 6.1.1 Si un experimento aleatorio consiste en lanzar una vez un dado equilibrado
y observar la cara superior del dado una vez que cae. Denotemos por 1,2,3,4,5 y 6 las
seis caras del dado. Es claro que el espacio muestral es = {1, 2, 3, 4, 5, 6}. Podemos definir
entonces la variable aleatoria X : R como X({1}) = 1 y X({2, 3, 4, 5, 6}) = 0 si
nuestro inters es el nmero de veces que se obtiene el 1 en este experimento.
Ejemplo 6.1.2 Consideremos el experimento aleatorio consistente en lanzar un dardo en
un tablero circular de radio uno. El espacio muestral o conjunto de posibles resultados del
experimento se puede escribir como sigue:
= {(x, y) : x2 + y2 1}
Los siguientes son ejemplos de funciones de en R, variables aleatorias, asociadas a este
experimento aleatorio:
a) X(x, y) = x, proyeccin sobre el eje horizontal.
b) Y (x, y) = y, proyeccin sobre el eje vertical.
p
c) Z(x, y) = x2 + y2 , distancia al centro del crculo.
d) V (x, y) = |x| + |y|, distancia del taxista.
e) W (x, y) = xy, producto de las coordenadas.
Figura 6.2: Representacin grfica del espacio muestral del ejemplo 6.1.2
Considerando el conjunto de valores que una variable aleatoria puede tomar, se puede
clasificar a las variables aleatorias en dos tipos: discretas o continuas.
Definicin 6.1.2 Una variable aleatoria es discreta cuando el conjunto de valores que s-
ta toma es un conjunto discreto, es decir, un conjunto finito o numerable. Por ejemplo, el
conjunto {0, 1, 2, ..., n} es un conjunto discreto porque es finito, lo mismo N pues aunque es
infinito, es numerable y por lo tanto discreto.
6.1. DEFINICIONES Y EJEMPLOS 65
Definicin 6.1.3 Una variable aleatoria es continua cuando toma todos los valores dentro
de un intervalo (a, b) R.
Usaremos con mucha frecuencia la notacin arriba explicada. El lector debe asegurarse
de comprender bien que si x es un nmero real entonces (X x) es un subconjunto de y por
lo tanto un evento. Lo mismo sucede con el complemento de este conjunto que es (X > x).
Podemos escribir entonces la igualdad de conjuntos (X x) (X > x) = . Y aplicando
probabilidad se obtiene:
P(X x) + P(X > x) = 1
6.2. DISTRIBUCIN DE PROBABILIDAD 66
Nota importante. A travs de una variable aleatoria se puede considerar que los posibles
resultados de un experimento aleatorio no son elementos en sino nmeros reales que la
variable aleatoria puede tomar. Esta es una consideracin radical pues ya no consideraremos
experimentos aleatorios particulares, ni espacios muestrales arbitrarios , ni eventos (sub-
conjuntos) de , en lugar de ello consideraremos que una cierta variable aleatoria de inters
toma valores en un cierto subconjunto de nmeros reales. La probabilidad definida antes para
subconjuntos de se traslada, como explicamos antes, a probabilidades para subconjuntos
de R. Esta perspectiva permite estudiar modelos generales y despus aplicarlos a cualquier
situacin particular. A partir de ahora y en lo que resta del curso el trmino variable aleatoria
constituir un elemento frecuente en los enunciados.
2) f (x) = 1
x
Ejemplo 6.2.1 Considere la variable aleatoria discreta X que toma los valores 1, 2 y 3, con
probabilidades 0,3; 0,5 y 0,2 respectivamente. Entonces la funcin de probabilidad de X es
0, 3 si x = 1
f (x) = 0, 5 si x = 2
0, 2 si x = 3
Esta funcin se muestra grficamente en la Figura 6.2. Alternativamente podemos tam-
bin expresar esta funcin mediante la tabla mostrada ms abajo. En esta representacin se
entiende de manera implcita que f (x) es cero para cualquier valor de x distinto de 1, 2 y 3.
En particular, compruebe que las siguientes probabilidades son correctas:
P(X 2) = 0, 7 P(|X| = 1) = 0, 3 y P(X < 1) = 0
x 1 2 3
p(x) 0,3 0,5 0,2
Ejemplo 6.2.2 Encontremos el valor de la constante c que hace que la siguiente funcin sea
de probabilidad.
cx si x = 0, 1, 2, 3
f (x) =
0 en otro caso
Los posibles valores de la variable aleatoria discreta, no especificada, son 0, 1, 2 y 3, con
probabilidades 0, c, 2c y 3c, respectivamente. Como la suma de estas probabilidades debe ser
uno, obtenemos la ecuacin c + 2c + 3c = 1. De aqui obtenemos c = 16 . Este es el valor de c
que hace que f (x) sea no negativa y sume uno, es decir, una funcin de probabilidad.
Definicin 6.2.2 (Funcin de densidad para una variable aleatoria continua)
Sea X una variable aleatoria continua. Decimos que la funcin integrable y no negativa
f (x) : R [0, ) es la funcin de densidad de X si para cualquier intervalo (a, b) de R se
cumple la igualdad
Z b
P(X (a, b)) = f (x)dx
a
6.2. DISTRIBUCIN DE PROBABILIDAD 68
Es decir, la probabilidad de que la variable tome un valor dentro del intervalo (a, b) se
puede calcular o expresar como el rea bajo la funcin de densidad en el intervalo (a, b).
De esta forma el clculo de una probabilidad se reduce al clculo de una integral. Vase
la Figura 6.4. No es difcil comprobar que toda funcin de densidad f (x) de una variable
aleatoria continua X cumple las dos propiedades que mencionamos a continuacin anlogas
al caso discreto.
Se trata de una variable aleatoria continua que toma valores en el intervalo [1, 1]. Como
esta funcin debe integrar uno tenemos que:
Z Z 1 Z 1 x 2 1
1= f (x)dx = c|x|dx = 2c xdx = 2c =c
1 0 2 0
Por lo tanto, cuando tomamos c = 1 la funcin anterior resulta ser una funcin de densi-
dad pues ahora cumple con ser no negativa e integrar uno.
Definicin 6.2.3 (Funcin de distribucin). Sea X una variable aleatoria discreta o con-
tinua. La funcin de distribucin de X, denotada por F(x) : R [0, 1], se define como
F(x) = P(X x)
Ejemplo 6.2.5 Consideremos la variable aleatoria discreta X del ejemplo 6.2.1. Tenemos que
la correspondiente funcin de distribucin evaluada en x se calcula sumando las probabilida-
des P(X = u) para valores de u menores o iguales a x, es decir,
0 si x < 1
0, 3 si 1 x < 2
F(x) = P(X x) = P(X = u) =
ux
0, 8 si 2 x < 3
1 si x 3
cuya grfica aparece en la Figura 6.6. Este es el comportamiento tpico de una funcin de
distribucin de una v.a. discreta, es no decreciente, constante por pedazos, y si la funcin
tiene una discontinuidad en x, entonces el tamao de tal discontinuidad es exactamente la
probabilidad de que la variable aleatoria tome ese valor.
6.2. DISTRIBUCIN DE PROBABILIDAD 70
Ejemplo 6.2.6 Consideremos ahora la variable aleatoria continua X del ejemplo 6.2.3. La
correspondiente funcin de distribucin se obtiene calculando la siguiente integral:
0 si x 1 0 si x 1
Z x Z x
1 x1
F(x) = P(X x) = f (u)du = du si 1 < x < 3 = si 1 < x < 3
1 2
2
1 si x 3 1 si x 3
cuya grfica aparece en la Figura 6.7. Observe que esta funcin es continua y no decreciente.
En los dos ejemplos anteriores se ha mostrado la forma de obtener F(x) a partir de f (x).
Ahora explicaremos el proceso contrario. En el caso continuo tenemos que para toda x en R,
Z x
F(x) = P(X x) = f (u)du
d
de modo que por el teorema fundamental del clculo, y cuando F(x) es diferenciable, (F(x)) =
dx
f (x). De este modo podemos encontrar f (x) a partir de F(x). En el caso discreto, f (x) =
6.2. DISTRIBUCIN DE PROBABILIDAD 71
Proposicin 6.2.1 . Toda funcin de distribucin F(x) satisface las siguientes propiedades:
1. 0 F(x) 1
2. lm F(x) = 1
x
3. lm F(x) = 0
x
6. F(x) = F(x+ )
Demostracin
1. Como F(x) es una probabilidad pues, por definicin, F(x) = P(X x). Por lo tanto se
cumple la primera propiedad.
/ =0
F(x) P(X ) = P(0)
6. Para h > 0 tenemos que F(x + h) = P(X x + h) = P(X x) + P(x < X x + h), de
modo que cuando h tiende a cero, el conjunto (x < X x + h) tiende al conjunto vaco.
Concluimos entonces que, cuando h 0 con h > 0,
/ = F(x)
F(x + h) F(x) + P(0)
a) Distribucin binomial
c) Distribucin Poisson
d) Distribucin geomtrica
e) Distribucin hipergeomtrica
a) Distribucin ji cuadrado
b) Distribucin exponencial
c) Distribucin t-student
d) Distribucin normal
e) Distribucin Gamma
f) Distribucin Beta
Las distribuciones continuas son imposibles de tabular y por lo tanto se representan con
curvas.
6.3.1. Esperanza
Definicin 6.3.1 Esperanza
La esperanza de una variable aleatoria X es un nmero real denotado por E(X) y que se
calcula como sigue:
6.3. ESPERANZA, VARIANZA Y MOMENTOS 73
E(X) = x f (x)
x
en donde la suma se efecta sobre todos los posibles valores que pueda tomar la variable
aleatoria X, y se define cuando esta suma sea absolutamente convergente, es decir,
El nmero de sumandos puede ser finito o infinito dependiendo del conjunto de valores
de la variable aleatoria.
Ejemplo 6.3.1 Sea X una variable aleatoria discreta con funcin de densidad dada por la
siguiente tabla.
x -1 0 1 2
f(x) 1/8 4/8 1/8 2/8
La esperanza de X es el nmero
3
1 4 1 2 1
E(X) = x f (x) = 1 + 0 + 1 + 2 =
8 8 8 8 2
x=1
Observe que la suma su efecta para todos los valores de x indicados en la tabla, es decir :
-1, 0, 1 y 2. Tambin es instructivo observar que la esperanza no es necesariamente uno de
los valores tomados por la variable aleatoria. En este ejemplo el valor 21 nunca es tomado por
la variable aleatoria, pero es su valor esperado.
6.3. ESPERANZA, VARIANZA Y MOMENTOS 74
La esperanza de X es
1
Z Z 1
2 2 2
E(X) = x f (x)dx = x 2x = x =
0 3 3
0
Observe que la integral slo es relevante en el intervalo (0, 1), pues fuera de dicho intervalo
la funcin de densidad se anula.
Proposicin 6.3.1 Sea X una variable aleatoria y sea g : R R una funcin tal que g(X)
es una variable aleatoria con esperanza finita. Entonces:
Ejemplo 6.3.4 Sea X una variable aleatoria con funcin de probabilidad dada por la tabla
que aparece abajo. Encuentre la funcin de probabilidad de Y = X 2 usando la ecuacin(6.3.2).
x -1 0 1 2
f(x) 1/8 4/8 1/8 2/8
Propiedades de la esperanza
Proposicin 6.3.2 Sean X y Y variables aleatorias con esperanzas finitas y sea c una cons-
tante. Entonces
a) E(c) = c
b) E(cX) = cE(X)
c) Si X 0, entonces E(X) 0
Demostracin
a) Si X es una v.a. discreta por definicin de esperanza para caso discreto tenemos que:
Si X es una v.a. continua por definicin de esperanza para caso continuo tenemos que:
Z Z
E(c) = c f (x)dx = c f (x)dx = c
b) Si X es una v.a. discreta por definicin de esperanza para caso discreto tenemos que:
Si X es una v.a. continua por definicin de esperanza para caso continuo tenemos que:
Z Z
E(cX) = (cx) f (x)dx = c x f (x)dx = cE(X)
6.3. ESPERANZA, VARIANZA Y MOMENTOS 76
c) Este inciso es muy evidente pues cuando se cumple la hiptesis (E(X) 0), en la
integral o suma correspondiente solo aparecern trminos que son no negativos.
Oservaciones:
6.3.2. Varianza
Definicin 6.3.2 (Varianza)
La varianza de una variable aleatoria X, denotada por Var(X), se define como la siguiente
esperanza, si sta existe,
[x E(X)]2 f (x) si X es una v.a. discreta
x
Var(X) = E[X E(X)]2 = Z
[x E(X)]2 f (x)dx si X es una v.a. continua
La varianza es una medida del grado de dispersin de los diferentes valores tomados por
la variable aleatoria. Se le denota regularmente por la letra 2 (sigma cuadrada). A la raz
cuadrada positiva de la varianza, esto es , se le llama desviacin estndar. Nuevamente la
anterior suma o integral puede no existir y en ese caso decimos que la variable aleatoria
no tiene varianza finita. Observemos que para calcular Var(X) necesitamos conocer primero
E(X). Veamos algunos ejemplos sencillos.
x -1 0 1 2
f(x) 1/8 4/8 1/8 2/8
6.3. ESPERANZA, VARIANZA Y MOMENTOS 77
1
Recordemos primeramente que por clculos previos, E(X) = . Aplicando la definicin de
2
varianza para v.a. discreta Var(X) = [x E(X)]2 f (x), tenemos que:
x
1 2 1 1 2 4 1 2 1 1 2 2
Var(X) = 1 + 0 + 1 + 2 =1
2 8 2 8 2 8 2 8
Ejemplo 6.3.6 Calcularemos la varianza de la variable aleatoria continua X con funcin de
densidad f (x) = 2x para x (0, 1) y cero en otro caso. En un clculo previo habamos encon-
2
trado que E(X) = . Aplicando la definicin de varianza para una v.a. continua Var(X) =
Z 3
2
[x E(X)] f (x)dx, tenemos que
Z 1 Z 1
2 2 8 8 x4 8 4 1 1
Var(X) = x 2xdx = 2x3 x2 + x dx = x3 + x2 =
0 3 0 3 9 2 9 9 0 18
Propiedades de la varianza
Ahora enunciamos algunas propiedades de la varianza.
Proposicin 6.3.3 Sean X y Y dos variables aleatorias, y sea c una constante. Entonces
a) Var(X) 0
b) Var(c) = 0
c) Var(cX) = c2Var(X)
d) Var(X + c) = Var(X)
f) Var(X +Y ) 6= V (X) +V (Y )
Demostracin
a) Este inciso es evidente a partir de la definicin de varianza pues en ella aparece una
suma o integral de trminos no negativos.
b) Para este inciso la constante c es una v.a. con un nico valor, de modo que E(c) = c,
entonces
Var(X) = E(c c)2 = E(0)2 = E(0) = 0
= E(X 2 ) [E(X)]2
f) Finalmente para demostrar la propiedad (f) es suficiente dar un ejemplo. Puede tomarse
el caso Y = X, en general y por lo demostrado antes, se tiene que
Observacin:
Nota: En este curso no entraremos en detalles con respecto a las v.a. independientes por
eso no demostraremos las propiedades que este hecho implica en la esperanza y la varianza
de la suma de v.a. de este tipo mencionadas anteriormente.
6.3.3. Momentos
Los momentos de una variable aleatoria son nmeros que representan algunas caracters-
ticas de la distribucin de probabilidad asociada. Bajo ciertas condiciones el conjunto de
momentos determinan de manera nica a la distribucin de probabilidad. A continuacin
definiremos los momentos si existen de una variable aleatoria alrededor del origen y alrede-
dor de la media tambin llamada momento central.
Ejemplo 6.3.7 Sea la variable aleatoria discreta X con funcin de probabilidad dada por la
siguiente tabla.
x 0 1 2
f(x) 1/4 2/4 1/4
a) Hallar el primer, segundo y tercer momento alrededor del origen
b) Calcular el primer, segundo y tercer momento alrededor de la media
Ejemplo 6.3.8 Una variable aleatoria X tiene funcin de densidad de probabilidad dada por:
x
si 0 < x < 2
2
f (x) =
0 en otro caso
a) Hallar el primer, segundo y tercer momento alrededor del origen
b) Calcular el primer y segundo momento alrededor de la media
Ejemplo 6.4.1 Sea X la variable aleatoria discreta del ejemplo 6.3.7, es decir, con funcin de
probabilidad dada por la tabla.
x 0 1 2
f(x) 1/4 2/4 1/4
Ejemplo 6.4.2 Una variable aleatoria X tiene funcin de densidad de probabilidad dada por:
2x
2e si x 0
f (x) =
0 en otro caso
2 2
= e(2t)x =
(2 t) 0 2t
(tX)k
k
t
MX (t) = E = E(X k )
k=0 k! k=0 k!
d
t k1
t k1
MX (t) = E(X k ) = E(X k1 X) = E(XetX )
dt k=1 (k 1)! k=1 (k 1)!
6.4. FUNCIN GENERADORA DE MOMENTOS 82
d2
t k2 k
t k2
2
MX (t) = E(X ) = E(X k2 X 2 ) = E(X 2 etX )
dt k=2 (k 2)! k=2 (k 2)!
..
.
dn
t kn k
t kn
M X (t) = E(X ) = E(X kn X n ) = E(X n etX )
dt n k=n (k n)! k=n (k n)!
Por lo que finalmente
dn
MX (0) = E(X n )
dt n
Ejemplo 6.4.3 Tomemos nuevamente a la variable aleatoria discreta X del ejemplo 6.4.1
junto con su funcin generadora de momentos y calculemos los cuatro primeros momentos
de la variable alrededor del origen. Entonces
et + et + 1
MX (t) =
2
d
e2t + et 1+1
E(X) = Mx (t) = = =1
dx t=0 2 t=0 2
d2
2e2t + et 2+1 3
E(X 2 ) = 2 Mx (t) = = =
dx t=0 2 t=0 2 2
d 3 2t
4e + e t 4+1 5
E(X) = 3 Mx (t) = = =
dx t=0 2 t=0 2 2
d 4 2t
8e + e t 8+1 9
E(X) = 4 Mx (t) = = =
dx t=0 2 t=0 2 2
Ejemplo 6.4.4 Tomemos ahora la variable aleatoria continua X del ejemplo 6.4.2 junto con
su funcin generadora de momentos y calculemos los cuatro primeros momentos de la vari-
able alrededor del origen. Entonces
2
MX (t) =
2t
d
2 2 1
E(X) = Mx (t) = 2 = 2=
dx t=0 (2 t) t=0 2 2
d2
4 4 1
E(X 2 ) = 2 Mx (t) = 3 = 3=
dx t=0 (2 t) t=0 2 2
d3
12 12 3
E(X) = 3 Mx (t) = 4 = 4 =
dx t=0 (2 t) t=0 2 4
d4
48 48 3
E(X) = 4 Mx (t) = 5 = 5 =
dx t=0 (2 t) t=0 2 2
Proposicin 6.4.2 Si X1 , X2 , . . . , Xn son v.a. independientes entonces
n
M n (t) = MXi (t)
Xi i=1
i=1
6.5. PROBLEMAS 83
Demostracin
Por definicin de funcin generadora de momentos se tiene que
n
Xit n n n
Xi t Xi t
M n (t) = E e i=1 = E e = E(e ) = MXi (t)
Xi i=1 i=1 i=1
i=1
Notese que para esta demostracin utilizamos la propiedad de la esperanza para v.a. in-
dependientes.
6.5. Problemas
Variables Aleatorias
1. Determine en cada caso si la variable aleatoria en cuestin es discreta o continua.
Cules son sus posible valores?
a) Tiempo de vida de una persona escogida al azar.
b) Nmero de errores tipogrficos en una pgina escogida al azar de un libro.
c) Tiempo de servicio en una transaccin escogida al azar realizada por una persona
en un cajero automtico.
d) Monto de una reclamacin por accidente automovilstico escogida al azar del
conjunto de reclamaciones efectuadas a una compaa aseguradora.
2. Considere el experimento aleatorio de escoger un nmero al azar dentro del intervalo
unitario (0, 1). Suponga que cada resultado de este experimento se escribe en su expan-
sin decimal como = 0, x1 x2 x3 . . . . Determine en los siguientes casos el conjunto de
valores de la variable aleatoria definida y clasifique sta como discreta o continua.
a) X() =
b) X() = x1
c) X() = 1
d) X() = 0, 0x1 x2 x3 . . .
3. Considere un experimento aleatorio con espacio muestral equiprobable = {1, 2, 3, 4, 5, 6}.
Defina la variable aleatoria X() = 2( 3). Cules son los posibles valores de X?.
Calcule P(X = 0), P(X {2, 3}), P(X 0), P(X < 0), P(X 2 = 1), P(2X 4 = 0), y
P(X 2 = 4).
4. Considere el ejemplo del experimento aleatorio de lanzar un dardo en un tablero circu-
lar de radio p
uno, Figura 1.13, junto con las variables aleatorias X(x, y) = x,Y (x, y) = y
y Z(x, y) = x2 + y2 . Suponga que para cada regin A cuya rea puede ser calcu-
rea(A)
lada se define por P(A) = .
rea()
1 1 1
Calcule P(X 0), P(X < 0), P(X +Y 1), P(Y > X), P Z < yP <Z< .
2 3 2
6.5. PROBLEMAS 84
3. Encuentre el valor de la constante c para que f (x) sea una funcin de probabilidad.
Grafique esta funcin y calcule P(X 2, 3, 4) y P(X < 3) en cada caso.
cx si x = 1, 2, . . . , 10
a) f (x) =
0 en otro caso
2
cx si x = 1, 2, . . . , 10
b) f (x) =
0 en otro caso
4. Determine si la siguiente funcin es de probabilidad. Grafique la funcin y justifique
su respuesta.
1
si x = 0, 1
6
f (x) = 2
si x = 2
3
0 otro caso
x -1 0 1
f(x) 0,2 0,3 0,5
11. Dadas las variables aleatorias con funciones de probabilidad dada por las tablas
x 0 1 2 3 4
f(x) 1/210 4/35 3/7 8/21 1/14
x 2 3 4 5 6 7 8 9 10 11 12
f(x) 1/36 1/18 1/12 1/9 5/36 1/6 5/36 1/9 1/12 1/18 1/36
12. Sea X una v.a. discreta con funcin de probabilidad dada por la tabla que aparece abajo.
Grafique f (x). Calcule la funcin de probabilidad de las siguientes variables aleatorias
Y = X 2 , Z = |X| y W = 2X 5. Grafique en cada caso.
x -2 -1 0 2 3 5
f(x) 0,1 0,15 0,4 0,1 0,15 0,1
13. Sea X discreta con funcin de probabilidad dada por la tabla que aparece abajo. En-
cuentre el valor de c y grafique f (x). Calcule y grafique la funcin de probabilidad de
la variable Y = X 2 .
x -2 0 2
f(x) 0,1 c 0,1
14. Sea X una variable aleatoria con la siguiente funcin de distribucin. Encuentre y
grafique f (x). Calcule P(0 X < 10).
1 x+1
1 si x = 0, 1, 2, 3, . . .
F(x) = 2
0 otro caso
18. El tiempo en minutos que una persona espera un autobs es una v.a. con funcin de
densidad dada por 1
2 si 0 < t < 1
f (t) = 1
4 si 2 < t < 4
0 para otro valor de t
Hallar la probabilidad de que el tiempo en que la persona que espera el autobs sea de
a) mayor de 3 minutos
b) entre 1 y 2 minutos
c) menor de 3 minutos
Hallar:
a) la constante c
b) la funcin de distribucin
1 3
c) P(X > 2) y P <X <
2 2
20. Sea X una variable aleatoria con la funcin de distribucin que aparece abajo. Es X
discreta o continua? Grafique F(x). Encuentre y grafique la correspondiente funcin
de densidad f (x). Calcule adems P(X = 2) y P(1 < X < 2).
0 para x < 1
1
F(x) = si 1 x < 2
3
1 para x 2
21. Sea X una variable aleatoria con la funcin de distribucin que aparece abajo. Es X
discreta o continua? Grafique F(x). Encuentre y grafique la correspondiente funcin
1 1
de densidad f (x). Calcule adems P(X = ) y P(X > ).
2 2
0 para x < 0
F(x) = x si 0 x < 1
1 para x 1
6.5. PROBLEMAS 88
22. Una urna contiene cuatro bolas numeradas 1, 2, 3 y 4. Se extraen dos bolas al azar, una
a la vez y sin reemplazo. Sea X la variable aleatoria que denota la suma de los nmeros
de las dos bolas seleccionadas.
a) Determine
b) Calcule y grafique f (x)
c) Calcule y grafique F(x)
d) Calcule P(X 6), P(3 < X 5) y P(X = 6)
Esperanza, varianza, momentos y funcin generadora de momentos
1. Sea a un nmero fijo. Construya una variable aleatoria X tal que E(X) = a.
2. Calcule la esperanza de la variable aleatoria discreta X cuya funcin de probabilidad
es
1
si x = 0, 1
3
a) f (x) = 1
si x = 2, 3
6
0 otro caso
1
si x = 1, 1
4
b) f (x) = 1
si x = 0
2
0 otro caso
7. Encuentre la esperanza y luego demuestre que la varianza de una variable aleatoria con
la siguiente funcin de densidad no existe.
2
3 para x > 1
f (x) = x
0 para x 1
a) Var(E(X)) = 0
b) E(Var(X)) = E(X)
14. Sea X una variable aleatoria continua con funcin de densidad f (x) = 12e|x| , para
< x < . Demuestre que f (x) es efectivamente una funcin de densidad y com-
pruebe que
a) E(X) = 0
b) E(X 2 ) = 2
c) Var(X) = 2
d) E(X n ) = n! para n par
a) E(X) = E(X)
b) Var(X) = Var(X)
c) E(Var(X)) = Var(E(X))
0 = Var(0)
= Var(X + (X))
= Var(X) +Var(X)
= Var(X) +Var(X)
= 2Var(X)
Captulo 7
Distribuciones de probabilidad
Demostracin
a) A partir de la definicin de esperanza se tiene que
E(X) = x f (x) = 0 (1 p) + 1 p = p
x
91
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 92
Ejemplo 7.1.1 Considere el experimento aleatorio de lanzar una moneda al aire. Calcula la
esperanza, la varianza y la funcin generadora de momentos.
Suponga que 1 = cara y 2 = cruz son los dos resultados posibles, con probabilidades
1 1
p = y 1 p = , respectivamente. Sea X la variable aleatoria dada por X(1 ) = 1, y
2 2 1
X(2 ) = 0. Entonces X tiene distribucin Ber , por lo tanto
2
1
E(X) = p =
2
1 1 1
Var(X) = p(1 p) = (1 ) =
2 2 4
1 1 1
MX (t) = 1 + et = (1 + et )
2 2 2
= {(EEE . . . E), (FEE . . . E), (FFE . . . E), . . . , (FFF . . . FE), (FFF . . . F)}
Usando el principio multiplicativo, es fcil ver que este conjunto tiene 2n elementos.
Si ahora se define la variable aleatoria X como el nmero de xitos en cada una de estas
sucesiones, esto es
entonces X toma los valores 0, 1, . . . , n, y se dice que X tiene una distribucin binomial con
parmetros n y p. Se escribe X bin(n, p), y su funcin de probabilidad es
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 93
n!
px (n p)1x si x = 0, 1, . . . , n
x!(n x)!
f (x) =
0 para otro caso
Demostracin
Ejemplo 7.1.2 El experimento consiste en lanzar cuatro veces al aire una moneda. Nuestro
inters es el nmero de caras obtenidas en los cuatro lanzamientos. Como es evidente, la
probabilidad de obtener un xito ( cara ), en una de las pruebas ( lanzamiento ) es 0,50 y la
de obtener un fracaso es tambin 0,50.
a) La probabilidad de no obtener caras en los cuatro lanzamientos es P(X = 0), esto es,
4! 1 4 1
P(X = 0) = =
0!(4 0)! 2 16
b) La probabilidad de obtener dos caras en los cuatro lanzamientos es P(X = 2), esto es,
4! 1 4 6 3
P(X = 2) = = =
2!(4 2)! 2 16 8
x 0 1 2 3 4
p(x) 1/16 4/16 3/8 1/4 1/16
1
E(X) = 4 =2
2
1 1
Var(X) = 4 = 1
2 2
1 1 4 1
MX (t) = 1 + et = (et + 1)4
2 2 16
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 95
Demostracin
a) A partir de la definicin de esperanza se tiene que
x1
e x e x e
E(X) = x x!
= = =
x=0 x=1 (x 1)! x=1 (x 1)!
b) Segn una de las propiedades de la varianza se tiene, Var(X) = E(X 2 ) [E(X)]2 , en-
tonces calculemos primero E(X 2 )
e x e x e x
E(X 2 ) = x2 x!
= x = (x 1 + 1)
x=0 x=1 (x 1)! x=1 (x 1)!
x1
e x e x e x e
= (x 1) + = +
x=1 (x 1)! x=1 (x 1)! x=2 (x 2)! x=1 (x 1)!
x1
e x2 e
= 2 + = 2 +
x=2 (x 2)! x=1 (x 1)!
Entonces:
Var(X) = 2 + 2 =
c) Por la definicin de funcin generadora de momentos, se tiene que
e x (et )x t t
MX (t) = etx x!
= e = e ee = e(e 1)
x=0 x=0 x!
= 1 0, 7306 = 0, 2694
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 98
La distribucin de Poisson puede ser vista como un caso lmite de la distribucin bino-
mial, es decir, una distribucin binomial en la que n y p 0 se puede aproximar
por una distribucin de Poisson de parmetro = np.
Ejemplo 7.1.4 En una central telefnica automtica la probabilidad de que una lla-
mada sea conectada errneamente es 103 .
Desarrollo
enp (np)0
1 0, 9
0!
0, 1 enp
ln|0, 1| np
n 2303 llamadas
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 99
El nombre de esta distribucin proviene del hecho de que cuando escribimos la suma
de todas las probabilidades, obtenemos una suma geomtrica. La inspeccin sucesiva de
artculos hasta encontrar una defectuoso, posiblemente en un proceso de control de calidad,
puede modelarse usando una distribucin geomtrica.
Proposicin 7.1.4 Si X es la v.a. que muestra el nmero de fracasos antes del primer xito
esto es; X geo(p) entonces:
(1 p)
a) E(X) =
p
(1 p)
b) Var(X) =
p2
p 1
c) MX (t) = t
, con t < ln
1 e (1 p) 1 p
Demostracin
d d h i
= p(1 p) [(1 p)x ] = p(1 p) (1 p)x
x=1 d p d p x=1
d 1 (1) 1 p
= p(1 p) 1 = p(1 p) 2 =
dp p p p
b) Segn una de las propiedades de la varianza se tiene, Var(X) = E(X 2 ) [E(X)]2 , en-
tonces calculemos primero E(X 2 )
2
E(X 2 ) = x p(1 p) = p x (1 p) = p(1 p) x2 (1 p)x1
x 2 x
x=0 x=1 x=1
d d h i
= p(1 p) [x(1 p)x ] = p(1 p) x(1 p)x
x=1 d p d p x=1
d h1 x
i d h1 pi
= p(1 p)
d p p x=1
px(1 p) = p(1 p)
d p p2
h p2 (1 p)2p i p 2 (1 p)(2 p)
= p(1 p) = p(1 p) =
p4 p3 p2
Entonces:
(1 p)(2 p) (1 p)2 1 p
Var(X) = = 2
p2 p2 p
c) Por la definicin de funcin generadora de momentos, se tiene que
p 1
tx x t x
MX (t) = e p(1 p) = p [e (1 p)] = t
con t < ln
x=0 x=0 1 e (1 p) 1 p
1
Observacin: Recordar que una serie geomtrica es de la forma rx1 y converge a 1 r
x=1
si su radio r cumple con la condicin |r| < 1
Ejemplo 7.1.5 Supongamos que un dado ordinario (equilibrado) es lanzado repetidas veces
hasta que aparece el resultado 1 por primera vez. Calcular
a) obtener la distribucin de probabilidad de la v.a. que se ajuste a este experimento y
calcular la probabilidad de obtener el 1 en el cuarto lanzamiento
b) la esperanza, la varianza y la funcin generadora de momentos
Desarrollo
a) Sea X la v.a que represente el nmero de lanzamientos necesarios del dado para obtener
por primera vez el resultado 1. Entonces X geo(P = 16 ), con lo cual
x
16 56 si x = 0, 1, 2, . . .
P(X = x) =
0 para otro caso
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 101
Por lo que
1 5 3 125
P(X = 3) = 1 =
6 6 1296
b) Segn la proposicin 7.1.4 se tiene que
1 16
E(X) = 1
=5
6
1 1
V (X) = 52 = 30
1
6
1
1
MX (t) = 6 =
1 et 1 16 6 5et
con lo cual
n1
P(An ) = pr (1 p)nr (7.1.1)
r1
Si decimos que X es la v.a. que cuenta el nmero de fracasos antes de obtener el r-simo
xito, entonces X puede tomar los valores del conjunto {0, 1, 2, . . . }. Adems recordemos
que n por definicin de An es nmero de fracasos (x) ms nmero de xitos (r), esto es
n = x + r. Entonces se entiende la v.a. X podra caracterizar numricamente al suceso An
como X(An ) = x, por lo que tendremos;
Proposicin 7.1.5 Si X es la v.a. que muestra el nmero de fracasos antes del r xito esto
es; X bin neg(r, p) entonces:
r(1 p)
a) E(X) =
p
r(1 p)
b) Var(X) =
p2
h p ir 1
c) MX (t) = t
, con t < ln
1 e (1 p) 1 p
Demostracin
Si X es la v.a que cuenta el nmero de fracasos antes del r-simo xito en sucesin
r
de pruebas de Bernoulli; entonces X = Xi, donde todas las v.a. Xi son independientes
i=1
1 p 1 p
entre si y cada Xi geo(p), i = 1, 2, . . . , r; con lo cual E(Xi ) = ,Var(Xi ) =
p p2
p
y MXi (t) = . Esto resulta del hecho de que para cada xito se tubo que haber
1 et (1 p)
tenido un cierto nmero de fracasos, que es la caracterstica de la distribucin geomtrica.
Entonces
a) la esperanza de X es
r r r
1 p r(1 p)
E(X) = E i i p = p
X = E(X ) =
i=1 i=1 i=1
b) la varianza de X es
r r r
1 p r(1 p)
Var(X) = Var Xi = Var(Xi ) = 2
=
p2
i=1 i=1 i=1 p
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 103
Ejemplo 7.1.6 Se lanza repetidas veces una moneda honesta, cuyos dos resultados son cara
y cruz.
a) Cul es la probabilidad de obtener la tercera cruz en el quinto lanzamiento?
b) Obtener la esperanza, varianza y la funcin generadora de momentos para esta dis-
tribucin
Desarrollo
a) Sea X la v.a. que represente el nmero de caras (fracasos) necesarias astes de obtener
por tercera vez cruz. Entonces X bin neg(3, 21 ), con lo cual
2+x 3 x
1 1
si x = 0, 1, 2, . . .
x
2 2
P(X = x) =
0 para otro caso
Por lo que
1 5
2+2 1 3 1 2 6
P(X = 2) = =6 = = 0, 1875
2 2 2 2 32
Proposicin 7.1.6 Dada una poblacin finita de tamao N con dos clases posibles de objetos.
Si X es la v.a. que muestra el nmero de objetos de la primera clase contenidos en una muestra
de tamao n seleccionada de dicha poblacin entonces X hipergeo(N, k, n) y presenta las
siguientes caracteristicas:
nk
a) E(X) =
N
nk k N n
b) Var(X) = 1
N N N 1
Demostracin
Como primer paso seleccionemos n objetos de la poblacin de tamao N que contiene
n
k objetos de una primera clase y N k objetos de la segunda clase. Definamos a X = Xi
i=1
como la v.a aleatoria que cuenta el nmero de objetos de la primera clase en la muestra
seleccionada; en donde cada Xi , i = 1, 2, . . . , n es una v.a que presenta las siguientes carac-
tersticas:
Xi = 1 si se selecciona un objeto de la primera clase en la i-sima extraccin
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 105
b) la varianza de X es
n
Var(X) = Var i = E(X 2) E(X)
X
i=1
calculemos entonces:
k N k k1 N k
2
n x x
x nx nk n x1 nx
E(X ) =
2 =
x=0
N N x=1 N 1
n n1
k1 N k
n (x 1 + 1)
nk x1 nx
=
N x=1
N 1
n1
k2 N k k1 N k
" #
nk (k 1)(n 1) n x2 nx
n
x1 nx
=
N N 1
N 2
+
N 1
x=2 x=1
n2 n1
" # " #
nk (k 1)(n 1) nk (k 1)(n 1) + N 1
= +1 =
N N 1 N N 1
Por lo tanto
" # " #
nk (k 1)(n 1) + N 1 nk 2 nk N 2 (k + n)N + nk
Var(X) = =
N N 1 N N N(N 1)
nk N k N n
=
N N N
7.1. DISTRIBUCIONES DISCRETAS DE PROBABILIDAD 106
Ejemplo 7.1.7 Supngase que una urna contiene cinco bolas rojas y diez azules. Si se selec-
cionan bolas de la urna sin reemplazamiento; sea X la v.a que cuenta el nmero de bolas rojas
extraidas. Si se extraen al azar sin reemplazamiento siete bolas
Desarrollo
Como X es la v.a que cuenta el nmero de bolas rojas extraidas en un muestreo sin reem-
plazmiento; se tiene que X hipergeo(15, 5, 7). Por lo tanto
! !
5 10
x 7x
15
! si x = 0, 1, 2, 3, 4, 5
P(X = x) =
7
0 para otro caso
a) Para contestar la pregunta de este item basta calcular P(X = 4), esto es;
5 10
4 3 5 120 40
P(X = 4) = = =
15 6435 429
7
b) Para contestar esta parte debemos calcular P(X 3); que equivale a decir,
Por lo tanto
5 10 5 10 5 10
3 4 4 3 5 2 140 40 1 61
P(X 3) = + + = + + =
15 15 15 429 429 143 143
7 7 7
75 7
E(X) = =
15 3
7 5 15 5 15 7 8
V (X) = =
15 15 15 1 9
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 107
Proposicin 7.2.1 Sea X la v.a. continua con distribucin uniforme en el intervalo (a, b),
entonces X tiene las siguientes caractersticas
a+b
a) E(X) =
2
(b a)2
b) Var(X) =
12
ebt eat
c) MX (t) =
(b a)t
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 108
0 si x > a
x
d) F(x) = si a x < b
ba
1 si x b
Demostracin
Como X es una v.a. continua con distribucin uniforme en el intervalo (a, b) entonces su
funcin de densidad de probabilidad es
1
si a < x < b
f (x) = ba
0 en otro caso
con lo cual
a) por definicin de esperanza para v.a. continua
Z Z b b
1 1 1 a+b
E(X) = x f (x)dx = x dx = x2 = (b2 a2 ) =
a ba 2(b a) a 2(b a) 2
1 h a + b 3 a + b 3 i 1 h b a 3 a b 3 i
= b a =
3(b a) 2 2 3(b a) 2 2
1 (b a)2 (b a)2
= =
3 4 12
c) por defincicin de funcin generadora de momentos
Z Z b b ebt eat
1 1 1
MX (t) = etx dx = etx dx = etx =
ba ba a t(b a) a (b a)t
Ejemplo 7.2.1 Supongase que tenemos una cuerda de 2m de longitud que queremos cortar
por un punto al azar a una cierta distancia de uno de los extremos. Sea X la v.a. que represente
el punto elegido; entonces
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 109
a) Como el rea debe ser 1, la altura del rectngulo ser 12 , entonces la funcin de densidad
es:
1
si 0 < x < 2
f (x) = 2
0 en otro caso
Definicin 7.2.2 Decimos que una v.a. X tiene distribucin de probabilidad normal si su
funcin de densidad de probabilidad est definida por la siguiente ecuacin:
1 1 x 2
f (x) = e 2 ( ) , para < x <
22
en donde R y > 0 son los parmetros. Escribimos entonces X N(, 2 ). La grfica de
esta funcin de densidad tiene forma de campana como se puede apreciar en la Figura 7.6, en
donde se muestra adems el significado geomtrico de los dos parmetros.
Figura 7.6: Representacin grfica de f (x) para ciertos valores de y 2 de una variable
aleatoria normal.
No es inmediato pero es posible demostrar que E(X) = , y ello significa que la campana
esta centrada en este valor, el cual puede ser negativo, positivo o cero. Tambin puede de-
mostrarse que Var(X) = 2 , y que la distancia del punto a cualquiera de los dos puntos en
donde la funcin tiene puntos de inflexin es , por lo tanto la campana se abre o se cierra de
acuerdo a la magnitud de este parmetro. El papel que desempean y puede apreciarse
en la grfica 7.7.
Si las curvas tienen iguales sus medias pero diferentes varianzas entonces las curvas es-
tarn centradas en la misma posicin y tendrn diferentes formas; tal como lo muestra
la Figura 7.8.
Figura 7.8: Curvas normales que tienen medias iguales y desviaciones estndar diferentes
Si las curvas tienen desviaciones estndar iguales y medias diferentes, las curvas sern
idnticas pero centradas en diferentes posiciones sobre el eje horizontal, as como lo
muestra la Figura 7.9.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 113
Figura 7.9: Curvas normales que tienen medias diferentes y desviaciones estndar iguales
Si las curvas tienen medias diferentes y tambin sus desviaciones estndar son difer-
entes entonces aparte de estar centradas en diferentes lugares del eje x, tendr formas
diferentes; as como lo muestra la Figura 7.10.
Figura 7.10: Curvas normales que tienen medias diferentes y desviaciones estndar diferentes
Proposicin 7.2.2 Sea X una variable aleatoria con distribucin normal con parmetros
y 2 . Entonces la siguiente variable aleatoria tiene una distribucin normal estndar
X
Z= (7.2.3)
Demostracin
Para probar que Z sigue una distribucin normal estandar debemos mostrar que E(Z) = 0
y Var(Z) = 1. Recordemos adems que si X N(, 2 ) entonces E(X) = y Var(X) = 2 .
Para realizar la demostracin de esta proposicin recordemos adems las propiedades de la
esperanza y la varianza de una v.a. Por lo tanto
X 1 1 1
E(Z) = E = E(X ) = [E(X) ] = [ ] = 0
x 1 1 1
Var(Z) = Var = 2 Var(X ) = 2 Var(X) = 2 2 = 1
A la operacin anterior se le conoce con el nombre de estandarizacin, y bajo tal transfor-
macin se dice que la variable X ha sido estandarizada. Es comn usar la letra Z para denotar
una variable aleatoria con distribucin normal estndar, y seguiremos nosotros tambin esa
costumbre.
La proposicin anterior parece muy modesta pero tiene una gran importancia opera-
cional pues establece que el clculo de las probabilidades de una variable aleatoria normal
cualquiera se reduce al clculo de las probabilidades para la normal estndar. Explicaremos
esta situacin con ms detalles. Suponga que X es una variable aleatoria con distribucin
N(, 2 ), y que deseamos calcular, por ejemplo, P(a < X < b), para a < b nmeros dados.
Tenemos entonces que
a X b
P(a < X < b) = P(a < X < b ) = P < <
por lotanto
a b
P(a < X < b) = P <Z<
La igualdad de estas probabilidades es consecuencia de la igualdad de los eventos. De
esta forma una probabilidad que involucra a la variable X se ha reducido a una probabilidad
que involucra a una variable Z.
Ejemplo 7.2.2 Los coeficientes intelectuales de 600 aspirantes de cierta universidad se dis-
tribuyen aproximadamente de forma normal con una media de 115 y una desviacin estndar
de 12. Si se selecciona un aspirante al azar, encuentre la probabilidad de que:
a) tenga un coeficiente mayor de 120
Desarrollo
Segn las condiciones del problema la v.a. X representa el coeficiente intelectual del
estudiante elegido y adems X N(115, 144).
Para calcular las probabilidades de los distintos itens debemos transformar esta distribu-
cin normal en una distribucin normal estndar (con media cero y desviacin estndar 1),
x 115
para lo cual hay que cambiar el valor de x por un valor z con la frmula z = . Entonces
12
la probabilidad de que:
120 115
a) tenga un coeficiente mayor de 120 es: P(X > 120) = P Z > = P(Z > 0, 41)
12
La distribucin ya transformada se observa en el siguiente grfico:
Se busca el valor del rea para 0 Z 0, 41 en la tabla de reas bajo la curva normal
estandar; que corresponde al valor 0,1591. Como el rea a la derecha del valor z = 0, 41
es el que corresponde a la probabilidad pedida, entonces la probabilidad de que un
aspirante a la universidad tenga un coeficiente intelectual mayor de 120 es:
P(X < 100) = P(Z < 1, 25) = 0, 5 A(1, 25) = 0, 5 0, 3944 = 0, 1056
Se busca el valor del rea para 0 Z 0, 58 en la tabla de reas bajo la curva normal
estandar, que es el valor 0,2190. Y como el rea a la izquierda del valor z = 0, 58 es el
rea que buscamos, entonces el resultado a buscar es:
Se busca el valor del rea para 0 Z 0, 83 en la tabla de reas bajo la curva normal
estandar, que es el valor 0,2967. Y como el rea a buscar es el rea entre z = 0 y z = 0, 83,
entonces el resultado a buscar es:
Recordemos que en la tabla de reas bajo la curva normal no se tabulan valores neg-
ativos de z y que la distribucin normal es simtrica; estos A(z) = A(z). Se busca el
valor del rea para 0 Z 2, 14 en la dicha tabla, que corresponde al valor 0,48382.
Y como el rea a la izquierda del valor z = 2, 14 es el rea que buscamos, entonces el
resultado a buscar es:
b) P(X = 35)
En este caso se pide una probabilidad cuando la variable aleatoria X toma un valor
exacto. En una distribucin continua la probabilidad de que la variable aleatoria sea
exactamente un determinado valor no se puede calcular y se estima que es cero, mien-
tras que en una distribucin discreta aproximada a una distribucin normal (continua)
la probabilidad de X sea igual a un valor puntual se calcula sumando y restando el fac-
tor de correccin de continuidad a dicho valor puntual y estimar el rea entre ambos
puntos.
Por lo tanto
34, 5 40 35, 5 40
P(X = 35) = P Z = P(1,12 Z 0, 92)
4, 899 4, 899
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 120
P(X = 35) = P(1, 12 Z 0, 92) = A(1, 12)A(0, 92) = 0, 36860, 3212 = 0, 0474
c) P(X 30)
Aqu se pide la probabilidad de que X tome valores desde 0 hasta 30 inclusive, como el
30 est incluido el factor de correccin de continuidad se suma. Entonces
30, 5 40
P(x 30) = P Z = P(Z 1, 94)
4, 899
Como A(1, 94) = A(1, 94); se busca el valor del rea para 0 Z 1, 94 en la tabla,
que corresponde al valor 0,4738. Y como el rea a la izquierda del valor z = 1, 94 es
el rea que buscamos, entonces el resultado a buscar es:
Definicin 7.2.3 Decimos que la variable aleatoria continua X tiene una distribucin ji-
cuadrada con k grados de libertad (k entero positivo), si su funcin de densidad est dada por
la siguiente expresin:
k
1 1 x
2k ( k ) x 2 e 2 si 0 < x <
2
f (x) =
0 si x 0
Figura 7.11: Grfica de f (x) cuando el parmetro k toma los valores 1,2,3,4 y 5
Por la definicin anterior; ji-cuadrada es una variable aleatoria continua con posibles
valores en el intervalo (0, ). Esta distribucin tiene un solo parmetro denotado aqui por
la letra k, y al cual se le llama grados de libertad. Tambin al parmetro de ji-cuadrado se
denota por la letra griega . A pesar de la aparente expresin complicada de f (x), no es difcil
comprobar que es efectivamente una funcin de densidad de probabilidad. La grfica de esta
funcin para varios valores del parmetro k aparece en la Figura 7.9.
Escribiremos simplemente X 2 (k), en donde la letra griega se pronuncia ji o
tambin chi. Puede demostrarse que E(X) = k y Var(X) = 2k. La distribucin ji-cuadrada
puede obtenerse como indican los siguientes resultados que dejaremos sin demostrar.
Es decir, el cuadrado de una variable aleatoria con distribucin normal estndar tiene
distribucin ji-cuadrada con un grado de libertad. Por otro lado, el siguiente resultado es-
tablece que la suma de dos variables aleatorias independientes con distribucin ji-cuadrada
tiene distribucin nuevamente ji-cuadrada con grado de libertad igual a la suma de los grados
de libertad de los sumandos.
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 122
Est distribucin esta estrechamente ligada con muestras aleatorias de una distribucin
normal.
la varinza 2 es desconocida.
4. Todas tienen la misma media de cero, pero sus desviaciones estndar difieren de acuer-
do al tamao de la muestra.
Definicin 7.2.5 Decimos que una variable aleatoria continua X tiene una distribucin
exponencial con parmetro > 0, y escribimos X exp(), cuando su funcin de densidad
de probabilidad es
ex si x > 0
f (x) =
0 si x 0
La grfica de esta funcin cuando el parmetro toma los valores particulares 0,5; 1,0 y
1,5 se muestra en la Figura 7.11.
La correspondiente funcin de distribucin de esta v.a. est dada por
0 si x 0
F(x) = P(X x) =
1 ex si x > 0
La grfica de esta funcin cuando el parmetro toma los valores particulares 0,5; 1,0 y
1,5 se muestra en la Figura 7.12.
Proposicin 7.2.8 Sea X la v.a. continua con distribucin exponencial, entonces X tiene las
siguientes caractersticas
1
a) E(X) =
1
b) Var(X) =
2
c) MX (t) =
t
Demostracin
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 126
Figura 7.13: Grfica de f (x) cuando el parmetro toma los valores 0,5;1,0 y 1,5
Figura 7.14: Grfica de F(x) cuando el parmetro toma los valores 0,5;1,0 y 1,5
7.2. DISTRIBUCIONES CONTINUAS DE PROBABILIDAD 127
Ejemplo 7.2.4 Suponga que el tiempo en minutos que un usuario cualquiera permanece re-
1
visando su correo electrnico sigue una distribucin exponencial de parmetro = . Calcule
5
la probabilidad de que un usuario cualquiera permanezca conectado al servidor de correo
a) menos de un minuto
b) ms de un ahora
Solucin
b) Siguiendo el mismo razonamiento del inciso anterior y teniendo en cuenta que una
hora equivale a 60 minutos se tiene que
Z
1 1x 1 1 x
P(X > 60) = e dx = 5e 5 = e12 = 6, 14 106
5
60 5 5 60
7.3. Problemas
Distribucin binomial
1. Sea X una variable aleatoria con distribucin bin(n, p) tal que E(X) = 4 y Var(X) = 2.
Cules son los valores de n y p?
2. Sea X una variable aleatoria con distribucin bin(n, p). Demuestre que la variable Y =
n X tiene distribucin bin(n, 1 p). Proporcione una explicacin probabilsta de este
resultado.
4. Se lanza una moneda equilibrada 6 veces. Calcule la probabilidad de que cada cara
caiga exactamente 3 veces.
5. Se lanza una moneda equilibrada 2n veces. Calcule la probabilidad de que ambas caras
caigan el mismo nmero de veces.
6. Sea X una variable aleatoria con distribucin bin(n, p). Demuestre que
0 Var(X) E(X)
7. Suponiendo que es igualmente probable que nazca un hombre (H) o una mujer (M), y
considerando la observacin de 6 nacimientos. Cul de los siguientes eventos es ms
probable que ocurra?
a) MHHMHM
b) MMMMHM
c) HMHMHM
9. En la ciudad la necesidad de dinero para comprar drogas se establece como la razn del
75 % de los robos. Encuentre la probabilidad de que entre los siguientes cinco casos de
robo:
10. Un prominente mdico afirma que 70 % de las personas con cncer de pulmn son
fumadores empedernidos. Si su aseveracin es correcta:
13. Un estudio examin las actitudes hacia los antidepresivos. El estudio revel que aprox-
imadamente el 70 % cree que los antidepresivos en realidad no curan nada, slo en-
cubren el problema real. De acuerdo con este estudio
a) sobrevivan exactamente 14
b) sobrevivan por lo menos 10
c) sobrevivan cuando mucho 16
d) sobrevivan entre 5 y 10
17. Harry Ohme esta a cargo de la seccin de electrnica de una gran tienda departamental.
Se has dado cuenta de que la probabilidad de que un cliente que solamente se encuen-
tra curioseando compre algo es de 0,3. Suponga que 15 clientes visitan la seccin de
electrnica cada hora.
a) Cual es la probabilidad de que almenos una de las personas que curiosea compr
algo durante una hora dada?
b) Cual es la probabilidad de que almenos cuatro personas que curiosean compre
algo durante una hora dada?
c) Cual es la probabilidad de que ninguna de las personas que curiosean compre
algo durante una hora dada?
d) Cual es la probabilidad de que no mas de cuatro personas que curiosean compre
algo durante una hora dada?
18. Un aparato de radio que no funciona se agrupa accidentalmente con 5 radios que fun-
cionan. Cual es la probabilidad de que se escoja un conjunto de tres radios, el aparato
que no funciona este entre los tres escogidos?
19. Una abogada especializada en litigios por drogas estima que gana el 70 % de sus casos
que van a la corte. Acaba de leer Drogas: Un caso para legalizacin en el nmero
del 3 de octubre de 1989 y quiere usar parte de los argumentos del artculo en su
prximo juicio. Considere su probabilidad de xito estimado, si actualmente representa
a 5 acusados en distintos casos. Cul es la probabilidad de qu:
22. Un complejo sistema electrnico esta construido con cierto nmero de componentes de
apoyo en sus subsistema. Un subsistema contiene cuatro componentes idnticos, cada
uno con una probabilidad de 0,2 de fallar en menos de 1000 hs. El subsistema funciona
si dos componentes cualesquiera de los cuatro trabajan en forma adecuada. Se suponen
que los componentes operan independientemente.
7.3. PROBLEMAS 132
24. Un examen de opcin mltiple esta compuesto de 15 preguntas, con cinco respuestas
posibles cada una, de las cuales solamente una es la correcta. Supngase que uno de
los estudiantes que realiza el examen contesta las preguntas al azar. Cual es la proba-
bilidad de que conteste al menos 10 preguntas correctamente?
25. Un sistema para detectar incendios utiliza tres celdas sensibles a la temperatura que
actan independientemente, talque una o ms pueden activar la alarma. Cada celda
tiene una probabilidad p = 0, 8 de activar la alarma al alcanzar la temperatura de 100
grados Celsius o ms. Sea Y el numero de celdas que activan la alarma cuando la
temperatura alcanza 100 grados. Encuentre la probabilidad de que la alarma funcione
cuando la temperatura alcanza los 100 grados.
26. Suponga que un lote de produccin de 40000 hornos de microondas incluye 32000 sin
ningn defecto, que no requieren en absoluto ningn ajuste. Sin embargo el departa-
mento de control de calidad, sin conocer el dato referente al lote de produccin, toma
una muestra aleatoria de 10 hornos para calcular la calidad global.
28. Una cadena de moteles ha adoptado la poltica de hacer un descuento del 3 % a los
clientes que paguen en efectivo en vez de hacerlo con tarjeta de crdito. Su experiencia
indica que el 30 % de los clientes aceptan el descuento. Sea Y el nmero de personas
que aceptan el descuento entre los prximos 20 clientes.
29. Un fabricante de medicamentos afirma que solo el 10 % que resultan efectivas en las
pruebas con animales pasan el resto de las que se le exige para su comercializacin.
Actualmente, el fabricante tiene 8 nuevos medicamentos de probada efectividad en
experimentos con animales y que esperan pasar en las siguientes pruebas.
30. Una compaa pequea utiliza un servicio de paquetera para enviar los pedidos de
quesos especiales que son para obsequios. La compaa ha encontrado que el 90 %
de los paquetes se entregan a tiempo. Se enva un embarque de 20 paquetes. Sea Y =
nmero de paquetes embarcados a tiempo. Suponiendo que las hiptesis binomiales se
cumplen calcular:
31. La revista Statistical Adstrac (U.S) informa que la mediana del ingreso familiar en
Estados Unidos durante 1985 fue 27755 dlares. En cuatro familias seleccionadas al
azar, calcular la probabilidad de que:
32. Entre personas que donan sangre en una clnica, 80 % tienen RH+, es decir el factor
Rhesus en su sangre. Cinco personas donan sangre en al clnica en determinado da.
a) Calcular la probabilidad de que al menos una de las cinco no tenga el factor RH+.
b) Calcular la probabilidad de que cuando mucho 4 de las 5 tenga sangre del tipo
RH+.
7.3. PROBLEMAS 134
Distribucin Geomtrica
1. Considere una urna con 3 bolas negras y 5 bolas blancas. Se escoge una bola al azar,
se registra su color, y despues se regresa a la urna. Cuntas extracciones en promedio
se necesitan realizar hasta obtener una bola negra por primera vez?
2. Sea X una variable aleatoria con distribucin geo(p). Demuestre que para cualesquiera
a, b = 0, 1, 2, . . . se cumple la siguiente propiedad llamada de prdida de memoria:
P(X a + b|X a) = P(X b).
Distribucin Poisson
1. Sea X una variable aleatoria con distribucin Poisson(). Demuestre que para todo
x = 0, 1, 2, . . . se cumple la siguiente frmula. Esta expresin permite calcular las pro-
babilidades Poisson de una forma iterativa.
P(X = x + 1) = P(X = x)
(x + 1)
2. Sea X una variable aleatoria con distribucin Poisson(). Demuestre que la probabili-
(1 + e2 )
dad de que X tome un valor par es .
2
3. El nmero de computadoras que fallan por mes en un laboratorio de cmputo tiene
una distribucin Poisson con un promedio mensual de = 2 mquinas descompuestas.
El laboratorio tiene capacidad para reparar hasta dos mquinas por mes. Cuando se
descomponen ms de dos mquinas, las restantes se envan fuera del laboratorio para
su reparacin.
4. Sea Y una variable aleatoria que tiene una distribucin de Poisson cuyo promedio es
de 2. Calcular:
a) P(Y = 4)
b) P(Y 4)
c) P(Y 4)
6. Supongamos que la probabilidad de que una persona reciba una inyeccin de penicilina
y sufra una reaccin desfavorable es de 0,0002. Si 3000 personas reciben aplicaciones
de este medicamento. Cul es la probabilidad de que 0,1,2,3,4 o 5 personas reaccio-
nen mal?
7.3. PROBLEMAS 135
11. Los grandes almacenes Bon han determinado que la demanda de cierto modelo de
cmara fotogrfica tiene una distribucin de Poisson con una media de 2 por semana.
La directora del departamento de cmara quiere estudiar la demanda actual para ver si
se justifica ofrecer clases de fotografa. Acaba de leer un articulo sobre el paisaje en el
American Photographer y piensa que ese tipo de clases seria efectivo.
12. Los autos llegan al lavadero 22 con una tasa promedio de 9 por hora. Si la llegada por
hora sigue una distribucin de Poisson, averige la probabilidad de que lleguen 15 o
ms autos durante una hora dad de operacin.
13. Se estima que el nmero de taxis que esperan recoger un pasajero delante de la terminal
de mnibus de Asuncin tiene una distribucin de Poisson con una media de 5,5 taxis.
14. La concertista de piano Donna Prima se preocupa cada vez ms por el nmero de
tosidos que se presentan en la audiencia justo antes que empiece a tocar. Durante su
ultima gira, Donna estimo un promedio de 8 tosidos justo antes de empezar su concier-
to. La seora prima le ha prometido a su director que si escucha ms de 5 tosidos en
el concierto esa noche, se rehusar a tocar. Cul es la probabilidad de que la artista
toque esa noche?
15. En promedio cinco pjaros chocan contra el monumento en Washington y mueren por
este motivo cada semana. Bill Garey, un oficial del Servicio del Parque Nacional de Es-
tados Unidos, ha solicitado que el congreso estadounidense asigne fondos para adquirir
equipos que alejen a los pjaros de dicho monumento. Un subcomit del congreso le
ha respondido que pueden asignarle fondos para tal fin a menos que la probabilidad de
que mueran ms de tres pjaros cada semana sea mayor que 0,70. Se destinaran los
fondos para la compra de los equipos que alejen a los pjaros del monumento?
16. El nmero de nudos en un tipo particular de madera tiene una distribucin de Poisson
con una media de 1,5 nudos de 10 pies cbicos de madera. Encuentre la probabilidad
de que un bloque de esta madera de 10 pies cbico tenga a lo ms un nudo.
18. La Articulate Corporation espera que el 99 % de los saldos de sus cuentas por cobrar
sean correctas. Se seleccion una muestra aleatoria de 200 cuentas para auditarlas.
19. En los ltimos 20 aos, solo el 2 % en promedio de los cheques endosados a la Ameri-
can Herat Association fueron rechazados. Este mes, la asociacin recibi 200 cheques.
Cul es la probabilidad de que:
20. El centro contencioso del condado de Orange, en California maneja varios tipos de
litigios, pero casi todos ellos son del tipo conyugal. De hecho 96 % de los pleitos que
atiende el centro son de esta naturaleza. Cul es la probabilidad de que de 80 litigios
atendidos por el centro exactamente 7 no sean del tipo conyugal?
Distribucin Uniforme
1. Sea X una variable aleatoria con distribucin uniforme en el intervalo (1, 4).
3. Se escogen al azar dos nmeros del intervalo (0, 3). Sea X la variable aleatoria que
indica la suma de los dos nmeros elegidos. Si X sigue una distribucin uniforme
Distribucin Normal
a) P(X 10)
b) P(X < 0)
c) P(0 < X 10)
d) P(X 20)
e) P(20 < X 10)
a) P(X 10)
b) P(X > 0)
c) P(0 < X 40)
d) P(X 30)
e) P(10 < X 10)
a) F(x) = 0, 8666
b) 1 F(x) = 0, 9154
4. Un investigador reporta que unos ratones vivirn un promedio de 40 meses cuando sus
dietas se restringen drsticamente y despus se enriquecen con vitaminas y protenas.
Suponga que la vida de tales ratones se distribuye normalmente con una desviacin
estndar de 6,3 meses, encuentre la probabilidad de que un ratn viva:
a) Ms de 32 meses
b) Menos de 28 meses
c) Entre 37 y 49 meses
d) Entre 45 y 50 meses
e) Entre 40 y 43 meses
f) Cul es la probabilidad de que de seis ratones 4 vivan ms de 30 meses?
5. Las barras de centeno que cierta panadera distribuye a las tiendas locales tienen una
longitud promedio de 30 centmetros y una desviacin estndar de 2 centmetros.
Suponga que las longitudes se distribuyen normalmente, qu porcentaje de las bar-
ras son
d) Encuentre cual es el tiempo a partir del cual que duran el 15 % de los viajes ms
lentos?
e) Encuentre la probabilidad de que dos de los siguientes tres viajes tomen como
mximo 12 hora.
7. Las alturas de 1000 estudiantes se distribuyen normalmente con una media de 174,5
cm y una desviacin estndar de 6,9 cm., cuntos de estos estudiantes se esperara
que tuvieran alturas
8. Una estacin de radio encontr que el tiempo promedio que una persona sintoniza esa
estacin es de 15 minutos con una desviacin estndar de 3,5 minutos. Cual es la
probabilidad de que un radioescucha sintonice la estacin por:
a) ms de 20 minutos?
b) entre 15 y 18 minutos?
c) entre 10 y 12 minutos?
d) Cuantos minutos como mximo sintonizan la estacin el 70 % de los radioes-
cuchas?
e) Cul es la probabilidad de que de 8 radioescuchas, al menos 7 sintonicen la
estacin por ms de 5 minutos?
10. Suponga que el salario por hora de un trabajador en una fabrica de ropa (que se basa
en un sistema de pago a destajo) tiene una distribucin normal con un valor esperado
de 5,10 dlares y una desviacin estndar de 0,40 dlares.
7.3. PROBLEMAS 140
11. Se ha determinado que la vida til de cierta marca de llantas radiales tiene una distribu-
cin normal con media 38000 kilmetros y desviacin estndar 3000 kilmetros.
a) Cul es la probabilidad de que una llanta elegida al azar tenga vida til de cuando
menos 35000 km.?
b) Cul es la probabilidad de que dure mas de 45000 km.?
13. Una operacin de maquinado produce ejes de aceros cuyos dimetros estn distribui-
dos normalmente con un promedio de 1,005 pulgadas y desviacin estndar de 0,01
pulgadas. Las especificaciones piden dimetros que queden en el intervalo 1, 00 0, 02
pulgadas. Qu porcentaje de la produccin no cumplir las especificaciones?
14. Las ausencias por enfermedad de los empleados de una empresa en un mes tiene una
distribucin normal aproximada con promedios de 200 horas y una varianza de 400
horas.
15. Una empresa elctrica fabrica focos que tienen una duracin, antes de fundirse, que se
distribuye normalmente con una media igual a 800 horas y una desviacin estndar de
40 horas.
16. Las calificaciones de un examen se distribuyen normalmente con valor esperado igual
a 74 y desviacin estndar igual a 7. Si 12 % de la clase obtiene Calificacin A . Cul
es la A ms baja posible y la B ms alta posible?.
7.3. PROBLEMAS 141
18. Los puntos logrados por los candidatos en una prueba de actitud estn distribuidos
normalmente con una media de 500 y una desviacin 100. Qu porcentaje de los
candidatos reciben puntajes
a) superiores a 700
b) entre 400 y 600
19. Si la estatura de los estudiantes de una universidad estn normalmente distribuidos con
media de 70 pulgadas, con un desvo estndar de 3 pulgadas.
20. El examen dado por un grupo de estudiantes arroja una media de 65 con una desviacin
tpica de 10. Si quisiramos dar al 15 % superior una calificacin A , al 20 % siguiente
B, al 30 % del medio C, al siguiente 25 % D y al 10 % ms bajo F. Qu calificaciones
numricas siguen el trazado de la curva?.
21. Las distribucin de los salarios de 2000 trabajadores tiene una media de 70 dlares y
una varianza de 36 dlares. Suponga que la distribucin es normal aproximada. Calcu-
lar la probabilidad que ganen:
a) entre 65 y 77 dlares
b) 82 dlares y mas
c) Cuantos trabajadores ganan 60 dlares o menos?
22. Un especialista en ictiologa tropical esta interesado en estimar cuanto tiempo puede
sobrevivir cierto tipo de pez en agua con determinado porcentaje de toxicidad. Luego
de una serie de experimentos llega a estimar que la vida media de este tipo de pez
alcanza 100 das con un desvi estndar de 20 das.
23. Dos estudiantes fueron informados de que haban recibido referencias tipificadas de
0,8 y -0,4 respectivamente, en un examen de ingls. Si sus puntuaciones fueron de 88
y 64 respectivamente. Hallar la media y la desviacin tpica de las puntuaciones.
24. La media de los pesos de 500 estudiantes de un cierto colegio es 151 libras y la
desviacin tpica 15 libras. Suponiendo que los pesos se distribuyen normalmente,
hallar
25. Una fabrica de productos para televisores vende transistores de vida media de 1000
horas y desviacin estndar de 100 horas. Suponiendo que la distribucin de vida en
horas de los transistores es normal, calcular:
26. La cantidad semanal que una compaa gasta en mantenimiento y reparaciones tiene
una distribucin normal aproximada cuyo promedio es de 400 dlares y su desviacin
estndar 20 dlares. Si el presupuesto para cubrir los gastos de reparacin para la sem-
ana siguiente es de 450 dlares.
a) Cul es la probabilidad de que los costos reales sean mayores que la cantidad
supuesta?
b) De cuanto debe ser el presupuesto semanal para mantenimientos y reparaciones
para que tan solo se rebase con una probabilidad de 0,1.
27. Los conductores que se fabrican para utilizar en determinado sistema de computo nece-
sitan tener resistencias que varen entre 0,12 y 0,14 ohm. Las resistencias reales medi-
das de los conductores que producen la compaa A tiene una distribucin normal con
un promedio de 0,13 ohm y una desviacin estndar de 0,005 ohm.
28. A una temperatura de 25C, las resistencias de un termistor de determinado tipo tiene
una distribucin normal con un promedio de 10000 ohm y una desviacin tpica de
4000 ohm. Los termistores se clasificaran para enviar a un cliente, los que tengan re-
sistencias entre 8000 y 15000 ohm. Qu fraccin de los termistores se debe enviar?
29. Los tiempos de las primera avera de una unidad de cierta marca de impresoras de
chorro de tinta tienen aproximadamente una distribucin normal con un promedio de
1500 horas y una desviacin estndar de 200 horas.
7.3. PROBLEMAS 143
30. Una encuesta entre los habitantes de cierta ciudad, indic que el ingreso promedio era
de 45000 guaranes, con una desviacin estndar de 5000 guaranes. Admitiendo una
distribucin normal para la variable ingreso, calcular
31. Se acepta que la vida de las bombillas producidas por una compaa elctrica tiene una
distribucin normal, con una media igual a 1000 hs. y una desviacin tpica de 50 hs.
Determinar la probabilidad de que una bombilla tomada al azar se queme:
32. El peso medio de 500 bacas es de 151 kilogramos, con una dispersin de 15 kilo-
gramos. Suponiendo que la variable peso se encuentre normalmente distribuida, de-
terminar:
34. Los resultados obtenidos por los aspirantes que rindieron examen de ingreso en una
Facultad, indicaron una distribucin aproximadamente normal de la variable puntaje
con un valor medio de 60 puntos y una dispersin de 8 puntos. Calcular el porcentaje
de aspirante que obtuvieron puntajes:
a) mayores a 70 puntos
b) inferiores a 56 puntos
c) entre 65 y 75 puntos
5. Para varios millares de artculos que se mantienen en existencia en una empresa, existe
una probabilidad global del 0,08 de que un articulo especifico (incluyendo tamao y
color determinado) no se encuentre en existencia. Si para un embarque que cubre los
pedidos para 120 artculos distintos.
7. La Articulate Corporation espera que el 99 % de los saldos de sus cuentas por cobrar
sean correctas. Se selecciono una muestra de 200 cuentas para auditarlas.
8. En los ltimos 20 aos, solo 3 % de los cheques endosados a la American Herat Asso-
ciation fueron rechazados. Este mes, la asociacin recibi 200 cheques . Cul es la
probabilidad de que:
9. Suponga que el 10 % de los habitantes de una ciudad son pelirrojos. Un grupo de en-
cuestadores selecciona 200 personas al azar y les pregunta confidencialmente por quien
votaran en las prximas elecciones.
11. Si el 15 % de motores elctricos producidos por una lnea de montaje son defectuosos,
determinar la probabilidad de que entre 100 motores elegidos al azar :
12. La proporcin de familias que usan el jabn A en cierta ciudad es de 0,3. Se toma una
muestra aleatoria de 40 familias. Determinar
13. La proporcin de estudiantes que reciben calificacin C es de 0,7. Se toma una muestra
aleatoria de 150 estudiantes.
7.3. PROBLEMAS 146
14. La probabilidad de que una persona que entra en un supermercado efecte compra es
de 0,80. Si entran 35 personas diariamente. Calcular la probabilidad de que :
Distribucin Exponencial
2. Sabemos que la duracin del tipo de bombillas que usamos sigue una distribucin
exponencial de media 6 horas.
3. Si la cantidad de dinero pagado por cada pliza en una compaa de seguros se dis-
tribuye exponencialmente con media 2000.
a) Si una persona en este momento est pagando una poliza de seguros a la compaa
cul es la probabilidad de que sea un monto superior a 2500?.
b) Encuentre la cantidad promedio de pago de dinero por un seguro a la compaa.
4. Una mquina de servicio tiene una unidad de reserva para sustituirla de inmediato
cuando falle. El Tiempo a la falla (tiempo entre fallas) de la mquina (o de su unidad
de reserva) es exponencial, y sucede cada 40 minutos en promedio.
5. El tiempo entre llegadas en una dependencia del Banco Mercan es exponencial con
valor medio de 0,05 hora. La oficina abre a las 8:00 A.M.
Las llegadas en restaurantes parecidos tienen una frecuencia de 35 clientes por hora.
El tiempo entre llegadas tiene distribucin exponencial.
10. Si un cliente llega a McDonalds en menos de 4 minutos despus del cliente inmediato
anterior, recibir un descuento del 10 %. Si el tiempo entre llegadas es entre 4 y 5
minutos, el descuento, es del 6 %. Si el tiempo entre llegadas es mayor que 5 minutos,
el cliente tiene 2 % de descuento. El tiempo entre llegadas es exponencial, con media
de 6 minutos.
a) Determine la probabilidad de que un cliente que llegue reciba el mximo des-
cuento.
b) Determine el descuento promedio a cada cliente que llega
11. Se sabe que el tiempo entre fallas de un refrigerador Kencore es exponencial, con una
media de 9000 horas (ms o menos 1 ao de funcionamiento), y la empresa otorga una
garanta de 1 ao con el refrigerador. Cul es la probabilidad de que la garanta cubra
una reparacin por descompostura?.
12. Los nios nacen en un estado poco poblado, con una frecuencia de un nacimiento cada
12 minutos. El tiempo entre nacimientos sigue una distribucin exponencial. Determi-
nar
a) La cantidad promedio de nacimientos por ao
b) La probabilidad de que no haya nacimientos en cualquier da
c) La probabilidad de emitir 50 certificados de nacimientos en 3 horas, cuando se
emitieron 40 certificados durante las primeras 2 horas del perodo de 3 horas.
d) Suponga que el empleado que pasa la informacin de los certificados de nacimien-
to a la computadora suele esperar hasta que se hayan acumulado 5 certificados.
Calcule la probabilidad de que el empleado capture un nuevo lote en cada hora.
13. Un coleccionista de arte viaja una vez al mes, en promedio, para asistir a subastas.
En cada viaje se garantiza una compra. El tiempo entre los viajes tiene distribucin
exponencial. Determine lo siguiente:
a) La probabilidad de que el coleccionista no compre obras de arte en un perodo de
3 meses.
b) La probabilidad de que el coleccionista no compre ms de 8 obras de arte por
ao.
c) La probabilidad de que el tiempo entre viajes sucesivos sea mayor que 1 mes.
14. En un banco, la frecuencia de llegadas es de 2 clientes por minuto. Determine lo sigu-
iente:
a) La cantidad promedio de llegadas durante 5 minutos.
b) La probabilidad de que no haya llegadas durante el prximo 0,5 minuto.
c) La probabilidad de que haya al menos una llegada durante el siguiente 0,5 minuto.
d) La probabilidad de que el tiempo entre dos llegadas sucesivas sea de 3 minutos,
cuando menos.
15. El tiempo entre llegadas al restaurante Juan Arepa es exponencial con media de 5
minutos. El restaurante abre a las 11:00 A.M. Determine:
7.3. PROBLEMAS 149
8.1. Introduccin
Supongamos que tenemos una poblacin de inters, esto es, un conjunto arbitrario de in-
dividuos (personas, animales, plantas objetos en general) cualesquiera, y deseamos conocer
cierta informacin de esta poblacin. Debido a la imposibilidad o no conveniencia de tener
informacin de todos y cada uno de los elementos de la poblacin, generalmente tomamos un
pequeo subconjunto de ella, al cual llamamos muestra. Con base en esta muestra trataremos
de inferir la informacin de la poblacin en su totalidad.
De este modo, cuando se diga, por ejemplo, que una muestra aleatoria es tomada de una
poblacin normal con media y varianza 2 , ello significa que las variables aleatorias que
forman la m.a. son independientes entre s, y todas ellas tienen la misma distribucin normal
y los mismos parmetros que la poblacin. Una muestra aleatoria constituye el elemento
bsico para llevar a cabo inferencias estadsticas.
Definicin 8.2.2 Una estadstica o estadstico muestral es una funcin cualquiera de una
muestra aleatoria X1 , X2 , . . . , Xn , y por lo tanto es tambin una variable aleatoria.
150
8.3. MTODOS DE MUESTREO 151
Una estadstica es entonces cualquier funcin de las variables aleatorias que se observaron
en la muestra; de manera que esta funcin no contiene cantidades desconocidas.
Veremos a continuacin dos ejemplos de estadsticas que sern usados con frecuencia
ms adelante. Considere una muestra aleatoria X1 , X2 , . . . , Xn . La funcin X definida como
sigue
1 n
X = Xi
n i=1
es una estadstica, y se le conoce con el nombre de media muestral. El otro ejemplo es el de
la varianza muestral, que se puede expresar de dos maneras distintas y se definen por
1 n 1 n
S2 = i (X X)2
y S 2
= (Xi X)2
n i=1 n 1 i=1
Por ejemplo se quiere conocer la resistencia de los tornillos que se fabrica en una plan-
ta, para conocerla es necesario destruir el producto, lgicamente no podemos probar
toda la poblacin porque nos quedaramos sin productos.
Por ejemplo se quiere conocer el efecto de un nuevo insecticida en las moscas, como se
puede comprender no es posible contactar a todas las moscas para realizar el estudio.
En ocasiones se necesita informacin rpida para tomar una decisin importante, tal
vez estudiar a toda la poblacin nos lleve ms tiempo del que disponemos.
8.3. MTODOS DE MUESTREO 152
Por las razones anteriores, en muchos casos es conveniente el uso de muestras, pero
para que podamos extraer conclusiones, es importante que elijamos bien las muestras para
nuestros estudios. Hay cuestiones que debemos especificar a la hora de elegir una muestra:
b) El tamao de la muestra.
Muestreos no probabilsticos
No sirven para realizar generalizaciones, pues no se tiene certeza de que la muestra ex-
trada sea representativa, ya que no todos los sujetos de la poblacin tienen la misma probabi-
lidad de se elegidos. En general se seleccionan a los sujetos siguiendo determinados criterios
procurando que la muestra sea representativa.
Muestreo sin norma: se toma la muestra sin norma alguna, la muestra podra ser
representativa si la poblacin es homognea y no se producen sesgos de seleccin.
Muestreos probabilsticos
Los muestreos probabilsticos son aquellos en los que todos los individuos tienen la mis-
ma probabilidad de ser elegidos para formar parte de una muestra. Dentro de los mtodos de
muestreo probabilsticos encontramos los siguientes tipos:
2. Muestreo sistemtico
3. Muestreo estratificado
despus al azar (como una urna, tablas de nmeros aleatorios, nmeros aleatorios gen-
erados electrnicamente, etc.) se eligen los elementos necesarios para la muestra.
que cuando se trabaja con muestras pequeas es posible que no represente a la poblacin
adecuadamente.
Ejemplo 8.3.1 En una compaa con 150 trabajadores se quiere obtener una muestra aleato-
ria de 15 elementos para un chequeo mdico. Se sigue el siguiente procedimiento:
3) El punto de arranque en la tabla se fija mediante la hora en ese momento, 4:03, por lo
tanto se inicia en la fila 4, columna 3.
4) Como los nmeros de los trabajadores van desde 1 hasta 150 solo se toman en cuenta las
primeras 3 cifras de cada nmero y se registran los nmeros que se vayan encontrando
en ese rango.
Ejemplo 8.3.4 Se quiere conocer la opinin de los padres de familia sobre los temas de edu-
cacin sexual tratados en los libros de texto de primaria en la Repblica Mexicana. Como la
poblacin est muy dispersa y es muy grande, es necesario hacer un muestreo por conglom-
erados en varias etapas.
Primero dividimos la Repblica en sectores geogrficos, que podran ser los estados, y
seleccionamos una muestra aleatoria de ellos. Luego en cada uno de ellos hacemos una se-
leccin aleatoria de escuelas primarias. Y por ltimo en las escuelas seleccionadas obtenemos
una muestra aleatoria de padres de familia.
Demostracin
Para realizar la demostracin de esta proposicin recordemos que una muestra aleato-
ria de tamao n esta constituida por n variables aleatorias independientes e identicamente
distribuidas, esto es cada una de las variables aleatorias Xi , i = 1, 2, . . . , n intervinientes
tienen los mismos parmetros que el de la poblacin de la cual provienen. Por lo tanto
E(Xi ) = , i = 1, 2, . . . , n; entonces
1 n 1 n 1
E(X) = E
n i=1
Xi = E(Xi ) = n =
n i=1 n
2
E(X )2 = 2X =
n
donde 2 es la varianza de la poblacin de la cual provienen todas las muestras de tamao n.
Demostracin
Como ya se dijo anteriormente las variables aleatorias Xi , i = 1, 2, . . . , n intervienientes
en la muestra aleatoria son independientes e identicamente distribuidas con lo cual tendremos
que Var(Xi ) = 2 , i = 1, 2, . . . , n y para cualquier par de variables aleatorias Xi , X j , i 6= j
en la muestra se tendr Var(Xi + X j ) = Var(Xi ) +Var(X j ). Por lo tanto
1 n 1 n 1 2 2
E(X )2 = 2X = Var(X) = Var Xi = Var(Xi ) = n =
n i=1 n2 i=1 n2 n
Desarrollo
Segn las condiciones del problema; la media y la desviacin estndar poblacional son
respectivamente = 300 libras y = 50 libras. Como no se conoce el tamao de la poblacin
se asume que es infinita, por lo que los parmetros de la distribucin muestral de medias
50
sern: X = = 300 libras y X = = libras. Entonces la probabilidad de que
n n
a) el peso medio de 35 paquetes recibidos aleatoriamente sea menor que 320 libras es
320 300
P(X < 320) = P Z < 50
= P(Z < 2, 37) = 0, 5 + A(2, 37)
35
b) el peso medio de 40 paquetes recibidos aleatoriamente sea mayor que 290 libras
290 300
P(X > 290) = P Z > 50
= P(Z > 1, 26) = 0, 5+A(1, 26) = 0, 5+A(1, 26)
40
Buscando nuevamente en la tabla de Z encontramos que A(1, 26) = 0, 3962 por lo que
la probabilidad buscada esta dada por
P(X > 290) = 0, 5 + 0, 3962 = 0, 8962
8.4. DISTRIBUCIONES MUESTRALES 160
Desarrollo
Segn las condiciones del problema; la media y la desviacin estndar poblacional son
respectivamente = 68, 2 kg y = 2, 5 kg. El tamao de la poblacin es 1000 estudiantes,
por lo que los
r parmetros de lardistribucin muestral de medias sern: X = = 68, 2 kg y
N n 2, 5 1000 100
X = = = 0, 2373 kg. Entonces la probabilidad de que
n N 1 100 1000 1
la media muestral
a) sea mayor que 68, 9 kg es
68, 9 68, 2
P(X > 68, 9) = P Z > = P(Z > 2, 95) = 0, 5 A(2, 95)
0, 2373
1 n 1 n
S2 = (Xi X)2
= [(Xi ) (X )]2
n i=1 n i=1
n
nS = [(Xi )2 2(Xi )(X ) + (X )2 ]
2
i=1
n n n
= (Xi )2 2(X ) (Xi ) + (X )2
i=1 i=1 i=1
n
= (Xi )2 2n(X )2 + n(X )2
i=1
n
= (Xi )2 n(X )2
i=1
Por lo tanto
n
(Xi )2 = nS2 + n(X )2
i=1
Proposicin 8.4.3 Si se extraen muestras de tamao n de una poblacin normal con media
y varianza 2 , entonces la esperanza y la varianza de S2 son respectivamente
n1 2 2(n 1) 4
S 2 = y S 2 =
n n2
.
8.4. DISTRIBUCIONES MUESTRALES 163
Desarrollo
Para realizar la demostracin primeramente recordemos que la esperanza y la varianza
de una distribucin ji-cuadrada con con k grados de libertad estn dadas por k y 2k respecti-
nS2
vamente. Adems tomemos en cuenta que la v.a. 2 tiene una distribucin ji-cuadrada con
n 1 grados de libertad. Entonces
nS2 nS2
E = n 1 y Var = 2(n 1)
2 2
por lo que
n 2 n2
E(S ) = n 1 y Var(S2 ) = 2(n 1)
2 4
con lo cual
n1 2 2(n 1) 4
E(S2 ) = y Var(S2 ) =
n n2
Ejemplo 8.4.3 Una poblacin normal tiene una varianza de 15. Si se extraen muestras de
tamao 5 de esta poblacin; qu porcentajes pueden tener varianzas
a) menores que 10?
b) mayores que 20?
Calcule adems la media y la varianza de esta distribucin muestral de varianzas.
Desarrollo
Segn las condiciones del problema; 2 = 15 y n = 5. Adems el grado de libertad ser
n 1 = 5 1 = 4, entonces
a) para responder este inciso debemos calcular primeramente 21 que viene dada por la
siguiente relacin
nS2 (5)(10)
21 = 21 = = 3, 3333
15
b) para responder a este inciso se debe realizar un procedimiento anlogo al anterior; esto
es
nS2 (5)(20)
22 = 22 = = 6, 667
15
Luego en la tabla 2 se observa que el valor 6,667 con 4 grados de libertad est ente los
valores 2[0,80 ;4] = 5, 99 y 2[0,90 ;4] = 7, 78; con lo cual podramos tomar al promedio
de estos valores como el valor ms cercano. Entonces
2[0,80 ;4] + 2[0,90 ;4]
5, 99 + 7, 78
2[0,85 ;4] = == 6, 885
2 2
con lo cual la probabilidad buscada es de aproximadamente 1 0, 85 = 0, 15.
La esperanza y la varianza para esta distribucin vienen dadas por la siguientes relaciones
n1 2 4
E(S2 ) = = 15 = 12
n 5
2(n 1) 2 2(4)
Var(S2 ) = = 2 15 = 4, 8
n2 5
8.4.4. Distribucin F
Esta distribucin de probabilidad es usada en varias situaciones. Es usada cuando quer-
emos probar si dos varianzas muestrales provienen de la misma poblacin o de poblaciones
con caractersticas idnticas, adems es aplicada cuando se quiere comparar las medias de
ms de dos poblaciones simultneamente.
La distribucin F se define como la razn entre dos distribuciones ji-cuadrada indepen-
dientes, dividida cada una de ellas entre sus respectivos grados de libertad.
Consideremos dos variables aleatorias independientes Y y W tales que Y tiene una dis-
tribucin 2 con m grados de libertad y W una distribucin 2 com n grados de libertad,
donde m y n son enteros positivos. Se define una nueva variable aleatoria como sigue:
Y
m nY
X= W
=
n
mW
entonces a la variable aleatoria X se le denomina distribucin F de Snedecor con m y n
grados de libertad.
8.4. DISTRIBUCIONES MUESTRALES 165
Figura 8.1: Grfica de f (x) cuando los parmetros m y n toman diferentes pares de valores.
Caractersticas de la distribucin F
Hay una familia de distribuciones F. Cada miembro de esta familia est determinado
por los grados de libertad del numerador (varianza mayor) y por los del denominador
(varianza menor).
Se rest el factor de correccin al lmite superior 0,4 debido a que pnio < 0, 4. Esta
resta garantiza que la probabilidad de ocurrencia de este valor extremo no forme parte
del resultado final. Luego en la tabla de Z se observa que A(2, 90) = A(2, 90) =
0, 4981, con lo cual
Entonces (1000)(0, 994) = 994. Lo que significa que con 994 muestras cabe esperar
que entre 40 % y 60 % sean inas.
c) La probabilidad de que 53 % o ms sean nias est dada por
1 !
0, 53 2(200) 0, 5
P(pnia 0, 53) = P Z = P(Z 0, 78) = 0, 5 A(0, 78)
0, 0354
Se rest el factor de correccin al lmite inferior 0,53 debido a que pnia 0, 53. Esta
resta garantiza que la probabilidad de ocurrencia de este valor extremo forme parte del
resultado final. Luego en la tabla de Z se observa que A(0, 78) = 0, 2823, con lo cual
P(pnia 0, 53) = 0, 5 0, 0, 2823 = 0, 2177
Con lo cual (1000)(0, 2177) = 217, 7. Por lo que en aproximadamente 218 muestras
cabe esperar que 53 % o ms sean nias.
Demostracin
Recordemos primeramente que por la proposicin 8.4.1 la media de toda distribucin
muestral de medias coincide con la media de la poblacin del cual se extraen las muestras.
Entonces la media de la distribuciones muestral de sumas y la media de la distribucin mues-
tral de diferencias sern respectivamente
2X NX nX
2X2 =
nX NX 1
donde nX y NX son el tamao de la muestra y de la poblacin uno respectivamente.
Cuando las muestras n1 y n2 son de gran tamao, esto es n1 + n2 2 30, la distribucin
muestral de sumas de medias por aplicacin del teorema central del lmite se aproxima a una
distribucin normal con media X+Y = X + Y y varinaza 2X+Y = 2X + Y2 . Por lo tanto la
variable aleatoria
(X +Y ) X+Y
Z= N(0, 1)
X+Y
Bajo estas mismas condiciones la distribucin muestral de diferencias de medias tambin
se aproxima a una distribucin normal con media XY = X Y y varinaza 2XY = 2X +Y2
y la variable aleatoria.
(X Y ) XY
Z= N(0, 1)
XY
Ejemplo 8.4.5 Los acumuladores del automvil de manufactura XY tienen una duracin
promedio de 360 das con una desviacin estndar de 45 das, y los de manufactura ZW
duran en promedio 300 das con una desviacin estndar de 30 das. Si se prueban muestras
al azar de 50 acumuladores de cada marca.
b) Halllar la probabilidad de que la suma de los promedios de los dos grupos sea mayor
que 670 das.
Desarrollo
Si nombramos por X a los acumuladores del automvil de manufactura XY y por Y a los
acumuladores del automvil de manufactura ZW tendremos: X = 360 das, X = 45 das,
nX = 50, Y = 300 das, Y = 30 das y nY = 50.
b) La probabilidad de que suma de los promedios de los acumuladores tenga una duracin
mayor de 670 das, se puede calcular estableciendo una distribucin muestral de sumas
de medias sobre las dos poblaciones de acumuladores para automviles. Adems se
tiene que n1 + n2 2 = 50 + 50 2 = 98, con lo cual
!
(X +Y ) (X + Y )
P(X +Y > 670) = P Z > q
2X + Y2
8.4. DISTRIBUCIONES MUESTRALES 172
n1 SX2 n2 SY2
Por la proposicin 7.2.4 + 2 2 (n1 + n2 2); entonces
2X Y
(X Y ) XY
XY
T=v t(n1 + n2 2)
u
u n1 SX2 n2 SY2
u 2 + 2
t X Y
n1 + n2 2
(X Y ) XY
r
1 1
+
n n2 (X Y ) XY (X Y ) XY
T= s 1 =s r = r
2
1 n1 SX + n2 SY 2 2 2
n1 SX + n2 SY 1 1 1 1
+ Sp +
n1 + n2 2 n1 + n2 2 n1 n2 n1 n2
s
n1 SX2 + n2 SY2
donde SP = recibe el nombre de varianza combinada de las muestras.
n1 + n2 2
Como se puede observar tanto T como su distribucin no dependen de las varianzas
poblaciones. Esto es caracterstico de las distribuciones t.
p1 p2 = E( p1 p2 ) = E( p1 ) E( p2 ) = p1 p2
Ejemplo 8.4.6 Un colegio de artes liberales tiene 100 profesores, 60 de los cuales tienen el
doctorado. Dos muestras con n1 = n2 = 30, son extradas independientemente de este grupo
de profesores, con reposicin, y se anotan los nmeros de los que tienen el doctorado. Hallar
la probabilidad de que las dos muestras difieran en 8 ms en el nmero con doctorado.
Desarrollo
Segn el problema el tamao de la poblacin es de 100 profesores, de las cuales 60 tienen
doctorado y 40 no, con lo cual la proporcin de profesores con doctorado es P = 0, 6 y la de
su opuesto es 1 P = 0, 4. El rasgo a estudiar en cada muestra es tiene doctorado.
X Y
Se define p1 = y p2 = ; donde X representa el nmero de profesores con doctorado
n1 n2
en la muestra n1 y Y nmero de profesores con doctorado en la muestra n2 . Adems como
los muestreos fueron hechos de la misma poblacin y con sustitucin, se tiene
p1 p2 = P1 P2 = 0, 6 0, 6 = 0
s r
P1 (1 P1 ) P2 (1 P2 ) (0, 6)(0, 4) (0, 6)(0, 4)
p1 p2 = + = + = 0, 1265
n1 n2 30 30
Entonces la probabilidad de que las dos muestras difieran en 8 ms en el nmero de
profesores con doctorado est dada por
X Y 8 0, 2667
P(X Y 8) = P = P( p1 p2 0, 2667) = P Z
30 30 0, 1265
= P(Z 2, 11) = 0, 5 A(2, 11)
8.5. Problemas
Captulo 9
Estimacin
9.1. Introduccin
El objetivo ms importante de la Estadstica es obtener una inferencia con respecto a
la poblacin basndose en la informacin contenida en una muestra. Como las poblaciones
se describen mediante medidas numricas denominadas parmetros, el objetivo de la may-
ora de las investigaciones estadsticas es deducir una inferencia con respecto a uno o ms
parmetros de la poblacin. Los parmetros poblacionales pertenecen a ciertos conjuntos de
valores denominados espacios parmetricos.
Un problema de inferencia estadstica o, ms simplemente, un problema de estadstica es
un problema en el cual se han de analizar datos que han sido generados de acuerdo con una
distribucin de probabilidad desconocida y en el que se debe realizar algn tipo de inferencia
acerca de tal distribucin. En otras palabras, en un problema de estadstica existen dos o ms
distribuciones de probabilidad que podran haber generado algunos datos experimentales.
En la mayoria de los problemas reales, existe un nmero infinito de distribuciones posibles
distintas que podran haber generado los datos. Analizando los datos, se intenta conocer la
distribucin desconocida para realizar inferencias acerca de ciertas propiedades de la dis-
tribucin y determinar la verosimilitud relativa que cada distribucin posible tiene de ser la
correcta.
Los problemas que se tratan en la inferencia estadstica se dividen generalmente en dos
clases: los problemas de estimacin y los de prueba de hiptesis.
El procedimiento mediante el cual; a partir del conocimiento de las caractersticas de la
muestra que llamaremos estimadores; inferimos las caractersticas de la poblacin se llama
estimacin, que a su vez se divide en estimacin puntual y estimacin por intervalos.
175
9.2. ESTIMADORES Y SUS PROPIEDADES 176
El valor que toma g, es decir g(x1 , x2 , . . . , xn ) ser mencionado como una estimacin de
y habitualmente es escrito como: = g(x1 , x2 , . . . , xn )
X
Ejemplo 9.2.1 Sea p = un estimacin del parmetro P; donde X es una v.a. bino-
n
mial con parmetros P y n. Probar que p es un estimador insesgado de P.
Desarrollo
Ejemplo 9.2.2 Sea una poblacin con media y varianza 2 . La distribucin mues-
2
tral de medias tiene media dada por E(X) = y varianza Var(X) = y la dis-
n
tribucin muestral de medianas tiene tambin media E(Xmediana ) = , pero varianza
2
Var(Xmediana ) = . Vemos que X y Xmediana son estimadores insesgados del parmetro
2n
y adems Var(X) < Var(Xmediana ), por lo que X es un estimador eficiente de .
Eficiencia relativa
E( i )2 = Var( i ) + [ E( i )]2
donde E( i ) se llama sesgo del estimador y puede ser positivo, negativo cero. Si
es cero el estimador ser insesgado.
Proposicin 9.2.1 Sea una estimacin del parmetro basada en una muestra de
= , y si lm Var()
tamao n; si lm E() = 0; entonces es una estimacin conver-
n n
gente de .
Suficiente
La definicin anterior nos dice que un estimador es suficiente si utiliza una cantidad
de la informacin contenida de la muestra y adems ningn otro estimador podra
extraer informacin adicional de la muestra sobre el parmetro de la poblacin que
se est estimando que no sea ya suministrada por .
9.2. ESTIMADORES Y SUS PROPIEDADES 178
Criterio de Fisher-Neyman
Un estadstico Y1 = Y1 (X1 , X2 , . . . , Xn ) es suficiente, si y slo si:
n
f (x1 , x2 , . . . , xn |) = f (xi |) = f (y1 |)h(x1 , x2 , . . . , xn )
i=1
donde h no contiene a .
Como la poblacin tiene distribucin Bernoulli con parmetro 0 < p < 1, la distribu-
cin conjunta de X1 , X2 , . . . , Xn est dada por
n n
n n xi (1 xi)
f (x1 , x2 , . . . , xn |p) = f (xi |p) = pxi (1 p)1xi = pi=1 (1 p)i=1
i=1 i=1
Invariante
2 2 2
con los cual E(X ) = + 2 . Entonces X no es un estimador insesgado de 2 , con lo
n
cual X no es un estimador invariante de .
Ejemplo 9.3.1 Los siguientes datos corresponden a una muestra aleatoria de las estaturas
de jugadores de baloncesto de una liga local. Vamos a realizar una estimacin puntual de la
estatura promedio de los jugadores de baloncesto de esta liga.
1 10
X= xi = 1, 96
10 i=1
Como es una estimacin puntual, se establece que la estatura promedio de los jugadores
de baloncesto de esta liga es aproximadamente igual a 1, 96 metros.Esto es = 1, 96.
Supongamos ahora que extraemos una muestra aleatoria de una poblacin con cierta dis-
tribucin de probabilidad y queremos estimar un cierto parmetro de est poblacin a traves
de la muestra tomada. Existen dos metodos de estimacin puntual de un parmetro pobla-
cional:
Funcin de verosimilitud
Si las variables aleatroias X1 , X2 , . . . , Xn constituyen una muestra aleatoria de una dis-
tribucin cuya funcin de probabilidad o de densidad de probabilidad es f (x|), entonces
la funcin de probabilidad o de densidad de probabilidad conjunta de las varables aleatorias
X1 , X2 , . . . , Xn , est dada por:
Ejemplo 9.3.2 Supongamos que las variables aleatorias X1 , X2 , . . . , Xn constituyen una mues-
tra aleatoria de una distribucin de Bernoulli con parmetro p desconocido (0 p 1).
Encontrar la funcin de verosimilitud.
Desarrollo
Como cada Xi ; i = 1, 2, . . . , n; tiene distribucin de Bernoulli entonces
x
p i (1 p)1xi si x = 0, 1
f (x) =
0 en otro caso
Ejemplo 9.3.3 Suponiendo que el tiempo para fallar T , de una componente tiene una dis-
tribucin exponencial con parmetro desconocido. Si se extrae una mustra aleatoria de
tamao n de esta poblacin, hallar el estimador de verosimilitud de .
Desarrollo
Como cada Ti , i = 1, 2, . . . , n tiene distribucin exponencial con prmetro por ser una
muestra aleatoria proveniente de una poblacin exponencial con dicho parmetro entonces
eti si ti > 0
f (ti ) =
0 en otro caso
por lo que la funcin de verosimilitud es
n
n
ti n
ti
L(x1 , x2 , . . . , xn |p) = e = e i=1
i=1
n
ti
log L(x1 , x2 , . . . , xn |p) = log e i=1
para t = 1, 2, . . . , k.
En general t ser funcin de los k parmetros. Sea ahora X1 , X2 , . . . , Xn una muestra
aleatoria de tamao n de f (x|1 , 2 , . . . , k ). A partir de esta muestra formamos los k primeros
momentos muestrales m1 , m2 , . . . , mn . Sean 1 , 2 , . . . , k las soluciones que resultan de las k
ecuaciones mt = t , para t = 1, 2, . . . , k. Las soluciones 1 , 2 , . . . , k constituyen los esti-
madores por el metodo de los momentos.
Ejemplo 9.3.4 Sea una poblacin normal con parmetros y 2 , ambas desconocidas. Sea
X1 , X2 , . . . , Xn una muestra aleatoria de tamao n de esta distribucin. Obtener por el metodo
de los momentos las estimaciones de y de 2 .
Desarrollo
Como la distribucin es normal entonces E(X) = y Var(X) = 2 . Adems recordemos
que Var(X) = E(X 2 ) [E(X)]2 , entonces E(X 2 ) = 2 + 2 . Por otro lado los momentos
1 n 1 n
muestrales se definen como m1 = Xi y m2 = Xi2 . Tomando en consideracin la
n i=1 n i=1
n
1 1 n
relacin mt = t temdremos que : = Xi = X y 2 + 2 = Xi2 , entonces
n i=1 n i=1
1 n 2 1 n 2 2
1 n
2 = Xi2 X = Xi nX = (Xi X)2
n i=1 n i=1 n i=1
Entonces los estimadores por el mtodo de los momentos son
1 n
= X y = (Xi X)2
2
n i=1
Definicin 9.4.1 Sea (0, 1). Un intervalo de confianza para un parmetro desconocido
de una distribucin de probabilidad es un intervalo aleatorio de la forma ( 1 , 2 ), en donde
1 y 2 son estadsticas muestrales tales que:
P( 1 < < 2 ) = 1
A las estadsticas 1 y 2 se les conoce como lmites inferior y superior, respectivamente,
del intervalo de confianza. A los nmeros y 1 se les conoce como nivel se significacin
y grado o nivel de confianza, respectivamente. En general, se toma el valor de cercano a 0
de tal forma que el grado de confianza, 1, es cercano a 1. Entonces el nivel de confianza es
la probabilidad de que el parmetro poblacional se encuentre dentro del intervalo encontrado.
Los niveles de confianza ms ampliamente usados son 0, 95 y 0, 99, sin embargo puede usarse
cualquier probabilidad cercana a 1.
Intervalos de confianza para estimar la media de una poblacin con muestras grandes
Recordemos que si la muestra es lo suficientemente grande, esto es n 30, la distribu-
cin muestral de medias por aplicacin del teorema central del lmite se aproxima a una
distribucin normal con media X = y varianza 2X . Entonces la v.a.
X X
Z= N(0, 1)
X
X X
Z1 < < Z2
X
se tendr
X Zc X < X < X + Zc X
que generalmente se abrevia como
X Zc X
con lo cual el intervalo buscado para la media poblacional es
(X Zc X , X + Zc X )
Ejemplo 9.4.1 Los resultados siguientes representan las calificaciones de una muestra aleato-
ria de estudiantes en el primer examen de estadstica elemental. Elaborar un intervalo de
confianza del 95 % para estimar la media poblacional.
23 60 79 32 57 74 52 70 82 36
80 77 81 95 41 65 92 85 55 76
52 10 64 75 78 25 80 98 81 67
41 71 83 54 64 72 88 62 74 43
60 78 89 76 84 48 84 90 15 79
34 67 17 82 69 74 63 80 85 61
Desarrollo
1 60 3929
X=
60 i=1
Xi =
60
= 65, 483
1 60 2 2 283635 3929 2 60 2
S2 = Xi X = = 439, 183 y S2 = S = 446, 627
60 i=1 60 60 60 1
S S
X = = 2, 705 y X = = 2, 728
60 60
9.4. ESTIMACIN POR INTERVALOS DE CONFIANZA 186
5. A continuacin se calcula el error mximo de estimacin denotado por E para las dos
situaciones, entonces
por lo que el intervalo de confianza buscado ser (60, 136 ; 70, 83), es decir
Si comparamos los intervalos obtenidos vemos que hay muy poca diferencia, pero la
obtenida con S es un poco ms ancha y por lo tanto un poco ms fiable.
Intervalos de confianza para estimar la media de una poblacin con muestras pequeas
Si la muestra es de tamao menor que 30 y la varianza poblacional es desconocida, en-
tonces para calcular el intervalo de confianza que contiene a la media poblacional se utiliza
la distribucin t de Student en vez de la distribucin normal. Luego se siguen los mismos
pasos de los intervalos de confianza para muestras grandes.
Tomando en consideracin que cuando se tienen muestras paqueas (n < 30) y la varianza
poblacional es desconocida, la distribucin muestral de medias puede ser relacionada con una
distribucin t de Studens. Por lo tanto la v.a.
(X X ) n 1
T= t(n 1)
S
9.4. ESTIMACIN POR INTERVALOS DE CONFIANZA 187
Ejemplo 9.4.2 Una muestra aleatoria de 12 secretarias que escriben a mquina arroj un
promedio 85,2 palabras por minuto con una desviacin estndar de 9,3 palabras por minu-
to. Encuentre un intervalo de confianza de 95 % para el nmero promedio de palabras por
minuto escritas por todas las secretarias.
Desarrollo
/2 = 0, 025
n 1 = 11 2,201
Por lo tanto el intervalo de confianza buscado es (79, 028 ; 91, 372), que en trmino de
probabilidades se expresa como
nS2
que 2 est entre estos dos valores sea igual al grado de fiabilidad propuesto, tal como lo
muestra la figura 9.1. Esto es
nS2
P 2c < 2 < 2l = 1
nS2
Tomando la expresin 2c < < 2c y despejando en ella a 2 , se tendr
2
2c 1 2l nS2 2 nS2
< < < <
nS2 2 nS2 2l 2c
nS2 nS2
Entonces la probabilidad de que la varianza poblacional est entre los valores y 2
2l c
estar dada por la relacin
nS2 nS2
P 2 < 2 < 2 = 1
l c
con lo cual el intervalo de confianza de 2 con un nivel de confianza de 1 estar dada por
nS2 nS2
,
2l 2c
se obtiene lo siguiente
nS nS
<<
[1 2 ; n1] [ 2 ; n1]
Desarrollo
p = 0, 05 p = 0, 95
y
gl = 4 0,7107 gl = 4 9,488
Con lo cual el intervalo buscado para la varianza es (2200, 67 ; 29367, 09), que en
trmino de probabilidades se expresa como
Este resultado se interpreta de la misma manera que para el caso anterior, esto es,
sustituyendo la palabra varianza por la de desiviacin estndar.
Ejemplo 9.4.4 Se pregunta a 2000 votantes cul ser la actitud respecto a una determinada
propuesta poltica; 800 se oponen. Suponiendo que la muestra fuese aleatoria y procedente de
una poblacin Bernoulli. Construya un intervalo de confianza para la proporcin de votantes
a favor de la propuesta poltica para un 95 % de confianza.
Desarrollo
1. El nivel de confianza fijado es 1 = 0, 95.
2. Como se trata de estimar una proporcin y adems n = 60 > 30, la variable aleatoria
estndar a utilizar es Z de la distribucin normal estndar. Como 1 = 0, 95, ya
vimos anteriormente que Zc = 1, 96.
Por lo que el intervalo buscado es (0, 5785 ; 0, 6215), que en trminos de probabilida-
des se expresa como
P(0, 5785 < P < 0, 6215) = 0, 95
Este resultado se interpreta de la siguiente manera: Hay una probabilidad de 0,95 de
que la proporcin de votantes que estn a favor de la propuesta poltica, se encuentre
entre los valores 0,5785 y 0,6215.
Observacin: Si n1 + n2 2 30 y se desconocen
s las varianzass
poblaciones se utilizan
S12 S22 21 22
las varianzas muestrales; dicho de otro modo + en lugar de + .
n1 n2 n1 n2
Ejemplo 9.4.5 En un laboratorio, se experimenta con dos drogas que reducen el tiempo de
respuesta a cierto estmulo. Se administra a 35 ratas la droga 1 y a 30 la droga 2. La reduccin
del tiempo de reaccin al estmulo de cada rata fue registrada como sigue:
Reduccin del tiempo con la droga 1 Reduccin del tiempo con la droga 2
28 31 33 23 20 11 21 7 21 23
30 22 34 32 35 23 24 27 23 30
30 33 36 34 43 17 17 16 16 25
26 28 27 23 29 37 29 22 12 26
28 33 33 29 38 27 15 23 29 19
27 26 21 24 24 16 17 33 36 14
27 15 28 19 27
Encuentre un intervalo de confianza del 90 % para estimar la diferencia entre los tiempos
de respuesta promedio al estmulo de los grupos e interprete el resultado.
Desarrollo
El nivel de confianza ya establecido es 1 = 0, 90.
Como n1 + n2 2 = 35 + 30 2 = 63 > 30, la variable aleatoria a utilizar es Z de la
normal tipificada. Como 1 = 0, 90, buscando en la tabla de Z, encontraremos que
Zc = 1, 645.
Los estadsticos muestrales a utilizar son
X = 28, 457 S12 = 32, 3053 n1 = 35
Y = 21, 867 S22 = 51, 3156 n2 = 30
El error estandar de estimacin es
r
32, 3053 51, 3156
XY = + = 1, 623
35 30
El error mximo de estimacin estar dada por
E = (1, 645)(1, 623) = 2, 67
Los lmites inferior y superior sern respectivamente
con lo cual; el intervalo de confianza buscado en estas condiciones est dada por la expresin
r r !
1 1 1 1
X Y tc S p + ; X Y + tc S p +
n1 n2 n1 n2
Por lo que el intervalo buscado es (32, 7 ; 84, 9), que en trminos de probabilidades
se expresa como
P(32, 7 < X Y < 84, 9) = 0, 99
mS12 2 nS22
2
(m 1) y 2
2 (n 1)
1 2
Suponiendo independencia entre estas variables aleatorias; entonces por lo ya visto an-
teriormente el cociente entre dos variables con distribuciones ji-cuadradas divididas por sus
9.4. ESTIMACIN POR INTERVALOS DE CONFIANZA 197
Ejemplo 9.4.7 La poblacin A tiene una varianza de 3,4 segn se determin con una mues-
tra de 21 elementos, mientras que la poblacin B tena una varianza de 5,2 segn se determin
por una muestra de 16 elementos. Determinar los lmites de confianza del
a) 90 %
b) 95 %
de la razn de las varianzas de las dos poblaciones.
Desarrollo
1 S12 1 3, 57
a) = = 0, 2762
F[0,95 ; 20 ; 15] S2 2, 33 5, 547
2
1 S12 1 3, 57
= = 1, 4145
F[0,05 ; 20 ; 15] S2 0, 455 5, 547
2
Por lo tanto el intervalo de confianza buscado es (0, 2762 ; 1, 4145); que en tr-
mino probabilstico se expresa como
21
P 0, 2762 < 2 < 1, 4145 = 0, 90
2
1 S12 1 3, 57
b) = = 0, 2332
F[0,975 ; 20 ; 15] S22 2, 76 5, 547
1 S12 1 3, 57
= = 1, 6502
F[0,05 ; 20 ; 15] S22 0, 39 5, 547
Por lo tanto el intervalo de confianza buscado es (0, 2332 ; 1, 6502); que en tr-
mino probabilstico se expresa como
2
P 0, 2332 < 12 < 1, 6502 = 0, 95
2
( p1 p2 ) p1 p2
N(0, 1)
p1 p2
donde p1 p2 = P1 P2 y p1 p2 = p1 + p2 .
Por lo tanto si establece un nivel de confianza de 1 y se toman consideraciones anlo-
gas al caso de diferencias de medias para el caso normal se tendr que
( p1 p2 ) p1 p2
P Zc < < Zc = 1
p1 p2
Recordemos que p1 p2 depende de los parmetros P1 y P2 , que en este caso son de-
sconocidos, razn por la cual para su clculo se reemplaza a P1 por p1 y a P2 por p2 .
Ejemplo 9.4.8 De una cierta ciudad se extrae una muestra aleatoria de 100 personas y
se encuentra que 50 usan una cierta marca de jabn. De la misma ciudad se extrae otra
muestra de 100 personas y se encuentra que 20 usan una marca de jabn distinta a la primera.
Construya un intervalo de confianza del 95 % para la diferencia de proporciones de personas
que usan las respectivas marcas de jabn e interprete el resultado.
Desarrollo
2. Como se trata de estimar diferencias de proporciones y adems las muestras son grandes,
la variable aleatoria estndar a utilizar es Z de la distribucin normal estndar. Como
1 = 0, 95, ya se vi que Zc = 1, 96.
Por lo que el intervalo buscado es (0, 1745 ; 0, 4255), que en trmino de probabilidad
se expresa como
P(0, 1755 < P1 P2 < 0, 4255) = 0, 95
9.5. Problemas
2. Sea X1 , X2 , . . . , Xn una m.a. de una poblacin con media desconocida . Probar que la
estadstica X
4. Sea X1 , X2 , . . . , Xn una m.a. de una poblacin con media conocida y varianza 2 de-
sconocida. Demuestra que la siguiente estadstica es un estimador insesgado para 2 ,
1 n
2 = (Xi )2
n i=1
5. Sea X1 , X2 , . . . , Xn una m.a. de una poblacin con media desconocida y varianza finita
2 desconocida. Demuestra que la siguiente estadstica es un estimador insesgado para
2 ,
n1
1
2 = (Xi+1 Xi)2
2(n 1) i=1
6. Sea X1 , X2 , X3 , X4 una muestra aleatoria de una poblacin distribuida segn la ley una
ley de Poissn con parmetro . Considere los siguientes estadsticos para .
X1 + X2 + X3 + X4 X1 + 2X2 + 3X3 + 4X4
1 = y
4 10
9.5. PROBLEMAS 202
Estimacin Puntual
Mtodo de mxima verosimilitud
7. Supngase que X1 , X2 , . . . , Xn constituye una muestra aleatoria de tamao n de una
distribucin Bernoulli con parmetro P desconocido, pero se sabe que P pertenece al
intervalo abierto (0, 1).
a) Determinar el estimador de mxima verosimilitud de P, suponiendo que no todos
los valores observados son 0 o todos los valores observados son 1.
b) Probar que el estimador de mxima verosimilitud de P no existe si todo valor
observado es 0 o si todo valor observado es 1.
8. No se sabe que proporcin P de la compra de cierta marca de cereal es realizada por
mujeres y que proporcin es realizada por hombres. En una muestra de 70 compras
de este cereal, se encontr que 58 fueron realizadas por mujeres y 12 por hombres.
Determine el estimador de mxima verosimilitud para P.
9. Supngase que X1 , X2 , . . . , Xn constituye una muestra aleatoria de tamao n de una
distribucin normal con media desconocida y varianza 2 tambin desconocida. De-
termnense los estimadores de mxima verosimilitud para y 2 .
10. Supngase que X1 , X2 , . . . , Xn constituye una m.a. de una distribucin cuya funcin de
densidad de probabilidad f (x|) es la siguiente
1
x si 0 < x < 1
f (x|) =
0 en otro caso
Adems, supngase que el valor de es desconocido ( > 0). Determnese el estimador
de mxima verosimilitud para .
11. Supngase que X1 , X2 , . . . , Xn constituye una m.a. de una distribucin cuya funcin de
densidad de probabilidad f (x|) es la siguiente
1
f (x|) = e|x| para < x <
2
Adems, supngase que el valor de es desconocido ( < < ). Determnese el
estimador de mxima verosimilitud para .
12. Supngase que X1 , X2 , . . . , Xn constituye una m.a. de una distribucin uniforme sobre el
intervalo (1 , 2 ), donde 1 y 2 son desconocidos ( < 1 < 2 < ). Determnense
los estimadores de mxima verosimilitud para 1 y 2 .
13. Una poblacin tiene una funcin de densidad de probabilidad dada por
r
2 x2
f (x|) = 2 x e para < x <
9.5. PROBLEMAS 203
14. Supongase que , el tiempo para fallas (en horas) de un instrumento elctronico, tiene
la siguiente funcin de densidad de probabilidad
e(tt0 ) si t > t0 > 0
f (t|) =
0 en otro caso
Supngase que se prueban n artculos y que se anotan los tiempos de fallas t1 ,t2 , . . . ,tn .
suponiendo que t0 es conocido, obtener el estimador de maxima verosimilitud para .
15. Supngase que X1 , X2 , . . . , Xn constituye una m.a. de una distribucin de Poisson con
media desconocida ( > 0).
Mtodo de momentos
16. Dada una muestra aleatoria de tamao n de una poblacin uniforme en el intervalo
[0, a], use el mtodo de momentos para encontrar un estimador para el parmetro a.
17. Dada una muestra aleatoria de tamao n de una poblacin Poisson con parmetro de-
sconocido > 0, use el mtodo de momentos para encontrar un estimador del parmetro
.
18. Dada una muestra aleatoria de tamao n de una poblacin exponencial con parmetro
desconocido > 0, use el mtodo de momentos para encontrar un estimador del parmetro
.
19. Dada una muestra aleatoria de tamao n de una poblacin con funcin de densidad de
probabilidad
1
si 0 < x <
f (x) =
0 otro caso
20. Dada una muestra aleatoria de tamao n de una poblacin con funcin de densidad de
probabilidad
(1 )x si 0 < x < 1
f (x) =
0 otro caso
Estimar por el mtodo de los momentos.
9.5. PROBLEMAS 204
21. Dada una muestra aleatoria de tamao n de una poblacin con funcin de densidad de
probabilidad
2
2 ( x) si 0 < x <
f (x) =
0 otro caso
Estimar por el mtodo de los momentos.
23. Los siguientes datos son el nmero de kilmetros al ao que es manejado el automvil
por una muestra de 25 propietarios de automviles:
24. Se toma una muestra aleatoria de 81 observaciones de una poblacin normal. La media
de la muestra es 40 y la desviacin estndar de la muestra es 5. Encuentre el intervalo
de confianza de 95 % para la media de la poblacin e inteprete el resultado.
25. Se toma una muestra aleatoria de 49 observaciones de una poblacin normal. La media
de la muestra es 55 y la desviacin estndar de la muestra es 10. Encuentre el intervalo
de confianza de 99 % para la media de la poblacin.
26. Una empresa de investigacin realiz una encuesta para determinar la cantidad media
que los fumadores continuos gastan en cigarrillos cada semana. Una muestra de 49
fumadores continuos revel que X = 20 dlares y S = 5 dlares.
27. Un profesor de ingles cont el nmero de palabras mal escritas en su ensayo que asign
hace poco a sus alumnos. Para una clase de 40 alumnos, el nmero medio de palabras
mal escritas fue de 6, 05 y la desviacin estndar fue de 2, 44. Construya un intervalo
de confianza de 95 % para el nmero medio de palabras mal escritas en la poblacin de
estudiantes e interprete el resultado.
28. Una empresa elctrica fabrica focos que tienen una duracin aproximadamente dis-
tribuida de forma normal con una desviacin estndar de 40 horas. Si una muestra de
30 focos tienen una duracin promedio de 780 horas. Encuentre un intervalo de con-
fianza de 95 % para la media de la poblacin de todos los focos que producen esta
empresa e interprete el resultado.
29. A muchos pacientes con problemas cardiacos se les implant un marca pasos para con-
trolar su ritmo cardiaco. Se monta un modulo conector de plstico sobre la parte su-
perior del marca pasos. Suponga una desviacin estndar de 0,0015 y una distribucin
aproximadamente normal. Encuentre un intervalo de confianza de 95 % para la media
de todos los mdulos conectores que fabrica cierta compaa e interprete el resultado.
Una muestra aleatoria de 75 mdulos tiene un promedio de 0,310 pulgadas.
31. Para una muestra de 50 empresas tomadas de una industria determinada, se encuentra
que el nmero promedio de empleados por empresas es de 420,5 con una desviacin
muestral de 55,7. Existe un total de 380 empresas en esa rama industrial. Encuentre
un intervalo de confianza de 95 % para media de la poblacin de los empleados por
empresa e interprete el resultado.
32. Una fabrica produce anillos para los pistones de un motor de automvil. Se sabe que
el dimetro del anillo esta distribuida aproximadamente en forma normal y que tiene
una desviacin estndar de 0, 001 mm. Una muestra aleatoria de 15 anillos tiene un
dimetro promedio de 74, 036 mm.
33. Se toma una muestra al azar de 45 alumnos, tomados sin reposicin de una clase de
estadstica de 221 alumnos que muestra una media de 70 puntos y una desviacin estn-
dar de 9 puntos en las calificaciones finales. Compruebe que el intervalo de confianza
del 98 % para la media de las 221 calificaciones varia de 72, 8 a 97, 2 puntos.
34. La media y la desviacin tpica de las cargas mximas soportadas por 60 cables estn
dadas respectivamente por 11, 9 ton. y 0, 73 ton. Hallar los limites de confianza de:
9.5. PROBLEMAS 206
a) 95 %
b) 99 % para la media de las cargas mximas de todos los cables producidos por la
compaa e interprete los resultados.
35. La municipalidad necesita adquirir lamparitas elctricas en una fbrica. Se toma una
muestra de 100 lmparas con las cuales se hace que se mida el tiempo en que tardan
en quemarse. Los resultados son: media 2080 horas de vida y desviacin tpica de 300
horas. Hallar un intervalo de confianza para con un nivel de significacin de 1 % e
interprete el resultado.
36. Se desea estimar el precio promedio de cierto artculo de consumo. Para tal fin se
realiza una muestra en 101 comercios seleccionados al azar, que indica un precio medio
de 120 dlares, con una desviacin muestral de 16 dlares. Construir un intervalo de
confianza que con 95 % de seguridad contenga el parmetro poblacional e interprete el
resultado.
37. La estatura de 1000 estudiantes estn distribuidas aproximadamente de forma normal,
con una media de 174, 5 cm y una desviacin estndar de 6, 9 cm. Si se extraen 200
muestras aleatorias de tamao 25 de esta poblacin y las medidas se registran al dcimo
de centmetros ms cercanos. Determine:
a) La media y la desviacin estndar de la distribucin muestral de medias
b) Construya un intervalo de confianza de 90 % para la media de estaturas de esta
poblacin e interprete el resultado.
41. Un profesor de ingls cont el nmero de palabras mal escritas en un ensayo que asign
hace poco a sus alumnos. Para una clase de 24 alumnos, el nmero medio de palabras
mal escritas fue de 6,05 y la desviacin estndar fue de 2,44. Construya un intervalo
de confianza de 95 % para el nmero medio de palabras mal escritas en la poblacin de
estudiantes e interprete el resultado.
Captulo 10
Prueba de Hiptesis
10.1. Introduccin
En el captulo 8 se inici el estudio de la inferencia estadstica. Se describi la manera
de seleccionar una muestra aleatoria y, con base a sta, estimar el valor de un parmetro
poblacional.
En este captulo se continuar con el estudio de la inferencia estadstica. Pero ya no se
realizarn estimaciones puntuales sobre el valor de un parmetro se establecer un intervalo
de valores dentro del cual se espera que se encuentre el parmetro poblacional, sino que se
realizar una prueba de hiptesis acerca de una afimacin sobre un parmetro poblacional.
Todas estas hiptesis tienen algo en comn, las poblaciones de inters son tan grandes
que no es factible estudiar todos sus elementos. Como ya sabemos, una alternativa a estudiar
208
10.2. DEFINICIONES Y EJEMPLOS 209
la poblacin entera es tomar una muestra de la poblacin de inters. De esta manera podemos
probar una afirmacin para determinar si la evidencia soporta o no la afirmacin.
= P(rechazar H0 | H0 es cierta)
En cambio, la aceptacin de la hiptesis nula cuando sta es falsa recibe el nombre de error
tipo II, y la probabilidad de cometer este segundo tipo de error est dada por la relacin
= P(aceptar H0 | H0 es f alsa)
H0 cierta H0 falsa
Rechazar H0 Error tipo I Decisin correcta
con probabilidad con probabilidad 1
Aceptar H0 Decisin correcta Error tipo II
con probabilidad 1 con probabilidad
La informacin para obtener una regla de decisin que nos lleve a rechazar o no rechazar
un hiptesis estadstica provendr de una muestra aleatoria X1 , . . . , Xn de la distribucin de
que se trate. Observe adems que al aceptar una hiptesis no se afirma que sta sea absoluta-
mente cierta, sino simplemente que es consistente con los datos de la muestra aleatoria. Si la
muestra cambia, posiblemente la decisin de rechazar o no rechazar tambin.
Definicin 10.2.4 El subconjunto S1 del espacio muestral S para el cual H0 sera rechazada
se denomina regin crtica del contraste y a la probabilidad de cometer el error tipo I, esto
es , se le llama tamao de la regin crtica. A esta probabilidad se le conoce tambin con el
nombre de nivel de significancia.
y R denominada zona de rechazo y que contiene todos los resultados para para los
cuales H0 ser rechazada.
que constituye la probabilidad de evitar un error de tipo II. Por lo que la potencia de la prueba,
para cualquier valor en H1 , es la probabilidad de rechazar H0 , dado que H1 es cierta.
Por el contrario si H0 es cierta, la funcin de potencia es
que constituye la probabilidad de evitar un error de tipo I. Por lo tanto, constituye la proba-
bilidad de tomar la decisin correcta de aceptar H0 cunado esta es cierta.
Cuando H0 es falsa, la funcin caracteristica de operacin est dada por la relacin
El primer paso para un contraste de hiptesis es establecer las hiptesis nula y alterna-
tiva; esto es
H0 : = 0 contra una de las tres alternativas siguientes
H1 : < 0 (1)
H1 : > 0 (2)
H1 : 6= 0 (3)
Si estamos ante el caso (1) o (2) decimos que el contraste es unilateral o de una cola;
por el contrario si estamos ante el caso (3) el contraste es bilateral o de dos colas.
10.3. PRUEBAS DE HIPTESIS PARA GRANDES MUESTRAS (N 30) 213
Una regla de decisin es establecer las condiciones sobre las cuales la hiptesis nula
deber ser rechazada o no rechazada. Si el estadstico de prueba queda dentro de la
zona crtica la hiptesis nula deber ser rechazada. Si por el contrario, el estadstico de
prueba queda fuera de la zona crtica la hiptesis nula no deber ser rechazada.
El problema es encontrar una regla para decidir cundo rechazar H0 en favor de H1 con
base en los datos de la muestra X1 , X2 , . . . , Xn . Cuando H0 es cierta, esto es, cuando es
2
efectivamente 0 , se tendr que X N(0 , n ) y por lo tanto
(X 0 ) n
Z= N(0, 1)
La variable aleatoria Z es una medida natural de la distancia entre X (un estimador de
) y su valor esperado 0 cuando H0 es cierta. Es entonces razonable rechazar H0 cuando la
variable |Z| sea grande. Es por ello que se puede tomar como criterio de decisin rechazar
H0 cuando |Z| k, para cierta constante k. Cmo encontramos el nmero k?, es la pregunta
a contestar. Si estamos ante una prueba unilateral (caso (1) el caso(2)); en una tabla de la
distribucin normal podemos encontrar un valor z talque P(Z z ) = P(Z z ) = ,
de la misma forma si estamos ante una prueba bilateral (caso (3)) podemos encontrar z/2 tal
que P(|Z| z/2 ) = , en todos los casos que se pueden presentar el valor de lo determina
la persona que lleva a cabo la prueba de hiptesis. Este valor z z/2 es precisamente la
constante k buscada pues con ello se logra que la regin de rechazo sea de tamao .
La variable aleatoria Z constituye la estadstica de la prueba. Llevar a cabo esta prueba
de hiptesis consiste en usar los datos de la muestra para encontrar el valor de Z, si |Z| z
caso unilateral |Z| z/2 caso bilateral, entonces se rechaza H0 , en caso contrario no se
rechaza H0 . En la siguiente tabla se muestra resumida la informacin de este anlisis.
Ejemplo 10.3.1 La experiencia de varios aos ha demostrado que los focos marca A tienen
una vida media de 1180 hs, con una desviacin estndar de 90hs. Para probar la pretencin
de los vendedores de la marca B, se probaron 100 de esos focos comprados en almacenes
ordinarios. La muestra arroj X = 1220 hs. y S = 80 hs. Probar la hiptesis de que la media
marca B es igual a la media marca A, contra la alternativa de que tenga un valor mayor. Usar
un nivel de significancia del 5 %.
Desarrollo
H0 : = 1180 hs
H1 : > 1180 hs
El siguiente paso consiste en establecer un criterio de decisin, que en este caso ser
Con un nivel de significancia de 0,05 se puede afirmar que son distintos los promedios
de la marca A y la marca B, presumiblemente mayor el de la marca B.
Captulo 11
216
11.2. PROCEDIMIENTO DEL ANLISIS DE LA VARIANZA 217
que un grupo de ratas consume est en relacin con el tiempo transcurrido desde su ltima
comida. Para comprobar esta hiptesis, se selecciona al azar tres grupos de ratas con seis
ratas en cada grupo. Despus de someter a cada grupo a un entrenamiento preliminar, prueba
al grupo A, tres horas despus de comer; el grupo B, doce horas despus de comer y al grupo
C, veinticuatro horas despus de comer. La cantidad de tabletas consumidas por cada animal
en un periodo de diez minutos fueron las siguientes:
x = 18 x = 30 x = 48
x2 = 104 x2 = 180 x2 = 424
Captulo 12
12.1. Introduccin
En muchas investigaciones estadsticas, el principal objetivo es establecer relaciones que
permitan pronosticar una o ms variables en trminos de otras. Por ejemplo, se han efectuado
estudios para pronosticar las ventas futuras de un producto en trminos de su precio, de la
reduccin de peso de una persona en trminos del nmero de semanas que ha seguido una
dieta de 800 caloras por da, de los gastos familiares en atencin mdica en trminos del
ingreso familiar, del consumo per cpita de ciertos artculos alimenticios en trminos de su
valor nutricional y el dinero que se gasta en su publicidad televisiva y as consecutivamente.
Es evidente que sera ideal si pudiramos pronosticar una cantidad exactamente en trmi-
nos de otra, pero esto rara vez es posible. En la mayoria de los casos debemos conformarnos
con pronosticar promedios o valores esperados. Por ejemplo, no podemos pronosticar con
exactitud la cantidad de dinero que un graduado universitario especfico ganar diez aos
despus de graduarse, pero considerando datos apropiados podemos pronosticar las ganan-
cias promedio de todos los graduados univeristarios diez aos despus de su graduacin. Este
problema de pronstico del valor promedio de una variable en trminos del valor conocido de
otra variable (o de los valores conocidos de otras variables) se designa como el problema de
la regresin. Este trmino se remonta a Francis Galton (1822-1911), quien lo us por primera
vez en un estudio de la relacin entre las alturas de padres e hijos.
Definicin 12.2.1 Modelo: Por un modelo entendemos una ecuacin matemtica que con-
tiene variables aleatorias, variables matemticas (no aleatorias) y parmetros poblacionales.
218
12.2. MODELO ESTADSTICO 219
donde
1 , 22 y 3 son parmetros poblacionales desconocidos
X1i , X2i y X3i son variables matemticas
i son variables aleatorias
Definicin 12.2.2 Modelo Lineal: Es una ecuacin que contiene variables aleatorias, va-
riables matemticas (no aleatorias) y parmetros poblacionales y que el modelo es lineal en
los parmetros y en las variables aleatorias.
donde
1 , 2 y 3 son parmetros poblacionales desconocidos
X1 , X2 y X3 son variables matemticas
i son variables aleatorias
Y = + X
Y = + X +
Definicin 12.2.5 Modelo de Regresin: Son aquellas en que las variables aleatorias inde-
pendientes o predictoras son variables continuas; tales como la edad, peso, ingreso, demanda,
produccin, etc; que toman infinitos valores y sirven para cuantificar en lugar de indicar la
presencia de un efecto cualitativo.
n
para minimizar (yi yi)2 respecto de a y b; lo derivamos parcialmente con respecto de
i=1
ellos e igualemos dichas derivadas parciales a cero y obtendremos un sistema de dos ecua-
ciones con dos incgnitas denominados ecuaciones normales. Esto es
h n 2
i n n n
a i=1
(y i y
i ) = 2 (y i a bxi ) = 2 yi na b =0xi
i=1 i=1 i=1
h n 2
i n n n n
2
i i
b i=1
(y y
) = 2 i (y a bx )x
i i = 2 i i i i =0
x y a x b x
i=1 i=1 i=1 i=1
con lo cual
n n
yi = na + b xi (12.3.1)
i=1 i=1
n n n
xiyi = a xi + b xi2 (12.3.2)
i=1 i=1 i=1
Ajusta una lnea recta de mnimos cuadrados que relacione los nmeros de aos que los
solicitantes de trabajos en el servicio exterior estudiaron alemn en preparatoria o universi-
dad con las calificaciones que obtuvieron en la prueba de dominio de ese idioma.
Desarrollo
Ilustrando los puntos correspondientes a estos diez pares de valores en un diagrama, ob-
servaremos que aunque no todos los puntos caen en una misma lnea recta, el patrn general
de la relacin se describira razonablemente bien por medio de una lnea recta adecuada acier-
tos criterios bien definidos.
El grfico 12.1 muestra el partrn de comportacin de la relacin entre los nmeros de
aos que los solicitantes de trabajos en el servicio exterior estudiaron alemn en preparatoria
o universidad con las calificaciones que obtuvieron en la prueba de dominio de ese idioma,
adems muestra la linea que mejor se ajusta a los diez pares de datos.
12.3. MODELO DE REGRESIN SIMPLE 223
Figura 12.1: Grfico de la relacin entre el nmero de aos que se estudi alemn y la califi-
cacin obtenida en la prueba.
Las sumas requeridas para la sustitucin en las ecuaciones normales se obtienen realizan-
do los clculos que aparecen en la tabla siguiente:
x y x2 xy
3 57 9 171
4 78 16 312
4 72 16 288
2 58 4 116
5 89 25 445
3 63 9 189
4 73 16 292
5 84 25 420
3 75 9 225
2 48 4 96
El estudio de la correlacin involucra cuestiones como: hay una relacin entre los prome-
dios de la preparatoria y los promedios de primero en la universidad?. Hay una relacin entre
los gastos en publicidad de un negocio y sus ventas?. Hay una relacin entre el nmero de
aos en el trabajo y la productividad?, etc.
12.4. ANLISIS DE CORRELACIN 225