Professional Documents
Culture Documents
1
2. La producción de una fábrica se ve afectada, tanto en volumen como en calidad,
por muchos factores a lo largo del proceso de producción. Al tener registros que
muestren los valores de estos factores en el pasado, así como los de la producción
actual, se puede intentar establecer una ecuación predictiva que relacione a la
producción con los factores.
3. De un conjunto representativo de clientes, cada uno de ellos es entrevistado para
conocer su opinión con respecto a determinado producto nuevo. De la información
obtenida, el analista de mercados deberá decidir si existe demanda suficiente para
el producto.
Los problemas mencionados ilustran brevemente el hecho de que la estadística
en la ingeniería requiere del uso de información muestral para estimar, predecir y,
en última instancia, para decidir.
En los ejemplos anteriores, el centro de nuestro interés, el gran conjunto de datos
se llama población, y el subconjunto seleccionado de ahí, representa una
muestra.
Se ve pues, que el objetivo de la estadística es el de hacer inferencias (predecir,
decidir) sobre algunas características de una población tomando como base la
información contenida en una muestra.
Cuando se desea conocer alguna característica de una población se lleva a cabo
un censo y para conocer una característica de una muestra se hace uso
generalmente de una encuesta.
respectivamente.
Para todo parámetro existe un estadístico muestral asociado. El estadístico
describe a la muestra de la misma forma como el parámetro describe la población.
El estadístico es el valor numérico que resume los datos de la muestra. La
estatura “promedio” encontrada al utilizar el conjunto de 25 estaturas es un ejemplo
2
de un estadístico. Casi todos los estadísticos se determinan con ayuda de fórmulas
_
y suelen simbolizarse usando letras del alfabeto español: x y s2 la media y
varianza muestral respectivamente.
Nominal
Cualitativa
Jerarquizada
Variable
Cuantitativa Discreta
Continua
3
1). Una variable discreta es la que asume solo valores aislados, es decir no admite
valores intermedios entre dos valores específicos. Por ejemplo, el número de goles
x en un partido de fútbol.
2). Las variables continuas son aquellas que pueden asumir virtualmente cualquier
valor en un determinado intervalo real, como el peso w o la altura h de un estudiante.
La misma población puede dar origen a diferentes tipos de datos, como en la
población de alumnos de la carrera de Ingeniería Civil de la UES.
La relación entre las dos últimas disciplinas se puede resumir al decir que la
probabilidad razona desde la población hacia la muestra (razonamiento deductivo),
mientras que la estadística inferencial razona desde la muestra hacia la población
(razonamiento inductivo).
La estadística inferencial o simplemente estadística, consiste entonces en el
análisis e interpretación de una muestra de datos. La idea básica del muestreo es
4
medir una pequeña porción, pero típica de alguna “población”, y posteriormente
utilizar dicha información para inferir que característica tiene la población total. Los
tres tipos más importantes de técnicas inferenciales que estudiaremos son la
estimación puntual, la estimación del intervalo de confianza, y la prueba de
hipótesis.
Pasos:
El asistente aparecerá al pulsar el botón
1. En el primer paso debemos elegir el tipo de gráfico más conveniente:
barras, columnas, circular, etc.
2. Lo siguiente es elegir los datos de origen: primero si los datos están en filas
o en columnas y dónde están. Ahora debemos elegir las series que queremos
representar en este gráfico y dónde se encuentran los rótulos.
5
3. Opciones de gráfico, donde debemos elegir el aspecto de ejes, leyenda,
rótulos, títulos, etc.
4. Finalmente debemos elegir la ubicación del gráfico.
Muchos de los elementos que hemos ido eligiendo en los pasos anteriores
pueden ser cambiados utilizando la barra de herramientas gráfico.
6
Un diagrama estadístico o gráfica es un medio plástico para presentar datos
estadísticos.
Las graficas de línea que son principalmente usadas para mostrar datos
clasificados sobre las bases de intervalos de tiempo, son referidas como series de
tiempo.
7
DEUDA EXTERNA TOTAL DE 2003 A 2007
(En millones de US $)
Año Remesa
2003 7916.7
2004 8210.5
2005 8761.4
2006 9584.3
2007 9059.7
Fuente: CEPAL
8
En el período 2004 a 2006 se experimenta un aumento en la deuda externa, ¿cuál
es el promedio porcentual de aumento?
Años
2008 2009
Meses
9
Julio 332.1 286.1
400
En millones de US $
350
300
250 Año 2008
200
Año 2009
150
100
50
0
En Feb Mar Abr May Jun Jul Ago Sep Oct
10
esta información mediante un gráfico de partes componentes de barras dobles
sobrepuestas verticales.
14000
Millones de US $
12000
10000
8000 8389 Importaciones
6000 6018.2 Exportaciones
4000
2000 3907.3 3219
0
2008 2009
Años
11
PRINCIPALES PAISES PRODUCTORES DE PETROLEO EN 2006
(Millones de barriles diarios (mb/d))
CANTIDAD
PAIS DE
BARRILES
Arabia Saudí 10.72
Rusia 9.67
Estados Unidos 8.36
Irán 4.15
China 3.84
México 3.71
Canadá 3.29
Emiratos Árabes 2.94
Unidos
Venezuela 2.80
Noruega 2.78
Kuwait 2.67
Nigeria 2.44
Brasil 2.16
Argelia 2.12
Irak 2.00
FUENTE: Agencia de Información Energética (AIE) de EUA
CANTIDAD
PAIS DE BARRILES GRADOS PORCENTAJE (%)
Arabia Saudí 10.72 60.63 16.84
Rusia 9.67 54.69 15.19
Estados Unidos 8.36 47.28 13.13
Irán 4.15 23.47 6.52
China 3.84 21.72 6.03
México 3.71 20.98 5.83
Canadá 3.29 18.61 5.17
Emiratos Árabes Unidos 2.94 16.63 4.62
Venezuela 2.80 15.84 4.40
Noruega 2.78 15.72 4.37
Kuwait 2.67 15.10 4.19
Nigeria 2.44 13.80 3.83
Brasil 2.16 12.22 3.39
Argelia 2.12 11.99 3.33
Irak 2.00 11.31 3.14
TOTAL 63.65 360.00 100%
Aquí, se utiliza una regla de tres simple directa, por ejemplo, para Arabia Saudí,
12
63.65 barriles………. 3600
10.72 barriles……….... x
(10.72)(360)
de donde x = = 60.630 , y de igual manera se obtienen los restantes
63.65
sectores.
El porcentaje se obtiene de manera semejante a los sectores.
Venezuela, 2.8,
5%
Emiratos; 2,94; Estados Unidos;
5% 8,36; 13%
Canadá, 3.29,
5%
¿Con qué
México, gráfica,
3.71, 6% con el diagrama de pastel o con una gráfica de barras, se
obtiene una mejor representación de la información? Irán, 4.15, 7%
China, 3.84, 6%
Al elaborar una gráfica de barras o de pastel, ¿cuál método gráfico refleja mejor los
datos? ¿Por qué?
Ejemplo 1.8. Inyección Neta Mensual Eléctrica por mes durante el año 2008.
Describa esta información mediante un gráfico polar.
13
INYECCION NETA MENSUAL ELECTRICA DURANTE EL AÑO 2008
(GWh)
INYECCION
MES NETA MENSUAL
Enero 455.5
Febrero 439.9
Marzo 458.9
Abril 477.1
Mayo 485.5
Junio 460.5
Julio 407.4
Agosto 472.3
Septiembre 463.1
Octubre 471,3
Noviembre 442.4
Diciembre 457.3
TOTAL 5,566.1
Fuente: SIGET
_
El promedio mensual de la inyección neta , x , es
_
inyección neta anual 5,566.1
x= = = 463.8 GWh
número de meses 12
Se asigna a este promedio un radio arbitrario, por ejemplo 5 cm. y luego se calcula
los radios para cada mes, a través de una regla de tres simple directa. Por ejemplo,
para el mes de Enero,
463.8----------------5
455.5-----------------x
(455.5)(5)
de donde, x = = 4.9
463.8
INYECCION
MES NETA MENSUAL RADIO
Enero 455.5 4.9
Febrero 439.9 4.7
Marzo 458.9 4.9
Abril 477.1 5.1
Mayo 485.5 5.2
Junio 460.5 5.0
Julio 407.4 4.4
Agosto 472.3 5.1
Septiembre 463.1 5.0
Octubre 471.3 5.1
Noviembre 442.4 4.8
Diciembre 457.3 4.9
TOTAL 5,566.1
14
A continuación se presenta el gráfico a escala:
Durante el mes de Mayo ocurre la más alta de las inyecciones eléctricas, 485.5
GWh, y la más baja , 407.4 GWh, en el mes de Julio.
Los pictogramas son gráficos con dibujos alusivos al carácter que se está
estudiando y cuyo tamaño es proporcional a las frecuencias que representan.
Generalmente se emplean para representar variables cualitativas.
AÑO CANTIDAD
2002 1,935.2
2003 2,105.3
2004 2,547.6
2005 2,830.2
2006 3,315.7
2007 3,695.3
2008 3,787.7
Fuente: BCR
15
Solución:
Una imagen alusiva será la figura de un paquete de billetes de US $, cuyo tamaño
estará relacionado con la cantidad de dinero remesado en cada año. El pictograma
correspondiente es el que sigue:
16
a. Elabore un diagrama de Pareto para esta información.
b. Según el principio de Pareto que defectos requieren especial atención.
Solución:
a.
17
Observe cómo los datos están “acumulados” cerca del centro y “más dispersos” en
los extremos.
76 74 82 96 66 76 78 72 52 68
86 84 62 76 78 92 82 74 88
Solución:
Se observan puntajes en las decenas: 50, 60, 70, 80 y 90. Como tallo se utiliza el
primer dígito y como hoja, el segundo dígito. Generalmente, la representación se
realiza en posición vertical. Se traza una recta vertical y se escriben los tallos, en
orden, a la izquierda de la recta.
18
19 puntos de examen
5 2
6 6 8 2
7 6 4 6 8 2 6 8 4
8 2 6 4 2 8 Tallo: decenas
9 6 2 Hoja: unidades
6 1 3 4 5 5 6
7 0 1 1 3 5 7 8 8 9
8 1 3 4 4 7 8 8
9 2 3 5
Solución:
6L 1 3 4
6U 5 5 6
7L 0 1 1 3
7U 5 7 8 8 9
8L 1 3 4 4
8U 7 8 8
9L 2 3 Tallo: decenas
9U 5 Hoja: unidades
19
Aquí se obtiene una presentación más adecuada de los datos.
Variables Continuas
El caso más frecuente, y también más interesante, es cuando la variable es
continua en estos casos existen dos modos de construir las tablas de distribución
de frecuencias:
1. Método simple
2. Método de las frecuencias agrupadas
1. Método simple
Es en todo similar al tratamiento que se ha dado a las variables discretas, su
tabla es idéntica a la de estas. En cuanto a sus representaciones gráficas, junto a
las gráficas de ordenadas y gráficas de puntos, ya expuestas, resulta interesante,
en este caso, la construcción del llamado diagrama acumulativo. Se dibuja a partir
20
del diagrama de puntos, acumulando a cada ordenada todas las frecuencias
anteriores.
1.3 1.0 1.1 1.2 1.3 1.4 1.6 1.7 1.5 1.8 1.8 1.8 1.0
1.4 1.2 1.4 1.3 1.5 1.1 1.5 1.3 1.4 1.7 1.7 1.2 1.7
1.8 1.8 1.8 1.8 1.8 1.8 1.1 1.5 1.4 1.4 1.5 1.5 1.6
1.8 1.3 1.6 1.6 1.7 1.7 1.6 1.5 1.2 1.5 1.4 1.5 1.7
1.2 1.3 1.5 1.4 1.6 1.5 1.6 1.2 1.3 1.4 1.4 1.5 1.6
1.1 1.2 1.3 1.5 1.6 1.7 1.6 1.7 1.4 1.5
21
El diagrama acumulativo se muestra a continuación:
22
ya que con él se pretende una simplificación de cálculos. Puede aconsejarse un
número discreto entre 5 y 20 clases. Una regla empírica es calcular la raíz cuadrada
del número de datos, n, y ajustarla para adaptarla (si es necesario) a los límites 5 y
20. Otra forma es utilizar la fórmula empírica de Sturges:
h=1 + (3.32) log (n)
Aquí, mientras no se diga lo contrario, utilizaremos el método de la raíz cuadrada
del número de datos. En el caso nuestro 75 8.6, que para adaptarla al problema
se ajusta a 9 (aproximación al entero próximo mayor), ya que el número de clases
es un número entero.
Si se está imposibilitado para juzgar los efectos del agrupamiento, entonces bajo
condiciones ordinarias (una muestra que no es muy grande y se cuenta con facilidad
de cálculo) se debe considerar la posibilidad de usar los datos originales no
agrupados. En definitiva, el número de intervalos lo dictará cada circunstancia en
particular.
R
c =i= = (0.8)/9 = 0.088888
h
23
Se forman los intervalos, agregando el ancho al límite inferior de cada clase,
iniciando por el menor de todos los datos. Así, por ejemplo, la primera clase es
1.0 - 1.09 ó 1.0 x < 1.09 ó [1.0, 1.09) y
la segunda clase es
1.09 - 1.18 ó 1.09 x < 1.18 ó [1.09, 1.18)
De manera similar se encuentran las restantes clases, para obtener finalmente
la tabla siguiente:
Intervalo
1.0 - 1.09
1.09 - 1.18
1.18 - 1.27
1.27 - 1.36
1.36 - 1.45
1.45 - 1.54
1.54 - 1.63
1.63 - 1.72
1.72 - 1.81
NOTA: Si Ls cae fuera de la última clase, agréguese al último dígito de c uno. Por
ejemplo, si con c=0.09, Ls hubiese caído fuera, entonces c=0.09 + 0.01=0.10.
5. Encontrar las frecuencias de clase, f, contando el número de datos que caen
en cada intervalo y este número anotarlo en la columna correspondiente a las
frecuencias. El total de esta columna debe ser igual a n (75), el número de datos.
Intervalo Frecuencia
f
1.0 - <1.09 2
1.09 - <1.18 4
1.18 - <1.27 7
1.27 - <1.36 8
1.36 - <1.45 11
1.45 - < 1.54 14
1.54 - < 1.63 10
1.63 - <1.72 9
1.72 - <1.81 10
Total 75
24
La suma de las frecuencias relativas de todas las clases es evidentemente 1 ó
100%.
6. Una vez establecidas las clases, han de establecerse las marcas de clase de
cada una de ellas. La marca de clase, x, o Pm es el punto medio de la clase y se
25
obtiene sumando los límites inferior y superior de la clase y dividiendo por 2. Así, la
marca de clase del intervalo 1.0 - 1.09 es
Marca de
Intervalo clase
x ó Pm
a. Sus bases sobre un eje horizontal (el eje x) con centro en las marcas de clase y
longitud igual al ancho de clase.
26
Si los intervalos de clase tienen todos iguales tamaños, las alturas de los
rectángulos son proporcionales a las frecuencias de clase y se acostumbra en tal
caso a tomar las alturas numéricamente iguales a las frecuencias de clase.
27
Ejemplo 1.15. Considere los siguientes datos sobre el tiempo activo de reparación
(horas) para una muestra de n=46 receptores de comunicaciones:
0.2 0.3 0.5 0.5 0.5 0.6 0.6 0.7 0.7 0.7 0.8 0.8
0.8 1.0 1.0 1.0 1.0 1.1 1.3 1.5 1.5 1.5 1.5 2.0
2.0 2.2 2.5 2.7 3.0 3.0 3.3 3.3 4.0 4.0 4.5 4.7
5.0 5.4 5.4 7.0 7.5 8.8 9.0 10.3 22.0 24.5
28
Esto es, el área de cada rectángulo es la frecuencia relativa de la clase
correspondiente. Además, como la suma de las frecuencias relativas debe ser 1.0
(salvo en los redondeos), el área total de todos los rectángulos en un histograma de
densidad es 1.
Histograma utilizando Excel
Pasos:
1. Rango de entrada: introducir la referencia de celda correspondiente al rango
de datos que desea analizar.
2. Rango de clases: introducir el rango de celdas que definen los extremos de
los intervalos de clase. Estos valores deberán estar en orden ascendente. Si
se omite el rango de clase, se creará un conjunto de clases distribuidas
igualmente entre los valores mínimo y máximo de los datos.
3. Rótulos: activar si la primera fila y la primera columna del rango de entrada
contiene rangos.
4. Opciones de salida: rango de salida, en una hoja nueva o en un libro nuevo.
5. Crear gráfico: genera un gráfico de histograma incrustado con la tabla de
resultados.
Tomando el ejemplo 1.14, se genera el siguiente histograma:
Clase Frecuencia
1,09 2
1,18 4
1,27 7
1,36 8
1,45 11
1,54 14
1,63 10
1,72 9
1,81 10
y mayor... 0
10
8
6
4
2
0
Clase
29
distribución porcentual o tabla de frecuencias relativas. Las representaciones
gráficas de distribuciones de frecuencia relativa pueden obtenerse del histograma o
polígono de frecuencias, sin más que cambiar la escala vertical de frecuencia o
frecuencia relativa, conservándose exactamente el mismo diagrama. Los gráficos
que resultan se llaman histogramas de frecuencias relativas o histogramas
porcentuales y polígonos de frecuencias relativas o polígonos porcentuales,
respectivamente.
Intervalo f Fa Fd
1.0 - < 1.09 2 2 75
1.09 - < 1.18 4 6 73
1.18 - < 1.27 7 13 69
1.27 - < 1.36 8 21 62
1.36 - < 1.45 11 32 54
1.45 - < 1.54 14 46 43
1.54 - < 1.63 10 56 29
1.63 - < 1.72 9 65 19
1.72 - < 1.81 10 75 10
30
2. Se colocan sobre el eje vertical las frecuencias acumuladas ascendentes.
3. El punto (ls, Fa) se forma con el extremo superior del intervalo y la frecuencia
acumulada ascendente respectiva.
4. Se le asigna cero al límite inferior del primer intervalo; con lo cual graficamos
un punto adicional, que es donde principia la ojiva ascendente.
5. Los puntos graficados se unen a través de segmentos de recta.
31
frecuencias o el de frecuencias relativas puede estar formado por muchos pequeños
segmentos rectos que aproximan el conjunto a una curva, que suele llamarse curva
de frecuencia o curva de frecuencia relativa, respectivamente.
Tales curvas teóricas provienen de la suavización de los polígonos de
frecuencias de la muestra y la aproximación es tanto más exacta en la medida como
aumenta el tamaño de la muestra. Por esta razón una curva de frecuencias se llama
polígono de frecuencias suavizado o histograma suavizado.
Las curvas de frecuencias se clasifican de acuerdo a determinadas
características como se muestran a continuación:
Sesgada: Una cola es más larga que la otra. La dirección del sesgo es del lado de
la cola más larga. Si el sesgo es a la derecha, este responde a la variabilidad que
presentan ciertas variables que no siguen una ley normal, como los tiempos de vida.
En forma de J: No hay cola del lado de la clase con la frecuencia más alta.
32
Bimodal: Las dos clases más pobladas están separadas por una o más clases.
Esta situación a menudo implica que se están muestreando dos poblaciones. La
curva bimodal resulta cuando el conjunto de datos está formado por observaciones
de dos tipos distintos de individuos u objetos.
1.7 Estadísticos
Los datos que caracterizan a una población se llaman parámetros y los que
caracterizan a una muestra se llaman estadísticos. Por ejemplo, el porcentaje
de mujeres en toda la república de El Salvador, es un parámetro; mientras que el
porcentaje de mujeres, de entre un total de 438 personas que se encuentran en una
reunión, es un estadístico.
Los estadísticos, permiten de una forma cuantitativa, al margen de todo
subjetivismo, la comparación entre distintas series estadísticas y la valorización, en
números, de sus diversas características.
Son de cinco clases estas medidas: los estadísticos de centralización que
suministran los valores centrales o promedios alrededor de los cuales se agrupan
los datos de la serie; los de Posición que describen la posición de datos con
respecto al resto; los de dispersión que miden la mayor o menor regularidad de
agrupamiento de la serie, sobre las medidas centrales; las medidas de asimetría
que cuantifican, como su nombre indica, la asimetría de la distribución; y
estadísticos de prominencia, que son capaces de comparar, a igualdad de
dispersión, la densidad de frecuencias centrales.
Media aritmética: x
DEFINICION.
x1 + x 2 + ...+ xn
x=
n
n
Para representar la suma x1 + x2 + ... + xn se usa el símbolo . Así, x
i=1
i
significa que debemos sumar los elementos x i , los que inician con x1 (cuando i=1)
y finalizan con x n (cuando i=n). Con esta notación, la media se escribe de la
manera siguiente:
n
x1 + x 2 + ...+ xn x
i=1
i
x= =
n n
34
Otras de las grandes herramientas que existen en Excel son las funciones: fx.
Las funciones nos permiten realizar operaciones más complejas y de forma sencilla,
tanto con valores numéricos o valores de texto.
Excel devuelve el
promedio de los
números que estén en
el rango de celdas, es
decir, 79,08
DEFINICION.
f1x1 + f2 x 2 + ... + fk xk fi xi fi xi
x= = = *
f1 + f2 + ... + fk fi n
_
(3)(4)+(5)(8)+(4)(9)+(2)(6)
x= = 7.1
3+5+ 4+2
35
Media aritmética ponderada
DEFINICION
A veces se asocia a los números x1, x2,. . . , xk ciertos factores o pesos w1, w2, .
. . , wk que dependen de la significación o importancia de cada uno de los
números. En este caso
w1x1 + w 2 x 2 + ... + w k xk w x
x= =
w1 + w 2 + ... + w k w
se llama media aritmética ponderada.
Nótese la similitud con (*), que puede considerarse como una media aritmética con
los pesos f1, f2,. . ., fk.
_
(6.0)(0.25)+(8.0)(0.10)+(5.4)(0.30)+(7.0)(0.10)+(6.3)(0.25)
x=
0.25 +0.10 +0.30 +0.10 +0.25
_
x = 6.20
DEFINICION
d = 0i
Demostración:
x - x = x - x = n n - x = n x- n x = 0
_
_ xi _ _ _
i i
36
c =c
Demostración:
c=
c = c + c +...+ c = nc = c
n n n
3. “La media aritmética del producto de una constante por una variable es igual al
producto de la constante por la media aritmética de la variable”. Es decir,
__
cx = cx
Demostración:
___
cx1 + cx 2 +...+ cxn c(x1 + x 2 +...+ xn ) c xi _
cx = cxi = = = =cx
n n n
4. “La media aritmética de la suma de una variable más una constante es igual a la
suma de la media aritmética de la variable más la constante”. Es decir,
_______
x +c = x +c
Demostración:
________
x +c = x
i + c + (x 2 + c)+...+ x n + c
1
x+c =
n n
x + x +...+ x n nc
= 1 2 +
n n
=
xi + c
n
_
x+ c
__
f1x1 + f2 x 2 +...+ fk xk
x= f1 + f2 +...+ fk
Sea la suma de las f1, f2, .. . , fk números m1, m2,. . . , mk respectivamente. Entonces
por definición de media aritmética,
__
m1 __ m2 __
m __ __ __
x1 = , x2 = ,..., x k = k o m1 = f1 x 1, m2 = f2 x 2 ,...,mk = fk x k
f1 f2 fk
37
Puesto que todos los números (f 1+f2+…+fk) suman (m1+m2+…+mk) la media
aritmética de todos los números es
m1 +m2 +...+mk
x=
f1 + f2 +...+ fk
f1x1 + f2 x2 +...+ fk xk
=
f1 + f2 +...+ fk
x=
x = 0.6 +1.2 + 0.9 +1.0 + 0.6 + 0.8 = 0.85
n 6
xi x- x
0.6 -0.25
1.2 0.35
0.9 0.05
1.0 0.15
0.6 -0.25
0.8 -0.05
_______
(1x +0.10x)+ 25 =1.10x + 25 = 1.10x + 25 =1.10x + 25 =1.10(300)+ 25 = $ 355.0
Ejemplo 1.21. En una fábrica con 80 empleados, 60 ganan un promedio de $
1.0 por hora y 20 ganan un promedio de $ 2.0 por hora. Determinar la media del
salario por hora.
_
(60)(1.0)+(20)(2.0) 60 + 40 100
x= = = = $ 1.25
60 + 20 60 + 20 80
x=
x f i i
n
Ejemplo 1.22. Los siguientes datos son mediciones de 40 emisiones diarias (en
toneladas) de óxido de azufre de una planta industrial.
15.8 24.1 15.2 13.5 22.3
17.3 28.6 26.6 14.5 11.8
23.9 23.7 21.4 29.6 20.0
18.7 22.7 21.6 17.0 31.7
9.0 20.5 19.0 24.3 10.5
13.2 20.9 23.0 24.6 27.5
9.8 19.4 20.1 18.1 17.9
14.7 10.7 18.0 21.9 24.1
PESOS (Tn.) f xf
9.0 - < 12.25 5 53.125
12.25 - < 15.00 4 54.50
15.00 - < 18.75 8 135.00
18.75 - < 22.00 9 183.375
22.00 - < 25.25 9 212.625
25.25 - < 28.50 2 53.75
28.50 - < 31.75 3 90.375
Total 40 782.75
b) Halle x .
La media es
x=
xf = 782.75 =19.57 toneladas
n 40
Ventajas:
1. Contiene toda la información de los datos de la distribución, lo que le confiere,
como promedio, un carácter muy representativo.
39
2. Siempre puede ser determinada, es fácil de calcular y admite todas las
operaciones aritméticas.
3. Es el estadístico más útil para análisis posteriores.
Desventajas:
1. Sensible al cambio de valores extremos por un lado, que no se compensen
por valores extremos en el lado contrario.
2. No se puede determinar si en una distribución de frecuencias hay intervalos
de clase abiertos.
3. No es recomendable emplearla en distribuciones muy asimétricas.
La Mediana: x ó Md
DEFINICION
7+9
x= = 8.0 .
2
40
Si se ordenan las observaciones por orden de magnitud y si n es impar, la
mediana es la observación que aparece en el lugar (n+1)/2; si n es par, la mediana
es el promedio de las observaciones que están en los lugares n/2 y n/2 + 1. Así,
6.1 5.8 7.8 7.1 7.2 9.2 6.6 8.3 7.0 8.3
7.8 8.1 7.4 8.5 8.9 9.8 9.7 14.1 12.6 11.2
Calcular xrec(10) .
La media de las 20 observaciones es x =8.58 MPa. La media recortada al 10%
se obtiene desechando las dos observaciones más pequeñas (5.8 y 6.1) y las dos
observaciones más grandes (12.6 y 14.1) y luego se promedian las restantes 16
observaciones para obtener xrec(10) = 8.31 MPa. El efecto de eliminar datos aquí es
obtener un “valor central” que está un poco arriba de la mediana y, todavía, bastante
debajo de la media.
En términos generales, al utilizar una media recortada con una proporción
moderada de datos eliminados se obtiene una medida que no es tan sensible a
valores inusuales como la media, ni tan insensible como la mediana. La media
recortada busca eliminar la distorsión de la media originada por los valores muy
extremos. Por este motivo, las medias recortadas llaman cada vez más la atención.
41
Mediana calculada a partir de datos agrupados
Supóngase que las observaciones en cada clase se “dispersan uniformemente” a
través del intervalo de clase, la mediana se obtiene por interpolación por medio de
la fórmula
n / 2 - Fa
x = li + c
f
Demostración:
La deducción de la fórmula anterior es la sencilla aplicación de una semejanza de
triángulos que se producen al cortar por la mitad de la frecuencia total, n/2 el
polígono de frecuencia acumulado ascendente (ojiva ascendente)
___
n / 2 - Fa
de donde AE = c , entonces
f
n / 2 - Fa
x = li + c
f
Si las observaciones en cada clase no se dispersan uniformemente, la fórmula
anterior se convierte en la fórmula
42
(n +1) / 2 - Fa
x = li + c
f
Ejemplo 1.26. La edad de cada uno de los 50 visitantes que asistieron a una
exhibición científica viene dado por la siguiente tabla de frecuencias.
Edad Número
0 - < 10 6
10 - <20 18
20 - < 30 11
30 - < 40 3
40 - < 50 0
50 - < 60 8
60 - < 70 4
50
Halle x .
Completando la columna correspondiente a la frecuencia acumulada ascendente
se tiene
Edad f Fa
0 - <10 6 6
10 - < 20 18 24
20 - < 30 11 35
30 - < 40 3 38
40 - < 50 0 38
50 - <60 8 46
60 - <70 4 50
50
x = 20.9 años
Ventajas y desventajas de la mediana
Ventajas:
1. No es afectada por valores extremos tan grave como la media.
3. Es fácil de entender y se puede calcular a partir de cualquier tipo de datos,
incluso a partir de datos agrupados con clases de extremo abierto, a menos
que la mediana entre en una clase de extremo abierto.
4. Podemos encontrarla incluso cuando nuestros datos son descripciones
cualitativas.
Desventajas:
43
1. Ciertos procedimientos estadísticos son más complejos que aquellos que
utilizan la media.
2. Debido a que es una posición promedio, debemos ordenar los datos antes
de llevar a cabo cualquier cálculo.
La moda: x̂ ó Mo
DEFINICION
La moda de una serie de datos es aquel dato que se presenta con la mayor
frecuencia, es decir, es el valor más común.
Ejemplo 1.27. Considérense los datos 9, 2, 7, 11, 14, 7, 2, 7. El valor 7 ocurre tres
veces, el 2 aparece dos veces y el resto ocurre una vez cada uno, luego, x̂ = 7 .
Solución alterna con Excel:
Función Sintaxis Descripción Ejemplo
44
1 =fi - fi – 1: exceso de la frecuencia modal sobre la frecuencia de la
clase
contigua inferior
2 = fi - fi + 1: exceso de la frecuencia modal sobre la frecuencia de la
clase contigua superior
Demostración:
Considérese en el histograma del ejemplo 1.27 el rectángulo más alto y sus
rectángulos adyacentes. El rectángulo más alto corresponde a la clase modal.
Δ1ls + Δ2li
xˆ =
Δ1 + Δ2
pero, ls = li +c, entonces
45
Δ1(li + c)+ Δ2li
xˆ =
Δ1 + Δ2
Δ1
xˆ = li + c
Δ1 + Δ2
12
xˆ =10 +10
12 + 7
x̂ =16.3 años
Ventajas y desventajas de la moda
Ventajas:
1. Puede utilizarse como una posición central para datos tanto cualitativos como
cuantitativos.
2. No es afectada indebidamente por valores extremos.
3. Podemos utilizarla aun cuando los valores extremos sean muy altos o muy
bajos.
4. Podemos utilizarla aun cuando una o más clases sean de extremo abierto.
Desventajas:
1. Muchas veces no existe debido a que a que el conjunto de datos no contiene
valores que se presenten más de una vez.
2. En ocasiones, cada valor es la moda, pues cada uno de ellos se presenta el
mismo número de veces.
3. Cuando los conjuntos de datos contienen dos, tres o más modas, es difícil
interpretarlos y compararlos.
4. En distribuciones muy asimétricas suele ser un dato muy poco
representativo.
5. Carece de rigor matemático.
46
Relación empírica entre la media, mediana y moda
Para curvas de frecuencias unimodales que sean moderadamente sesgadas
(asimétricas), se tiene la relación empírica
x - xˆ = 3(x - x)
A continuación se muestran las posiciones relativas de la media, mediana y
moda para curvas de frecuencias que están sesgadas a la derecha y a la izquierda
respectivamente.
I. Distribución Simétrica.
Para curvas simétricas, la media, moda y media coinciden.
47
Los cuartiles: Qk
DEFINICION
Sean x1, x2,… , xn un conjunto de n datos ordenados por orden de magnitud. El
primer cuartil, Q1, es aquel que deja a la izquierda ¼ (25%) de los datos y es
menor que ¾ (75%) de los datos. El segundo cuartil, Q2, es la mediana. El tercer
cuartil, Q3, sobrepasa ¾ (75%) de los datos y es menor que ¼ (25%) de ellos.
48
2. Calcular k(n/4)=3(8/4)=6, de donde w=6
Q = x 2x
+ 13 +18
4. 3
6 7
= = 31/ 2 = 15.5
2
Nota: Los valores calculados por este método difieren un poco a los calculados por
Excel.
Los cuartiles se usan con frecuencia en los datos de ventas y encuestas para
dividir las poblaciones en grupos. Por ejemplo, se pueden utilizar para determinar el
25 por ciento de ingresos más altos en una población. ¿Cómo?
4. Q1 = x 2 = 5
Q2: 1. 1, 5, 6, 7, 9
4. Q2 = 6
Q3: 1. 1, 5, 6, 7, 9
49
2. Calcular k(n/4)=3(5/4)=3.75, de donde w=3
4. Q3 = 7
k(n / 4) - Fa
Qk = li + c ; k=1, 2, 3
f
donde li: límite inferior de la clase cuartílica
c: ancho de la clase cuartílica
Fa: frecuencia acumulada anterior a la clase cuartílica
f: frecuencia de la clase cuartílica
Ejemplo 1.32. Encuentre Q1, Q2 y Q3 del tiempo de espera para consulta de los
pacientes de una clínica
Minutos f
0 - <5 220
5 - <10 82
10 - <15 27
15 - <20 15
20 - <25 5
25 - <30 1
50
Q2: Como k(n/4) = 2(350)/4 = 175, es claro que Q2 ha de buscarse en el primer
intervalo.
2(n / 4) - Fa
Así, Q2 = li + c
f
175 - 0
= 0+5
220
Q2 = 4.0 Min. = x
Los centiles: Ck ó Pk
DEFINICION
Análogamente a los cuartiles, los valores que dividen al conjunto de datos en
100 partes iguales se llaman percentiles o centiles.
Por ejemplo C90 para un conjunto de datos es el valor que deja bajo si el 90% de
ellos y arriba de si el 10%.
Ejemplo 1.33. Encontrar C70 en los siete valores 6, 10, 13, 19, 18, 16, y 15.
51
Esta función permite establecer un umbral de aceptación. Por ejemplo, podrá
examinar a los candidatos en un evento cuya calificación sea superior al
nonagésimo percentil. ¿Cómo?
Grado (0 f
C)
40 - < 50 5
50 - <60 18
60 - <70 27
70 - < 80 15
80 - < 90 6
71
k(n/100) - Fa
Ck = li + c
f
21.3 - 5
C30 = 50 +10
18
C30 = 59.10 C
52
Una medida de dispersión es importante por dos razones: primero, puede ser
usada para mostrar el grado de variación entre los valores en los datos dados; y
segundo, puede ser usada para suplementar un promedio para describir un grupo
de datos o para comparar un grupo de datos con otro.
Una medida de dispersión puede ser expresada ya sea en valor absoluto o en
valor relativo. Los tipos más comunes de dispersión expresados en valores
absolutos son: el recorrido, la desviación cuartílica, la desviación media, la
varianza y la desviación estándar.
R=10-1=9
Desventajas:
1. Refleja únicamente los valores extremos, ignorando la información
intermedia.
2. Difícil de interpretar, principalmente porque depende del número de
observaciones que sirvieron para computarlo.
3. Una de las desventajas del rango es que no proporciona información sobre
los datos están entre el dato mayor y el menor.
El recorrido intercuartílico: Q
DEFINICION
Q=Q3 – Q1
53
Cuando esta diferencia es dividida entre 2, el cociente es el recorrido semi-
intercuartílico o desviación cuartílica (D. Q.):
Q3 - Q1
D. Q. =
2
Estas dos medidas son muy poco usadas y son de alguna utilidad cuando el
promedio utilizado es la mediana.
Q3 - Q1 7.6 - 2.0
D. Q. = = = 5.6 / 2 = 2.8 Min.
2 2
La desviación media: D. M.
DEFINICION
La desviación media, de una serie de n datos x1, x2,…,xn viene definida por
x -x
i=1
i
D. M. =
n
2 + 3 + 6 + 8 +11
x= =6
5
Entonces,
54
2 - 6 + 3 - 6 + 6 - 6 + 8 - 6 + 11- 6 4 + 3 + 0 + 2 + 5
D. M. = = = 2.8
5 5
Solución con Excel:
Función Sintaxis Descripció Ejemplo
n
f
i=1
i xi - x
Aquí, D. M. = , donde xi es la marca de clase y fi la correspondiente
n
frecuencia de clase.
D. M. =
f x - x =
180.08
= 4.50 Tn.
n 40
Ventajas:
55
1. Es fácil de computar.
Desventajas:
1. Si de varios grupos se conocen las desviaciones medias respectivamente,
la desviación media no se puede hallar del grupo combinado, si se conocen
todas las observaciones.
2. Es de poca utilidad en inferencia estadística.
La varianza: s2
DEFINICION
s2 =
(x - x) 2
n -1
=
(x 2 - 2xx + x 2 )
n -1
s2 =
x - 2x x + nx 2
2
n -1
Reemplazando x por x / n y multiplicando el numerador y el denominador
por n, se obtiene la fórmula
n x 2 - x
2
s2 =
n(n -1)
x - x / n
2 2
ó 2
s =
n -1
56
Ejemplo 1.39. El espesor de tablillas de circuitos impreso es una característica
muy importante. Una muestra de ocho tablillas tiene los siguientes espesores (en
milésimas de pulg.): 63, 61, 65, 62, 61, 64, 60 y 66. Calcular la varianza de la
muestra.
n x 2 - x
2
2
s =
n(n -1)
x 2
= 31,532; x = 502.
8(31,532) - (502)2 252,256 - 252,004 252
s2 = = = = 4.5 (milésimas de pulgadas2 )
8(7) 56 56
2
f x - x
s2 = o s2 =
n -1 n -1
Si s se calcula sin fines inferenciales, o bien, si se calcula s2 de una población,
2
2
s =
n -1
x f
0 - <10 5 2
10 -<20 15 1
20 -<30 25 5
30 -<40 35 8
40 -<50 45 4
20
20
x f xf x2f
0 - <10 5 2 10 50
57
10 -<20 15 1 15 225
20 -<30 25 5 125 3,125
30 -<40 35 8 280 9,800
40 -<50 45 4 180 8,100
20 610 21,300
x2f - xf / n
2
2
s =
n -1
s2 =141.8
Propiedades de la varianza
2
Propiedades. Sea s x la varianza de un conjunto de datos x1, x2,…,xn, k y b
constantes, entonces:
2 2 2
1. s x >0 4. Si y=x + k entonces s y = s x
2 2 2 2
2. Si y=k entonces s y =0 5. Si z=x + y entonces s z = s x + s y
2 2 2 2 2 2
3. Si y=kx entonces sy = k .sx 6. Si y=kx + b entonces sy = k .sx
Ejemplo 1.41. Considere los datos de espesor de las tablillas de circuito impreso
en el ejemplo 1.39.
2
c) Si y=5x + 2, calcule s y .
Desventajas:
1. Las unidades de esta medida son las unidades de la variable al cuadrado.
58
2. No es fácil su interpretación debido a sus unidades.
3. Se debe acompañar de otras medidas de dispersión para su análisis.
s = s2
59
2 o
s c
= s c
= 34.03 = 5.83 C
El coeficiente de variación: CV
En ocasiones es deseable expresar la variación como fracción de la media. Para
hacer esto se utiliza una medida adimensional de variación relativa, denominada
coeficiente de variación muestral.
DEFINICION
s
El coeficiente de variación muestral es CV = ó en forma porcentual
x
s
CV= .100
x
60
0.012
CV = = 0.003
4.03
0.0075
y CV = = 0.004
1.76
respectivamente. Las medidas hechas con el primer micrómetro presentan una
variabilidad relativamente menor que las efectuadas con el otro micrómetro.
Si el CV para un conjunto de datos es menor que 0.1 ó 10%, entonces se dice
que este conjunto de datos es homogéneo, es decir, hay muy poca variabilidad
entre ellos y por lo tanto la media aritmética es altamente representativa de dichos
datos.
di+1 fi
Mo = li-1 + c ; di =
di-1 + di+1 li - li-1
f d
2-<4 1 0.5
4-<6 2 1
6-<10 8 2
10-<12 3 1.5
di+1 1.5
xˆ = li-1 + c = 6+4 = 8.4 ¿Qué tipo de asimetría tenemos?
di-1 + di+1 1+1.5
30.1 30.1 30.2 30.5 31.0 31.1 31.2 31.3 31.3 31.4
31.5 31.6 31.6 32.0 32.4 32.5 33.0 33.0 33.0 33.5
34.0 34.5 34.5 35.0 35.0 35.6 36.0 36.5 36.9 37.0
37.5 37.5 37.6 38.0 39.5
Trace el diagrama de caja y bigotes.
Solución:
Aquí, Mín=30.1 y Máx=39.5. Además, Q1: k(n/4)=1(35/4)=8.75≈9, y Q1=31.3; Q2=
~
x : k(n/4)=2(35/4)=17.5, Q2= 33.0; y Q3: 3(n/4)=3(35/4)= 26.25≈27, Q3=36.0.
62
fabricación de circuitos integrados, se consideran tres flujos (cm3 normales/minuto),
y se obtuvieron los siguientes datos:
Flujo:
125: 2.6 2.7 3.0 3.2 3.8 4.6
160: 3.6 4.2 4.2 4.6 4.9 5.0
200: 2.9 3.4 3.5 4.1 4.6 5.1
Solución:
Flujo 125:
Mín=2.6 y Máx=4.6. Q1: k(n/4)=1(6/4)=1.5≈2. Q1=2.7. Q2= x (3.0 3.2) / 2 3.1 .
Q3: k(n/4)=3(6/4)=4.5≈5. Q3=3.8.
Flujo 160:
Mín=3.6 y Máx=5.0. Q1: k(n/4)=1(6/4)=1.5≈2. Q1=4.2. Q2= ~
x (4.2 4.6) / 2 4.4 .
Q3: k(n/4)=3(6/4)=4.5≈5. Q3=4.9.
Flujo 200:
Mín=2.9 y Máx=5.1. Q1: k(n/4)=1(6/4)=1.5≈2. Q1=3.4. Q2= ~
x (3.5 4.1) / 2 3.8.
Q3: k(n/4)=3(6/4)=4.5≈5. Q3=4.6.
Con base a este diagrama de caja comparativo, parece que las tres muestras
difieren mucho respecto al centro. Hay un poco menos variabilidad para la razón de
flujo de 160 que para los otros dos flujos. Hay evidencia de asimetría positiva
moderada en el 50% intermedio de cada muestra.
63
Se puede embellecer un diagrama de caja que muestre la presencia de valores
atípicos (observaciones que estén muy alejados del grupo de los datos), en forma
explícita.
DEFINICION
Toda observación a más de 1.5 Q del cuartil más cercano es atípico leve o
inusual. Un valor inusual es extremo si está a más de 3Q del cuartil más cercano
y es moderado en cualquier otro caso. Sea x un valor, entonces
Si x<Q1 – 1.5Q, entonces x se llama atípico inferior.
Si x>Q3 + 1.5Q, entonces x llama atípico superior.
Si x<Q1 – 3Q, entonces x se llama extremo inferior, en caso contrario es
moderado inferior.
Si x>Q3 + 3Q, entonces x se llama extremo superior, en caso contrario es
moderado superior.
Solución:
n 13
Aquí, Mín = 1.1 y Máx = 9.9. Además, Q1: k = 1 = 3.25, Q1 = x4 = 5.8;
4 4
n 13 n 13
Q2 = x : k = 2 = 6.5, Q2 = x7 = 6.2; Q3: k = 3 = 9.75,
4 4 4 4
Q3 = x10 = 7.2; y Q = Q3 - Q 1 = 1.4.
Atípico inferior: x<Q1 – 1.5Q. x<5.8 – 1.5(1.4)=5.8 – 2.1= 3.7, luego, x=1.1<3.7,
entonces x=1.1 es atípico inferior.
Extremo inferior: x<Q1 – 3Q. x <5.8 – 3(1.4)=5.8 – 4.2 = 1.6, luego x=1.1<1.6,
entonces x=1.1 es extremo inferior.
Atípico superior: x>Q3 + 1.5Q. x>7.2 + 1.5(7.2)= 7.2 + 2.1 = 9.3, luego, x=9.8>9.3
y x=9.9>9.3, entonces x=9.8 y x=9.9 son atípicos superiores.
64
Extremo superior: x>Q3 + 3Q. x > 7.2 +3(1.4)=7.2 + 4.2 = 11.4, luego, x=9.8>11.4
y x=9.9>11.4, entonces x=9.8 y x=9.9 no son extremos superiores, 9.8 y 9.9 son
moderados superiores.
Momentos.
Si x1, x2,…,xn son los n valores que toma la variable x, se define la cantidad
__ r
r x
x =
n
como el momento de orden r. El momento de primer orden r =1 es la media
__
aritmética x.
Ejemplo 1.49. Hallar los momentos de primero y segundo orden del conjunto de
datos: 2, 3, 7, 8 10.
Solución:
65
__
x =Σx/n =(2+3+7+8+10)/5=30/5=6 es el momento de primer orden o media
aritmética.
__
2
x = Σx2/n=(22+32+72+82+102)/5=226/5=45.2 es el momento de segundo orden.
DEFINICION
__
El momento de orden r con respecto a la media x es
n __
(xi - x )r
mr = i=1
n
Si r=1, m1 =0. Si r=2, m2=s2, es la varianza.
Ejemplo 1.50. Hallar los momentos de primero y segundo orden con respecto a la
media para los datos del ejemplo 1.49.
Solución:
__
(x - x ) (2 - 6)+(3 - 6)+(7 - 6)+(8 - 6)+(10 - 6) 0
m1 = = = = 0 . m1 es siempre igual a
n 5 5
cero.
__ 2
(2 - 6)2 +(3 - 6)2 +(7 - 6)2 +(8 - 6)2 +(10 - 6)2 46
(x - x )
m2 = = = = 9.2 . Adviértase
n 5 5
que m2 es la varianza s2.
66
Momentos en forma adimensional
Para evitar unidades particulares se pueden definir los momentos adimensionales
respecto a la media
mr mr mr
ar = = =
r r r
s m2
m2 2
Sesgo o asimetría
El sesgo es el grado de asimetría o falta de simetría de una distribución de
frecuencias. Si la curva de frecuencias (polígono de frecuencias suavizado) de una
distribución tiene una “cola” más larga a la derecha del máximo central que a la
izquierda, se dice de la distribución que está sesgada a la derecha o que tiene
sesgo positivo. Si es al contrario, se dice que está sesgada a la izquierda o que
tiene sesgo negativo.
Una importante medida de este tipo emplea el momento de tercer orden con
respecto a la media expresado en forma adimensional y dada por
67
EL COEFIENTE DE ASIMETRIA DE FISHER
m3 m3
As = a3 = =
s3 m3/2
2
Millas recorridas f
0-<2 2
2-<4 5
4-<6 4
6-<8 8
8 - < 10 1
20
Solución:
f - xf / n 620 - 102 / 20
2 2 2
__ 2
x
s2 = m2 =
f(x - x )
ó m2 = = = 99.8 / 20 = 4.99
n n 20
__ 3
f(x - x ) 2(1- 5.1)3 + 5(3 - 5.1)3 + 4(5 - 5.1)3 + 8(7 - 5.1)3 +1(9 - 5.1)3
m3 = = = -3.498
n 20
68
m3 -3.498
As = a3 = = = -0.31381 .
m3/2
2 4.991.5
Curtosis
Es el grado de apuntamiento o prominencia de una distribución, normalmente se
toma en relación a la distribución normal. Una distribución que presenta un
apuntamiento relativo alto, se llama leptocúrtica, mientras que la curva que es más
achatada, se llama platicúrtica. La distribución normal, que ni es muy achatada, se
llama mesocúrtica.
m4 m4
Coeficiente de curtosis = a4 = =
s4 m22
m4
3 , donde
m22
Leptocúrtica: 0 ó a4 >3 si la distribución es más apuntada que la normal.
Platicúrtica: 0 ó a4 < 3 si la distribución de frecuencias es menos apuntada
que la normal.
Mesocúrtica: 0 ó a4 = 3 cuando la distribución de frecuencias es tan apuntada
como la normal.
69
Ejemplo 1.52. Tomando el ejemplo precedente encontrar la curtosis basada en el
cuarto momento.
Solución:
__ 4
f(x - x ) 2(1- 5.1)4 + 5(3 - 5.1)4 + 4(5 - 5.1)4 + 8(7 - 5.1)4 +1(9 - 5.1)4
m4 = = = 49.8997
n 20
m4 m 49.8997
a4 = 2 2
= 24 = = 2.004 .
(s ) m2 24.9001
Puesto que 0, la distribución de frecuencias es platicúrtica, menos aplastada
que la normal, achatada relativamente.
1 3 8 7 6 5 5 7 5 6 6 8 7 7 8 8 9
Solución:
70
Por defecto el cursor se encuentra situado en el campo “Rango de entrada”.
Para rellenarlo solamente debemos poner el ratón sobre la hoja que confine
los datos y seleccionar este rango. En nuestro ejemplo seleccionaremos la
primera fila desde la celda 1 hasta la 17, es decir el rango $A$1:$A$17.
Media 6.23529412
Error típico 0.48906733
Mediana 7
Moda 8
Desviación estándar 2.01647625
Varianza de la muestra 4.06617647
Curtosis 1.66573814
Coeficiente de asimetría -1.1934234
Rango 8
Mínimo 1
Máximo 9
Suma 106
Cuenta 17
71
4.5
4
3.5
Frecuencia
3
2.5
2
1.5
1
0.5
0
Clases
Una asimetría negativa o hacia los valores más pequeños ya que x x xˆ o por
que el coeficiente de asimetría es negativo. Puesto que la curtosis es positiva, la
distribución es Leptocúrtica, más apuntada que la normal.
Así pues, los experimentos en los que sí podemos decir lo que va a ocurrir, se
les llama experimentos deterministas. A los experimentos en los cuales no sabemos
lo que va a ocurrir se les llama experimentos aleatorios.
72
Al conjunto de todos los posibles resultados de un
experimento aleatorio se le llama espacio
muestral y se denota por S.
Diagrama de árbol
Útil para listar los elementos de S en forma sistemática. Por ejemplo,
lanzamiento de una moneda dos veces.
73
EVENTO
S
A AS
“A es subconjunto de S”
Teoría de conjuntos
74
S
=A ∩ BC
75
Eventos mutuamente excluyentes, disyuntos o disjuntos si A ∩ B= Φ, es
decir, si A y B no tienen elementos en común, o si no pueden ocurrir
simultáneamente.
1. A∩ Φ= Φ
2. AU Φ=A
3. A∩A´= Φ
4. AUA´=S
5. S´= Φ
6. Φ´=S
7. (A´)´=A
8. (A∩B)´=A´ U B´
9. (AUB)´=A´ ∩ B´
Los resultados 8. y 9. constituyen la Ley de D´Morgan.
76
2.2 Definición de probabilidad
La idea de probabilidad surge por la necesidad de medir la incertidumbre o
verosimilitud que posee cada suceso asociado a un experimento aleatorio.
Actualmente, la teoría de la probabilidad encuentra aplicación en las más variadas
ramas del conocimiento, como puede ser la física, la química, la biología, la
medicina, la psicología, la ciencia política, la educación, la economía, los negocios,
la investigación de operativa y todas las ramas de la ingeniería.
La probabilidad de que un evento ocurra se evalúa por medio de un conjunto de
números llamados probabilidades.
Antes de profundizar en la forma como se utilizan las probabilidades, es
necesario conocer de cierta manera de donde provienen. La definición clásica o a
priori de probabilidad proveniente de los juegos de azar o enfoque clásico de
Laplace, se emplea cuando los espacios muestrales son finitos y tienen resultados
igualmente probables; la definición frecuencial o empírica o a posteriori de
probabilidad, que se basa en la frecuencia relativa de ocurrencia de un evento con
respecto a un gran número de ensayos repetidos y por último la definición de
Kolmogorov o la definición axiomática de probabilidad. Seleccionar uno de las
tres definiciones dependerá de la naturaleza del problema.
Esta definición clásica de probabilidad fue una de las primeras que se dieron
(1900) y se atribuye a Laplace; también se conoce con el nombre de probabilidad
a priori pues, para calcularla, es necesario conocer, antes de realizar el experimento
aleatorio, el espacio muestral y el número de resultados o sucesos elementales que
entran a formar parte del suceso.
Pierre-Simón Laplace
Esta definición es de uso limitado puesto que descansa sobre la base de las
siguientes dos condiciones: 1. El espacio muestral de todos los resultados posibles
S es finito; y 2. Los resultados del espacio muestral deben ser igualmente
probables.
77
A partir de esta definición, se pueden deducir algunas propiedades importantes:
1. Cuando no existan casos favorables (suceso imposible), la probabilidad será
cero.
2. Si los casos favorables son todos los posibles (suceso seguro), la probabilidad
será 1.
Por consiguiente, la probabilidad siempre oscilará entre un valor mínimo (0) y un
valor máximo (1).
Por ejemplo, cuando dos dados se lanzan separadamente, hay n=36 resultados. Si
ambos dados no están cargados, los 36 resultados son igualmente probables, así
que para un evento Ai cualquiera, P(Ai)=1/36, con i=1,2,…,36. Entonces, el evento
E: suma de los números igual a 7, está formado por los seis resultados (1,6), (2,5),
(3,4), (4,3), (5,2) y (6,1), así que
Baraja
La baraja inglesa es un conjunto de naipes o cartas, formado por 52 cartas
repartidas en cuatro palos (manjares).
La baraja está dividida en cuatro palos, dos de color rojo y dos de color negro:
Picas/Espadas ♠, (negra)
Corazones ♥, (roja)
Diamantes ♦, (roja)
Tréboles ♣. (negra)
Cada palo está formado por 13 cartas, de las cuales 9 cartas son numerales y 4
literales. Se ordenan de menor a mayor rango de la siguiente forma: 2, 3, 4, 5, 6, 7,
8, 9, 10, J (sota), Q (reina), K (rey) y A (as) (que vendría siendo el 1).
Ejemplo 2.4. Selecciónese una carta al azar de una baraja corriente de 52 cartas.
Sea el evento A: seleccionar una espada; B: seleccionar J, Q, ó K; y A ∩ B:
seleccionar espada y seleccionar J, Q, ó K. Entonces,
P(A)=h/n=13/52=1/4;
P(B)=h/n=12/52=3/13; y
P(A ∩ B)= h/n=3/52.
78
Por ello se necesita una definición más general de probabilidad. Una forma de
dar respuesta a esta pregunta es obtener algunos datos empíricos en un intento por
estimar las probabilidades.
1. 0≤fA≤1.
2. fA=0 si A no ocurre y fA=1 si A ocurre en cada repetición.
3. A y B disjuntos, fAUB= fA+ fB
La definición empírica de probabilidad nos permite afirmar que la probabilidad de
obtener un determinado suceso A es el valor hacia el cual tiende la frecuencia
relativa, cuando el número de observaciones tiende a infinito.
nA
P(A) = lim f A = lim
n n n
79
La estabilidad de fA, no es del todo una conclusión matemática, sino simplemente
una realidad empírica. Por esto, la definición anterior no es una definición correcta
de probabilidad, matemáticamente.
P(A)≈ fA=nA/n=80/100=0.80
Enfoque subjetivo
El uso de las creencias personales y de otra información indirecta para llegar a la
probabilidad se llama definición subjetiva de probabilidad.
Definición axiomática
La definición axiomática de la probabilidad es quizás la más simple de todas las
definiciones y la menos controvertida ya que está basada en un conjunto de axiomas
que establecen los requisitos mínimos para dar una definición de probabilidad.
La ventaja de esta definición es que permite un desarrollo riguroso y matemático
de la probabilidad. Fue introducida por A. N. Kolmogorov y aceptada por estadísticos
y matemáticos en general.
Definimos la probabilidad de A, P(A), como una función de conjuntos, donde el
dominio son eventos y el recorrido son el conjunto de los números reales.
DEFINICION AXIOMATICA
real P:
P: C ──────> R
A ~~~~~~>P(A), A S
80
Axioma 2: P(S)=1
El Axioma 1, señala que P(A) es un número cuyo valor mínimo y máximo son 0
y 1 respectivamente. Axioma 2, la probabilidad máxima de 1 se asigna a S. Axioma
3, la función probabilidad es aditiva. Obsérvese que los axiomas no dicen como
asignar las probabilidades, ellos restringen únicamente la manera de como hacer la
asignación.
P(A c ) =1-P(A)
(AC)=1 – P(A)
Ejemplo 2.6. Se lanzan dos dados. ¿Cuál es la probabilidad de que la suma sea
por lo menos 3 (es decir, 3 o más)?
81
(menor que tres) y luego aplicar el teorema, dejando que “por lo menos” sea A. Así,
sean los eventos A: suma sea por lo menos 3 y Ac: suma sea 2
P(Ac)=1/36;
P(A)=1-P(Ac)=1-1/36=35/36.
Ejemplo 2.7. Según un artículo publicado en una revista (1991), una de cada nueve
personas a quienes se diagnosticará SIDA durante 1991 será una mujer. Con base
en esta información, encuentre la probabilidad de que una persona a la que se
diagnosticará SIDA en 1991 sea hombre.
Solución:
Sea A=partes usadas; B=partes defectuosas; y A ∩ B: partes usadas y
defectuosas.
P(A U B)=P(A)+P(B)-P(A ∩ B)
P(A ∩ B)=P(A)+P(B)-P(A U B)
=0.60+0.05 – 0.61
=0.0400.
82
A = (A ∩ B) U (A ∩ BC)
A = (A ∩ B) U (A ∩ BC)
P(A)=P(A ∩ B) + P(A ∩ BC)
P(A ∩ BC)=P(A) – P(A ∩ B)
=0.60 – 0.04
=0.56.
Asignación de probabilidades
Si un espacio muestra S consiste únicamente de los eventos simples A1, A2,…,An
entonces por la definición axiomática de probabilidad
P(A1 )+P(A 2 )+...+P(An ) =1
Se concluye que podemos escoger arbitrariamente cualquier número no
negativo para las probabilidades de estos sucesos elementales siempre que se
satisfaga la ecuación anterior. En particular, si suponemos probabilidades iguales
para todos los sucesos simple, entonces
1
P( A i) = , i =1,2,...,n
n
y si A es un suceso compuesto por h sucesos simples tenemos
1 h
P(A) = h * =
n n
83
La asignación de probabilidades provee un modelo matemático y su éxito debe
probarse experimentalmente en forma muy similar a como las teorías en física u
otras ciencias deben probarse experimentalmente.
Ejemplo 2.10.
1) Se lanza solo un dado. Sea el evento E: caiga un 2 ó 5, hallar P(E).
El espacio muestral es S ={1, 2, 3, 4, 5, 6 }, A1={1}, A2={2}, A3={3}, A4={4}, A5={5}
y A6={6}. Si asignamos probabilidades iguales a los puntos muestrales, es decir si
suponemos que el dado es legal, entonces,
diámetro
longitud muy delgado está bien muy grueso
demasiado corta 10 3 5
está bien 38 900 4
demasiado larga 2 25 13
P(E)=h/n=18/1000
84
Un evento ocurre de n1 formas y si por cada una de éstas formas un segundo
evento ocurre de n2 formas, entonces el número de formas en que ambos
ocurren es n1 * n2.
Ejemplo 2.12. Supongamos que una placa de automóvil en un país consta de dos
letras diferentes, seguidas de tres dígitos que se repiten, de los cuales el primero
no es cero. ¿Cuántas placas diferentes pueden grabarse?
h 3+2
P(A ó B) = P(AUB) = = = 5/6
n 6
85
h 8 * 6 +5 * 4 +3 * 2
P(A ó B ó C) = P(AUBUC) = = = 74/192
n 16 *12
PERMUTACION
Ejemplo 2.15. Permutaciones de las letras a, b, c: abc, acb, bca, bac, cba, cab, 6
permutaciones o por la regla del producto: n1*n2*n3=(3)(2)(1)=6 permutaciones.
Permutaciones de n objetos: n!
n.(n-1).(n-2).....3.2.1
n!=n(n-1)(n-2)...3.2.1
DEFINICION
Ejemplo 2.17.
En una clase de teoría de la probabilidad hay 6 hombres y 4 mujeres. Se hace un
examen y se ordena a los estudiantes de acuerdo con su desempeño. Suponiendo
que no hay dos estudiantes con la misma calificación:
a) ¿De cuántas maneras distintas pueden quedar ordenados los estudiantes?
10 ! =3 628 800
86
Ejemplo 2.18. Sobre una estantería se tienen que colocar en primer lugar 6 libros
distintos de biología, en segundo lugar 5 de química y tercero 2 de física. Hallar el
número de formas en que se puede hacer. Sea n1=6, n2=5 y n3=2, entonces por la
regla del producto
n. (n-1).(n-2). . . . (n-r+2).(n-r+1)
n!
nPr=
(n-r)!
TEOREMA
n!
nPr=
(n-r)!
donde r≤n.
87
n! n!
Obsérvese que nPn = (n-n)! = 0! = n!1 = n! , como se esperaba.
En su calculadora puede utilizar la tecla n P r
Ejemplo 2.20. Una tarjeta de circuitos impresos tiene ocho sitios diferentes en los
que puede instalarse un componente. Si en la tarjeta deben instalarse cuatro
componentes diferentes, ¿cuántos diseños diferentes son posibles?
nPr=8P4=1 680
h 6 * 7 P3 * 5 6 * 7 * 6 * 5 * 5
P(A) = = = = 30 / 72
n 9 P5 9*8*7*6*5
b) Sea A: Número par de cuatro cifras donde los dígitos se repiten, entonces
h 9 * 9 * 9 * 4 2916
P(A) = = =
n 9 * 9 * 9 * 9 6561
Permutaciones circulares:
TEOREMA
(n - 1)!
88
1 M, 4 I, 4 S y 2 P, entonces
11!
11P 1,4,4,2 = 1!4!4!2! = 34,650 palabras.
9!
9 P 4,3,2 = 4!3!2! =1260 códigos.
COMBINACION
Las combinaciones son agrupaciones de objetos en las que no importa su
orden.
n
NOTACION: Combinación de n objetos seleccionando r se denota por nCr ó .
r
Ejemplo 2.25. Combinación de las letras a, b, c tomando dos.
Combinación Permutación
ab ab, ba
ac ac, ca
bc bc, cb
P2
Luego, 3P2=3C2 • 2! y 3C2=
3
2!
= 3.2.1
2.1
= 3.
nPr= nCr * r!
TEOREMA
n!
P
n r (n-r)! n!
nCr= = = r!(n-r)!
r! r!
89
Sea A: Número de tres cifras donde los dígitos son impares mayores que 1 y el
orden de formación no interesa, entonces
h 4 C3 4
P(A) = = =
n 9 C3 84
Ejemplo 2.28. En una fundidora, se identifica un lote de 20 bloques de motor, de
los cuales cinco contienen defectos internos. El comprador selecciona tres bloques
al azar y prueba su dureza. Se aceptará el lote si no se identifican defectos. ¿Cuál
es la probabilidad de que se acepte este lote?
Sea A: se acepta el lote, entonces
h 5 C0 15 C3 455
P(A) = = =
n 20 C3 1140
Ejemplo 2.29. Selección al azar de tres lámparas entre 15 de las cuales 5 son
defectuosas.
a. Probabilidad de que una por lo menos sea defectuosa.
b. Probabilidad de que ninguna sea defectuosa.
c. Probabilidad de que exactamente una sea defectuosa.
d. Probabilidad de que dos por lo menos sean defectuosas.
e. Probabilidad de que a lo sumo dos son defectuosas.
Solución:
a. A: una lámpara por lo menos sea defectuosa
P(Ac) + P(A)=1
P(Ac) =1 – 335/455=24/91
c. C: una exactamente sea defectuosa
P(C)=h/n=5C1 . 10C2 /455=225/455
d. P(a lo sumo una sea defectuosa)+P(dos por lo menos sean defectuosas)=1
P(dos por lo menos sean defectuosas)=1- P(a lo sumo una sea defectuosa)
=1 – [P(ninguna sea defectuosa)+
P(una exactamente sea defectuosa)]
=1 – [24/91 + 225/455]
=1 – 69/91
=22/91
e. P(a lo sumo dos sean defectuosas)+P(tres exactamente sean defectuosas)=1
P(a lo sumo dos sean defectuosas)=1 - P(tres exactamente sean defectuosas)
=1 - 5C3 . 10C0 / 455
=1- 10/455
=445/455
90
Ejemplo 2.30. De una baraja de 52 cartas se sacan tres naipes. Determinar la
probabilidad de que:
a) Sean el as de tréboles, el de corazones y el de picas, en este orden.
Sea A= as de tréboles, el de corazones y el de picas, entonces
h 1
P(A) = = =1/ 132,600
n 52 P3
b) Sean todos del mismo palo.
Sea A: todos del mismo manjar, entonces
h 4 13 C3
P(A) = = =1144/22100
n C
52 3
Ejemplo 2.32. Si al seleccionar al azar una carta de una baraja, si se nos hubiera
dicho que dicha carta es negra, ¿cuál es la probabilidad que la carta fuera un as?
Deseamos encontrar P(as │ negra). Aquí se da la información que la carta es negra.
Por lo tanto, el espacio no consiste en las 52 cartas de la baraja; consiste sólo en
las cartas negras. De las 26 cartas, dos son ases. Por consiguiente, la probabilidad
de un as, dado que sabemos que la carta es negra, es
número de ases negros
P(as negra) =
número de cartas negras
2
=
26
Este resultado (2/26) también puede obtenerse usando la definición de la siguiente
manera:
91
Sí
P(A B)
P(A│B) = , P(B) > 0
P(B)
con evento A= as y evento B= negra
Entonces
2 / 52
P(as negra) =
26 / 52
2
=
26
longitud
acabado de
la superficie excelente buena
excelente 212 24
bueno 18 12
230 36
Sea el evento A: muestra tiene acabado de la superficie excelente y B: muestra
tenga una longitud excelente. Se toma una muestra al azar, encuentra utilizando la
tabla:
a) Probabilidad de que el acabado de la superficie sea excelente
b) P(B)
c) P(A U B)
d) P(A ∩ BC)
e) P(A│B)
f) P(B│A)
g) ¿Cuál es la probabilidad de que el acabado de la superficie de la muestra sea
excelente, dado que tiene buena longitud?
h) Si la muestra seleccionada tiene acabado de la superficie excelente, ¿cuál es la
probabilidad de que la longitud sea buena?
Solución:
a) P(A)=236/266
b) P(B)=230/266
c) P(A U B) = P(A) + P(B) –P(A∩B)= 236/266 + 230/266 – 212/266=254/266
92
d) P(A ∩ BC)=P(A) –P(A∩B)=236/266 – 212/266=24/266
e) P(A│B)=P(A∩B)/P(B)=212/230
Obsérvese que P(A) y P(A│B) son las probabilidades del mismo evento, pero se
calculan bajo condiciones de conocimiento diferentes, de manera similar, P(B) y
P(B│A).
diámetro
longitud muy delgado está bien muy grueso
demasiado corta 10 3 5
está bien 38 900 4
demasiado larga 2 25 13
Ejemplo 2.34. Una varilla de aluminio se selecciona del espacio muestral que se
presenta en la tabla. Sean los eventos L1, L2 y L3 de que la varilla sea demasiado
corta, está bien y demasiado larga respectivamente; y los eventos D 1, D2 y D3 de
que el diámetro de la varilla sea muy delgado, está bien y muy grueso
respectivamente. Determine P(L3) y P(L3 │D1). ¿Estas probabilidades son
diferentes?
P(L3)=40/1000=4/100=2/50
2 /1000 2
P(L3 │D1)=P(L3∩D1)/P(D1)=
50 /1000 50
La probabilidad condicional y la probabilidad incondicional son las mismas. La
información de que el diámetro de la varilla es muy delgado no cambia la
probabilidad de que la varilla sea demasiado larga.
El ejemplo muestra que el conocimiento de que un evento ocurra a veces no
cambia la probabilidad de que ocurra otro evento. En estos casos, se dice que los
dos eventos son independientes. El evento L3 y D1 son independientes.
INDEPENDENCIA
Dos eventos A y B son independientes si P(A│B)=P(A) y son dependientes en
cualquier otro caso.
93
B: observar un número par
C: observar un 1 ó 2.
a) ¿A y B son independientes?
Para decidir si A y B son independientes, debemos ver si satisfacen las condiciones
de la definición. En este ejemplo, P(A)=3/6=1/2, P(B)=3/6=1/2 y P(C)=2/6=1/3.
Como A∩B=Φ, P(A|B)=P(A∩B)/P(B)=0 y es evidente que P(A|B)≠P(A). Los eventos
A y B no son independientes, son dependientes.
b) ¿A y C son independientes?
Observe que P(A|C)=P(A∩C)/P(C)=1/2 y, como antes, P(A)=1/2. Por tanto,
P(A|C)=P(A) y A y C son independientes.
Consecuencias:
Teorema 1: Si A y B son eventos independientes, entonces A y Bc son eventos
independientes.
Teorema 2: Si A y B son eventos independientes, entonces A c y Bc son eventos
independientes.
Teorema 3: Si A, B y C son eventos independientes, entonces A y B U C son
eventos independientes.
Ejemplo 2.36. Ana y Benito lanzan dardos a un blanco. La probabilidad de que Ana
dé en el blanco es 0.25 y la de Benito es 0.40. Si Ana y Benito lanzan los dardos,
¿cuál es la probabilidad de que peguen al blanco?
94
=0.5500.
Ejemplo 2.37. Se tiene una caja con 50 pernos: 14 de 2”, 24 de 3 1/2” y 12 de 4”.
Cuatro se extraen al azar con reemplazo. ¿Cuál es la probabilidad de que por lo
menos seleccionemos un perno de 3 1/2”?
Ejemplo 2.39. De una caja que contiene 6 bolas negras y 4 bolas verdes se extraen
3 bolas en forma sucesiva y se reemplaza cada una de ellas antes de hacer la
siguiente extracción. Sean los eventos: Ni, i=1,2,3, de que la bola sea negra y Vi,
i=1,2,3, de que la bola sea verde. Cuál es la probabilidad de que las tres sean del
mismo color.
El evento pedido es N1 y N2 y N3 ó V1 y V2 y V3, es decir (N1∩N2∩N3) U(V1∩V2∩V3)
P[(N1∩N2∩N3) U (V1∩V2∩V3)]=P(N1).P(N2).P(N3)+P(V1).P(V2).P(V3)
=6/10 · 6/10 · 6/10 + 4/10 · 4/10 · 4/10
= 280/1000.
Aplicaciones
95
Sean los interruptores I1 y I2. Si los interruptores están en paralelo la corriente
pasa de un interruptor a otro si al menos uno de ellos está abierto: I1 U I2. Si los
interruptores están en serie la corriente pasa de un interruptor a otro si ambos están
abiertos: I1 ∩ I2.
Ejemplo 2.40. El circuito ilustrado abajo opera si hay una trayectoria de dispositivos
funcionales de izquierda a derecha. La probabilidad de que cada dispositivo
funcione se indica en la ilustración. Suponga que los dispositivos fallan
independientemente. ¿Cuál es la probabilidad de que el circuito opere?
Sea Ii: interruptor i-ésimo está cerrado, i=1, 2, 3. Sea E: la corriente pasa de a a b:
E=(I1U I2 ) ∩ I3 ¿por qué?
P(E)=P[(I1 U I2) ∩ I3)]
=P(I1 U I2) • P(I3) (Independencia de eventos)
={1 - P[(I1 U I2)c]} • P(I3) (Ley del complemento)
={1 - P[(I1c)∩(I2c)]} • P(I3) (Ley de D´Morgan)
={1 – P(I1c)•P(I2c)} • P(I3) (Independencia de eventos)
=(1 – 0.12)(0.95)
=0.9405
P(B│A).P(A) =P(B∩A)=P(A∩B)
96
que se conoce como regla multiplicativa.
P(A∩B)= P(A).P(B │ A)
Ejemplo 2.41. Se tiene una caja con 10 tornillos con 4 defectuosos. Tres tornillos
se extraen al azar sin reemplazo, ¿cuál es la probabilidad de que los tres tornillos
estén defectuosos?
97
TEOREMA. LEY DE LA PROBABILIDAD TOTAL
Sea A1, A2, A3,...,Ak una partición de S. Entonces para cualquier evento B de
S para el que P(B)>0,
k k
P(B) = P(A i B) = P(A i ).P(B A i )
i=1 i=1
Demostración:
k
P(B) = P(A i ).P(B A i )
i=1
98
P(D)=(0.50) (0.03)+ (0.30 )(0.04)+ (0.20) (0.05)=0.0370
Teorema, ley o regla de Bayes
La regla es un método para calcular la probabilidad de una causa dado el efecto.
Se utiliza entonces para calcular las probabilidades a posteriori de los eventos Aj,
ajustados o modificados por B.
Cuando se habla de probabilidad condicional, se busca la probabilidad de un
cierto evento A dado que otro evento B ha ocurrido. Se piensa en general que A es
un evento final, de alguna manera un efecto, para el cual B es una causa posible y
que ambos se encuentran ordenados en el tiempo.
El teorema de Bayes también es aplicable cuando S subdivide en más de dos
eventos mutuamente excluyentes. A continuación, se define el teorema en este
contexto más general.
TEOREMA DE BAYES
Sea {A1, A2,...,Ak} una partición de S. Entonces para cualquier otro evento B para
el que P(B)>0,
P(A j B) P(A j ).P(B A j )
P(A j B) = = k para j =1,2,...,k
P(B)
P(Ai ).P(B Ai )
i=1
99
a) ¿Cuál es la probabilidad de que esté defectuoso?
Sean los eventos A1, A2 y A3: el producto es ensamblado por la máquina 1, 2 y 3
respectivamente y B: producto defectuoso.
3
P(B) = P(A i ).P(B A i ) = 0.30x0.02+0.45x0.03+0.25x0.02 = 0.0245
i=1
P(B)=(0.30)(0.02)+(0.45)(0.03)+(0.25)(0.02)=0.0245.
100
VARIABLE ALEATORIA.
Una variable aleatoria (VA) es una función denotada por X que asocia un
número real x a cada elemento s del espacio muestral S. Así,
X: S-----------> R
s~~~~~~~~>X(s)= x
Ejemplo 3.1. En el lanzamiento de dos monedas, S={HH, HT, TH, TT}. Interesa el
número de cruces que aparecen en cada punto, estos son: 0, 1, 2. Estos son valores
que toma alguna variable aleatoria X que representa el número de cruces que
aparecen en el lanzamiento.
Ejemplo 3.4.
a) Número de rayaduras en una superficie.
b) Número de bits transmitidos recibidos con error.
101
Una variable aleatoria es continua si su conjunto posible de valores abarca
todo un intervalo en sea finito o infinito.
102
Por lo tanto, para la variable aleatoria X que representa el número de fallas en una
longitud de alambre, p(0)=0.48, p(1)=0.39, p(2)=0.12, p(3)=0.01 y p(x)=0 para
cualquier x diferente de 0, 1, 2 ó 3, lo cual se puede expresar en forma tabular
x 0 1 2 3
p(x) 0.48 0.39 0.12 0.01
Solución:
P(X=1)=p(1)=0.7, (acceso en el primer intento)
p(2)=(0.3)(0.7), (primero no y segundo sí)
p(3)=(0.3)(0.3)(0.7)=(0.3)2(0.7), (1º no, 2º no, y 3º si)
p(4)=(0.3)(0.3)(0.3)(0.7)=(0.3)3(0.7), (acceso hasta el cuarto)
...
p(x)=(0.3)x-1(0.7). (acceso hasta el x-ésimo intento)
Así,
(0.3)x-1(0.7), si x =1,2,3,...
p(x) =
0, en otra parte.
x 0 1 2
103
p(x) 12/90 48/90 30/90
x 0 1 2
p(x) 12/90 48/90 30/90
Ejemplo 3.10. Entre 10 solicitantes para un puesto 6 son mujeres y 4 son hombres.
Supóngase que se seleccionan al azar 3 candidatos de entre todos ellos para
concederles las entrevistas finales. Determinar la función de probabilidad para X, el
número de candidatas entre los tres finalistas.
Solución:
10 solicitantes: 6 mujeres y 4 hombres. Se seleccionan 3. No interesa el orden en
que se seleccionen.
h C
P(X = 0) = P(ninguna mujer) = P(todos son hombres) = = 4 3 4 / 120.
n 10 C3
C. C 36 36
P(X =1) = P(una mujer) = 6 1 4 2 = = ;
C
10 3 120 120
C . C 60
P(X = 2) = 6 2 4 1 = ;
10 C3 120
C 20
P(X = 3) = 6 3 =
10 C3 120
x 0 1 2 3
p(x) 4/120 36/120 60/120 20/120
Cuando los posibles valores de un variable aleatoria discreta están espaciados
uniformemente, la función de masa de probabilidad se puede representar por medio
de un histograma, con rectángulos centrados en los posibles valores de la variable
104
aleatoria. El área de un rectángulo centrado en un valor x es igual a P(X=x)=p(x).
Este histograma se llama un histograma de probabilidad, ya que las áreas
representan probabilidades.
x 0 1 2 3
p(x) 0.5 0.3 0.1 0.1
Solución:
a)
b) Esta probabilidad está dada por el área bajo el histograma de probabilidad que
corresponde a rectángulos centrados en valores superiores a 1; sus áreas son
P(X=2)=0.1 y P(X=3)=0.1, entonces P(X>1)=P(X=2)+P(X=3)=0.1+0.1=0.2, como se
muestra en la figura.
105
Ejemplo 3.12. Una compañía de materiales químicos envía cierto disolvente en
tambores de diez galones. Sea X el número de tambores pedidos por un cliente
elegido aleatoriamente. Suponga que X tiene la siguiente función de masa de
probabilidad:
x 1 2 3 4 5
p(x) 0.4 0.2 0.2 0.1 0.1
Solución
a). Primero se calcula F(x) para cada uno de los valores posibles de X, que son 1,
2, 3, 4 y 5.
F(1)=P(X≤1)=P(X=1)=p(1)=0.4
F(2)=P(X≤2)=p(1)+p(2)=0.4+0.2=0.6
F(3)=P(X≤3)=0.4+0.2+0.2=0.8
F(4)=P(X≤4)=0.4+0.2+0.2+0.1=0.9
F(5)=P(X≤5)=0.4+0.2+0.2+0.1+0.1=1
0, x 1
0.4, 1 x 2
0.6, 2 x 3
F ( x)
0.8, 3 x 4
0.9, 4 x 5
1, x5
x x<1 1≤x<2 2≤x<3 3≤x<4 4≤x<5 x≥5
F(x) 0 0.4 0.6 0.8 0.9 1
106
b) p(a)=P(x≤a) – P(x≤ a─)=F(a) – F(a─), donde “a─" representa el valor máximo
posible de X que es estrictamente menor que a. Así, por ejemplo
p(2)=F(2) – F(2─)=F(2) – F(1)=0.6 – 0.4=0.2
VALOR ESPERADO
107
E(X) = μ = x.p(x)
x
x
La desviación estándar de X es
2
i) E(aX+b)=aE(X)+b
ii) V(aX+b)=a2V(X)
Ejemplo 3.13. El gerente de una bodega en una fábrica sabe, por haber estudiado
sus registros, que la demanda diaria (número de veces que se usa) de cierta
herramienta tiene la siguiente distribución de probabilidad:
Demanda 0 1 2
Probabilidad 0.1 0.5 0.4
Si X representa la demanda diaria, calcular E(X) y V(X).
Solución:
E(X)=Σxp(x)=0(0.1)+1(0.5)+2(0.4)=1.3
Se usa la herramienta un promedio de 1.3 veces diarias.
V(X)=Σx2p(x) – μ2
=02(0.1)+12(0.5)+22(0.4) – (1.3)2
=0.41
Ejemplo 3.14. Suponer que en el ejemplo precedente, a la fábrica le cuesta $ 10
cada vez que se usa la herramienta. Calcular el promedio y la varianza de los costos
diarios por uso de esta herramienta.
Solución:
Si X es la demanda diaria, el costo diario por usar la herramienta es por lo tanto
10X. El costo promedio es
108
E(10X)=10E(X)=10(1.3)= $ 13
La fábrica debe destinar (o presupuestar) $ 13 diarios para cubrir el costo por usar
la herramienta.
V(10X)=102V(X)=100(0.41)=41$2
Estos ejemplos ilustran que un modelo general de probabilidad que los incluya
como casos particulares sería muy conveniente.
Puede considerarse que cada uno de estos experimentos aleatorios consta de
una serie de ensayos aleatorios repetidos. El resultado de cada ensayo puede
resumirse como éxito o bien como fracaso, respectivamente. Los ensayos que
constituyen el experimento aleatorio son independientes. La probabilidad de un éxito
en cada ensayo es constante. Los experimentos de este tipo se conocen como
experimentos binomiales.
Ejemplo 3.16. La posibilidad de que un bit se reciba con error es 0.1. Suponga que
los ensayos son independientes. Sea X=número de bits con error en los siguientes
n bits transmitidos. Hallar P(X=x).
Solución:
Un posible resultado es
109
cuya probabilidad es (0.1)x(0.9)n – x. El total de resultados con esta probabilidad es
n n!
= , por lo tanto,
x x!(n - x)!
n
P(X = x) = (0.1)x (0.9)n-x
x
DISTRIBUCION BINOMIAL
Un experimento aleatorio que consta de n ensayos repetidos tales que
1) los ensayos son independientes,
2) cada ensayo produce únicamente dos resultados posibles, “éxito” o
“fracaso”, y
3) la probabilidad de un éxito en cada ensayo, denotada como p, permanece
constante
se llama experimento binomial.
n
f(x) = px (1- p)n-x , x = 0,1,...,n
x
REGLA.
Si el muestreo es sin reemplazo de una población de tamaño N y si n es a lo
sumo 5% del tamaño de la población (n≤0.05N), el experimento se considera
entonces como binomial.
Ejemplo 3.17. De una caja de 200 tornillos se extrae una muestra sin reemplazo
de 10 tornillos. Aquí 10 es el 5% de 200, entonces el experimento es binomial.
110
Ejemplo 3.18. Supongamos que el 20% de ciertos libros fallan a una prueba de
resistencia de encuadernación. Sea X el número de entre 15 ejemplares
seleccionados al azar que fallan a la prueba. Entonces X tiene una distribución
binomial con n=15 y p=0.2. ¿Por qué?
Solución:
a) P(X 3) =F(3) = p(0)+p(1)+p(2)+p(3)
= 15 C0 (.2)0 (.8)15 +15 C1(.2)1(.8)14 + 15 C2 (.2)2 (.8)13 + 15 C3 (.2)3 (.8)12
=0.6482.
b) P(X = 3) = 15 C3 (0.2)3 (0.8)12 = 0.2501.
c) P(X 3) =1-P(X 2) =1- p(0)+p(1)+p(2)
=1- 15 C0 (.2)0 (.8)15 +15 C1(.2)1(.8)14 + 15 C2 (.2)2 (.8)13
=0.6020.
d) μ=np=(15)(0.2)=3 y σ2=np(1-p)=(15)(0.2)(0.8)=2.4
111
Se selecciona una muestra de tamaño n, al azar (sin reemplazo) de entre N
objetos, donde K≤N y n≤N.
Sea que la variable aleatoria X denote el número de éxitos en la muestra.
Entonces X tiene una distribución hipergeométrica y
K N - K
f(x) =
x n - x
; x = máx 0, n +K - N hasta mín {K, n}
N
n
112
12 38
P(X = 3) = = 0.2703
3 7
50
10
b) μ=n.(K/N)=10(12/50)=2.4 y
σ2=((N-n)/(N-1)).n.(K/N).(1-(K/N))=(40/49)(10)(12/50)(1-(12/50))=1.49
Ejemplo 3.21. En el curso de una hora, una máquina específica llena 1000 botellas
de jugo. En cada uno de sus intervalos, se selecciona aleatoriamente una muestra
de 20 botellas y se verifica el volumen del contenido en cada una. Sea X el número
de botellas seleccionadas con contenido insuficiente. Suponga que en una hora
específica se producen 100 botellas llenadas en forma deficiente. Calcule la
probabilidad aproximada de que al menos tres botellas con contenido deficiente se
incluyan en las muestreadas.
=1- P(X≤2)
=1- 0.6769
=0.3231
113
3.7 Distribución binomial negativa
La distribución binomial negativa es una distribución que puede considerarse
como lo “inverso” de la distribución binomial. En el contexto binomial, la variable
aleatoria X representa el número de éxitos obtenidos en una serie de n ensayos
independientes e idénticos, número que es fijo, mientras que el de éxitos varía de
un experimento a otro. La variable aleatoria binomial negativa corresponde al
número de ensayos para obtener precisamente r éxitos, de modo que con ella el
número de éxitos es fijo y el número de ensayos cambia de un experimento a otro.
Los experimentos de esta clase se llaman experimentos binomiales negativos.
Ejemplo 3.22. En el problema de los bits con error, ¿cuál es la probabilidad de que
el décimo bits transmitido sea el cuarto con error?
Sea X=el número de bits hasta el cuarto con error. La probabilidad de obtener 3 bits
con error en los primeros nueve y que el décimo sea el cuarto con error es:
9 3 6 9 4 6
(0.1) (0.9) g(0.1) = (0.1) (0.9)
3 3
Si X~Bn(r,p), entonces
r(1-p)
E(X) = μ = r y V(X) = σ 2 =
p p2
114
Ejemplo 3.23. El 10% de las máquinas producidas en una línea de montaje resultan
defectuosas, ¿cuál es la probabilidad de encontrar la tercer máquina defectuosa en
el quinto ensayo, si se seleccionan aleatoriamente máquinas, de una por una, para
probarlas?. Cuál es la media y la varianza.
Solución:
n n λ x λ n-x
P(X = x) = p x (1- p)n-x = 1-
x x n n
n λ x λ n-x
lím P(X = x) = lím x n 1- n
n n
n -x
λ x λ n(n -1)...(n - x +1) λ
= lím 1- 1-
n x! n n x n
n -x
λx λ λ 1 2 x -1
= lím 1- 1- 1- 1- ... 1-
x! n n n n n n
115
Se observa que
n
λ -λ
lím 1- n = e
n
y que todos los demás términos en los que interviene n tienden a la unidad;
entonces, tenemos la distribución al límite
e-λ λ x
lím P(X = x) = x!
, x =1, 2,...
n
116
e-λ λ x
f(x) = , x = 0, 1, 2,...
x!
Si X~Poisson(λ), entonces
E(X)=V(X)=λ
Ejemplo 3.25. Para el caso del alambre de cobre delgado, suponga que el número
de imperfecciones sigue una distribución de Poisson con una media de 2.3
imperfecciones por milímetro.
a) Determine la probabilidad de 10 imperfecciones en 5 milímetros de alambre.
b) Determine la probabilidad de al menos una imperfección en 2 milímetros de
alambre.
Solución:
a) Sea que X denote el número de imperfecciones en 5 milímetros de alambre.
Entonces, X tiene una distribución de Poisson con E(X)=2.3 imperfecciones/mm x 5
mm =11.5 imperfecciones. Entonces X~Poison(11.5) y
117
e-11.511.510
P(X =10) = = 0.113
10!
b) Sea X denote el número de imperfecciones en 2 milímetros de alambre.
Entonces, X tiene una distribución de Poisson con E(X)= 2.3 imperfecciones/mm x
2 mm =4.6 imperfecciones. Entonces, X~Poisson(4.6) y
P(X 1) =1-P(X = 0)
e-4.6 4.60
=1-
0!
=1- e-4.6
Ejemplo 3.26. Supóngase que 300 erratas están distribuidas a lo largo de un libro
de 500 páginas. Hallar la probabilidad de que una página contenga 2 erratas
exactamente.
Solución:
Sea X el número de erratas de entre 300 es una variable aleatoria binomial con
n=300, p=1/500=0.002 y np=0.6, así que se cumple la regla, entonces
e-0.6 (0.6)2
P(X = 2) = = 0.0988.
2!
Introducción
La distribución de probabilidad de una variable aleatoria discreta siempre se
puede obtener asignando una probabilidad positiva a cada uno de los posibles
valores que puede tomar la variable. Naturalmente, tenemos que estar seguros de
que la suma de las probabilidades asignadas sea siempre igual a 1.
Desafortunadamente, la distribución de probabilidad de una variable aleatoria
continua no puede establecerse de la misma manera. Es matemáticamente
imposible asignar probabilidades diferentes de cero a todos los puntos de un
intervalo real y al mismo tiempo satisfacer el requisito de que la suma de las
probabilidades de los distintos valores posibles tiene que ser 1.
118
FUNCION DE DENSIDAD (fd)
P(x1≤X≤x2)=P(x1<X≤x2)=P(x1≤X<x2)=P(x1<X<x2)
119
b a
Consecuencia: P(a<X<b)= f(t)dt - f(t)dt =F(b) -F(a), esto es, la acumulada
- -
evaluada en el límite superior menos la acumulada evaluada en el límite inferior.
Percentiles
Las reglas del valor esperado y la varianza del caso discreto son válidas también
para el caso continuo.
Ejemplo 4.1. Se especifica que el espesor de las hojas de aluminio para hacer latas
está entre 8 y 11 milésimas de pulgada. Sea X el espesor de una hoja de aluminio,
con una función de densidad
a) calcule la constante k para que la función sea una legítima función de densidad.
b) haga un bosquejo de la gráfica de f(x).
c) ¿cuál es el % de hojas que no cumplen las especificaciones?
d) calcule F(x) y haga un bosquejo de la gráfica.
e) calcule P(x<8) usando F(x).
f) calcule P(8<x<10) usando F(x).
g) calcule µ y σ2
h) calcule P50.
Solución:
120
12
a) f(x) es una legítima función de densidad si - f(x)dx =6 kx dx =1
12
6 kx dx =1
12
k 6 x dx =1
12
(k/2) x 2 1
6
(k/2)[122 - 62]=1
k=1/54
Entonces, f(x)=(1/54)x, 6<x<12
b)
12
Area 1
x dx =1
6 54
c) P(6<x<8)+P(11<x<12)=
8 12
(1/54)x dx + (1/54)x dx = 51/108 = 0.4722 ó 47.22%
6 11
121
54
1
12 12
g) μ = xf(x)dx = x x
54
dx = x 2dx = 9.33 milésima de pulg
- 6 6
2
1 12 3 28
σ 2 = x2 f(x)dx -μ2 =
-
54 6
x dx - = 2.89 milésima de (pulg)2
3
x
h) p = F(x) = P(X x) = - f(t)dt
x
0.50 = F(x) = P(X x) = 6 f(t)dt
0.50=(1/108)(x2 – 36)
x=P50=9.49 milésima de pulg
DEFINICION.
1
, a xb
f(x; a, b) = b - a
0, de otro modo
TEOREMA.
a +b 1
y V(X) = b - a
2
E(X) =
2 12
x-a
F(x) = , a x b
b-a
Solución:
50.1- 49.75
a) P(X 50.1) = F(50.1) = = 0.7.
50.25 - 49.75
b) μ =
a +b = 49.75 + 50.25 = 50 lb. ¿Se concluye lo mismo gráficamente?
2 2
1 1
σ2 = b - a 2 = 50.25 - 49.75 2 = 0.0208 (lb)2 .
12 12
123
La ecuación de la función de densidad normal, depende de los parámetros μ
y σ, media y desviación estándar respectivamente.
DISTRIBUCION NORMAL
1 x-μ 2
1 -
f(x) = e 2 σ
, x R
σ 2π
Además,
E(X)=μ y V(X)=σ2
PROPIEDADES:
1. Moda x=μ.
2. Simetría con respecto a x=μ
3. Puntos de inflexión en: x=μ±σ; concavidad hacia abajo en μ-σ<X<μ+σ y
concavidad hacia arriba en caso contrario.
4. El eje horizontal es asíntota horizontal: y=0.
5. Área bajo la curva es 1.
b
P(a X b) = f(x)dx
a
1 2 x-μ
b
= 1 e- 2 ( σ ) dx
a σ 2π
124
Ninguna de las técnicas de integración se puede utilizar para evaluar la integral
anterior, por lo que su evaluación solamente puede obtenerse utilizando métodos
numéricos dado que no puede calcularse directamente al no existir la primitiva de
f(x). En su lugar, para μ=0 y σ=1, dicha integral se ha evaluado y tabulado
numéricamente para determinados valores de a y b. La tabla también se utiliza para
calcular probabilidades con otros cualesquiera valores de μ y σ.
Si μ=0 y σ=1, se tiene la distribución normal estándar (DNE) y la variable de
ésta distribución se llama variable aleatoria normal estándar (VANE) y se denota
por Z.
- 1 z2
f(z) = 1 e 2 , z R
2π
125
Φ(z) es el área sombreada a la izquierda de z como se muestra en la figura cuyo
valor se encuentra desde z= - 3.49 a z=3.49 en las tablas utilizadas aquí. Fuera de
este intervalo Φ(z) es 0 para Z< - 3.49 y 1 para Z>3.49 respectivamente.
Ejemplo 4.3.
a) P(Z>1.35)=1 - P(Z≤1.35)=1- Φ(1.35)=1 - 0.9115=0.0885.
b) P(Z≤ - 1.35)=Φ(-1.35)=0.0885.
c) P( - 0.76≤Z≤1.35)=P(Z≤1.35)–P(Z≤ - 0.76)=Φ(1.35)–Φ( - 0.76)=
0.9115– 0.2236=0.6879.
d) P(Z≤ - 3.5)= Φ( - 3.5)=0.
e) P(Z≤3.5)= Φ(3.5)=1.
126
Si X es una variable aleatoria normal con E(X)=μ y V(X)=σ 2, entonces la variable
X-μ
Z=
σ
es una variable aleatoria normal con E(Z)=0 y V(Z)=1. Es decir, Z es una variable
aleatoria normal estándar.
Solución:
a) P(100 < X <115) =P( 100-100
16
< X-100
16
< 115-100
16
)
=P(0 < Z < 0.94)
=Φ(0.94) – Φ(0)
=0.8264 – 0.5
127
=0.3264
P(|X-μ|≤1σ)=P(-σ≤X-μ≤σ)
=P(μ-σ≤X≤μ+σ)
= P( μ-σ-μ
σ
Z μ+σ-μ
σ
)
=P(-1.00≤Z≤1.00)
=Φ(1.00)-Φ(-1.00)
=0.8413 - 0.1587
=0.6826.
REGLA EMPIRICA
Si una va es normal o aproximadamente normal entonces:
1. Alrededor de 68% de los valores están a menos de 1 DE de μ.
2. Alrededor de 95% de los valores están a menos de 2 DE de μ.
3. Alrededor de 99.7% de los valores están a menos de 3 DE de μ.
128
De este ejemplo se deduce que x = μ + σz.
TEOREMA
Ejemplo 4.8. Suponga que el 50% de todas las familias en una colonia tienen
cable. Calcular la probabilidad aproximada de que a lo sumo 10 tenga cable entre
20. La aproximación es aceptable ya que np=20(0.5)≥10 y nq=20(0.5)≥10.
129
4.7 Gráficas de cuantiles y gráficas de probabilidad normal
El objetivo principal de éstas es proporcionar una verificación diagnóstica sobre la
suposición de que los datos provienen de una distribución normal.
Una gráfica cuantilar normal es una herramienta que nos ayuda a determinar si
aparentemente se satisfacen los requisitos de una distribución normal.
PROCEDIMIENTO:
Si se tiene un conjunto pequeño de datos, identifique datos distantes. Rechace la
normalidad si hay más de un dato distante presente. (La presencia de un solo dato
distante podría ser un error o el resultado de la variación por el azar, pero tenga
cuidado porque incluso un solo dato distante llega a producir un efecto importante
en los resultados).
Los siguientes pasos describen la construcción de una gráfica cuantilar normal:
a. Primero ordene los datos del más bajo al más alto.
b. Con una muestra de tamaño n, cada valor representa una proporción de 1/n de
la muestra. Utilizando el tamaño muestral n que se conoce, identifique las áreas
de 21n , 23n , 25n , 27n , etc. Estas son las áreas acumulativas a la izquierda de los
valores muestrales correspondientes.
d. Una los valores originales de los datos ordenados con sus puntuaciones z
correspondientes, que se calcularon en el paso c, después grafique los puntos
(x,y), donde cada x es un valor muestral original, en tanto y es la puntuación z
correspondiente.
e. Examine la gráfica cuantilar normal con los siguientes criterios: si los puntos no
se acercan a una línea recta o si exhiben algún patrón sistemático diferente al
de una línea recta, entonces parece que los datos provienen de una población
que no tiene una distribución normal. Si el patrón de puntos se acerca
razonablemente a una línea recta, entonces los datos pueden provenir de una
población normal.
Ejemplo 4.9.
Se extrae una muestra aleatoria de edades de tamaño 5: 62, 46, 68, 64, 57.
Construya una gráfica cuantilar normal para los datos y determine si parecen
provenir de una población que se distribuye normalmente.
Solución:
Los siguientes pasos corresponden a los listados en el procedimiento anterior para
la construcción de una gráfica cuantilar normal.
a. Primero hay que ordenar los datos: 46, 57, 62, 64, 68.
130
b. Con una muestra de tamaño n=5, cada valor representa una proporción de 1/5
de la muestra, por lo que procedemos e identificar las áreas acumulativas a la
izquierda de los valores muestrales correspondientes. Estas áreas izquierdas
acumulativas, que se expresan en general como 21n , 23n , 25n , 27n , etc., se
convierten en áreas específicas para el presente ejemplo, con n=5: 1/10, 3/10,
5/10, 7/10 y 9/10. Tales áreas izquierdas acumulativas, que se expresan en
forma decimal, son: 0.1, 0.3, 0.5, 0.7 y 0.9.
131
e. INTERPRETACION: examinamos la gráfica cuantilar normal de la figura. Como
los puntos parecen estar razonablemente cerca de una línea recta, concluimos
que las edades dadas parecen provenir de una población que se distribuye
normalmente.
132
Como se aprecia los datos de distribuciones asimétricas positivas presentan
claramente una curvatura negativa cuando se representan en papel probabilístico
normal. Además, las distribuciones asimétricas negativas presentan una curvatura
positiva en el papel de probabilidad normal. La mezcla de dos poblaciones con
diferentes medias se detecta por la existencia de dos tramos de crecimiento rápido
separados por uno de crecimiento lento. Por último los valores anormalmente altos
o bajos se representan por puntos que se separan de la recta en la zona superior
derecha e inferior izquierda respectivamente.
Solución:
j x(j) (j-0.5)/5
1 46 0.1
2 57 0.3
3 62 0.5
4 64 0.7
5 68 0.9
133
Después se grafican en papel probabilidad normal los pares de valores x(j) y (j-
0.5)/5. La mayoría de los papeles probabilidad normal grafican 100(j-0.5)/n en la
escala vertical derecha y 100[1-(j-0.5)/n] en la escala vertical izquierda, mientras
que en la escala horizontal se grafica el valor de la variable.
134
Los puntos de la muestra se aproximan a una línea recta, por lo que es factible que
provengan de una población normal.
La media se estima como el 500 percentil de la muestra, es decir x 59.5 , y la
desviación estándar se estima como la diferencia entre los percentiles 840 y 500 es
decir s 68 59.5 8.5 .
DEFINICION
135
Es fácil calcular la función de distribución de probabilidad acumulativa de la
distribución exponencial. Para x≤0, F(x)=P(X≤0)=0. Para x>0, la función de
distribución acumulativa es
x
F(x) = P(X x) = λe-λt dt =1- e-λx
0
TEOREMA.
Si X~Exp(λ), la función de distribución acumulada de X es
x
F(x) = P(X x) = λe-λt dt =1- e-λx
0
Solución:
a) Sabemos que E(X)=1/λ=5, de donde λ=0.2. Entonces
P(X 10) =1- e-(0.2)(10) =1- e-2 = 0.8647
b) P(5 X 10) = (1- e-2 ) - (1- e-1) = 0.2325
c) Sea x la mediana de X. Entonces
P(X≤ x )=0.5
F(X) =1- e-0.2x = 0.50
x=3.47 seg
Relación entre la distribución exponencial y el proceso de Poisson
En el desarrollo de la distribución de Poisson, fijamos el tiempo en algún valor t,
y desarrollamos la distribución del número de ocurrencias en el intervalo [0, t].
Indicamos esta variable como X, y la distribución como
e-λ λ x
P(X = x) = , x = 0, 1, 2,...
x!
136
Consideremos ahora P(X=0), que es la probabilidad de ninguna ocurrencia en
[0, t]. Esta está dada por
P(X = 0) = e-λt
Recuerde que en principio fijamos el tiempo en t. Otra interpretación de
P(X = 0) = e-λt es que ésta es la probabilidad de que el tiempo para la primera
ocurrencia sea mayor que t. Al considerar este tiempo como una variable aleatoria
T, notamos que
f(t) = λe-λt , t 0
que nos da la función de masa de probabilidad del tiempo requerido hasta que se
detecta la primer ocurrencia, ésta es la función de densidad exponencial. En
consecuencia, la relación entre la distribución exponencial y de Poisson puede
establecerse como sigue: si el número de ocurrencias tiene una distribución
Poisson, entonces el tiempo (longitud, área, etc.) entre ocurrencias tiene una
distribución exponencial. Por ejemplo, si el número de pedidos para un cierto
artículo recibidos a la semana tiene una distribución de Poisson, el tiempo entre
pedidos tendría una distribución exponencial. Una variable es discreta (el conteo) y
la otra (el tiempo) es continua.
Ejemplo 4.12. El tiempo entre llamadas telefónicas a una ferretería tiene una
distribución exponencial con tiempo promedio entre llamadas de 15 min.
a) ¿Cuál es la probabilidad de que no haya llamadas en un intervalo de 30 min?
b) ¿Cuál es la probabilidad de que haya al menos una llamada en un intervalo de
10 min?
c) ¿Cuál es la probabilidad de que el tiempo hasta la siguiente llamada esté entre
5 y 10 min?
d) Determine el intervalo de tiempo tal que la probabilidad de que no haya llamadas
en el intervalo sea 0.90.
Solución:
a) Sabemos que E(x)=1/λ=15, de donde λ=1/15. Entonces
137
o por la función exponencial
P(T > 30) =1-P(T 30) =1- 1- e-(1/15)(30) = 0.1353
b) P(X 1) =1-P(X = 0) =1- e-(1/15)(10) = 0.4866
c) P(5 < T <10) =P(T <10)-P(T < 5)
= 1- e-(1/15)(10) - 1- e-(1/15)(5)
= e-(1/15)(5) - e-(1/15)(10)
= 0.2031
d) P(X = 0) = P(T > t) = 0.90
e-(1/15)t = 0.90
1
- t = Ln(0.90)
15
t=1.58 min
PROPIEDADES:
La distribución gamma
DISTRIBUCION GAMMA
La variable aleatoria X cuya función de densidad de probabilidad es
λr xr-1e-λx
f(x) = , si x > 0
Γ(r)
138
Si X es una variable aleatoria cuya función de densidad de probabilidad gamma con
parámetro de forma r y de escala λ, se expresa como X~Γ(r, λ). Observe que cuando
r=1, la distribución gamma es igual a la exponencial. Con símbolos, Γ(1,
λ)=Exp(λ). La figura muestra gráficas de la función de densidad gamma para valores
de r y λ.
Algunas alternativas de la función de densidad gamma se muestran en el siguiente
gráfico. Siendo los parámetros de forma y escala r y λ, respectivamente. En general,
la forma de la distribución es:
TEOREMA.
e-λx (λx)k
x r r-1 -λt r-1
λt e
F(x) = dt =1- , x>0
Γ(r) k=0 k!
0
Ejemplo 4.13. En cierta ciudad, el consumo diario de agua (en millones de litros)
sigue una distribución gamma con parámetros r=2; λ=1/3. Si el consumo total diario
139
en esa ciudad es de 9 millones de litros; ¿cuál es la probabilidad de que en un día
cualquiera el abastecimiento de agua sea insuficiente?
Solución:
e-(1/3)(9) (1/3)(9)
1 k
F(9) = P(X < 9) =1- =1- 0.1991= 0.8009.
k=0 k!
Solución alterna:
( 31 )2
1 9 - 31 x
9 - 1x
Γ(2) 0
9 0
P(x < 9) = xe 3
xe dx dx =
Resolvamos por integración por partes: ∫u dv=uv - ∫v du, haciendo u=x y dv=e-1/3 x,
- 1x
de donde du=dx y v= - e – 1/3 x. Así, xe 3 dx = - 3xe- 1/3 x - ∫ (- 3 e – 1/3 x) dx
= - 3xe- 1/3 x – 9 e – 1/3 x
( 31 )2 9 - 1x 1 9 - 31 x
Γ(2) 0 9 0
Por lo tanto, P(x < 9) = xe 3 dx = xe dx
1 9
= -3xe-1/3 x - 9e-1/3 x
9 0
=0.8009
141
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995
3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998
es decir, los valores f(x,y) dan la probabilidad de que ocurran los resultados x y y al
mismo tiempo.
1. f(x,y)≥0
2. f(x,y) =1
x y
3. f(x,y)=P(X=x, Y=y)
Media y varianza
E(X) = xfX (x) = x f(x,y) = xf(x,y)
y R
x x
V(X) = (x - μX ) fX (x) = (x -μX )2 f(x,y)
2
x x y
V(X) = (x - μX ) 2
(x -μX )2 f(x,y)
fX (x) =
x R
Fórmula abreviada:
f(x,y)=fX(x).fY(y)
Ejemplo 5.1. Una caja contiene 14 piezas de las cuales 4 tienen defectos grandes,
3 con defectos pequeños y están buenas 7. Se seleccionan al azar 2 piezas de entre
144
14. Sea X el número de piezas con defectos grandes y Y el número de piezas con
defectos pequeños.
a) Calcular la dpc en forma de función utilizando combinatorios.
b) Calcular la dpc en forma tabular.
c) Calcular P(x+y≤1)
d) Calcular la marginal de X y Y.
e) Calcular µX y σ 2X .
f) ¿Son X y Y estadísticamente independientes?
h 4 Cx .3 Cy .7 C2-(x+y)
f(x,y) = p(x,y) = ; x=0,1,2; y=0,1,2; 0≤x+y≤2
n C
14 2
y
x 0 1 2
1 28/91 12/91 0
2 6/91 0 0
c) P(x+y≤1)=f(0,0)+f(0,1)+f(1,0)=21/91+ 21/91+28/91=70/91
d) La marginal de x, fX(x)=P(X=x)=p(x) es el total marginal del renglón.
y
x 0 1 2
0 21/91 21/91 3/91 45/91
1 28/91 12/91 0 40/91
145
2 6/91 0 0 6/91
55/91 33/91 3/91 1
Así, fX(x) es
x 0 1 2
P(X=x) 45/91 40/91 6/91
Otra forma de encontrar los valores de f X(x) es a través de la definición de fX(x),
fX (x) = f(x,y)
y
fX(0)=∑f(0,y)=f(0,0)+f(0,1)+f(0,2)=21/91+21/91+3/91+0=45/91
fX(1)=∑f(1,y)=f(1,0)+f(1,1)+f(1,2)=28/91+12/91+0+0=40/91
fX(2)=∑f(2,y)=f(2,0)+f(2,1)+f(2,2)=6/91+0+0=6/91
La marginal de y, fY(y)=P(Y=y)=p(y) es el total marginal de la columna.
y 0 1 2
P(Y=y) 55/91 33/91 3/91
Los valores de fY(y) se pueden encontrar también por definición.
e) μX = x fX (x) = (0)(45/91)+(1)(40/91)+(2)(6/91)=52/91 o por definición,
x
f(0,0)=fX(0).fY(0)
21/91≠(45/91).(55/91)
Así, X y Y no son estadísticamente independientes, son pues dependientes.
146
entonces Y=2X1+2X2 es una variable aleatoria que representa el perímetro de la
pieza.
DEFINICION
Dadas las variables aleatorias X1, X2,…,Xn y las constantes a1, a2,…,an, entonces
Y = a1X1 +a2 X2 +...+an Xn
TEOREMA
Si X1, X2,...,Xn tienen valores medios μ1, μ2, ...,μn, y varianzas σ12, σ22,...,σn2,
respectivamente, entonces:
Solución:
a) W= Z - 2S
b) W=1.Z + (-2)S
μW=1.μZ + (-2).μS (media de una combinación lineal)
μW= μW - 2 μS
147
σ2W = (1)2.σ2Z + (-2)2.σS2 (varianza de una combinación lineal de VAI)
TEOREMA
E( X )=μ
V(X) = σ2 /n
Ejemplo 5.3.
a) Lanzamiento de una moneda. X: número de caras. Calcule μX y σ 2X .
x p(x) μX =∑x.p(x)=(0)(0.5)+(1)(0.5)=0.5
0 0.5 σ 2X =∑x2.p(x)- μ2X =(0)2(0.5)+(1)2(0.5)-(0.5)2=0.25=(1/4)/1
1 0.5
x1 x2 p(x1, x2) x
148
0 0 0.25 0 Distribución de probabilidad de x :
0 1 0.25 0.5 x 0 0.5 1
1 0 0.25 0.5 p( x ) 0.25 0.50 0.25
1 1 0.25 1
μX =∑ x p( x )=(0)(0.25)+(0.5)(0.50+(1)(0.25)=0.5
σ 2X =∑ x 2p(x) - μX 2 =0.125=1/8= (1/4) / 2
1 1 1 0.125 1
μX =μ y σ 2X = σ2/n
Ejemplo 5.4. El diámetro exterior de un tubo cilíndrico es una variable aleatoria con
una media de 3 pulg y una DE de 0.02 pulg, el espesor del tubo es una variable
aleatoria con una media de 0.3 pulg y una DE de 0.005 pulg, y las dos variables
aleatorias son independientes normalmente distribuidas.
149
σ2W = σ2Z + (2)2 σS2 =(0.02)2 + 4(0.005)2=0.0005 pulg2; σW=0.022 pulg.
b) P(W≥2.39)=1 – P(W<2.39)
W - 2.4 2.39 - 2.4
=1 - P <
0.022 0.022
=1 - P Z < -0.45
=1 - ( - 0.45)
= 1 – 0.3264
=0.6736
Ejemplo 5.5. Se llenan latas de refresco con una máquina de llenado automático.
El volumen de llenado promedio es 12.1 onzas líquidas, y la desviación estándar es
0.05 onzas líquidas. Suponga que el volumen de llenado de las latas es una variable
aleatoria normal e independiente. ¿Cuál es la probabilidad de que el volumen
promedio de 10 latas seleccionadas de este proceso sea menor que 12 onzas
líquidas?
Sea X1, X2,...,X10 que denoten los volúmenes de llenado de las 10 latas. El volumen
de llenado promedio (denotado como X ) es una variable aleatoria normal con E( X
σ 2 (0.05)2
)=μX=12.1 y V(X) = X = 0.00025 cm2 . Por consiguiente,
n 10
X -12.1 12 -12.1
P(X <12) = P <
0.00025 0.00025
= P(Z < -6.32) = 0
Como puede verse esto es inusual que el promedio de 10 latas sea menor que 12
onzas líquidas.
150
Ejemplo 5.6. En el lanzamiento de un dado obtenemos 2, 5, 1, 3, 6,4, 4, 5, 2, 4, 1,
2. Estos números constituyen una muestra aleatoria ya que:
DEFINICION
Las variables aleatorias X1, X2,…,Xn son una muestra aleatoria de tamaño n si:
Interpretaciones:
Las condiciones a) y b) nos dicen que las Xi son independientes y tienen
distribuciones idénticas.
Si el muestreo es con reemplazo o de una población infinita (conceptual), las
condiciones a) y b) se satisfacen exactamente.
Si el muestreo es sin reemplazo las condiciones se satisfacen aproximadamente,
pero con n « N. En la práctica, si n≤0.05N.
151
de 0 a 999. Luego refiérase a una tabla de números aleatorios, tal como la porción
mostrada en la tabla siguiente
Solución:
No. No todo subconjunto de 50 tiene la misma probabilidad de pertenecer a la
muestra. Para formar una muestra aleatoria, el ingeniero necesitaría asignar un
número a cada producto durante el día y después generar números aleatorios para
determinar con qué productos se forma la muestra.
152
Algunas personas piensan que una muestra aleatoria es garantía de que refleja
perfectamente a su población. Esto no es cierto. Las muestras aleatorias siempre
son diferentes de sus poblaciones en algunos aspectos y en ocasiones podrían ser
considerablemente diferentes. Dos muestras diferentes de la misma población
también serán diferentes entre sí. Este fenómeno se conoce como variación del
muestreo.
Ejemplo 5.9. Un inspector de calidad prueba 40 pernos de una gran remesa y mide
la longitud de cada uno. Descubre que 34 de ellos (85%) cubre la especificación de
longitud. Llega entonces a la conclusión de que exactamente 85% de los pernos de
la remesa satisfacen la especificación. Por otra parte, el supervisor del inspector
concluye que la proporción de pernos buenos está cerca de 85% con cierta
probabilidad, pero que no es exactamente igual. ¿Cuál es la conclusión correcta?
Solución:
En los ejemplos 5.8 y 5.9, las poblaciones constaban de elementos físicos reales:
estudiantes de una universidad y pernos de una remesa. Estas poblaciones se
denominan poblaciones tangibles, poblaciones que siempre son finitas. En
ingeniería es frecuente que los datos sean producto de mediciones realizadas
durante un experimento, más que por muestreo de una población tangible. Por
ejemplo, imagine un ingeniero mide la longitud de una varilla cinco veces, haciendo
las mediciones en condiciones idénticas, las mediciones difieren una de otra. Estos
datos se consideran como una muestra aleatoria de una población. En estos casos,
la población consta de todos los valores que posiblemente puedan haber sido
observados. Esta población se denomina población conceptual.
153
Un estadístico es cualquier función de las observaciones de una muestra
aleatoria.
Nos hemos encontrado ya con estadísticos. Por ejemplo, si X1, X2,…,Xn es una
muestra aleatoria de tamaño n, entonces la media muestral X , la varianza muestral
S2, y la desviación estándar S son estadísticos.
TEOREMA
Sea X1, X2, … ,Xn una muestra aleatoria de tamaño n de una distribución normal
con media µ y varianza σ2. Entonces
X = x/n
Está distribuida normalmente con media μX = μ y varianza σ 2X = σ 2 /n , es decir,
X N(μ, σ2 /n) .
Ejemplo 5.10.
154
1)
2)
3)
Las tres distribuciones de los ejemplos que no son normales parecen comprobar
el teorema del límite central; las distribuciones muestrales de las medias muestrales
asemejan comportarse aproximadamente de manera normal cuando se usan
muestras de tamaño 30. Así, se presencia un fenómeno asombroso: no importa cuál
sea la forma de una población, la distribución muestral de las medias muestrales es
normal o se vuelve aproximadamente cuando n se hace suficientemente grande.
Aun cuando el teorema del límite central funcionará bien para muestras
pequeñas (n=4, 5) en la mayoría de los casos, en particular cuando la población es
continua, unimodal y simétrica.
El teorema del límite central establece que X se distribuye aproximadamente
normal, si el tamaño de la muestra n es suficientemente grande. La cuestión natural
155
por preguntar es: ¿Qué tan grande es suficientemente grande? La respuesta
depende de la forma de la población principal. No obstante, si la población está
demasiado sesgada, puede ser necesaria una n muy grande. La evidencia empírica
sugiere que para la mayoría de las poblaciones, un tamaño de muestra de 30 o más
(n≥30) es lo suficientemente grande para que la aproximación normal sea
adecuada. Si n<30, el teorema del límite central funcionará si la distribución de la
población no se aparte significativamente de la distribución normal.
DEFINICION
157
Aunque S2 es un estimador insesgado de σ 2 , S, es por otro lado, un estimador
sesgado de σ siendo insignificante el sesgo en muestras grandes. Este ejemplo
ilustra por qué dividimos entre n-1 en lugar de n cuando se estima la varianza.
TEOREMA
insesgado de p.
ˆ =p .
Demostración: P̂ = X/n es estimador insesgado de p sí E(P)
ˆ = E X = E 1 .X 1 E(X) = 1 np = p
E(P)
n n n n
μ X
σ2 S2
X
p n
μ1 -μ2 X1 - X2
p1 - p2 X1 X2
-
n1 n2
158
X ~ N(μ, σ2 ) μ X
1
σ2 n
(X - X)2
1
X ~ Exp(λ) λ X
X ~ Poisson(λ) λ X
1
X ~ Geo(p) p X
X2
r
X ~ Γ(r, λ)
1
n X2 - X 2
X
λ 1
n X2 - X2
Ejemplo 6.3. Se piensa que los defectos de un tablero metálico usado en la
manufactura de automóviles sigue una distribución de Poisson. Se cuentan los
defectos en 10 tableros con los siguientes resultados: x1=2, x2=7, x3=15, x4=8, x5=7,
x6=6, x7=3, x8=7, x9=3, x10=4. Encuentre una estimación puntual del parámetro de
Poisson λ.
Solución:
λˆ = x =
x = 62 = 6.2 defectos
n 10
Para una población normal, μ = μ , por lo tanto hay dos opciones para estimar μ.
Entonces, ¿Cuál es el estimador que produce estimados más cercanos al parámetro
θ?
TEOREMA
Sea X1, X2,…,Xn una muestra aleatoria de una distribución normal con parámetro
μ y σ. Entonces el estimador μ̂ = X es el EIVM para μ.
ERROR ESTANDAR
Además de reportar el valor de una estimación puntual, también debe indicarse su
precisión. La medida de precisión usual es el error estándar del estimador
empleado.
159
DEFINICION
El error estándar de un estimador θ es su desviación estándar σθˆ = V(θ)ˆ . Si
en el error estándar intervienen parámetros desconocidos, cuyos valores se
pueden estimar, la sustitución de estas estimaciones en ˆ produce el error
estándar estimado (desviación estándar estimada) del estimador. El error
estándar estimado se puede representar ya sea por σˆ θˆ o por Sθ̂ .
1 1 np(1- p) p(1- p)
σPˆ = V(X/n) = V( X) 2 V(X) = 2
=
n n n n
Intervalos de confianza
Una estimación por intervalo de un parámetro poblacional θ es un intervalo de la
forma l<θ<u, donde l y u dependen de θ . l y u se determinan con:
160
TERMINOLOGIA:
Ejemplo 6.6. Se sabe que la vida en horas de una bombilla de 75 watts tiene una
distribución aproximadamente normal, con desviación estándar σ = 5 horas. Una
muestra aleatoria de 20 bombillas tiene una vida media de x =1014 horas.
Construya un intervalo de confianza de 95% para la vida media.
Solución:
La estimación puntual de μ es x =1014. El valor de z, que deja un área de 0.025 a
la derecha y por tanto un área de 0.975 a la izquierda, es z0.025 1.96. De aquí que
el intervalo de confianza de 95% es
5 5
1014 - (1.96) < μ <1014 +(1.96) .
20 20
que se reduce a 1011.8<μ<1016.2.
161
inversamente relacionado con su precisión. Una estimación del intervalo altamente
confiable puede ser imprecisa porque los puntos extremos del intervalo estén muy
separados, mientras que un intervalo preciso puede ocasionar relativamente poca
confiabilidad. Por lo tanto, la ganancia, en confiabilidad ocasiona una pérdida de
precisión. Un buen intervalo de confianza debe tener las siguientes dos
características:
Ejemplo 6.7. En el ejemplo 6.6, ¿qué tamaño muestral es necesario para garantizar
que el IC de 95% resultante tenga una longitud w de 10? El tamaño muestral n debe
satisfacer
w=10
2(1.96)(5/n)=10
n=4
2
σ
n = 2zα/2
w
Cuanto más pequeña sea la longitud w deseada, mayor debe ser n. Además, n
es una función creciente de σ y del nivel de confianza 100(1-α)%.
Si deseamos estimar μ con una precisión B (la cota específica del error de
estimación) con un nivel de confianza de 100(1-α)%, el tamaño necesario de la
muestra se calcula reemplazando 2/w por 1/B en la fórmula del cuadro precedente,
con lo que
2
σ
n = zα/2
B
162
Intervalo de confianza para µ.
Muestras grandes. σ2 se conoce.
Sea X1, X2,…,Xn una muestra aleatoria de una población con media μ y
desviación estándar σ. Siempre que n sea grande, el TLC implica que X tiene
aproximadamente una distribución normal, cualquiera que sea la naturaleza de la
distribución de la población, lo que produce el intervalo:
x ± zα/2 s/ n
En términos generales, n>40 será suficiente para justificar el uso de este intervalo.
Es algo más conservador que la sencilla regla para el TLC.
μ < u = x + zασ/ n
x - zασ/ n = l < μ
Ejemplo 6.8. Se encuentra que la concentración promedio de zinc que se saca del
agua a partir de una muestra de mediciones de zinc en 36 sitios diferentes es 2.6
163
gramos por milímetro. Encuentre intervalos de confianza de 95% para la
concentración media de zinc en el río. Suponga que la desviación estándar de la
población es 0.3.
Solución:
La estimación puntual de μ es x = 2.6. El valor de z, que deja un área de 0.025 a la
derecha y por tanto un área de 0.975 a la izquierda, es z0.025 =1.96. De aquí que el
intervalo de confianza de 95% es
0.3 0.3
2.6 - (1.96) < μ < 2.6 +(1.96) .
36 36
que se reduce a 2.50<μ<2.70.
Solución:
6.83
x - zασ/ n =12.68 -1.645 * =11.091, o
50
μ>11.091, y
6.83
x + zασ/ n =12.68 + 2.33 * =14.931, o
50
μ<14.931.
pˆ ± zα/2 pq/n
ˆˆ
164
cuyo caso los intervalos obtenidos no tienen sentido. Correa & Sierra (2003), entre
otros, señalan que los intervalos de Wald tienen una probabilidad de cobertura muy
por debajo del nivel de confianza nominal, en especial cuando el tamaño de muestra
es pequeño.
Solución:
ˆ p)/n
ˆ (0.12)(0.88)
zα/2 p(1- =1.96 = 0.0691
85
2
z
n = α/2 p(1- p) (a)
E
Para usar esta ecuación se necesita estimar p. Si se cuenta con una estimación p̂
de una muestra anterior, ésta puede sustituir a p en la ecuación, o tal vez pueda
hacerse una estimación subjetiva. Si estas alternativas no son satisfactorias, puede
tomarse una muestra preliminar, calcular p̂ y después usar la ecuación para
determinar cuántas observaciones adicionales se requieren para estimar p con la
precisión deseada. Otro enfoque para elegir n utiliza el hecho de que el tamaño de
la muestra de la ecuación siempre será un máximo para p=0.5, lo cual puede usarse
para encontrar una cota superior de n. En otras palabras, se tiene una confianza de
al menos 100(1-α) por ciento de que el error al estimar p utilizando p̂ es menor que
E si el tamaño de la muestra es
165
2
z
n = 0.25 α/2 (b)
E
SUGERENCIA
Para tamaños muestrales muy grandes, los resultados del intervalo clásico de Wald
son casi idénticos a los obtenidos con el método de Wald Ajustado. Para tamaños
muestrales pequeños o medianamente grandes, el punto de vista del intervalo de
Wald Ajustado, llamado también de Agresti-Coull, es mejor.
Ejemplo 6.12. En cierto día se fabrica un gran número de fusibles cada uno tasado
a 15 A. Al extraer una muestra de 75 de la producción del día, se encontró que 17
de ellos tenían amperajes de quemado mayores que 15 A.
Determine un IC de 95% para la proporción de fusibles fabricados ese día, cuyo
amperaje de quemado es mayor que 15 A.
Solución:
166
Sumando 4 al número de ensayos y 2 al de éxitos, se tiene
x+2
p= = (17 + 2)/(75 + 4) =19/79 = 0.2405,
n+ 4
de donde,
(0.2405)(0.7595)
zα/2 p(1- p)/n =1.96 = 0.0942
79
El intervalo de confianza de 95% es, por lo tanto, 0.2405±0.0942, ó (0.1463; 0.3347).
p - zα p(1- p)/n , y
p + zα p(1- p)/n
Solución:
Dicho intervalo es de la forma
(0.2405)(0.7595)
p + zα p(1- p)/n = 0.2405 + 2.05 = 0.2405 + 0.0986 = 0.3391 ó
79
p<0.3391
167
Ejemplo 6.14. Del ejemplo precedente, determine el tamaño muestral necesario
para que un intervalo de confianza de 95% especifique la proporción dentro de
±0.05.
Solución:
El IC más ancho posible, para una muestra de tamaño n, es
(0.2405)(0.7595)
±1.96
n+ 4
Al despejar n de
(0.2405)(0.7595)
1.96 = 0.05
n+ 4
se obtiene,
(0.2405)(0.7595)
(1.96)2 = (0.05)2
n+ 4
0.7017
= 0.0025
n+ 4
de donde, n≈277.
h(t) = 1+ , t R
Γ(ν/2) πν ν
168
1. Cada curva tν tiene forma de campana con centro en 0.
2. Cada curva tν está más dispersa que la curva normal estándar (z).
3. A medida que ν aumenta, la dispersión de la curva tν correspondiente disminuye.
4. A medida que , la secuencia de curvas tν se aproxima a la curva normal
estándar (por lo que la curva z recibe a veces el nombre de curva t con gl = ).
Sea X1, X2,…,Xn una muestra aleatoria pequeña (n<30) de una población normal
con media μ. Entonces un intervalo de confianza de nivel 100(1-α)% para μ es
s
x ± tn-1, α/2
n
s
x + tn-1, α
n
s
x - tn-1, α
n
169
¿Cómo se determina si la distribución t de Student es adecuada?
En muchos casos se debe decidir si una población es aproximadamente normal
examinando la muestra. Desafortunadamente, si el tamaño de la muestra es
pequeño, desviaciones a la normalidad pueden ser difíciles de detectar. Una manera
es construir ya sea un gráfico de papel probabilidad, una gráfica cuantilar normal,
un diagrama de caja o uno de puntos. Si el gráfico o estos diagramas no revelan
una asimetría fuerte o algún dato atípico, entonces en la mayor parte de los casos
la distribución t de Student es confiable.
Ejemplo 6.16. Se presentan mediciones de la fuerza nominal de corte (en kN) para
una muestra de 15 vigas de concreto. Los resultados son
580 400 428 825 850 875 920 550
575 750 636 360 590 735 950
Solución:
Aquí, x = 668.3; s =192.1; y t14, 0.01 = 2.624 , entonces
192.1
t s = 2.624 =130.2
n-1, α 15
n
σ12 σ 22
x1 - x2 ± zα/2 +
n1 n2
Cuando los valores de σ12 y σ 22 son desconocidos, se pueden sustituir con las
DE muestrales s1 y s2 , pero con n1>40 y n2>40.
170
Solución:
Aquí, n1 = 45, x1 = 517.0o F y s1 = 2.4o F; y n2 = 47, x2 = 510.1o F y s2 = 2.1o F.
Además, z0.005 = 2.575. Entonces,
pˆ (1- pˆ 1) pˆ 2 (1- pˆ 2
(pˆ 1 - pˆ 2 ) ± zα/2 1 +
n1 n2
Solución:
171
El IC es similar al que se tomo para el intervalo de confianza de una muestra. El
intervalo de confianza dado a continuación suele ser llamado intervalo de Agresti-
Caffo, después que lo desarrollaron Alan Agresti y Brian Caffo.
Solución:
Sea X1 la va del número de conexiones bajo condiciones húmedas y X 2 la va del
número de conexiones bajo condiciones secas.
Aquí, n1 = n1 + 2 =100 + 2 =102, p1 = (x1 +1)/n1 = (20 +1)/102 = 0.2059; y
n2 = n2 + 2 =150 + 2 =152, p2 = (x2 +1)/n2 = (10 +1)/152 =.0724; y además
z0.05 =1.645.
Entonces,
p (1- p1) p2 (1- p2 ) (.2059)(.7941) (.0724)(.9276)
zα/2 1 + =1.645 + = 0.0744
n1 n2 102 152
El IC de 90% es, por lo tanto, (0.2059-0.0724) ± 0.0744=0.1335±0.0744, ó (0.0591;
0.2079).
172
χ2=(n-1)S2/σ2 que tiene una distribución ji-cuadrada con ν= n – 1 grados de
libertad, siempre que la muestra se tome de una distribución normal.
1
f(x) = ν/2
x ν/2 - 1.e-x/2 , x > 0 Distribución Ji-cuadrada
2 Γ(ν/2)
Solución:
(n -1)s2 2 (n -1)s2
< σ <
χ 2α/2, ν 2
χ1-α/2, ν
(9)(2.35)2 (9)(2.35)2
<σ <
2
16.919 3.325
2.936<2<14.941
y
1.714<<3.865
173
Distribución muestral de F
La distribución F de probabilidad tiene dos parámetros, representados por ν1 y ν2. El
parámetro ν1 se llama número de grados de libertad del numerador, y ν2 es el
número de grados de libertad del denominador; aquí, ν1 y ν2 son enteros positivos.
Hay una relación importante entre una variable F y las variables ji-cuadradas. Si X1
y X2 son variables aleatorias ji-cuadradas independientes con ν1 y ν2 grados de
libertad, respectivamente, entonces se puede demostrar que la variable aleatoria
X1/ν1
F=
X2 /ν 2
el cociente entre las dos variables ji-cuadrada, divididas entre sus respectivos
grados de libertad, tiene una distribución F:
174
pulgadas cuadrada). Una muestra aleatoria de n2=10 mediciones en una segunda
máquina, pero del mismo tipo de vidrio, dio s22=2.31. Estimar la relación verdadera
de las varianzas σ12 /σ 22 , en un intervalo de confianza de 90%. Suponer normalidad
para ambas poblaciones.
Solución:
s12 1 σ12 s12
< < f
s22 fα/2, ν1, ν 2 σ 22 s22 α/2, ν 2 , ν1
1-α=0.90, α=0.10, α/2=0.05, f α/2, ν1, ν2 = f 0.05,15, 9 = 3.01, f α/2, ν2, ν1 = f 0.05, 9,15 = 2.59,
175
Unidad VII: PRUEBA DE HIPOTESIS
Introducción
Podemos estimar un parámetro de manera puntual o a través de un intervalo de
confianza. A veces el objetivo no es estimar un parámetro sino determinar cuál de
dos hipótesis contradictorias del parámetro es la correcta. Esto se logra con las
pruebas de hipótesis.
Ejemplos 7.1.
1. La expresión μ=0.75, donde μ es el promedio verdadero del diámetro interior de
cierto tipo de tubo de PVC.
2. El enunciado p<0.10, donde p es la proporción de tarjetas defectuosas de un
circuito, entre todas las fabricadas por un fabricante.
3. Si μ1 y μ2 representan el verdadero promedio de resistencia a la ruptura de dos
tipos de cuerdas, una hipótesis es la afirmación μ1-μ2=0 ó μ1 = μ2.
DEFINICION
Una prueba de hipótesis estadística es un método que emplea datos de una
muestra para decidir si se debe rechazar Ho.
176
El razonamiento usado en una prueba de hipótesis estadística es similar al
proceso en un juicio. Al procesar a una persona por robo, el jurado debe decidir
entre la inocencia y la culpabilidad. Cuando empieza el juicio, se considera que la
persona acusada es inocente. La parte acusadora reúne y presenta toda la
evidencia disponible en un esfuerzo por contradecir la hipótesis de inocencia, el
jurado rechazará la hipótesis de inocencia y declarará al demandado culpable. Si la
fiscalía no presenta suficientes pruebas para demostar que el demandado es
culpable, el jurado lo declarará no culpable. Observe que esto no demuestra que el
demandado es inocente, sino sólo que no hubo evidencia suficiente para concluir
que el demandado era culpable.
Ejemplo 7.3. En el ejemplo del tubo de PVC, podríamos probar Ho: μ=0.75, contra
la alternativa Ha: μ≠0.75. Si los datos de la muestra indican que μ≠0.75, se debe
rechazar Ho.
La alternativa a Ha, puede presentarse en una de las tres formas:
Ha: θ> θo, Ha: θ< θo ó Ha: θ≠ θo
Ejemplo 7.4. Sea μ el tiempo medio de secado de una pintura. Se decide utilizarla
si μ<75 min. La hipótesis pertinente sería Ho: μ=75 min. contra Ha: μ<75 min.
El valor del parámetro poblacional especificado en la hipótesis nula se determina
por lo general en una de tres formas. Primera, puede ser el resultado de la
experiencia pasada, del conocimiento del proceso o, incluso, de pruebas o
experimentos anteriores. Así, el objetivo de la prueba de hipótesis suele ser
determinar si el valor del parámetro ha sufrido cambios. Segunda, este valor puede
determinarse a partir de una teoría o modelo del proceso bajo estudio. En este caso,
el objetivo de la prueba de hipótesis es verificar la teoría o el modelo. Una tercera
situación surge cuando el valor del parámetro poblacional es resultado de
consideraciones externas, como especificaciones de diseño o de ingeniería, o de
obligaciones contractuales. En este caso, por lo general el objetivo de la prueba de
hipótesis es una prueba de conformidad.
PROCEDIMIENTO DE PRUEBA
Un procedimiento de prueba se especifica por un estadístico de prueba, que es
una función de los datos muestrales en los cuales se basa la decisión, y una región
de rechazo, el conjunto de todos los valores del estadístico de prueba para los
cuales Ho será rechazada. La hipótesis nula se rechaza si y sólo si el valor calculado
del estadístico se ubica en la región de rechazo.
DECISION Y ERROR
177
Rechazar a Ho No rechazar Ho
Ho cierta Error de tipo I Decisión correcta
Ho falsa Decisión correcta Error tipo II
Ejemplo 7.5. El diámetro interior de una tubería de PVC es diferente de ¾ pulg.
Ho: µ=3/4 pulg
Ha: µ≠3/4 pulg
Error tipo I: el diámetro interior de una tubería de PVC es diferente a ¾ pulg, cuando
de hecho es igual a ¾ pulg.
Error tipo II: el diámetro interior de una tubería de PVC es igual a ¾ pulg, cuando de
hecho es diferente a ¾ pulg.
No es posible un procedimiento de prueba para el cual no ocurra algún tipo de error
probablemente. Buen procedimiento es aquel en el que la probabilidad de cometer
algún tipo de error es pequeña. La probabilidad de cometer un error tipo I y II se
denota por α y β respectivamente. Para controlar esos errores, a cada uno de ellos
se le asigna una pequeña probabilidad. La probabilidad asignada a cada error
depende de la gravedad de ellos. 0.001 muy grave, 0.01 y 0.05 algo grave (los de
mayor uso), 0.1 grave y mayores que 0.1 no grave en absoluto.
Ejemplo 7.6. Un fabricante de fibras textiles está investigando una nueva fibra para
tapicería, la cual tiene una elongación media por hilo de 12 kg con una DE de 0.5
kg. La compañía desea probar Ho: μ=12 contra Ha: μ<12, usando n=16 suponiendo
normalidad.
a) ¿Cuál es la probabilidad del error tipo I si la región crítica es X <11.6 kg?
b) Encuentre β para el caso donde la verdadera elongación promedio es de 11.1
kg.
Solución:
a) α=(Error tipo I)
=P(Rechazar Ho | Ho es verdadera)
=P( X <11.6 | µ=12)
x -12 11.6 -12
= P( < )
0.5/ 16 0.5/ 16
=P(Z<-3.2)
=0.0007
=0.001
¿gravedad?
178
x -11.5 11.6 -11.5
= P( )
0.5/ 16 0.5/ 16
=P(Z≥0.8)
=1 – P(Z<0.8)
=1 – 0.7881
=0.2119 ¿gravedad?
Hay una interrelación entre la probabilidad del error tipo I, la probabilidad del error
tipo II y el tamaño de la muestra n. Si cualquiera de estos tres se incrementa o
disminuye, uno o dos de ellos se ven afectados. Al analizar el ejemplo 7.6 se
obtienen los siguientes resultados.
RESUMEN
Un error tipo I es por lo general más serio que uno de tipo II. El método que siguen
los expertos consiste en especificar el máximo valor de α tolerable y encontrar una
región de rechazo que incluya ese valor de α en lugar de cualquier otro menor. Esto
hace que β sea tan pequeña como sea posible, sujeta al límite α. El valor de α se
conoce con el nombre de nivel de significancia de la prueba. Los niveles
tradicionales de significancia son 0.10, 0.05 y 0.01. El correspondiente
procedimiento de prueba se llama prueba de nivel α.
179
Ejemplo 7.7. Representamos por µ el verdadero promedio de vida actual en una
ciudad. Consideremos probar Ho: µ=70 años contra Ha: µ>70 años. Una muestra
de tamaño 100 muertes el año pasado mostró un promedio de vida de 71.8 años,
con una desviación estándar de 8.9 años. Si la probabilidad de cometer un error
tipo I se especifica como 0.05, ¿cuál es la probabilidad de cometer un error tipo II
para el caso en que la media verdadera sea 72 años?
Solución:
Para probar Ho: μ=70, contra Ha: μ=72, se rechaza Ho si
z>zα
z>z0.05
z>1.645
x - μ0
z= >1.645
σ/ n
o bien, si
σ
x > μ0 +1.645
n
8.9
= 70 +1.645 = 71.464 = c
100
de donde x >71.464 es la región de rechazo.
La figura muestra esta región de rechazo, donde μ´ es otro valor particular de μ que
excede del valor nulo μo. Así, por definición, β = P(X 71.464 cuando μ´= 72) es el
área sombreada bajo la curva a la izquierda de c=71.464. Por consiguiente, si
μ´=72,
71.464 - 72
β = P Z = P(Z -0.61) = 0.2743.
8.9/ 100
180
7.2 Proceso de prueba para la media
Procedimiento de prueba de hipótesis: enfoque clásico
1. Identificar el parámetro de interés.
2. Establecer la hipótesis nula Ho.
3. Especificar una apropiada hipótesis alternativa, Ha.
4. Establecer el nivel de significancia.
5. Establecer un estadístico de prueba apropiado sustituyendo el valor
nulo y valores de parámetros, pero no las de cualesquier cantidad
basada en la muestra.
6. Establecer la región de rechazo para α.
7. Calcular todas las cantidades muestrales necesarias, sustituirlas en la
ecuación para el estadístico de prueba, y calcular el valor
correspondiente.
8. Decidir si Ho debe ser rechazada y establecer esta conclusión en el
contexto del problema.
7. z = 94.32-95 = -2.27
1.20/ 16
181
Determinación de β y del tamaño muestral
Considérese primero la prueba de cola superior con región de rechazo z≥zα. Esto
σ σ
equivale a x μo + zα , por lo que Ho no será rechazada si x < μo + zα .
n n
Representemos con μ´ un valor particular de μ que exceda el valor Ho. Entonces
σ
= P(X < μo + zα cuando μ = μ´)
n
X -μ μ -μ
= P < zα + o cuando μ = μ´
σ/ n σ/ n
μ -μ´
β(μ´) = Φ zα + o
σ/ n
Las probabilidades de error para las pruebas de cola inferior y dos colas se
deducen de una manera similar.
Para comparar Ho: μ=μo contra Ha: μ=μ´, donde μ´>μo, se ha visto que se rechaza
σ σ
Ho cuando x c, donde c = μo + zα . Pero es claro que c = μ´-zβ .
n n
Así es que
σ σ
c = μo + zα = c = μ´-zβ
n n
σ
z α + zβ = μ´-μo
n
o sea,
n
z
z
´ o
de donde,
2
σ(zα + zβ )
n=
μo - μ´
Un argumento paralelo produce el tamaño muestral necesario para pruebas de
cola inferior y de dos colas, como se resume a continuación.
182
Hipótesis Probabilidad β(μ´) del error tipo II
alternativa para una prueba de nivel α
o ´
Ha: μ>μo ( ´) z
/ n
´
Ha: μ<μo 1 z o
/ n
´ o ´
Ha:μ≠μo z / 2 o z / 2
/ n / n
zα + zβ
2
σ para una prueba de una cola (superior o inferior)
μo - μ´
n=
zα/2 + zβ
2
σ
para una prueba de dos colas (solución aproximada)
μo - μ´
Ejemplo 7.9. Consideremos probar Ho: µ=70 contra Ha: µ>70. Una muestra de
tamaño 100 mostró un promedio de 71.8, con una DE de 8.9.
a) Si se utiliza una prueba de nivel 0.05, ¿Cuál es β(72)?
b) ¿Qué tamaño muestral n es necesario si β(74.5)=0.001?
Solución:
μ -μ´
a) β(μ´) = Φ zα + o
σ/ n
70 - 72
β(72) = Φ 1.645 + = Φ(-0.6) = 0.2743 ; zα=z0.05=1.645
8.9/ 100
2
σ(zα + zβ )
b) n =
μo - μ´
2
8.9(1.645 + 3.08)
n=
70 - 72 243 ; zβ=3.08
183
Ejemplo 7.10. Consideremos probar Ho: µ=58 contra Ha: µ>58. Una muestra de
tamaño 100 mostró un promedio de 58.5, con una DE de 3.2. Use un nivel de
significancia 0.05.
Solución:
1. μ, promedio verdadero
2. Ho: μ=58
3. Ha: μ>58
4. Nivel de significancia α=0.05.
__
-58
5. z = x
s/ n
6. Región de rechazo: z≥1.645
7. z = 58.5-58 =1.56
3.2/ 100
Ejemplo 7.11. Consideremos probar Ho: µ=3.50 contra Ha: µ>3.50. Una muestra
de tamaño 8 mostró un promedio de 3.72, con una DE de 1.25. Use un nivel de
significancia de 0.05. Se supone la población normal.
Solución:
1. μ, promedio verdadero.
2. Ho: μ=3.50
3. Ha: μ>3.50
4. α= 0.05
184
x - 3.50
5. t =
s/ n
6. Región de rechazo: t>1.895, tα, n - 1 =t0.05, 7=1.895
3.72 - 3.50
7. t = = 0.489
1.25/ 8
8. Decisión: Como t=0.498 no cae en la región de rechazo, entonces Ho no se
rechaza al nivel 0.05. Conclusión: El promedio verdadero no es mayor que 3.50 al
nivel 0.05.
(3.2285; 4.7215)
7.3 Valor P
DEFINICION.
El Valor P o nivel de significancia alcanzado, es el nivel más pequeño de
significancia α para el cual la información observada indica que la hipótesis nula
debe ser rechazada. Una vez que el valor P se haya determinado, la conclusión
en cualquier nivel α particular resulta de comparar P con α:
1. Identificar el parámetro.
2. Establecer Ho.
3. Especificar Ha.
4. Establecer α.
5. Establecer el valor del estadístico de prueba apropiado.
6. Calcular el estadístico de prueba.
7. Uso del valor P.
8. Decisión y conclusión.
Ejemplo 7.13. Se sabe que el diámetro de los agujeros para una montura de cable
tiene una DE de 0.01 pulg. Se obtiene una muestra aleatoria de diez monturas,
186
donde el diámetro promedio resulta ser 1.5045 pulg. Utilice α=0.01. Pruebe la
hipótesis de que el diámetro promedio verdadero del agujero es 1.50 pulg.
Solución:
1. μ, diámetro promedio verdadero.
2. Ho: μ=1.50 pulg
3. Ha: μ≠150 pulg
4. =0.01
5. z= x-150
0.01/ n
6. z= 1.5045 - 1.50 =1.42
0.01/ 10
7. Valor P
El valor P es el área de la región sombreada a la derecha de -1.42 y a la izquierda
de 1.42. Entonces, P=2(1-Φ(IzoI))=2(1-Φ(I1.42I))=2(1-0.9222)=0.1556.
8. Decisión: Como P>0.01, Ho no se rechaza al nivel 0.01. Conclusión: El diámetro
medio verdadero no es diferente de 1.50 pulg al nivel 0.01.
Ejemplo 7.14. Una muestra aleatoria de 100 muertes registradas en una ciudad el
año pasado mostró un promedio de vida de 71.8 años, con una desviación estándar
de 8.9 años. ¿Podría esto indicar que el promedio de vida actual es mayor que 70
años? Utilizar un nivel de significancia de 0.05.
Solución:
1. μ, promedio verdadero de vida.
2. Ho: μ=70 años.
3. Ha: μ>70 años.
4. =0.05
5. z= x-70
s/ n
6. z= 71.8-70
= 2.02
8.9/ 100
7. Valor P
El valor de P es el área de la región sombreada a la derecha de 2.02. Entonces P=
1 – Φ(2.02)= 1–0.9783=0.0217.
8. Decisión: Como P<0.05, Ho se rechaza al nivel 0.05. Conclusión: El promedio
verdadero de vida es mayor que 70 años al nivel 0.05.
187
Si se supone que σ1 =1.6 y σ2= 1.4, pruebe Ho: µ1 - µ2 = 0 contra Ha: µ1 - µ2 > 0 al
nivel 0.01.
Solución:
1. μ1 y µ2: resistencia promedio verdadera de adherencia para el mortero modificado
y no modificado respectivamente.
2. Ho: μ1-μ2=0
3. Ha: μ1-μ2 >0
4. =0.01
x1-x2 x1-x2
5. z= =
12 22 (1.6)2 (1.4)2
+ +
n1 n2 n1 n2
Solución:
1. p, fracción verdadera de circuitos integrados defectuosos.
2. Ho: p=0.05
3. Ha: p≠0.05
4. α=0.05
ˆ o
p-p ˆ
5. z
p-0.05
=
po (1-po )/n (0.05)(0.95)
n
0.0433 - 0.05
6. z = = -0.53
(0.05)(0.95)
300
7. Valor P
P es la probabilidad de la región sombreada a la derecha de – 0.53 y a la izquierda
de 0.53, entonces P=2(1 – Φ(IzoI))=2(1 – Φ(I - 0.53I))=2(1-0.7019)=0.5962.
8. Decisión: Como P>0.05, Ho no se rechaza al nivel 0.05. Conclusión: La fracción
verdadera de circuitos integrados defectuosos no es diferente de 0.05, al nivel 0.05.
7.6 Pruebas para la diferencia entre proporciones (x≥10 y
n - x≥10)
188
Ejemplo 7.17. Sea utilizan dos máquinas diferentes de moldeo por inyección para
la fabricación de piezas de plástico. Una pieza se considera defectuosa si tiene un
encogimiento excesivo o si le falta color. Se toman dos muestras aleatorias cada
una de tamaño 300, y se encuentran 15 piezas defectuosas en la muestra de la
máquina 1, mientras que sólo ocho en la muestra de la máquina 2. ¿Es razonable
concluir que ambas máquinas producen la misma fracción de partes defectuosas,
utilizando α=0.05?
Solución:
1. p1 y p2 son las fracciones verdaderas de partes defectuosas de las máquinas 1 y
2 respectivamente.
2. Ho: p1 - p2=0 ó p1=p2
3. Ha: p1 - p2≠0 ó p1≠p2
4. =0.05
pˆ 1 - pˆ 2
5. z =
ˆˆ 1 + 1
pq
n1 n2
0.0500 - 0.0267
6. z= =1.48
0.0388 0.9612
1 1
+
300 300
x +x
pˆ 1 = 0.0500, pˆ 2 = 0.0267, pˆ = 1 2 = 0.0388
n1 +n2
7. Valor P.
P es la probabilidad de la región sombreada a la izquierda de – 1.48 y a la derecha
de 1.48, entonces P=2(1-Φ(IZoI))=2(1-Φ(I1.48I))=2(1-0.9306)=0.1388.
8. Decisión: Como p>0.05, Ho no se rechaza al nivel 0.05. Conclusión: Ambas
máquinas no producen diferentes fracciones de partes componentes defectuosas al
nivel 0.05.
Solución:
1. σ2, varianza verdadera del contenido de azúcar del almíbar en (mg)2.
2. Ho: σ2=18 (mg)2
3. Ha: σ2 ≠18 (mg)2
4. =0.05
(n -1)s2 (n -1)s2
5. χ 2 =
2 18
189
6. Región de rechazo: 2 20.975, 9 2.700 ó 2 20.025, 9 19.022
(9)(4.8)
7. χ 2 = =11.52
18
8. Decisión: Como X2=11.52 cae en la región de no rechazo, entonces Ho no se
rechaza al nivel 0.05. Conclusión: La varianza verdadera del contenido de azúcar
del almíbar no es diferente de 18 (mg)2 al nivel 0.05.
Solución:
1. σ12 y σ22 varianzas verdaderas de las resistencias al impacto de los engranes
del proveedor 1 y 2 respectivamente.
2. Ho: σ12=σ22
3. Ha: σ12≠σ22
4. =0.05
5. f=s12/s22
6. Región de rechazo:
f<f0.975, 14, 9=0.31 y f>f0.025 9,14=3.21
7. f= 122/152=0.64
190