Professional Documents
Culture Documents
INFERENCIA ESTADÍSTICA
Ernesto Canizales
22 de octubre de 2012
1
ÍNDICE ÍNDICE
Índice
1. PROBABILIDAD Y ESTADÍSTICA 6
1.1. Esperanza matemática . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2. Función Caracterı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3. Distribuciones de probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.3.1. Distribución normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3.2. Distribución Chi-Cuadrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.3.3. Distribución t de Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3.4. Distribución F de Snedecor . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.4. Inferencia Estadı́stica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.4.2. Razones que justifican un estudio inferencial . . . . . . . . . . . . . . . . . . 13
1.4.3. Conceptos de muestreo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.4.4. Tipos de muestreo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.5. Problemas propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2. DISTRIBUCIONES MUESTRALES 17
2.1. Distribución conjunta de la muestra . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.2. Estadı́sticos y distribuciones muestrales . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.3. Distribución muestral de la media . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.4. Distribución muestral de la proporción . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.5. Distribución muestral de la varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.6. Teorema Central del Lı́mite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.7. Distribución muestral de la diferencia de dos medias . . . . . . . . . . . . . . . . . . 39
2.8. Distribución muestral de la diferencia de dos proporciones . . . . . . . . . . . . . . 42
2.9. Distribución muestral del cociente de dos varianzas . . . . . . . . . . . . . . . . . . 43
2.10. Problemas propuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3. ESTIMACIÓN DE PARÁMETROS 50
3.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
2
ÍNDICE ÍNDICE
3
ÍNDICE ÍNDICE
4
ÍNDICE ÍNDICE
Prefacio
El objetivo de este documento es ayudar a los estudiantes en su proceso de aprendizaje en el
curso de Inferencia Estadı́stica. Muchos de los obstáculos que todo estudiante debe enfrentarse
en el transcurso de su carrera, es la falta de bibliografı́a. Además se dificulta el hecho de prestar
atención a la clase y de tomar apuntes de la misma. Por esa razón, he considerado conveniente
el tomarme tiempo para digitar en LATEXun documento que trate sobre los temas que deben ser
visto en el curso de Inferencia Estadı́stica; este material no tiene por objeto reemplazar en ningún
momento a los libros clásicos sobre inferencia; sino más bien el de presentar de manera breve pero
elegante un resumen de dichos libros en un solo documento que contenga toda la sencillez pero a
la vez el rigor matemático necesario.
Se ha considerado conveniente incorporar un apartado sobre probabilidad, con el objetivo de pre-
sentar los conocimientos previos que el estudiante debe poseer para una comprensión adecuada del
material que se presenta en el documento.
Hago resaltar que todo el documento es de mi absoluta responsabilidad, por lo que agradeceré al
lector comunicarme de cualquier falta ortográfica, gramatical o de cualquier errata que contenga
el documento, e inclusive cualquier sugerencia para mejorar la redacción y la presentación del
documento a la siguiente dirección electrónica canizales1985@gmail.com
5
1 PROBABILIDAD Y ESTADÍSTICA
1. PROBABILIDAD Y ESTADÍSTICA
Si X es una variable aleatoria con función de probabilidad P (X) (densidad f (X)), se define la
esperanza matemática por:
n
X
E[X] = xi P (X = xi ); cuando X es discreta
Zi=1∞
E[X] = xf (x)dx; cuando X continua
∞
1. E[aX] = aE[X]
2. E[X ± b] = E[X] ± b
3. E[aX ± b] = aE[X] ± b
Además,
E[XY ] = E[X]E[Y ]
Sea X una variable aleatoria con función de distribución F (X). Se llama función caracterı́stica de
la variable aleatoria X y se le representa por φX (t), a la esperanza matemática de exp(itX) (la
cual es también variable aleatoria).
6
1.3 Distribuciones de probabilidad 1 PROBABILIDAD Y ESTADÍSTICA
Es decir,
φX (t) = E [exp(itX)]
Z ∞
= exp(itX)dF (x) Continua
∞
n
X
= exp(itxi )P (X = xi ) Discreto
i=1
Y = a1 X 1 + a2 X 2 + · · · + an X n
Demostración.
Si X es una variable aleatoria que puede tomar los valores (x1 , x2 , . . . , xk ), se llama distribución
de probabilidad de X al siguiente cuadro:
X P (X)
x1 P (x1 )
x2 P (x2 )
.. ..
. .
xk P (xk )
1
7
1.3 Distribuciones de probabilidad 1 PROBABILIDAD Y ESTADÍSTICA
A continuación se presentan las principales distribuciones de probabilidad que son necesarias para
el desarrollo del curso.
Una variable aleatoria X se dice que tiene una distribución normal de parámetros µ (media) y σ 2
(varianza) si función de densidad es la siguiente:
(x − µ)2
1
f (x) = √ exp − (2)
σ 2Π 2σ 2
la cual se abrevia por X ∼ N (µ; σ 2 ).
Su función caracterı́stica es:
t2 σ 2
φX (t) = exp itµ −
2
Una variable aleatoria X se dice que tiene una distribución normal estándar N (0; 1) si función de
densidad es la siguiente:
2
1 x
f (x) = √ exp − (3)
2Π 2
Su función caracterı́stica es:
t2
φX (t) = exp −
2
Teorema 1.2. Sean X1 , X2 , . . . , Xn , n variables aleatorias independientes cada una con Xi ∼
N (µi ; σi2 ). Entonces la variable aleatoria
Z = a1 X 1 + a2 X 2 + · · · + an X n
Pn Pn
es una variable con distribución normal de parámetros µ = i=1 ai µ i y σ 2 = i=1 a2i σi2
1 2 2 2
φai Xi (t) = exp it (ai µi ) − t ai σi
2
8
1.3 Distribuciones de probabilidad 1 PROBABILIDAD Y ESTADÍSTICA
n
−
φχ2n (t) = (1 − 2it) 2 (5)
Teorema 1.3. Sean χ2n1 , χ2n2 , . . . , χ2nk , k variables aleatorias independientes con distribución Chi-
Cuadrada con grados de libertad respectivos n1 , n2 , . . . , nk . Entonces la variable aleatoria
Demostración.
9
1.3 Distribuciones de probabilidad 1 PROBABILIDAD Y ESTADÍSTICA
1. E [χ2n ] = n
2. var (χ2n ) = 2n
X
T =r (6)
1 Pn
X2
n i=1 i
Teorema 1.4. La distribución t de Student es ası́ntoticamente N (0; 1). Es decir, si n → ∞,
entonces t ∼ N (0; 1).
Sean χ2m y χ2n , dos variables aleatorias independientes con distribución Chi-cuadrado con grados
de libertad respectivos m y n.
Llamaremos F de Snedecor con (m, n) grados de libertad, y la representaremos por F (m, n) a la
variable aleatoria:
1 2
χm
F = m (7)
1 2
χ
n n
Propiedades de la distribución F .
1
1. Si X ∼ F (m, n), entonces X
∼ F (n, m)
2. Si representamos por F (m, n, α) al valor en el distribución F de Snedecor tal que P {F (m, n) >
1
F (m, n, α)} = α. Entonces F (m, n, 1 − α) =
F (n, m, α)
10
1.4 Inferencia Estadı́stica 1 PROBABILIDAD Y ESTADÍSTICA
1.4.1. Introducción
Estadı́stica Descriptiva
Permite organizar y presentar un conjunto de datos de manera que describan en forma precisa
las variables analizadas haciendo rápida su lectura e interpretación. Su materia prima la
constituyen los datos, que son el resultado de las observaciones y/o experimentos.
Estadı́stica Inferencial
Generaliza los resultados de una muestra a los de una población total; es cuando de los
datos estadı́sticos obtenidos de una muestra se deduce o infiere una observación la cual se
generaliza sobre la población total. Para determinar la confiabilidad de la inferencia de los
datos estadı́sticos de una muestra, se hace necesario comprobar la misma para poder asegurar
que lo que se observa en una muestra también se observará en la población.
Generalmente el análisis inferencial se lleva a cabo para mostrar relaciones de causa y efecto,
ası́ como para probar hipótesis y teorı́as cientı́ficas.
11
1.4 Inferencia Estadı́stica 1 PROBABILIDAD Y ESTADÍSTICA
1. Inferencia paramétrica.
2. Inferencia no paramétrica.
EJEMPLO 1.1
Se realiza un estudio para comprobar tres métodos de compresión lectora a niños de segundo grado,
como son:
Intrucción directa.
Enseñanza recı́proca.
¿Para el próximo año el método identificado como el mejor, dará buenos resultados para el
alumno “Juan Pérez”, quien cursará el segundo grado?
12
1.4 Inferencia Estadı́stica 1 PROBABILIDAD Y ESTADÍSTICA
Los casos de incertidumbre y toma de desiciones son resueltos por la estadı́stica inferencial, apo-
yando por supuesto de la probabilidad.
Ası́, por ejemplo, nos puede interesar tener información sobre:
etc.
Las inferencias sobre el valor de un parámetro poblacional θ se pueden obtener básicamente de dos
maneras:
En ocasiones la población tiene un gran número de elementos, pudiendo ser éstos potencial-
mente infinitos (número de clientes demandando un servicio).
13
1.4 Inferencia Estadı́stica 1 PROBABILIDAD Y ESTADÍSTICA
Por motivos de precisión. Aunque parezca contradictorio, a veces un análisis total, implica
que se comentan errores graves en la medición, codificación, resumen, etc., cuestiones que
pueden ser mucho mejor controladas utilizando un estudio a partir de una muestra.
Las estadı́sticas de por si no tienen sentido si no se consideran o se relacionan dentro del contexto
con que se trabaja.
Población. Es el conjunto total de individuos, objetos, elementos que poseen algunas carac-
terı́sticas observables en un lugar y en un momento determinado. La población por su parte
debe contener las siguientes caracterı́sticas:
1. Homogeneidad. Que todos los elementos de la población tenga las mismas caracterı́sticas
según las variables que se vayan a considerar. Por ejemplo, si se fuera a investigar la inci-
dencia de la drogadicción entre jóvenes mujeres adolescentes hay que definir claramente
las edades que comprenden la adolescencia.
Parámetros. Caracterı́stica que se desea conocer en la población, tales como: una proporción,
una media; suelen denotarse por letras griegas θ.
Marco muestral. Es el listado fı́sico de todos los elementos de la población y con el cual se
elegi la muestra.
14
1.4 Inferencia Estadı́stica 1 PROBABILIDAD Y ESTADÍSTICA
Muestra aleatoria. Dada una población X se llama muestra aleatoria de tamaño n a la repeti-
ción de X1 , X2 , . . . , Xn variables aleatorias independientes con ditribución igual, y denotada
por (X1 , X2 , . . . , Xn ).
En el primero es la persona que selecciona la muestra la que procura que sea representativa;
por consiguiente, la representatividad depende de su intención al seleccionar la muestra.
En el muestreo sin norma se toma la muestra de cualquier manera, a la aventura, por razones
de comodidad o circunstancias.
Probabilı́stico:
Entre los muestreos probabilı́sticos, los más ampliamente utilizados son los siguientes:
2. Muestreo Estratificado.
15
1.5 Problemas propuestos 1 PROBABILIDAD Y ESTADÍSTICA
1. Demuestre que si X tiene una distribución de Student Tn con n grados de libertad, entonces
si n > 2
n
E[X] = 0 V [X] =
n−2
2. Demuestre que si X es una variable aleatoria con distribución de Snedecor Fm,n , entonces si
n>4
n 2n2 (n + m − 2)
E[X] = V [X] =
n−2 m(n − 2)2 (n − 4)
16
2 DISTRIBUCIONES MUESTRALES
2. DISTRIBUCIONES MUESTRALES
Es decir, las variables Xi son independientes e idénticamente distribuidas con la misma distribución
de probabilidad que tenga la población.
Si la muestra no fuera aleatoria (es decir, la selección fuése sin reemplazamiento)
17
2.2 Estadı́sticos y distribuciones muestrales 2 DISTRIBUCIONES MUESTRALES
Dado que se supone que las muestras son aleatorias, la distribución de un estadı́stico es un tipo de
modelo de probabilidad conjunta para variables aleatorias independientes, en donde cada variable
posee una función de densidad de probabilidad igual a la de las demás. De manera general, la
distribución de muestreo de un estadı́stico no tiene la misma forma que la función de densidad de
probabilidad en la distribución de la población.
EJEMPLO 2.1
Una urna contiene 1000 bolas, todas de igual tamaño, y marcadas con 4 números distintos: 400
con el número 1, 100 con el 2, 300 con el 3 y las 200 restantes con el 4.
La distribución de probabilidad de la población es:
P (X = 1) = 0.4 P (X = 2) = 0.1
P (X = 3) = 0.3 P (X = 4) = 0.2
Tomamos una muestra aleatoria de tamaño 100, siendo el resultado: 43 bolas con el número 1, 6
con el 2, 28 con el 3 y 23 con el 4.
La distribución de frecuencias de la muestra obtenida es:
n1 n2
= 0.43 = 0.06
n n
n3 n4
= 0.28 = 0.23
n n
18
2.2 Estadı́sticos y distribuciones muestrales 2 DISTRIBUCIONES MUESTRALES
Si comparamos ambas distribuciones se aprecia que son muy parecidas pero no coinciden, pues
la muestra no reproduce exactamente la estructura de la población, debiéndose esta diferencia a
la variabilidad introducida en la estricta aleatoriedad de la muestra. Si más muestras, cada una
de ellas tendrá su propia distribución, que se aproximará tanto más a la población cuanto “más
aleatorio” haya sido el proceso de selección, es decir, “más objetivo”.
En general, en una muestra concreta, sus caracterı́sticas (momentos, etc.) no tienen por qué coin-
cidir exactamente con las correspondientes de la población a cuasa de la aleatoriedad del procedi-
miento de extracción de los elementos, pero sı́ la muestra ha sido tomada con las máximas garantı́as
de aleatoriedad, con máxima objetividad, es de esperar que los valores de las caracterı́sticas mues-
trales no se alejen demasiado de los poblaciones, lo que proporciona a la muestra sus posibilidades
inductivas.
En el caso de que la caracterı́stica fuese la media:
19
2.3 Distribución muestral de la media 2 DISTRIBUCIONES MUESTRALES
En la población,
= 2.3
= 2.31
Muestra aleatoria, significa de ahora en adelante que la muestra ha sido seleccionada de manera
aleatoria y con reposición (un elemento puede estar incluido más de una vez en la muestra).
EJEMPLO 2.2
Una variable aleatoria X tomo los valores 1, 2 y 3 con probabilidades 0.1, 0.2 y 0.7. Tomamos mues-
tras aleatorias simples de tamaño 3 y consideramos como estadı́stico la media muestral. Encontrar
la distibución en el muestreo para X̄.
Solución. En el cuadro 1 se muestra todas las muestras de tamaño 3 que pueden obtenerse de la
población. En la columna identificada como tipo, se muestra los elementos que conforman a cada
una de las muestras (sin considerar el orden de aparición); en la columna muestra se enumeran
todas las muestras posibles; en las restantes columnas se muestra el valor de la media muestra (X̄)
y la probabilidad asociada para cada una de las muestras (P(muestras)).
La distribución en el muestreo de X̄ se muestra en el cuadro 2.
EJEMPLO 2.3
Una variable aleatoria X toma los valores 1, 2, 3, 4 y 5 con probabilidades iguales. Estudiar la
distribución en el muestreo para la media en el caso que el tamaño de la muestra sea 2.
Solución. En el cuadro 3 se presentan las muestras obtenidas de tamaño 2 que pueden obtenerse de
la población. En la columna etiqueta como “Tipo” se muestran las muestras que pueden obtenerse
20
2.3 Distribución muestral de la media 2 DISTRIBUCIONES MUESTRALES
EJEMPLO 2.4
Una variable aleatoria X toma los valores 1, 2, 3, 4 y 5 con probabilidades iguales. Estudiar la
distribución en el muestreo para la media en el caso que el tamaño de la muestra sea 3.
Solución. En el cuadro 5 se presentan las muestras obtenidas de tamaño 3 que pueden obtenerse de
21
2.3 Distribución muestral de la media 2 DISTRIBUCIONES MUESTRALES
X̄ P (X̄)
1 0.13 = 0.001
4
3
3 × 0.12 × 0.2 = 0.006
5
3
3 × 0.12 × 0.7 + 3 × 0.1 × 0.22 = 0.033
2 6 × 0.1 × 0.2 × 0.7 + 0.23 + 0.092
7
3
3 × 0.22 × 0.7 + 3 × 0.1 × 0.72 = 0.231
8
3
3 × 0.2 × 0.72 = 0.294
3 0.73 = 0.343
la población. En la columna etiqueta como “Tipo” se muestran las muestras que pueden obtenerse
(sin considerar el orden de los elementos en la misma); en la columna “Cantidad” se presenta
el número de muestras diferentes que pueden considerarse para cada tipo; mientras que en las
columnas restantes se muestra la media muestral para cada tipo de muestra.
En el cuadro 6 se muestra la distribución muestral de la media para todas las muestras posibles
de tamaño 3.
En la figura 2 se representación gráfica de la distribución de la media muestral para los ejemplos
3 y 4. La distribución en el caso de muestras de tamaño 2 se muestra en 3a; mientras que la
distribución para muestras de tamaño 3 se presenta en 3b. Puede observarse que al aumentar el
tamaño de la muestra mejora la precisión de las estimaciones, pues la curva correspondiente para
n = 3 muestra menor dispersión. Estudiaremos el efecto del tamaño de la muestra más adelante.
22
2.3 Distribución muestral de la media 2 DISTRIBUCIONES MUESTRALES
Denotemos por X̄i a la media muestral para una muestra de tamaño i. De los resultados anteriores
podemos verificar que se cumple que:
1 2 2 1
E X̄2 = 1 + 1.5 + · · · + 4.5 +5
25 25 25 25
= 3
23
2.3 Distribución muestral de la media 2 DISTRIBUCIONES MUESTRALES
X̄ P (X̄)
1
1 25
2
1.5 25
3
2 25
4
2.5 25
1
3 5
4
3.5 25
3
4 25
2
4.5 25
1
5 25
1 4 3 14 3 1
E X̄3 = 1 + + ··· + +5
125 3 125 3 125 125
= 3
Además;
var X̄2 = 1
var X̄3 = 0.667
De lo anterior se observa que el valor esperado de la media muestral siempre coincide con el valor de
la media poblacional. Por otra parte, la varianza de la media muestral parece disminuir a medida
que el tamaño de la media muestra aumenta.
Hagamos ahora un análisis geneneral sobre el comportamiento de la media muestral para cualquier
tamaño, recordemos únicamente que:
n
1X
X̄ = Xi
n i=1
y utilicemos el hecho que son muestras aleatorias y apoyándonos en las propiedades de valor
24
2.3 Distribución muestral de la media 2 DISTRIBUCIONES MUESTRALES
{1 , 1, 1 } 1 1 {2 , 2, 2 } 1 2
{3 , 3, 3 } 1 3 {4 , 4, 4 } 1 4
{5 , 5, 5 } 1 5
esperado.
" n #
1X
E X̄ = E Xi
n i=1
n
1X
= E [Xi ]
n i=1
n
1X
= µ
n i=1
nµ
=
n
= µ
25
2.3 Distribución muestral de la media 2 DISTRIBUCIONES MUESTRALES
X̄ P (X̄)
1
1 125
4 3
3 125
5 6
3 125
2
2 25
7 3
3 25
8 18
3 125
19
3 125
10 18
3 125
11 3
3 25
2
4 25
13 6
3 125
14 3
3 125
1
5 125
Mientras que:
n
!
1X
var X̄ = var Xi
n i=1
n
1 X
= var(Xi )
n2 i=1
n
1 X 2
= σ
n2 i=1
nσ 2
=
n2
σ2
=
n
26
2.3 Distribución muestral de la media 2 DISTRIBUCIONES MUESTRALES
N −1
Si se fija un elemento en la muestra, digamos Xi , en total habrá n−1
muestras que contenga a
Xi .
De este modo;
(Nn ) n
!
1 X 1 X
E X̄ = N
Xi
n j=1
n i=1
j
N
1 X N −1
= N
Xi
n−1
n n i=1
N −1 X
N
n−1
= Xi
n Nn i=1
N −1 N
n−1
X
= Xi
N N −1
n i=1
n n−1
N
1 X
= Xi
N i=1
= µ
Veamos ahora que sucede con la varianza de la media muestral, note que ahora Xi y Xj si están
relacionadas entre sı́, y ya no son independientes como en el caso anterior. La probabilidad de Xi
1
y Xj pertenezcan a una muestra es de N (N −1)
.
27
2.3 Distribución muestral de la media 2 DISTRIBUCIONES MUESTRALES
1. Primera forma:
n
!
1X
var X̄ = var Xi
n i=1
n
!
1 X
= var Xi
n2 i=1
" n n
#
1 X X
= var(Xi ) + 2 cov(Xi ; Xj )
n2 i=1 i<j
" n #
2
1 X σ
= nσ 2 + 2 −
n2 i<j
N −1
σ2
1 2 n(n − 1)
= nσ − 2
n2 N −1 2
σ2
n(n − 1)
= 2
n−
n N −1
σ nN − n − n2 + n
2
=
n2 N −1
2
σ N −n
=
n N −1
28
2.3 Distribución muestral de la media 2 DISTRIBUCIONES MUESTRALES
Puesto que:
Cov(Xi ; Xj ) = E[Xi Xj ] − µ2
N N
!2
X 1 1 X
= Xi Xj − 2 Xi
i6=j
N (N − 1) N i=1
!2
N N
1 X Xi Xj 1 X
= − Xi
N i6=j N − 1 N i=1
PN 2 P !2
N 2
1 i=1 Xi − i=1 Xi 1 X
N
= − Xi
N N −1 N i=1
!2 !2
PN 2 N N
−1 i=1 Xi
1 X 1 X
= + Xi − Xi
N N −1 N i=1 N −1 i=1
!2
PN 2 N
−1 i=1 Xi 1 X
= − Xi
N N −1 N (N − 1) i=1
!2
N N
−1 X 1 X
= Xi2 − Xi
N (N − 1) i=1 N i=1
N
−1 X 2
= Xi2 − µ
N (N − 1) i=1
−1 2
= σ
N −1
Por consiguiente
2
n2 X̄ − µ = (X1 − µ)2 + (X2 − µ)2 + · · · + (Xn − µ)2
En muestreo aleatorio debe cumplirse que E[nX̄] debe ser un múltiplo del total poblacional,
29
2.3 Distribución muestral de la media 2 DISTRIBUCIONES MUESTRALES
es decir;
E[X1 + X2 + · · · + Xn ] = θ(X1 + X2 + · · · + XN )
n
Resulta que θ = N
, pues en la expresión anterior. En la izquierda hay n términos, mientras
que en la derecha hay N .
y también
" n
# " N #
X n(n − 1) X
E 2 (Xi − µ) (Xj − µ) = 2 (Xi − µ) (Xj − µ)
i<j
N (N − 1) i<j
(la suma de los productos se extiende sobre todas las parejas de elementos en la muestra
(izquierda) y en la pobación (derecha)).
n(n−1)
La suma del lado izquierdo contiene 2
términos, mientras que la suma de la derecha
N (N −1)
contiene 2
términos.
Observe que,
N
X
(Xi − µ) = 0
i=1
Finalmente,
N
X
1 n−1
(Xi − µ)2
var X̄ = 1−
nN N −1 i=1
N −n 2
= σ
n(N − 1)
30
2.3 Distribución muestral de la media 2 DISTRIBUCIONES MUESTRALES
Teorema 2.2. En el caso de que la caracterı́stica poblacional de interés, tenga distribución normal,
se cumplirá, no importando el tamaño de la muestra (siempre y cuando se trate de muestras
aleatorias) que:
σ2
X̄ ∼ N µ; (9)
n
Demostración. Recordemos que si:
X ∼ N (µ; σ)
31
2.3 Distribución muestral de la media 2 DISTRIBUCIONES MUESTRALES
n
itµ it2 σ 2
⇒ φX̄ (t) = exp −
n 2n2
t2 σ 2
= exp itµ −
2n
σ2
La cual es una función generatriz de una distribución normal de parámetros µ y n
Observación: el resultado anterior sigue siendo válido en muestreo sin reemplazamiento (hay que
reemplazar la varianza correspondiente).
En el caso de que la distribución de la población sea normal pero se deconozca el valor de σ 2
(muy común en la práctica). Más adelante veremos que una buena estimación de σ 2 , será Sn−1
2
, la
cuasivarianza muestral:
2 1 X 2
Sn−1 = Xi − X̄
n − 1 i=1
Se sabe que,
2
(n − 1)Sn−1
∼ χ2n−1
σ2
La suma de n − 1 variables N (0; 1)2 independientes.
De este modo
X̄ − µ
σ
√
n
t = s
2
(n − 1)Sn−1
(n − 1)σ 2
X̄ − µ
= r
2
Sn−1 σ2
nσ 2
X̄ − µ
=
Sn−1
√
n
Es decir, la variable aleatoria
X̄ − µ
t = ∼ tn−1
Sn−1
√
n
32
2.4 Distribución muestral de la proporción 2 DISTRIBUCIONES MUESTRALES
X̄ − µ
≈ N (0; 1)
Sn−1
√
n
Es decir, X̄ tendrá aproximadamente una distribución normal, como veremos más adelante Teo-
rema Central del Lı́mite (TLC).
La proporción muestral, es la media muestral cuando las observaciones Xi sólo pueden tomar dos
valores 0 y 1 (ausencia o presencia de la caracterı́stica o propiedad de interés).
Puede asumirse que cada Xi sigue una distribución de Bernoulli de parámetro p (Xi ∼ B(p)).
Sabemos que en la distribución de Bernoulli la media es p, mientras que la varianza es p(1 − p).
En una muestra aleatoria, sea π la proporción muestral (estimador de p).
Entonces;
" n
#
1X
E [π] = E Xi
n i=1
n
1X
= E [Xi ]
n i=1
n
1X
= p
n i=1
1
= (np)
n
= p
33
2.4 Distribución muestral de la proporción 2 DISTRIBUCIONES MUESTRALES
E [π] = p
N − n p(1 − p)
var (π) =
N −1 n
Además, de manera equivalente puede verificarse que para n grande (muestras grandes) se cumple,
p(1 − p)
π ∼ N p;
n
La distribución en el muestreo de π, proporción observada en la muestra, se obtiene inmediatamente
de la distribución Binomial. En efecto:
r
P π= = PB (r)
n
n r
= p (1 − p)n−r
r
donde r es el número de elementos en la muestra que presentan la caracterı́stica de interés. LA
SUMA DE n VARIABLES CON DISTRIBUCIÓN DE BERNOULLI DE PARÁMETRO p ES
UNA NUEVA VARIABLE CON DISTRIBUCIÓN BINOMIAL.
r
Es decir, la probabilidad de que la porporción en la muestra sea es igual a la probabilidad de
n
obtener r elementos con esta caracterı́stica en una muestra de tamaño n; la cual es la distribución
Binomial:
π ∼ B (n; p)
34
2.5 Distribución muestral de la varianza 2 DISTRIBUCIONES MUESTRALES
n
1X 2
Sn2 = Xi − X̄
n i=1
Mientras que la cuasivarianza muestral por,
n
2 1 X 2
Sn−1 = Xi − X̄
n − 1 i=1
Calculemos la esperanza para cada una de las estimaciones de la varianza poblacional.
Puesto que:
n n
1X 1 X
(Xi − µ) µ − X̄ = µ − X̄ (Xi − µ)
n i=1 n i=1
1
= µ − X̄ nX̄ − nµ
n
2
= − µ − X̄
35
2.5 Distribución muestral de la varianza 2 DISTRIBUCIONES MUESTRALES
" n #
1X 2 2
(Xi − µ)2 + µ − X̄ − 2 µ − X̄
2
⇒ E Sn = E
n i=1
" n #
1X 2
(Xi − µ)2 − µ − X̄
= E
n i=1
n
1X h 2 i
E (Xi − µ)2 − E µ − X̄
=
n i=1
n
1X σ2
= var(Xi ) −
n i=1 n
σ2
= σ2 −
n
n−1
= σ2
n
Se sabe que:
nSn2 = (n − 1)Sn−1
2
2 n
⇒ Sn−1 = Sn2
n−1
36
2.6 Teorema Central del Lı́mite 2 DISTRIBUCIONES MUESTRALES
Por consiguiente;
n 2
2
(n − 1)Sn−1 X (Xi − µ)2 µ − X̄
= −n
σ2 i=1
σ 2 σ2
n 2 !2
X Xi − µ µ − X̄
= −
σ √σ
i=1 n
2
(n − 1)Sn−1
⇒ ∼ χ2n − χ21
σ2
∼ χ2n−1
Pues cada uno de los n sumandos del primer término de la derecha de la ecuación sigue una
distribución normal estándar elevada al cuadrado, lo mismo sucede para el segundo término; y
como además se cumple que la suma (diferencia) de dos variables Chi-Cuadrado siguen también
una distribución con grados de libertad igual a la suma (resta) de ambas variables.
37
2.6 Teorema Central del Lı́mite 2 DISTRIBUCIONES MUESTRALES
Estos teoremas revelan las razones por la cual, en muchos campos de aplicación, se encuentran
distribuciones normales.
Si X1 , X2 , . . . , Xn son variables aleatorias independientes e idénticamente distribuidas (iid), enton-
ces: " # !!
n
X n
X n
X
Xi ∼ N E Xi ; var Xi
i=1 i=1 i=1
y por consiguiente
Pn Pn
i=1 Xi − E [ Xi ]
p Pn i=1 ∼ N (0; 1)
var ( i=1 Xi )
cuando el tamaño de la muestra sea lo suficientemente grande, es decir, cuando n → ∞.
Del resultado anterior, se deducen los siguientes teoremas:
Teorema 2.3 (Levy-Lindeberg). Sean {Xn }n∈N variables aleatorias iid con E[Xi ] = µ (finita)
y var(Xi ) = σ 2 (finita) ∀i. Entonces
Pn
i=1Xi − nµ
√ ∼ N (0; 1)
σ n
t2
φZn (t) → exp − ; cuando n → ∞
2
con Pn
i=1 Xi − nµ
Zn = √
σ n
Al ser las Xi variables aleatorias independientes e idénticamente distribuidas, todas tendrán la
misma media µ, y la misma varianza σ 2 (las cuales suponemos que son valores finitos).
Será pues que ∀i ∈ N , E[Xi − µ] = 0
Haciendo Sn = ni=1 Xi , resulta que E[Sn ] = µ y var(Sn ) = nσ 2 .
P
Entonces ∀n ∈ N , se tiene:
Sn − nµ
Zn = √
nσ
Pn
i=1 Xi − nµ
= √
nσ
n
X Xi − µ
= √
i=1
nσ
38
2.7 Distribución muestral de la diferencia de2 dos
DISTRIBUCIONES
medias MUESTRALES
y
Pn
it i=1 (Xi − µ)
φZn (t) = E exp √
σ n
n
Y it(Xi − µ)
= E exp √
i=1
σ n
n
Y t
= φXi −µ √
i=1
σ n
Teorema 2.4 (Moivre). Sean {Xn }n∈N variables aleatorias iid con Xn ∼ Bin(n; p) ∀n. Entonces
X − np
p n ∼ N (0; 1)
np(1 − p)
La demostración se deja como ejercicio para el estudiante.
Si en lugar de una población se consideran dos, y de cada una de ellas se selecciona una muestra
aleatoria, la primera de tamaño n1 (X1 , X2 , . . . , Xn1 ); y la segunda de de tamaño n2 (Y1 , Y2 , . . . , Yn2 )
de manera independiente de la primera.
Es decir;
39
2.7 Distribución muestral de la diferencia de2 dos
DISTRIBUCIONES
medias MUESTRALES
= µ1 − µ2
Mientras que,
var X̄ − Ȳ = var X̄ + var Ȳ
σ2 σ2
= 1+ 2
n1 n2
σ12
2
X ∼ N µ1 ; σ1 ⇒ X̄ ∼ N µ1 ;
n1
σ22
2
Y ∼ N µ2 ; σ2 ⇒ Ȳ ∼ N µ2 ;
n2
Sucederá que:
σ12 σ22
X̄ − Ȳ ∼ N µ1 − µ2 ; +
n1 n2
40
2.7 Distribución muestral de la diferencia de2 dos
DISTRIBUCIONES
medias MUESTRALES
σ12 σ22
N µ1 − µ2 ; +
n1 n2
2. En caso que las poblaciones sean normales, pero se desconozcan σ12 y σ22 .
σ 2 (n1 + n2 )
X̄ − Ȳ ∼ N µ1 − µ2 ;
n1 n2
σ 2 (n1 + n2 )
Note que es una varianza combinada de las dos poblaciones, de este modo:
n1 n2
X̄ − Ȳ − (µ1 − µ2 )
Z= r ∼ N (0; 1)
(n1 + n2 )
σ
n1 n2
Del mismo modo que se combinan las varianzas poblacionales podemos calcular las cuasiva-
rianzas muestrales, sean Sn21 −1 y Sn22 −1
Por argumento similar al presentado para una población, puede verificarse que,
(X̄−r
Ȳ )−(µ1 −µ2 )
(n1 +n2 )
σ n1 n2
t = s
(n1 − 1)Sn21 −1 + (n2 − 1)Sn22 −1
σ 2 (n1 + n2 − 2)
q
(n1 n2 )
n1 +n2
X̄ − Ȳ − (µ 1 − µ 2 )
= s
(n1 − 1)Sn21 −1 + (n2 − 1)Sn22 −1
(n1 + n2 − 2)
∼ tn1 +n2 −2
41
2.8 Distribución muestral de la diferencia de2 dos
DISTRIBUCIONES
proporciones MUESTRALES
Al igual que en el caso de una muestra partimos del hecho que la proporción muestral es la media
aritmética de una variable que toma los valores 0 y 1 (ausencia o presencia de la caracterı́stica de
interés).
En la primera muestra de tamaño n1 las observaciones (X1 , X2 , . . . , Xn1 ), son variables aleatorias
con distribución de Bernoulli de parámetro p1 , es decir,
Xi ∼ B(p1 )∀ i = 1, . . . , n1
En la segunda muestra de tamaño n2 las observaciones (Y1 , Y2 , . . . , Yn2 ) (la cual es totalmente
independiente de la primera),
Yi ∼ B(p2 )∀ i = 1, . . . , n2
⇒ Π1 ∼ Bin(n1 ; p1 )
y Π2 ∼ Bin(n2 ; p2 )
= p1 − p2
42
2.9 Distribución muestral del cociente de dos
2 DISTRIBUCIONES
varianzas MUESTRALES
p̂1 (1 − p̂1 ) p̂2 (1 − p̂2 )
Π1 − Π2 ∼ N p̂1 − p̂2 ; + (12)
n1 n2
donde p̂1 y p̂2 representan valores concretos de las estimaciones de las proporciones en ambas
muestras, es decir, para una muestra concreta.
Dada una muestra aleatoria (X1 , X2 , . . . , Xn1 ) de una población N (µ1 ; σ12 ) y (Y1 , Y2 , . . . , Yn2 ) de
una población N (µ2 ; σ22 ), ambas muestras independientes entre si.
Por una parte de los resultados previos, se tendrá que:
(n1 − 1)Sn21 −1
χ1 = 2
∼ χ2n1 −1
σ1
(n2 − 1)Sn22 −1
χ2 = ∼ χ2n2 −1
σ22
son variables aleatorias independientes (al ser las muestras independientes entre si).
Resulta entonces, que la distribución en el muestreo del estadı́stico,
(n1 − 1)Sn21 −1
(n1 − 1)σ12
F =
(n2 − 1)Sn22 −1
(n1 − 1)σ22
Sn21 −1
σ12
= 2 (13)
Sn2 −1
σ22
sigue una distribución F de Snedecor con n1 − 1 grados de libertad en el numerador y n2 − 1 grados
de libertad en el denominador.
43
2.10 Problemas propuestos 2 DISTRIBUCIONES MUESTRALES
a) 2 b) 3 c) 4 d) 5
2. Repetir el problema anterio, pero considerando que las muestras no son aleatorias (es decir,
muestras se seleccionan sin reemplazamiento).
3. Sea (X1 , X2 , . . . , Xn ) una muestra aleatoria de una población N (µ; σ 2 ) y Xn+1 una varia-
ble aleatoria independiente de la muestra anterior. Calcúlese la distribución de la variable
aleatoria r
n Xn+1 − X̄
Y =
n+1 S
Siendo S 2 , la cuasivarianza muestral.
4. Demuéstrese que dada una muestra aleatoria (X1 , X2 , . . . , Xn ) de una población N (µ; σ 2 ),
las variables aleatorias X̄ y Xi − X̄ son independientes para todo i.
1
5. Sea X una población de Bernoulli de parámetro 2
y se consideran todas las muestras aleato-
rias posibles de tamaño 3. Para cada muestra calcúlese X̄ y S 2 , la media y la cuasivarianza
muestrales y determı́nense sus distribuciones en el muestreo.
a)
2 2
(k − 1)Sk−1 + (n − k − 1)Sn−k−1
σ2
44
2.10 Problemas propuestos 2 DISTRIBUCIONES MUESTRALES
b)
2
Sk−1
2
Sn−k−1
7. Dada dos muestras aleatorias independientes (X1 , X2 , . . . , Xm ) de una población N (µ1 ; σ12 )
e (Y1 , Y2 , . . . , Yn ) de una población N (µ2 ; σ22 ) respectivamente, y dos números reales α y β,
hállese la distribución de la variable aleatoria
α(X̄ − µ1 ) + β(Ȳ − µ2 )
q
Sp m1 + n1
Donde
(m − 1)S12 + (n − 1)S22
Sp2 =
n+m−2
siendo S12 y S22 las cuasivarianzas muestrales.
8. Dada una muestra aleatoria de tamaño n, calcule la distribución de la media muestral X̄,
cuando la población es:
a) Bernoulli.
b) Gamma.
c) Exponencial.
d ) Cauchy.
9. Demostrar que para una muestra aleatoria de tamaño n de una población N (µ; σ 2 ) se tiene
que el segundo momento muestral respecto de la media (la varianza muestral) y la media
muestral, son variables aleatorias independientes.
10. Dada una muestra aleatoria de tamaño n, de una población con momento poblacional de
cuarto orden finito, demostrar que:
n
E S2 = σ2
n−1
β4 − β22 β4 − 2β22 β4 + 3β22
var S 2 =
−2 − 4
n n2 n3
Donde βk = E (X − µ)k , el momento poblacional de orden k respecto al centro de los datos.
S 2 denota la varianza muestral.
45
2.10 Problemas propuestos 2 DISTRIBUCIONES MUESTRALES
1
11. De una población binomial de parámetro n = 3 y p = ; se extraen muestras aleatorias de
2
tamaño 2. Determine:
a) Distribución de la muestra.
12. Sea una urna con 100 bolas de las cuales 20 están marcadas con el número uno, 30 con el dos y
50 con el tres. Se extraen dos bolas al azar. Determine, primero suponiendo reemplazamiento
en la extracción de las bolas y después no:
13. Se lanza dos veces un dado ideal (todas las caras tienen igual probabilidad de ocurrencia).
Determine:
14. Los salarios mensuales de dos trabajadores de dos sectores económicos A y B se distribuyen
independientemente según las leyes de probabilidad.
46
2.10 Problemas propuestos 2 DISTRIBUCIONES MUESTRALES
15. De una población normal se toman dos muestras: la primera de tamaño 10 es tal que la su
varianza es igual a 9; en la segunda de tamaño 8 se tiene que su varianza muestral es 20.
¿Cuál es la probabilidad de la diferencia de medias sea menor que 3?
16. El tiempo en minutos que un cliente debe esperar hasta ser atendido en una pastelerı́a de
moda sigue una distribución exponencial, de modo que:
x
F (x) = P (X ≤ x) = 1 − exp −
2
Se elige una muestra de 100 clientes, y se miden los tiempos de espera. A partir de esta
muestra se pide:
17. Consideremos una muestra de tamaño 4 de una población normal N (µ, σ 2 ), donde se desea
estimar la media. Para ello se consideran los estimadores:
1
T1 = (X1 + X2 + X3 + X4 )
4
1 1 1
T2 = X1 + X2 + (X3 + X4 )
2 4 8
18. Sea X una variable aleatoria con distribución de Poisson de parámetro λ. Dada una muestra
aleatoria de tamaño n, encontrar la función de densidad conjunta de la muestra.
47
2.10 Problemas propuestos 2 DISTRIBUCIONES MUESTRALES
19. Sean (X1 , X2 , . . . , X25 ) e (Y1 , Y2 , . . . , Y25 ) dos muestras aleatorias independientes de dos po-
blaciones N (0; 42 ) y N (1; 32 ). Determine:
20. Una población consiste en cuatro números 1, 2, 3 y 4. Se extraen dos elementos sin reempla-
zamiento y se nota por (X1 , X2 ) los valores obtenidos. Se pide
21. La duración media de una muestra aleatoria de 10 bombillas de una población de desviación
tı́pica 425 horas, fue de 1327 horas. Una muestra aleatoria independiente de la anterior
de tamaño 6 de una población con desviación tı́pica de 375 horas, arrojó una duración
media muestral de 1215 horas. Si las medias de las dos poblaciones se supones iguales, ¿qué
probabilidad se tiene de obtener una desviación de las muestrales menor que la que se ha
obtenido?
22. Una población se compone de los cinco números 2, 3, 6, 8, 11. Considerar todas las mues-
tras posibles de tamaño dos que se puedan extraer con reemplazamiento de esta pobla-
ción.Encontrar:
23. Repetir el problema anterior pero considerando el caso que las muestras se eligen sin reem-
plazamiento.
24. Los pesos de 1500 cojinetes de bolas se distribuyen normalmente con media 22.4 onzas y
desviación tı́pica 0.048 onzas. Si se extraen 300 muestras de tamaño 36 de esta población,
determinar la esperanza y la desviación tı́pica de la distribución muestral de medias si el
muestreo se hace con reemplazamiento, ¿y si se hace sin reemplazamiento?
48
2.10 Problemas propuestos 2 DISTRIBUCIONES MUESTRALES
25. Una población de 7 números tiene una media de 40 y una desviación tı́pica de 3. Si se extraen
muestras de tamaño 5 de esta población y se calcula la cuasivarianza de cada muestra, hallar
la media de la distribución muestral de cuasivarianzas si el muestreo es con reemplazamiento,
¿y en el caso de ser muestras sin reemplazamiento?
26. Tenemos una variable aleatoria que toma los valores 1, 2 y 3 con probabilidades 0.1, 0.2 y
0.7, respectivamente. Encuentre la distribución muestral de la cuasivarianza muestral y en
base a ella encuentre la esperanza de la cuasivarianza en los siguientes casos:
27. Para muestras aleatorias de tamaño 10, encuentre la media y la varianza de la media muestral
en el caso que:
28. Sea una población Poisson de parámetro igual 0.1 de la cual se toma una muestra aleatoria
de tamaño 2. Determine la distribución de probabilidad, esperanza y varianza de la media
muestral. Considere únicamente los primeros cuatro valores que puede tomar la variable.
49
3 ESTIMACIÓN DE PARÁMETROS
3. ESTIMACIÓN DE PARÁMETROS
3.1. Introducción
Estimación puntual
θ̂ = f (X1 , X2 , . . . , Xn )
donde
θ̂i = fi (X1 , X2 , . . . , Xn )
El estimador θ̂ será una variable aleatoria (función de variables aleatorias muestrales) (X1 , X2 , . . . , Xn ),
y se transformará en una estimación del parámetro θ, un valor concreto, cuando las variables mues-
trales (X1 , X2 , . . . , Xn ) se conviertan en datos observados al obtenerse una muestra determinada.
Es posible definir muchos estimadores para tratar de estimar un parámetro desconocido θ. Enton-
ces, ¿cómo seleccionar un buen estimador de θ?, ¿cuáles son los criterios para juzgar cuando un
50
3.2 Propiedades de los estimadores 3 ESTIMACIÓN DE PARÁMETROS
La intuición sugiere que θ̂3 podrı́a considerarse como el mejor estimador de θ, no solo porque se
concentra alrededor del valor de θ, sino porque además su variabilidad es pequeña. θ̂2 no serı́a
tan bueno porque tiene una mayor variabilidad que la de θ̂2 3 a pesar que también se concentra
alrededor de θ. Mientras que θ̂1 serı́a el peor de todos pues apesar que tiene aproximadamente la
misma variabilidad que θ̂3 , no se encuentra concentrado alrededor de θ, por lo que es poco probable
acertar con una muestra el verdadero valor.
Es de recalcar que en la práctica, sólo tendremos acceso a la información contenida por una sola
muestra, por lo que debe tomarse el “mejor” estimador posible para el parámetro de interés.
De los comentarios anteriores surgen dos propiedades deseables que un estimador θ̂ debe tener una
distribución en el muestreo concentrada alrededor del valor de θ, y la varianza de θ̂ debe ser la
menor posible.
Sea θ̂ = T (X1 , X2 , . . . , Xn ) un estimador, y (X1 , X2 , . . . , Xn ) una muestra aleatoria.
Al ser desconocido el parámetro θ nunca sabemos exactamente hasta qué punto cada estimación
se encuentra lejos o cerca del valor del parámetro. Para establecer la bondad de un estimador,
partimos del hecho de conocer si la estimación se encuentra lejos o cerca del verdadero valor
51
3.2 Propiedades de los estimadores 3 ESTIMACIÓN DE PARÁMETROS
siempre desconocido.
El error que podemos cometer, es la diferencia entre θ̂ y θ, para eliminar signo se toma el cua-
2
drado, θ̂ − θ . Si fuera posible obtener todas las muestras posibles y para cada una de ellas su
estimación, un medida global de los errores es el Error Cuadrático Medio, el cual se presenta en la
siguiente definición.
Un valor pequeño de ECM (θ̂) indicará que, en media, el estimador no se encuentra lejos lejos de
θ, inversamente, cuánto mayor sea ECM (θ̂), θ̂ estará más alejado de θ, también en media.
Para un mejor cálculo de E(θ̂), se puede escribir como:
h i2
ECM θ̂ = E θ̂ − θ
h h i h i i2
= E θ̂ − E θ̂ + E θ̂ − θ
h h ii2 h h i i2
= E θ̂ − E θ̂ + E θ̂ − θ
2
= var θ̂ + sesgo θ̂
52
3.2 Propiedades de los estimadores 3 ESTIMACIÓN DE PARÁMETROS
EJEMPLO 3.1
Sea X1 , X2 , . . . , Xn una muestra aleatoria tal que E[Xi ] = µ y var(Xi ) = σ 2 , y consideremos los
estimadores siguientes para µ:
n
1X
θ̂1 = Xi
n i=1
n
1 X
θ̂2 = Xi
n + 1 i=1
Entonces,
2
ECM θ̂1 = var θ̂1 + sesgo θ̂1
σ2
=
n
Mientras que
2
ECM θ̂2 = var θ̂2 + sesgo θ̂2
2
n n
= var θ̂1 + µ−µ
n+1 n+1
n2 σ 2 µ2
= +
(n + 1)2 n (n + 1)2
1 2 2
= nσ + µ
(n + 1)2
Para un tamaño de muestra n = 10 y σ 2 = 100, tendrı́amos
ECM θ̂1 = 10
1000 + µ2
ECM θ̂2 =
121
√
y se cumplirá que para µ > 210 que ECM θ̂1 < ECM θ̂2 ; mientras que para que para
√
µ < 210 que ECM θ̂2 < ECM θ̂1 .
Sin embargo, a partir del Error Cuadrático Medio construiremos una buena parte de las propiedades
que es razonable exigir a un estimador para ser considerado como “bueno”.
Para que ECM θ̂ sea mı́nimo es necesario que los dos sumandos sean mı́nimos. El sesgo de θ̂
será mı́nimo cuando valga 0, los cual no lleva a la primera propiedad.
53
3.2 Propiedades de los estimadores 3 ESTIMACIÓN DE PARÁMETROS
Definición 3.2. Se dice que un estimador θ̂ es un estimador insesgado del parámetro θ, si para
todos los posibles valores de θ se cumple que E[θ̂] = θ. De este modo la distribución en el muestreo
de θ̂ se encuentra centrada alrededor de θ y ECM (θ̂) = var(θ̂).
Definición 3.3. Sea θ̂ el estimador de un parámetro θ, y sea θ̂1 , θ̂2 , . . . , θ̂n una sucesión de esti-
madores que representan a θ̂ con base a muestras de tamaño 1, 2, . . . , n, respectivamente. Se dice
que θ̂ es un estimador consistente para θ si:
lı́m p |θ̂ − θ| ≤ ε = 1 (15)
n→∞
EJEMPLO 3.2
La media muestral X̄, es un estimador consistenta para µ, es decir:
lı́m P |X̄ − µ| ≤ ε = 1
n→∞
Demostración.
E X̄n = µ
σ2
var X̄n =
n
54
3.2 Propiedades de los estimadores 3 ESTIMACIÓN DE PARÁMETROS
σ2
P |X̄ − µ| > ε ≤ 2
εn
⇒ lı́m P |X̄ − µ| > ε = 0
n→∞
Es decir, X̄ es consistente.
Definición 3.4. Un estimador θ̂ se dice que es eficiente para el parámetro θ, si entre todos los
posibles estimadores insesgados que pueden obtenerse para θ es el que tenga la menor varianza
posible. Es decir, θ̂ si
var(θ̂) = min{var(θ̂s )} (17)
En otras palabras, si θ̂1 y θ̂2 son estimadores de θ, θ̂1 será eficiente siempre y cuando var(θ̂1 ) ≤
var(θ̂2 ). Si son sesgados se utiliza el Error Cuadrático Medio.
Esta propiedad exige que el estimador que se utilice genere estimaciones parecidas para las dife-
rentes muestras que puedan obtenerse de la población.
55
3.3 Cota para la varianza de un estimador 3 ESTIMACIÓN DE PARÁMETROS
Sea una población definida por la función de densidad f (X; θ) que contiene al parámetro descono-
cido, estimado mediante, θ̂.
La función de verosimilitud es simplemente la distribución conjunta de la muestra
L(X1 , X2 , . . . , Xn ; θ) = f (X1 , X2 , . . . , Xn ; θ)
Entonces,
ln L(X1 , X2 , . . . , Xn ; θ) = n ln f (X; θ)
1
var θ̂ ≥ 2 (21)
∂ ln f (X; θ)
nE
∂θ
Puede apreciarse que la cota depende únicamente del tamaño muestral y de la función de densidad.
La cota también podrı́a utilizarse para saber si un estimador es eficiente (si la cota coincide con
la varianza del estimador).
56
3.4 Métodos de estimación 3 ESTIMACIÓN DE PARÁMETROS
Anteriormente hemos visto las propiedades deseables de un buen estimador. Ahora nos concentra-
remos en la forma de cómo obtener esos estimadores, de manera que tengan buenas propiedades.
Trataremos únicamente con los más utilizados y que cumplen la mayorı́a de las propieades.
Tenemos una variable aleatoria X, con función de densidad f (X; θ), siendo θ el parámetro
desconocido que se desea estimar.
L(X1 , X2 , . . . , Xn ; θ)
Para la selección del estimador θ̂ del parámetro θ, de entre todos los posibles valores que
puede tomar, se toma θ̂ de manera que:
Para encontrar el valor que maximiza la función conjunta de la muestra (el estimador θ̂),
se deriva con respecto al parámetro θ y se iguala a cero (se obtiene una ecuación con una
incógnita). La solución (θ̂), será únicamente una función que depende de los elementos en
la muestra (y no del parámetro), será el estimador de máxima verosimilitud del parámetro,
siempre y cuando se verifique la condición de máximo. En la mayorı́a de los casos es más
conveniente trabajar con el logaritmo de la función conjunta, a dicho logaritmo se le da el
nombre de función soporte.
57
3.4 Métodos de estimación 3 ESTIMACIÓN DE PARÁMETROS
EJEMPLO 3.3
Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribución normal µ y σ 2 (X ∼ N (µ; σ 2 )) con
función de densidad,
(x − µ)2
2 1
f (X; µ, σ ) = √ exp −
2Πσ 2 2σ 2
Determine los estimadores de µ y σ 2 por el método de máxima verosimilitud.
Solución. La función de verosimilitud es
n
Y
2
L(X1 , X2 , . . . , Xn ; µ, σ ) = f (Xi ; µ, σ 2 )
i=1
n
(Xi − µ)2
Y 1
= √ exp −
i=1 2Πσ 2 2σ 2
n " n
#
2
1 X (Xi − µ)
= √ exp −
2Πσ 2
i=1
2σ 2
La función soporte es:
n
2 n n 2 1 X
ln L(X1 , X2 , . . . , Xn ; µ, σ ) = − ln(2Π) − ln(σ ) − 2 (Xi − µ)2
2 2 2σ i=1
Para obtener el estimador de µ se deriva con respecto a µ y se iguala a 0,
n
∂ ln L(X1 , X2 , . . . , Xn ; µ, σ 2 ) 1 X
=− 2 (Xi − µ) = 0
∂µ 2σ i=1
n
1X 2
σ̂ = (Xi − X̄)2
n i=1
El método de máxima verosimilitud, selecciona como estimador a aquel valor del parámetro que
tiene la propiedad de maximizar el valor de la probabilidad de la muestra observada. Consiste más
bien en encontrar el valor del parámetro que maximiza la función de verosimilitud.
58
3.4 Métodos de estimación 3 ESTIMACIÓN DE PARÁMETROS
Insesgadez:
Los estimadores son por lo general sesgados, sin embargo, son insesgados asintóticamente, es
decir, si θ̂ es un estimador por máxima verosimilitud del parámetro θ, entonces:
h i
lı́m E θ̂ = θ
n→∞
Consistencia:
Eficiencia:
Normalidad
1
lı́m θ̂ ∼ N θ;
2
n→∞ ∂ ln L(X1 , X1 , . . . , Xn ; θ)
E
∂θ
Suficiencia
Invarianza
59
3.4 Métodos de estimación 3 ESTIMACIÓN DE PARÁMETROS
Quizá el método más antiguo para la estimación de parámetros es el método de los momentos.
Este consiste en igualar los momentos apropiados de la distribución de la población con los corres-
pondientes momentos en la muestra para estimar el parámetro desconocido. Los momentos son
con respecto al origen.
Si ak es el momento de orden k con respecto al origen el la muestra y αk lo es en la población.
Entonces:
E [ak ] = αk (22)
ak es un estimador insesgado de αk .
El procedimiento consiste en:
Calculamos los primeros k momentos muestrales con respecto al origen dependiendo del
número k de parámetros a estimar,
n
1X k
ak = X
n i=1 i
a1 = α 1
a2 = α 2
.. ..
. .
ak = α k
θ̂1 = f1 (a1 , a2 , . . . , ak )
θ̂2 = f2 (a1 , a2 , . . . , ak )
.. ..
. .
θ̂k = fk (a1 , a2 , . . . , ak )
60
3.5 Estimación por Intervalos de confianza en3 una
ESTIMACI
poblaciÓN
ón DE PARÁMETROS
En condiciones generales, los estimadores obtenidos son consistentes. Pueden tener otras propie-
dades pero no se cumplirán siempre.
EJEMPLO 3.4
En una población N (µ; σ 2 ) determinar los estimadores para µ y σ 2 por el método de los momentos.
Solución. Para una muestra aleatoria de tamaño n (X1 , X2 , . . . , Xn ),
n
1X
a1 = Xi = X̄
n i=1
n
1X 2
a2 = X
n i=1 i
Mientras que en la población
α1 = µ
α 2 = σ 2 + µ2
El esistema es:
µ = X̄
n
2 2 1X 2
σ +µ = X
n i=1 i
La solución es:
µ̂ = X̄
n
2 1X 2
σ̂ = X − X̄ 2
n i=1 i
n
1X
= (Xi − X̄)2
n i=1
= S2
Cuando se toma una muestra aleatoria se obtiene un único valor para el estimador θ̂, a ciencia
cierta si desconocemos totalmente el valor del parámetro θ, no podemos saber si θ̂ se encuentra
61
3.5 Estimación por Intervalos de confianza en3 una
ESTIMACI
poblaciÓN
ón DE PARÁMETROS
y donde inf (X; θ̂) y sup(X; θ̂) dependan únicamente de θ̂ y de valores que puedan conocerse.
a 1 − α se le da el nombre de nivel de confianza. Mientras que a α nivel de significancia.
Téngase en cuenta que, el intervalo de confianza es un intervalo aleatorio, pues depende de los
elementos seleccionados en la muestra.
El intervalo de confianza no representa la probabilidad de que el parámetro θ se encuentre en el
intervalo es igual a 1 − α, pues:
62
3.5 Estimación por Intervalos de confianza en3 una
ESTIMACI
poblaciÓN
ón DE PARÁMETROS
Los intervalos anteriores son bilaterales, pues se especifica tanto inf (X; θ̂) como sup(X; θ̂), en
algunos casos el intervalo se deja abierto dejando a inf (X; θ̂) = −∞ o sup(X; θ̂) = ∞ , se habla
en ese caso de intervalos unilaterales:
P θ ≥ inf (X; θ̂) = 1 − α
P θ ≤ sup(X; θ̂) = 1 − α
Supongamos que la caracterı́stica de interés X sigue una distribución N (µ; σ 2 ), siendo únicamente
desconocido el valor de µ. De dicha población seleccionamos una muestra aleatoria de tamaño n.
Lo que deseamos es encontrar valores reales, digamos k1 y k2 , tales que
P (k1 ≤ µ ≤ k2 ) = 1 − α
Puesto que:
si X ∼ N (µ; σ 2 )
σ2
⇒ X̄ ∼ N µ;
n
X̄ − µ
Z= σ ∼ N (0; 1)
√
n
Tomenos Z α2 y Z1− α2 como los valores tabulares de la distribución N (0; 1) tales que entre
ellos se encuentra contenida un área igual a 1 − α. Como la distribución N (0; 1) es simétrica
resulta que Z1− α2 = −Z α2 (valor que deja por encima de el un área igual a α2 ).
De este modo el intervalo buscado será simétrico y a la vez tendrá longitud mı́nima, resulta
entonces;
63
3.5 Estimación por Intervalos de confianza en3 una
ESTIMACI
poblaciÓN
ón DE PARÁMETROS
P −Z α2 ≤ Z ≤ Z α2 = 1 − α
!
X̄ − µ
P −Z α2 ≤ σ ≤ Z α2 = 1−α
√
n
σ σ
P − √ Z α2 ≤ X̄ − µ ≤ √ Z α2 = 1−α
n n
σ σ
P X̄ − √ Z α2 ≤ µ ≤ X̄ + √ Z α2 = 1−α
n n
σ
k1 = X̄ − √ Z α2
n
σ
k2 = X̄ + √ Z α2
n
σ σ
µ ∈ X̄ − √ Z α2 , X̄ + √ Z α2
n n
64
3.5 Estimación por Intervalos de confianza en3 una
ESTIMACI
poblaciÓN
ón DE PARÁMETROS
Resulta que:
α α
P −tn−1 ≤ T ≤ tn−1 = 1 − α
2 2
!
α X̄ − µ α
P −tn−1
2
≤ Sn−1 ≤ tn−1
2
= 1−α
√
n
Sn−1 α2 Sn−1 α2
P − √ tn−1 ≤ X̄ − µ ≤ √ tn−1 = 1−α
n n
Sn−1 α2 Sn−1 α2
P X̄ − √ tn−1 ≤ µ ≤ X̄ + √ tn−1 = 1−α
n n
Por lo que el intervalo de confianza para la media poblacional µ (cuando la varianza pobla-
cional es desconocida) es:
Sn−1 α2 Sn−1 α2
µ ∈ X̄ − √ tn−1 , X̄ + √ tn−1
n n
En caso de que la población no fuese normal, para encontrar el intervalo de confianza se usará la
desigualdad de Tchebyssheff, el intervalo será sólo aproximado en cuanto a confianza (la confianza
será mayor a la propuesta). Sin embargo, sólo puede usarse cuando σ 2 es conocida.
p̂ − p
Z=r
p̂(1 − p̂)
n
donde p̂ es el valor de la proporción muestral para esa muestra en particular.
65
3.5 Estimación por Intervalos de confianza en3 una
ESTIMACI
poblaciÓN
ón DE PARÁMETROS
El intervalo de confianza será entonces (utilizando una lógica similar para el caso de la media).
P −Z α2 ≤ Z ≤ Z α2 = 1 − α
p̂ − p
P −Z α2 ≤ q ≤ Z α2 = 1 − α
p̂(1−p̂)
n
r r !
p̂(1 − p̂) p̂(1 − p̂)
P −Z α2 ≤ p̂ − p ≤ Z α2 = 1−α
n n
r r r !
p̂(1 − p̂) p̂(1 − p̂) p̂(1 − p̂)
P p̂ − Z α2 ≤ p ≤ p̂ + = 1−α
n n n
Supongamos que la caracterı́stica de interés X sigue una distribución N (µ; σ 2 ). De dicha población
seleccionamos una muestra aleatoria de tamaño n. Se sabe por lo visto que antes, que la variable
aleatoria,
2
(n − 1)Sn−1
χ2 = ∼ χ2n−1 (26)
σ2
La distribución Chi-cuadrado no es simétrica, por lo que el intervalo más pequeño que se puede
α
encontrar es aquel donde se reparte un área igual a 2
para valores que sean mayores o menores al
de la ditribución, es decir, sean χ21− α y χ2α los valores tabulares de la distribución Chi-cuadrado
2 2
(para n − 1 grados de libertad) que dejan comprendida un área igual 1 − α entre ellos.
De este modo el intervalo puede obtenerse por;
P χ21− α ≤ χ2 ≤ χ2α = 1−α
2 2
2
(n − 1)Sn−1
P χ21− α ≤ 2
≤ χ2α = 1−α
2 σ 2
!
2 2
(n − 1)Sn−1 (n − 1)S n−1
P 2
≤ σ2 ≤ 2
= 1−α
χα χ1− α
2 2
66
3.6 Intervalo de confianza en dos poblaciones3 ESTIMACIÓN DE PARÁMETROS
3.6.1. Intervalo de confianza para la diferencia de dos medias, cuando las muestras
son independientes
Basando en la misma lógica aplicada para el caso de una población, resulta que el intervalo,
P −Z α2 ≤ Z ≤ Z α2 = 1 − α
X̄ − Ȳ − (µ1 − µ2 )
P −Z α2 ≤ q 2 ≤ Z α2 = 1 − α
σ1 σ22
n1
+ n2
s s
2 2 2 2
σ1 σ2 σ1 σ2
P −Z α2 + ≤ X̄ − Ȳ − (µ1 − µ2 ) ≤ Z α2 + = 1−α
n1 n2 n1 n2
s s
2 2 2 2
σ1 σ2 σ1 σ2
P X̄ − Ȳ − Z α2 + ≤ (µ1 − µ2 ) ≤ X̄ − Ȳ + Z α2 + = 1−α
n1 n2 n1 n2
67
3.6 Intervalo de confianza en dos poblaciones3 ESTIMACIÓN DE PARÁMETROS
Haciendo s
(n1 − 1)Sn21 −1 + (n2 − 1)Sn22 −1
Sp2 =
n1 + n2 − 2
resulta que,
X̄ − Ȳ − (µ1 − µ2 )
T = q ∼ tn1 +n2 −2
1 1
Sp n1 + n2
68
3.6 Intervalo de confianza en dos poblaciones3 ESTIMACIÓN DE PARÁMETROS
Solución de Welch.
con
Sn21 −1 Sn22 −1
ψ1 = y ψ2 =
n1 n2
Autor desconocido.
Quien aproxima la distribución de (27) por una distribución t de Student con v grados
de libertad.
n1 −1
+ n2 −1
los grados de libertad dependerán de cualquiera de las soluciones elegidas anteriores. Por lo
69
3.6 Intervalo de confianza en dos poblaciones3 ESTIMACIÓN DE PARÁMETROS
Sn21 −1 ≈ Sn21 y n1 − 1 ≈ n1
Sn22 −1 ≈ Sn22 y n2 − 1 ≈ n2
70
3.6 Intervalo de confianza en dos poblaciones3 ESTIMACIÓN DE PARÁMETROS
3.6.2. Intervalo de confianza para la diferencia de dos medias, cuando las muestras
son dependientes
var X̄ − Ȳ = var X̄ + var Ȳ − 2var X̄; Ȳ
con lo que si consideramos las muestras como independientes y nos olvidamos de la covarianza, la
variable,
X̄ − Ȳ − (µ1 − µ2 )
Z= q
var X̄ − Ȳ
puede ser equivocadamente grande o pequeña dependiendo de la magnitud y signo de cov X̄; Ȳ .
La solución para esto es definir una nueva variable D = X − Y y utilizar la varianza de la nueva
variable como estimación directa de var X̄ − Ȳ (para esto ambas muestran deben tener igual
número de elementos, es decir, los tamaños deben coincider). En este caso asumiendo normalidad
en ambas poblaciones, se tendrá que D también es normal con media µD = µ1 − µ2 y varianza
2
σD = var X̄ − Ȳ .
De este modo construir un intervalo de confianza para µ1 − µ2 será equivalente a construirlo para
µD . Es de mencionar que para que tenga sentido D = X − Y , se trabajan con observaciones de un
mismo individuo o elemento (por lo regular X denota las observaciones antes de realizar o aplicar
algún tratamiento, mientras que Y es despúes de aplicarlo).
Definiendo la variable aleatoria,
D̄ − µD
T = SD
∼ tn−1 (33)
√
n
Siguiendo el procedimiento descrito para encontrar el intervalo de confianza para la media cuando
la varianza es desconocida se tiene que el intervalo es:
α α
P −tn−1
2
≤ T ≤ tn−1
2
= 1−α
!
α D̄ − µD α
P −tn−1
2
≤ SD
≤ tn−1
2
= 1−α
√
n
SD α SD α2
P − √ tn−1 ≤ D̄ − µD ≤
2
√ tn−1 = 1−α
n n
SD α2 SD α2
P D̄ − √ tn−1 ≤ µD ≤ D̄ + √ tn−1 = 1−α
n n
71
3.6 Intervalo de confianza en dos poblaciones3 ESTIMACIÓN DE PARÁMETROS
En la primera muestra de tamaño n1 las observaciones (X1 , X2 , . . . , Xn1 ), son variables aleatorias
con distribución de Bernoulli de parámetro p1 , es decir,
Xi ∼ B(p1 )
+
n1 n2
El intervalo de confianza será entonces:
s s
p̂1 (1 − p̂1 ) p̂2 (1 − p̂2 ) p̂1 (1 − p̂1 ) p̂2 (1 − p̂2 )
(p1 − p2 ) ∈ (p̂1 − p̂2 ) − Z α2 + ; (p̂1 − p̂2 ) + Z α2 +
n1 n2 n1 n2
72
3.6 Intervalo de confianza en dos poblaciones3 ESTIMACIÓN DE PARÁMETROS
Dada una muestra aleatoria (X1 , X2 , . . . , Xn1 ) de una población N (µ1 ; σ12 ) y (Y1 , Y2 , . . . , Yn2 ) de
una población N (µ2 ; σ22 ), ambas muestras independientes entre si.
Sabemos según lo visto anteriormente que:
(n1 − 1)Sn21 −1
∼ χ2n1 −1
σ12
(n2 − 1)Sn22 −1
∼ χ2n2 −1
σ22
Si ambas muestras son independientes, está claro que la variable aleatoria definida en la ecuación
(13) sigue una distribución F de Snedecor con n1 − 1 y n2 − 1 grados de libertad; la variable
aleatoria como se recordará es:
Sn21 −1
σ12
F =
Sn22 −1
σ22
Sn21 −1 σ22
= (35)
Sn22 −1 σ12
El intevalo de confianza se calcula de manera similar al del intervalo para una varianza, pero se
usa la F de Snedecor en lugar de la χ2 .
Sean
α
1− α
Fn21 −1,n2 −1 y Fn1 −1,n
2
2 −1
(36)
σ2
El interalo de confianza es (para σ12 ):
2
α
1− α
P Fn21 −1,n2 −1 ≤ F ≤ Fn1 −1,n2
2 −1
= 1−α
Sn21 −1 σ22
α
1− α
P Fn1 −1,n2 −1 ≤ 2
2
≤ Fn1 −1,n2 −1
2
= 1−α
Sn2 −1 σ12
!
1 Sn22 −1 σ12 1
P 1− α
≤ 2 ≤ α = 1−α
Fn1 −1,n
2 Sn1 −1 σ22 Fn21 −1,n2 −1
2 −1
!
Sn21 −1 1 σ 2 S 2
1
P 2 1− α ≤ 12 ≤ n21 α = 1−α
Sn2 −1 F 2 σ2 Sn2 F 2
n1 −1,n2 −1 n1 −1,n2 −1
73
3.7 Problemas propuestos 3 ESTIMACIÓN DE PARÁMETROS
σ22
El interalo de confianza es (para σ12
):
De una manera muy similar al caso anterior, resulta que el intervalo de confianza es:
2
σ22 Sn22 −1 1− α2
Sn2 −1 α2
∈ F , F
σ12 Sn21 −1 n1 −1,n2 −1 Sn21 −1 n1 −1,n2 −1
1 1
T1 = x y T2 = (x + 1)
n n+1
2. Sea X1 , X2 , X3 y X4 una muestra aleatoria de tamaño cuatro de una población cuya dis-
tribución es exponencial de parámetro θ desconocido. De los siguientes estimadores, ¿cuáles
son estimadores insesgados de θ?
1 1
T1 = (X1 + X2 ) + (X3 + X4 )
6 3
1
T2 = (X1 + 2X2 + 3X3 + 4X4 )
5
1
T3 = (X1 + X2 + X3 + X4 )
4
74
3.7 Problemas propuestos 3 ESTIMACIÓN DE PARÁMETROS
10. Dada una población de distribuida normalmente con media desconocida y varianza igual a
25, se extraen una muestra aleatoria de tamaño 3 y se consideran los siguientes estimadores
para la media:
T2 = 2X3 − X1 )
1
T3 = (X1 + X2 + X3 )
3
Estudie cuál de los tres estimadores es el mejor desde el punto de vista del sesgo y la eficiencia.
75
3.7 Problemas propuestos 3 ESTIMACIÓN DE PARÁMETROS
12. Obtenga un estimador, por el método de los momentos, para el parámetro a de la distribución
que tiene por función de densidad.
2(a − x)
f (x; a) = ;0 < x < a
a2
16. Supóngase que se están probando bombillas de dos tipos: normales y de larga duración. El
tiempo de vida de una bombilla normal sigue una distribución exponencial de media θ y
el tiempo de vida de una bombilla de larga duración sigue una distribución exponencial de
media 4θ. La compañı́a que las produce quiere medir los tiempos de vida de dos bombillas
normales (X1 , X2 ) y de dos de larga duración (Y1 , Y2 ). Escribir la función de verosimilitud
para θ basada en estas 4 bombillas. Calcular el estimador de θ por el método de la máxima
verosimilitud.
76
3.7 Problemas propuestos 3 ESTIMACIÓN DE PARÁMETROS
2 18 24 3 19 6 5 8 5 4
2 1 1 16 3 34 1 1 26 10
19. Sea X una variable aleatoria cuya distribución es uniforme en el intervalo [0, a]. Calcular los
estimadores de a por el método de los momentos y de máxima verosimilitud.
c) Comparar el intervalo obtenido en los dos incisos anteriores. ¿Se sabı́a a priori si uno
de ellos debı́a tener mayor tamaño que el otro?
d ) En general, sugerir al menos dos maneras en las que la longitud de los intervalos de
confianza puede ser reducida.
77
3.7 Problemas propuestos 3 ESTIMACIÓN DE PARÁMETROS
3. Un fabricante de fibras sintéticas desea estimar la tensión de ruptura media de una fibra.
Diseña un experimento en que se observan las tensiones de ruptura, en libras de 16 hilos del
proceso seleccionados aleatoriamente. Las tensiones son 20.8, 20.6, 21.0, 20.9, 19.9, 20.2, 19.8,
19.6, 20.9, 21.1, 20.4, 20.6, 19.7, 19.6, 19.6, 20.3 y 20.7. Supóngase que la tensión de ruptura
de una fibra se encuentra modelada por una distribución normal con desviación estándar de
0.45 libras. Construir un intervalo de confianza estimado para el valor real de la tensión de
ruptura promedio de la fibra en el caso que la confianza sea del 90 %, 95 % y 99 %.
4. Una muestra aleatoria de los salarios por hora para nueve mecánicos de automóviles pro-
porcionó los siguientes datos: 10.5, 11, 9.5, 12, 10, 11.5, 13, 9, 8.5. Bajo la suposición que el
muestreo se lleva a cabo sobre una población distribuida normalmente, construir los inter-
valos de confianza estimados del 90 %, 95 % y 99 % para los salarios por hora promedio para
todos los mecánicos. Interpretar los resultados.
5. Dos universidades financiadas por el gobierno tienen métodos distintos para inscribir a sus
alumnos a principios de cada semestre. Las dos desean comparar el tiempo promedio que
les toma a sus estudiantes completar el trámite de inscripción. En cada universidad se ano-
taron los tiempos de inscripción para 100 alumnos seleccionados al azar. Las medias y las
desviaciones estándares muestrales son las siguientes:
S1 = 4.8 S2 = 5.4
Si se supone que el muestreo se llevó a cabo sobre dos poblaciones distribuidas normalmente
78
3.7 Problemas propuestos 3 ESTIMACIÓN DE PARÁMETROS
6. Cierto metal se produce, por lo común, mediante un proceso estándar. Se desarrolla un nuevo
proceso en que se añade una aleación a la producción de metal. Los fabricantes se encuentran
interesados en estimar la verdadera diferencia entre las tensiones de ruptura de los metales
producidos por los dos procesos. Para cada metal se seleccionan 12 especı́menes y cada uno
de éstos se somete a una tensión hasta que se rompe. La siguiente tabla muestra las tensiones
de ruptura de los especı́menes en kilogramos por centı́metro cuadrado:
Proceso estándar 428 419 458 439 441 456 463 429 438 445 441 463
Proceso nuevo 462 448 435 465 429 472 453 459 427 468 452 447
Si se supone que el muestreo se llevó a cabo sobre dos distribuciones normales e indepen-
dientes con varianzas iguales, obtener los intervalos de confianza estimados del 90 %, 95 % y
99 % para la diferencia de medias (estándar - nuevo).
7. Se espera tener una cierta variación aleatoria nominal en el espesor de las láminas de plástico
que una máquina produce. Para determinar cuándo la variación en el espesor se encuentra
dentro de ciertos lı́mites, cada dı́a se seleccionan de forma aleatoria 12 láminas de plástico y
se mide en milı́metros su espesor. Los datos que se obtuvieron son los siguientes: 12.6, 11.9,
12.8, 12.3, 11.8, 11.7, 12.4, 12.1, 12.3, 12.0, 12.5, 12.9. Si se supone que el espesor es una
variable aleatoria distribuida normal, obtener los intervalos de confianza estimados del 90 %,
95 % y 99 % para la varianza desconocida del espesor. Si no es aceptable una varianza mayor
de 0.9 mm, ¿existe alguna razón para preocuparse con base en esta evidencia?
8. Una agencia estatal tiene la responsabilidad de vigilar la calidad del agua para la crı́a de peces
con fines comerciales. Esta agencia se encuentra interesada en comparar la variación de cierta
sustancia tóxica en dos estuarios cuyas aguas se encuentran contaminadas por desperdicios
industriales provenientes de una zona industrial cercana. En el primer estuario se seleccionan
11 muestras y en el segundo 8, las cuales se enviaron a un laboratorio para su análisis. Las
mediciones en ppm que se observaron en cada muestra se exponen en la siguiente tabla.
79
3.7 Problemas propuestos 3 ESTIMACIÓN DE PARÁMETROS
Estuario I 10 10 12 13 9 8 12 12 10 14 8
Estuario II 11 8 9 7 10 8 8 10
Si se supone que el muestreo se hizo sobre dos poblaciones independientes distribuidas norma-
les, obtener un intervalo de confianza estimado del 95 % para el cociente de las dos varianzas
σ12
no conocidas σ22
.
9. La lista electoral final en una elección reciente para senador, reveló que 1400 personas de
un total de 2500 seleccionadas aleatoriamente, tienen preferencia por el candidato A con
respecto al candidato B.
b) Supóngase que selecciona aleatoriamente una muestra de 225 personas con la misma
proporción muestral a favor del candidato A. ¿Son los resultados diferentes a los del
apartado anterior?
10. Se recibe un lote muy grande de artı́culos proveniente de un fabricante que asegura que el
porcentaje de artı́culos defectuosos en la producción es del 1 %. Al seleccionar una muestra
aleatoria de 200 artı́culos y después de inspeccionarlos, se descubren 8 defectuosos. Obtener
los intervalos de confianza aproximados del 90 %, 95 % y 99 % para la verdadera proporción
de artı́culos defectuosos en el proceso de manufactura del fabricante.
11. A partir de una muestra de 26 embotelladoras de agua, se observa que el número medio de
botellas llenas es de 71.2 por minuto y que su varianza es de 13.4. Suponiendo Normalidad,
calcule un intervalo de confianza del 95 % para el número medio de botellas llenas.
12. Se está realizando un estudio para determinar el grado de precisión de las medidas efectuadas
por un aparato. Para ello, se realizan 10 medidas, observándose que presentan una desviación
tı́pica de 0.23 unidades. Suponiendo normalidad, obténgase un intervalo de confianza al 99 %
para la desviación tı́pica de las medidas llevadas a cabo por el aparato.
13. Un agricultor siembra dos tipos de tomates hı́bridos en cinco parcelas diferentes. Las Pro-
ducciones, en quintales métricos por hectáreas son las siguientes:
80
3.7 Problemas propuestos 3 ESTIMACIÓN DE PARÁMETROS
Parcelas 1 2 3 4 5
Hı́brido I 90 85 95 76 80
Hı́brido II 90 84 85 87 95
14. Para estudiar la diferencia de estaturas medias, medidas en centı́metros, de estudiantes va-
rones en las facultades de ciencias de Cádiz y Málaga, se toma una muestra aleatoria de 15
estudiantes en cada facultad, oteniéndose:
Cádiz 182 170 175 167 171 174 181 169 174 174 170 176 168 178 180
Málaga 181 173 177 170 170 175 169 169 171 173 177 182 179 165 174
15. Se está realizando un estudio sobre la evolución del nivel de colesterol de las personas, para lo
cual se seleccionan 10 individuos al azar y se les somete a una nueva dieta alimenticia durante
seis meses, tras la cual se les volvió a medir el nivel de colesterol en mg/dl. Suponiendo
Normalidad, obtenga un intervalo de confianza al 90 % para la diferencia de medias.
Antes 200 156 178 241 240 256 245 220 235 200
Después 190 145 160 240 240 255 230 200 210 195
16. En una población de 10000 niños se desea hacer una campaña de vacunación. Se quiere saber
cuántas vacunas deben preverse, con un 95 % de confianza, si de una muestra aleatoria de 90
encuestados 30 estaban vacunados.
81
3.7 Problemas propuestos 3 ESTIMACIÓN DE PARÁMETROS
17. A partir de una muestra de 150 enfermos escogidos entre los admitidos en un hospital durante
un periodo de tres años, se observó que 129 tenı́an algún tipo de seguro hospitalario. En un
segundo hospital, se tomó otra muestra de 160 individuos, extraı́da de forma similar, de los
cuales 144 tenı́an algún tipo de seguro. Encuentre los intervalos al 90 %, 95 % y 99 % de
confianza para la diferencia de proporciones.
18. Con el propósito de estudiar la cantidad de nicotina de una determinada marca de cigarrillos
se toma una muestra de 100 de ellos, encontrándose una media de 26 mg. Se sabe que
la cantidad de nicotina se distribuye normalmente, y que su desviación tı́pica es de 8 mg.
Obtenga un intervalo de confianza para el contenido medio en nicotina al 99 %.
19. Sea X la longitud (centı́metros) de una cierta especie de pescado que se captura en primavera.
Una muestra aleatoria de 13 observaciones de la variable X son:
13.1; 5.1; 18.0; 8.7; 16.5; 9.8; 6.8; 12.0; 17.8; 25.4: 19.2: 15.8; 23.0 2
20. Un fabricante de televisores afirma que poco menos del 20 % de sus tubos de imágenes fallan
dentro de 2 años. Se encontró en una muestra aleatoria de tamaño 100 que 18 tubos de
imágenes fallaron en 2 años. Calcule un intervalo de confianza al 95 % para π, la proporción
de tubos que fallan en 2 años.
21. Se cree que los supermercados en Swansea tienden a cobrar más por sus artı́culos que en
Cardiff. Un comprador en Cardiff y un comprador en Swansea acuerdan comprar artı́culos
para luego comparar precios. Las dos ciudades tiene 10 cadenas de supermercado en común,
las cuales llamaremos A, B, . . . , J, y los compradores visitarán cada una a la vez en semanas
consecutivas, se registraron los siguientes precios en libras:
Tienda A B C D E F G H I J
Swansea 12.08 12.81 12.74 13.54 14.86 14.68 12.64 15.23 13.83 12.64
Cardiff 11.62 11.69 12.57 13.32 13.15 14.04 11.76 13.63 12.95 12.59
82
3.7 Problemas propuestos 3 ESTIMACIÓN DE PARÁMETROS
22. Se está realizando un estudio sobre la oferta turı́stica existente en un conocido lugar de
veraneo. Como parte de ese estudio, se desea conocer el precio medio del “menú del dı́a” de
los restaurantes de una determinada zona. Para ello se eligen al azar 12 restaurantes y se
recogen los precios de dicho menú:
6.70, 7.80, 7.70, 7.75, 7.00, 5.50, 8.20, 8.40, 7.90, 9.50, 3.00, 11.00
Suponiendo normalidad en los precios y un nivel de significancia del 5 %, calcule los intervalos
de confianza para el precio medio y la desviación tı́pica del precio.
23. Una cadena de tiendas de electrodomésticos quiere estudiar la efectividad de una nueva
campaña televisiva sobre la venta de frigorı́ficos. Para ello se recoge el número de unidades
vendidas antes y después de la campaña, en las 12 tiendas que componen la cadena:
Antes 12 10 15 8 19 14 12 21 16 11 8 15
Después 11 11 17 9 21 13 16 25 20 18 10 17
a) Con un nivel de significancia del 5 %, hallar un intervalo de confianza para la diferencia
de medias de unidades vendidas antes-después
24. En una encuesta a 600 personas, 270 son favorables al voto a favor de un nuevo candidato.
Con un nivel de confianza del 95 %
25. Sea una población normal (µ; 42 ) de la cual se extrae una muestra aleatoria de tamaño 100
cuya media muestral resulta ser 25, construya un intervalo de confianza del 95 % para la
media poblacional µ.
83
4 PRUEBA DE HIPÓTESIS ESTADÍSTICAS
La función de probabilidad de una variable aleatoria X, f (X; θ), depende de uno o más parámetros
θ0 s, los cuales toman valores en un espacio paramétrico Θ (θ ∈ Θ), de forma que para cada valor
θ en Θ, la función f (X; θ) es distinta.
“Una hipótesis estadı́stica sobre el parámetro es una conjetura sobre los valores que el parámetro
puede tomar”.
El establecimiento de una hipótesis sobre θ supone dividir el espacio parámetrico en dos partes;
una, que denominaremos Θ0 , integrada por el conjunto de valores que cumplen la hipótesis, y otra
Θ1 , por el conjunto de valores que no la cumplen, los dos conjuntos Θ0 y Θ1 son mutuamente
excluyentes y la unión de ellos es el espacio Θ.
A la hipótesis que se desea contrastar la denominaremos hipótesis nula H0 [θ ∈ Θ0 ], y la otra,
hipótesis alternativa H1 [θ ∈ Θ1 ].
Llamaremos hipótesis estadı́stica a una suposición que determina, parcial o totalmente, la distri-
bución de probabilidad de una o varias variables aleatorias. Estas hipótesis pueden clasificarse,
según que:
1. Especifiquen un valor concreto o un intervalo de valores para los parámetros de una población.
Un ejemplo del primer tipo es que la media de una variable es 10; del segundo, que las medias de
dos poblaciones normales con igual varianzas son idénticas; del tercero, que la distribución de una
población es normal. Aunque la metodologı́a para realizar el contraste es análoga en los tres casos,
es importante distinguir entre ellos porque:
84
4.2 Tipos de hipótesis 4 PRUEBA DE HIPÓTESIS ESTADÍSTICAS
Hipótesis nula (H0 ) es la hipótesis que se constrasta. El nombre de “nula” proviene de que H0
representa la hipótesis que mantendremos a no ser que los datos indiquen su falsedad, y debe
entenderse, por tanto, en el sentido de “neutra”. La hipótesis nula nunca se considera probada,
aunque puede ser rechazada por los datos.
Po ejemplo, la hipótesis de que dos poblaciones tienen la misma media puede ser rechazada cuando
ambas difieran mucho, analizando muestras lo suficientemente grandes de ambas poblaciones, pero
no puede ser “demostrada” mediante muestreo (es posible que las medias difieran en δ, siendo δ
un valor pequeño imperceptible en el muestreo).
La hipótesis H0 se elige normalmente de acuerdo al principio de simplicidad cientı́fica, que podrı́amos
resumir diciendo que solamente debemos abandonar un modelo simple a favor de otro más complejo
cuando la evidencia a favor de este último sea fuerte.
En consecuencia, en el primer tipo de contraste respecto a los parámetros de una distribución, la
hipótesis nula suele ser que el parámetro es igual a un valor concreto. Cuando comparamos pobla-
ciones, H0 es siempre que las poblaciones son iguales (igualdad de medias). Cuando investigamos
la forma de la distribución H0 suele ser que los datos son una muestra homogénea de una población
simple (Normal, Poisson, etc.).
85
4.3 Tipos de regiones 4 PRUEBA DE HIPÓTESIS ESTADÍSTICAS
Definición 4.1. Un contraste o test de hipótesis es una regla de desición mediante la cual optamos
por una u otra hipótesis, a la luz de la información proporcionada por una muestra extraı́da de la
población objeto de estudio.
El procedimiento para llevar a cabo un contraste es el siguiente: se procede a una partición del
espacio muestral X (X1 , X2 , . . . , Xn ) en dos subconjuntos disjuntos, C y C ∗ , los cuales dependen
de H0 y H1 , de tal forma que si el punto muestral (la muestra seleccionada) X pertenece a uno
de ellos, por ejemplo a C, llamado región crı́tica, se rechaza la hipótesis nula y si, pertenece a C ∗ ,
llamado región de aceptación; se acepta la hipótesis nula.
El rechazo de la hipótesis nula equivale a la aceptación de la alternativa, y viceversa. Debiendo
entender que la aceptación o rechazo de una hipótesis en el sentido de que la muestra ha propor-
cionado evidencia suficiente, pero no absoluta, para que sea razonable la aceptación o rechazo de
la hipótesis.
EJEMPLO 4.1
En la distribución B(p) el campo de variación del parámetro p es el intervalo (0, 1). Una hipótesis
nula podrı́a ser la pertenencia de p al intervalo Θ0 = (0.0, 0.3] y la alternativa la pertenencia de p
al intervalo Θ1 = (0.3, 1.0), es decir,
86
4.4 Tipos de errores 4 PRUEBA DE HIPÓTESIS ESTADÍSTICAS
EJEMPLO 4.2
El peso de un producto oscila entre 1 y 4 kg y puede distribuirse con media de 2 kg o 3 kg. Se
toma una muestra aleatoria de tamaño 1, si el peso es mayor a 2.6 kg se rechaza la hipótesis de
que la media sea igual a 2 kg y se acepta, por consiguiente, de que es igual a 3 kg.
El espacio muestral X es el intervalo [1, 4], la región crı́tica C = [2.6, 4.0] y la región de aceptación
C ∗ = [1.0, 2.6), de tal forma que:
X = C∗ ∪ C
= [1.0, 4.0]
En cualquier contraste de hipótesis no está exento de errores debido entre muchos factores a la
aleatoriedad de la muesttra. La situación se refleja en el cuadro 7:
Hipótesis Decisión
Cierta Aceptar H0 Rechazar H0
H0 Correcta Error tipo I
H1 Error tipo II Correcta
87
4.4 Tipos de errores 4 PRUEBA DE HIPÓTESIS ESTADÍSTICAS
Si la hipótesis nula es falsa y se acepta la decisión es errónea, se le denomina “Error tipo II”
o de segunda especie.
Las situaciones de error, como las de acierto, son desconocidas e incontrolables de manera cierta,
sin embargo, procuraremos establecer controles sobre ellos mediante el conocimiento de las proba-
bilidades de cometer los mencionados errores, se analizará para hipótesis simples (para hipótesis
compuestas son bastante similares).
La probabilidad de cometer el “Error tipo I” (rechazar la hipótesis nula siendo verdadera) se llama
nivel de significancia del contraste o tamaño de la región crı́tica o del contraste, y se designa por
la letra griega α.
La probabilidad de cometer el “Error tipo II” no tiene nombre particular y se representa por la
letra griega β, suele ser más fácil trabajar con 1 − β a la que se le denomina potencia del contraste
y es la probabilidad de rechazar la hipótesis nula siendo falsa.
α = P (Error tipo I)
= P (Rechazar H0 / H0 es cierta)
= P (Aceptar H0 / H0 es falsa)
= P (Rechazar H0 / H0 es falsa)
EJEMPLO 4.3
En una población N (µ; 22 ) tenemos la hipótesis nula H0 : [µ = 1] y la alternativa H1 : [µ = 4]. Se
toma una muestra aleatoria de tamaño uno y se considera como región crı́tica el intervalo [2, ∞),
es decir, si el valor muestral es igual o superior a 2 se rechaza H0 , en caso contrario se acepta.
La probabilidad del Error tipo I, nivel de significancia, es la probabilidad de que el valor muestral
pertenezca a la región crı́tica, [2, ∞) cuando es cierta la hipótesis nula H0 : [µ = 1]. En estas
88
4.5 Metodologı́a de un contraste de hip
4 PRUEBA
ótesis DE HIPÓTESIS ESTADÍSTICAS
condiciones no tenemos más que encontrar en una distribución N (1 : 22 ) la probabilidad del suceso
{X ≥ 2}.
α = P (Error tipo I)
= P X ≥ 2/N (1; 22 )
X −1 2−1
= P ≥
2 2
= P (Z ≥ 0.5)
= 0.3085
Con lo cual comprobamos que, efectivamente, aunque no sepamos si la elección ha sido acertada o
no, disponemos de un criterio razonable de información.
La probabilidad de aceptar la hipótesis nula siendo falsa, es decir, aceptar H0 será porque el valor
muestral no pertenece a la región crı́tica y si al intervalo complementario (−∞, 2), siendo cierta la
hipótesis alternativa N (4 : 22 )
= 0.1587
Dado el desconocimiento que el experimentador tiene sobre qué hipótesis es la correcta no sabrá
en cuál de las cuatro situaciones descritas se encuentra, dos correctas y dos incorrectas. Para
protegerse, el experimentador debe asegurarse que la probabilidad de comenter un error sea mı́nima,
siendo la situación ideal fijar el nivel de significancia lo menor posible (se plantea la probabilidad
de un suceso raro) y simultáneamente hacer la potencia lo mayor posible (probabilidad de acierto).
Estas dos probabilidades no son independientes.
89
4.5 Metodologı́a de un contraste de hip
4 PRUEBA
ótesis DE HIPÓTESIS ESTADÍSTICAS
acusado es inocente o culpable. En un juicio, la hipótesis nula que es la que tratamos de mantener
a no ser que los datos nos indiquen claramente lo contrario, es que el acusado es inocente. El
juicio consiste en aportar evidencia suficiente para rechazar la hipótesis nula de inocencia más
allá de cualquier duda razonable. Análogamente, en un contraste de hipótesis se analiza si los
datos muestrales permiten rechazar la hipótesis nula, es decir, si los datos observados tienen una
probabilidad de aparecer lo suficientemente pequeña cuando la hipótesis nula es cierta.
Si la hipótesis nula especı́fica el parámetro de la distribución de una variable en una población,
el contraste consiste en tomar una muestra aleatoria y calcular un estimador del parámetro. Si el
estimador está “próximo” al valor del parámetro indicado por H0 concluiremos que la hipótesis ha
predicho lo observado, y que no existe evidencia para rechazarla. Si, por el contrario, la diferencia
entre ambos es grande, concluiremos que hay una discrepancia significativa entre lo previsto por
la hipótesis y lo observado, y rechazaremos H0 .
En sı́ntesis, las etapas de un contraste son:
2. Definir una medida de discrepancia entre los datos muestrales y la hipótesis H0 , que no
dependa de las unidades de medida de los datos.
3. Calcular que discrepancias son esperables si H0 es cierta. Para ello se estudia la distribución
de la medida de discrepancia cuando H0 es cierta. En muchos casos la distribución es una
variable normal estándar bajo H0 (o alguna de sus derivadas).
4. Fijar el mı́nimo p-valor admisible para no rechazar H0 . A este valor se le denomina nivel
de significancia. Al fijar esta cantidad queda definida una región de rechazo o región crı́tica,
que es el conjunto de valores de la discrepancia para los que se rechaza H0 . El nivel de
significancia es la probabilidad de la región de rechazo cuando H0 es cierta.
90
4.6 Prueba de hipótesis en una poblaci4ón
PRUEBA DE HIPÓTESIS ESTADÍSTICAS
Para realizar un contraste de hipótesis se define normalmente una medida de discrepancia entre
los datos muestrales y la hipótesis nula H0 . Intuitivamente la discrepancia debe depender de la
diferencia entre el valor del parámetro especificado por H0 y el valor del estimador calculado en la
muestra. Para obtener una medida de discrepancia que no dependa de las unidades de medida de la
variable podemos dividir esta diferencia por su valor promedio, que es el error tı́pico de estimación
del parámetro,
estimador − parámetro
discrepancia = (37)
error tı́pico de estimación
Note que la ecuación (37) representa el error relativo en la estimación.
El concepto de nivel crı́tico o p-valor proporciona una filosofı́a para la resolución de un contraste
de hipótesis.
Definición 4.2. Consideremos un estadı́stico de contraste D y sea dˆ el valor observado para una
muestra determinada X1 , X2 , . . . , Xn , es decir, X̂ = D(X1 , X2 , . . . , Xn ).
Se denomina nivel crı́tico o p-valor a la probabilidad de obtener una discrepancia mayor o igual
que dˆ cuando H0 es cierta.
En la definición anterior, la expresión mayor o igual debe interpretarse en relación con el dis-
tanciamiento de H0 en la dirección de H1 . De este modo, si el contraste es unilateral derecho,
ˆ 0
(izquierdo) el p-valor es P D ≥ d/H P D ≤ d/Hˆ 0 , y el caso de pruebas bilaterales es,
ˆ 0 ), P (D ≥ d/H
2 mı́n{P (D ≤ d/H ˆ 0 )}.
Para efectuar el contraste de hipótesis sobre la media poblacional de una distribución normal
distinguimos, en primer lugar, dos casos: Población con varianza conocida y Población con varianza
desconocida. La hipótesis nula será simple H0 : [µ = µ0 ], mientras que la alternativa será simple
H1 : [µ 6= µ0 ] o cumpuesta H0 : [µ < µ0 ] o H0 : [µ > µ0 ].
Los contraste se efectúan tomando muestras aleatorias (X1 , X2 , . . . , Xn ) de tamaño n, de una
población N (µ; σ 2 ).
1. Varianza conocida.
91
4.6 Prueba de hipótesis en una poblaci4ón
PRUEBA DE HIPÓTESIS ESTADÍSTICAS
H0 : µ = µ0
H1 : µ 6= µ0
En (38) en lugar de construir el intervalo de confianza para µ, lo construimos para X̄, resultará
que el intervalo es:
σ σ
X̄ ∈ µ0 − √ Z α2 , µ0 + √ Z α2
n n
Donde Z α2 es el valor de la distribución normal estándar que deja por encima un área igual
a α2 .
En este caso:
Con lo que rechazamos la hipótesis nula, cuando X̄ se encuentre en la región crı́tica, en caso
contrario se acepta.
X̄ − µ0
Z0 = σ (39)
√
n
92
4.6 Prueba de hipótesis en una poblaci4ón
PRUEBA DE HIPÓTESIS ESTADÍSTICAS
Con lo que rechazaremos la hipótesis nula cuando Z0 (dada en la ecuación 39) se encuentre
en la región crı́tica, en caso contrario se acepta.
Otra forma de contrastar una hipótesis referida a la media poblacional es con ayuda del
p-valor, recuerdese que:
X̄ − µ0
Z0 = σ ∼ N (0; 1)
√
n
por lo que valores grandes (en valor absoluto) nos llevarán al rechazo de H0 , es decir, dema-
siadia discrepancia entre H0 y X̄ (entre lo observado y lo esperado por la hipótesis nula), la
cual se define por:
X̄ − µ
0
P − valor = 2P Z ≥ σ = 2P (Z ≥ |Z0 |)
√
n
También es posible que lo que se desee es contrastar cualquiera de las siguientes tipos de
hipótesis:
H1 : µ > µ0
H1 : µ < µ0
La única diferencia con la prueba bilateral radica en que, ahora uno de los extremos del
intervalo queda abierto dependiendo del tipo de prueba que se esté considerando B) o C).
93
4.6 Prueba de hipótesis en una poblaci4ón
PRUEBA DE HIPÓTESIS ESTADÍSTICAS
Obteniendo nuevamente los intervalos de confianza para X̄, tendremos que las regiones
crı́ticas son:
Caso B)
σ
µ0 + √ Zα , ∞
n
Caso C)
σ
−∞, µ0 − √ Zα
n
Con lo que el criterio de aceptación o de rechazo para H0 se basa en la región crı́tica; si X̄
se encuentra en la región crı́tica rechazamos H0 , aceptamos en caso contrario.
Caso B)
(Zα , ∞)
Caso C)
(−∞, −Zα )
Caso B)
p − valor = P (Z > Z0 )
Caso C)
p − valor = P (Z < Z0 )
2. Varianza desconocida.
94
4.6 Prueba de hipótesis en una poblaci4ón
PRUEBA DE HIPÓTESIS ESTADÍSTICAS
A) H0 : µ = µ0
H1 : µ 6= µ0
B) H0 : µ ≤ µ0
H1 : µ > µ0
C) H0 : µ ≥ µ0
H1 : µ < µ0
Con lo que se realiza un procedimiento similar al caso anterior pero sustituyendo σ por Sn−1
y N (0; 1) por tn−1 (cuasidesviación tı́pica).
Basados en los resultados obtenidos para los intervalos de confianza cuando se desconoce
la varianza poblacional y el de los contraste de hipótesis cuando la varianza es conocida,
tendremos que las regiones crı́ticas para X̄ son:
Caso A) [
Sn−1 α2 Sn−1 α2
−∞, µ0 − √ tn−1 µ0 + √ tn−1 , ∞
n n
Caso B)
Sn−1 α
µ0 + √ tn−1 , ∞
n
Caso C)
Sn−1
−∞, µ0 − √ tαn−1
n
Donde tαn−1 el valor de la distribución t de Student con n − 1 grados de liberta que deja por
encima de el una área igual a α.
95
4.6 Prueba de hipótesis en una poblaci4ón
PRUEBA DE HIPÓTESIS ESTADÍSTICAS
Con lo que rechazaremos H0 cuando X̄ se encuentre en la región crı́tica; en caso contrario se acepta.
De manera equivalente podemos calcular el estadı́stico de prueba,
X̄ − µ0
T0 = (40)
Sn−1
√
n
Con lo que las regiones crı́ticas para T0 (dadas en 40) se convierten en:
Caso A)
α [ α
−∞, −tn−12
tn−1 , ∞
2
Caso B)
tαn−1 , ∞
Caso C)
−∞, −tαn−1
Caso A)
p − valor = 2P (tn−1 > |T0 |)
Caso B)
p − valor = P (tn−1 > T0 )
Caso C)
p − valor = P (tn−1 < T0 )
96
4.6 Prueba de hipótesis en una poblaci4ón
PRUEBA DE HIPÓTESIS ESTADÍSTICAS
Lo cual nos permitirá construir las regiones crı́ticas bilaterales y unilaterales, para el siguiente
conjunto de hipótesis;
A) H0 : p = p0
H1 : p 6= p0
B) H0 : p ≤ p0
H1 : p > p0
C) H0 : p ≥ p0
H1 : p < p0
Caso A) " r ! r #
p0 (1 − p0 ) [ p0 (1 − p0 )
0; p0 − Z α2 p0 + Z α2 ;1
n n
Caso B) r #
p0 (1 − p0 )
p0 + Zα ;1
n
Caso C) " r !
p0 (1 − p0 )
0; p0 − Zα
n
p̂ − p0
Z0 = r (41)
p0 (1 − p0 )
n
De este modo las regiones crı́ticas para Z0 (definidas en 41) son:
Caso A)
[
−∞, p0 − Z α2 Z α2 , ∞
Caso B)
(Zα , ∞)
97
4.6 Prueba de hipótesis en una poblaci4ón
PRUEBA DE HIPÓTESIS ESTADÍSTICAS
Caso C)
(−∞, Zα )
Y del mismo modo, podemos calcular el p-valor en cada uno de los tipos de hipótesis.
Caso A)
p − valor = 2P (Z > |Z0 |)
Caso B)
p − valor = P (Z > Z0 )
Caso C)
p − valor = P (Z < Z0 )
Partimos nuevamente que X ∼ N (µ; σ 2 ), en este caso σ 2 es desconocida. Las hipótesis que nos
interesan contrastar son las siguientes:
A) H0 : σ 2 = σ02
H1 : σ 2 6= σ02
B) H0 : σ 2 ≤ σ02
H1 : σ 2 > σ02
C) H0 : σ 2 ≥ σ02
H1 : σ 2 < σ02
98
4.6 Prueba de hipótesis en una poblaci4ón
PRUEBA DE HIPÓTESIS ESTADÍSTICAS
Caso A)
χ21− α χ2α
" ! #
[
0, σ02 2
σ02 2
,∞
n−1 n−1
Caso B)
χ2α
!
σ02 2
,∞
n−1
Caso C)
χ21− α
" !
0, σ02 2
n−1
donde χ2α el valor de la distribución Chi-cuadrado (para n − 1 grados de libertad) que deja
por encima de el un área igual a α.
Caso A)
h [
0, χ21− α χ2α , ∞
2 2
Caso B)
χ2α , ∞
2
Caso C)
h
0, χ21− α
2
Por otra parte el p-valor en cada uno de los tres tipos de prueba es:
Caso A)
p − valor = 2 mı́n{P χ2n−1 > χ20 , P χ2n−1 < χ20 }
Caso B)
p − valor = P χ2n−1 > χ20
Caso C)
p − valor = P χ2n−1 < χ20
99
4.7 Prueba de hipótesis en dos poblaciones
4 PRUEBA DE HIPÓTESIS ESTADÍSTICAS
Sean X ∼ N (µ1 ; σ12 ) e Y ∼ N (µ2 ; σ22 ) dos poblaciones normales de las cuales extraemos dos
muestreas aleatorias independientes entre si.
Sea X1 , X2 , . . . , Xn1 , una muestra aleatoria de tamaño n1 de la población X, entonces;
σ12
X̄ ∼ N µ1 ;
n1
σ12 σ22
X̄ − Ȳ ∼ N µ1 − µ2 ; + (43)
n1 n2
A paritr de estas dos muestras, interesa contrastar la hipótesis nula de igualdad de medias. Dis-
tinguimos al igual que en los intervalos de confianza tres casos:
1. Varianzas conocidas.
A)H0 : µ1 = µ2 o H0 : µ1 − µ2 = 0
H1 : µ1 6= µ2 H1 : µ1 − µ2 6= 0
B)H0 : µ1 ≤ µ2 o H0 : µ1 − µ2 ≤ 0
H1 : µ1 > µ2 H1 : µ1 − µ2 > 0
C)H0 : µ1 ≥ µ2 o H0 : µ1 − µ2 ≥ 0
H1 : µ1 < µ2 H1 : µ1 − µ2 < 0
100
4.7 Prueba de hipótesis en dos poblaciones
4 PRUEBA DE HIPÓTESIS ESTADÍSTICAS
X̄ − Ȳ
Z0 = q 2 ∼ N (0; 1)
σ1 σ22
n1
+ n2
Se verifica que las regiones crı́ticas para X̄ − X̄ en cada uno de los tres tipos de hipótesis
son:
Caso A)
s s
−∞, −Z α σ12 σ22 [ σ12 σ22
+ Z α2 + , ∞
2
n1 n2 n1 n2
Caso B)
s
σ12 σ22
Zα + , ∞
n1 n2
Caso C)
s
−∞, −Zα σ12 σ22
+
n1 n2
Alternativamente, podemos definir las regiones crı́ticas con ayuda del estadı́stico de contraste,
X̄ − Ȳ
Z0 = q 2 (44)
σ1 σ22
n1
+ n2
Se verifica entonces que las regiones crı́ticas para Z0 (dado en la ecuación 44) son:
Caso A)
[
−∞, −Z α2 Z α2 , ∞
Caso B)
(Zα , ∞)
Caso C)
(−∞, −Zα )
101
4.7 Prueba de hipótesis en dos poblaciones
4 PRUEBA DE HIPÓTESIS ESTADÍSTICAS
Caso A)
p − valor = 2 (Z > |Z0 |)
Caso B)
p − valor = 2 (Z > Z0 )
Caso C)
p − valor = (Z < Z0 )
Las hipótesis de independencia y normalidad de las muestras garantiza que la variable alea-
toria,
X̄ − Ȳ
T0 = q ∼ tn1 +n2 −2
Sp n11 + 1
n2
con
(n1 − 1)Sn21 −1 + (n2 − 1)Sn22 −1
Sp2 =
n1 + n2 − 2
(una estimación insesgada de la varianza poblacional común en ambas poblaciones).
De este modo las regiones crı́ticas en cada uno de los tipo de hipótesis para X̄ − Ȳ son:
Caso A)
r r
α 1 1 [ α 1 1
−∞, −Sp tn1 +n2 −2
2
+ Sp tn1 +n2 −2
2
+ ,∞
n1 n2 n1 n2
Caso B) r
α 1 1
Sp tn1 +n2 −2 + ,∞
n1 n2
Caso C) r
1 1
−∞, −Sp tαn1 +n2 −2 +
n1 n2
Con lo que las regiones crı́ticas para T0 (dada en 45) en cada uno de los tipos de hipótesis
son:
102
4.7 Prueba de hipótesis en dos poblaciones
4 PRUEBA DE HIPÓTESIS ESTADÍSTICAS
Caso A)
α [ α
−∞, −t 2
n1 +n2 −2 t
2
n1 +n2 −2 ,∞
Caso B)
tαn1 +n2 −2 , ∞
Caso C)
∞, −tαn1 +n2 −2
Finalmente también podemos tomar nuestra decisión con ayuda del p-valor, el cálculo para
cada una de los tipos de hipótesis (haciendo g = n1 + n2 − 2)es:
Caso A)
p − valor = 2P (tg > |T0 |)
Caso B)
p − valor = P (tg < T0 )
Caso C)
p − valor = P (tg > T0 )
Entre las muchas soluciones aproximadas, una de las más habituales y más ampliamente
usadas es considerar la variable aleatoria,
X̄ − Ȳ
T0 = s ∼ tv
Sn21 −1 Sn2−1
2
+
n1 n2
103
4.7 Prueba de hipótesis en dos poblaciones
4 PRUEBA DE HIPÓTESIS ESTADÍSTICAS
3. Mientras que la otra alternativa es usar los grados de libertad a partir de la ecuación
(30).
Las regiones crı́ticas, serán similares al caso anterior, la diferencia radicará únicamente en
los grados de libertad asociados a la distribución t de Student (dependiendo de la solución
que se esté utilizando). El cálculo del p-valor, también es similar con la misma observación
q 2
Sn −1 S2
hecha sobre los grados de libertad, y además utilizando 1
n1
+ n2−1
n2
en lugar de Sp .
Este caso es similar al caso en que se conocen las varianzas; pues de lo visto previamente re-
sulta que si definimos la variable Z como en la ecuación (32), la variable Z ∼ N (0; 1). De este
modo las regiones crı́ticas pueden encontrarse de manera similar reemplazando únicamente
q 2 2
q 2
Sn −1 Sn2−1 σ1 σ2
1
n1
+ n2
por n1
+ n22 ; el cálculo del p-valor se obtiene de manera similar.
Las hipótesis a contrastar son siempre las mismas a las del apartado anteriror,
A)H0 : µ1 = µ2 o H0 : µ1 − µ2 = 0
H1 : µ1 6= µ2 H1 : µ1 − µ2 6= 0
B)H0 : µ1 ≤ µ2 o H0 : µ1 − µ2 ≤ 0
H1 : µ1 > µ2 H1 : µ1 − µ2 > 0
C)H0 : µ1 ≥ µ2 o H0 : µ1 − µ2 ≥ 0
H1 : µ1 < µ2 H1 : µ1 − µ2 < 0
No se puede abordar el problema como se hizó antes pues claramente cov(X̄; Ȳ ) 6= 0. Tal y como
se indicó en el apartado de intervalos de confianza en muestras pareadas, la solución consiste en
104
4.7 Prueba de hipótesis en dos poblaciones
4 PRUEBA DE HIPÓTESIS ESTADÍSTICAS
A)H0 : µD = 0
H1 : µD 6= 0
B)H0 : µD ≤ 0
H1 : µD > 0
C)H0 : µD ≥ 0
H1 : µD < 0
y determinamos la región de confianza para esta nueva variable, se determina que las regiones
crı́ticas para D̄ en cada uno de las tipos de hipótesis son:
Caso A)
α SD [ α2 SD
−∞, −tn−1 √
2
tn−1 √ , ∞
n n
Caso B)
α SD
tn−1 √ , ∞
n
Caso C)
SD
∞, −tαn−1 √
n
donde
n n
2 1 X 1X
SD = (Di − D̄) D̄ = Di
n − 1 i=1 n i=1
Alternativamente podemos encontrar las regiones crı́ticas con ayuda del estadı́stico de contraste:
D̄
T0 = (46)
S
√D
n
Caso A)
α [ α
−∞, −tn−1
2
tn−1
2
,∞
105
4.7 Prueba de hipótesis en dos poblaciones
4 PRUEBA DE HIPÓTESIS ESTADÍSTICAS
Caso B)
tαn−1 , ∞
Caso C)
∞, −tαn−1
Caso A)
p − valor = 2P (tn−1 > |T0 |)
Caso B)
p − valor = P (tn−1 > T0 )
Caso C)
p − valor = P (tn−1 < T0 )
A)H0 : p1 = p2 o H0 : p1 − p2 = 0
H1 : p1 6= p2 H1 : p1 − p2 6= 0
B)H0 : p1 ≤ p2 o H0 : p1 − p2 ≤ 0
H1 : p1 > p2 H1 : p1 − p2 > 0
C)H0 : p1 ≥ p2 o H0 : p1 − p2 ≥ 0
H1 : p1 < p2 H1 : p1 − p2 < 0
106
4.7 Prueba de hipótesis en dos poblaciones
4 PRUEBA DE HIPÓTESIS ESTADÍSTICAS
Por el Teorema del Lı́mite Central y por los resultados obtenidos en el apartado de intervalos de
confianza se tiene que:
p1 (1 − p1 )
Π1 ∼ N p1 ;
n1
p2 (1 − p2 )
Π2 ∼ N p2 ;
n2
p1 (1 − p1 ) p2 (1 − p2 )
Π1 − Π2 ∼ N p1 − p 2 ; +
n1 n2
Π1 − Π2
s ∼ N (0; 1)
1 1
p(1 − p) +
n1 n2
n1 n2
p̂ = p̂1 + p̂2
n1 + n2 n1 + n2
Π1 − Π2
Z0 = s ∼ N (0; 1)
1 1
p̂(1 − p̂) +
n1 n2
Las regiones crı́ticas (para p1 - p2 ) en cada uno de los tipos de hipótesis son:
Caso A)
s ! [ s !
1 1 1 1
−∞, −Z α2 p̂(1 − p̂) + Z α2 p̂(1 − p̂) + ,∞
n1 n2 n1 n2
Caso B) s !
1 1
Zα p̂(1 − p̂) + ,∞
n1 n2
Caso C) s !
1 1
−∞, −Zα p̂(1 − p̂) +
n1 n2
107
4.7 Prueba de hipótesis en dos poblaciones
4 PRUEBA DE HIPÓTESIS ESTADÍSTICAS
p̂1 − p̂2
Z0 = s (47)
1 1
p̂(1 − p̂) +
n1 n2
Caso A)
[
−∞, −Z α2 Z α2 , ∞
Caso B)
(Zα , ∞)
Caso C)
(−∞, −Zα )
Caso A)
p − valor = 2P (Z > |Z0 |)
Caso B)
p − valor = P (Z > Z0 )
Caso C)
p − valor = P (Z < Z0 )
Sean X1 , X2 , . . . , Xn1 e Y1 , Y2 , . . . , Yn2 dos muestras aleatorias obtenidas de dos poblaciones nor-
males e independientes X ∼ N (µ1 ; σ12 ) e Y ∼ N (µ2 ; σ22 ), repectivamente.
A partir de la información proporcionada por ambas muestras se desea contrastar la hipótesis de
igualdad de varianzas:
H0 : σ12 = σ22
H1 : σ12 6= σ22
108
4.8 Problemas propuestos 4 PRUEBA DE HIPÓTESIS ESTADÍSTICAS
Nos concentraremos únicamente en un caso, pues como ya se sabe la comparación de medias se basa
únicamente en si las varianzas son iguales o distintas, por lo que en un primer paso se deberı́a de
realizar este contraste, a menos que tengamos información sobre la varianza de ambas poblaciones.
Bajo el supuesto normalidad e independencia de las muestras, se tiene:
(n1 − 1)Sn21 −1
∼ χ2n1 −1
σ12
(n2 − 1)Sn22 −1
∼ χ2n2 −1
σ22
Bajo el supuesto de que H0 es cierta, se tendrá, según la ecuación (35) que la variable aleatoria:
Sn21 −1
F0 = ∼ Fn1 −1,n2 −1 (48)
Sn22 −1
α
1− α
Sean Fn21 −1,n2 −1 y Fn1 −1,n
2
2 −1
los descritos en (36). De este modo la región crı́tica para el conciente
2
Sn
1 −1
F0 = 2
Sn
es
2 −1
α
1− α
h [
0, Fn21 −1,n2 −1 Fn1 −1,n
2
2 −1
, ∞
Con lo que rechazaremos la hipótesis nula de igualdad de varianzas siempre y cuando el valor de F0
calculado en la ecuación (48) se encuentre en la región de aceptación; en caso contrario se aceptará.
Mientras que el p-valor es:
1. A partir de una muestra aleatoria de tamaño 36 extraı́da de una población normal con
desviación tı́pica 5 se desea realizar el siguiente contraste:
H0 : µ = 14
H1 : µ = 17
109
4.8 Problemas propuestos 4 PRUEBA DE HIPÓTESIS ESTADÍSTICAS
si X̄ ≤ 15; no se rechaza H0
2. Tenemos una población N (µ; 1). Sobre el parámetro µ se establecen dos hipótesis: la hipótesis
nula establece que µ = 1, mientras que la alternativa que µ = 2. La región crı́tica es el
intervalo [2.282, ∞). El contraste se efectúa mediante una muestra aleatoria de tamaño 1.
Determine el nivel de significación y la potencia del contraste.
3. Para una muestra aleatoria de tamaño 16 de una población N (µ; 1) con µ ∈ {0, 1} se utiliza
la región crı́tica RC = {X̄ > k} para contrastar
H0 : µ=0
H1 : µ=1
Se pide:
4. Por estadı́sticas que se tienen, se ha podido establecer que más del 40 % de los jóvenes toman
regularmente Coca-Cola, cuando tienen sed. Una muestra aleatoria de 450 jóvenes reveló que
162 de ellos solı́an tomar dicha bebida cuando tenı́an sed.
a) ¿Cuál podrı́a ser su conclusión al nivel del 1 % de significancia acerca de lo que muestran
las estadı́sticas?
b) ¿Cuál podrı́a ser su conclusión al nivel del 5 % de significancia acerca de lo que muestran
las estadı́sticas?
110
4.8 Problemas propuestos 4 PRUEBA DE HIPÓTESIS ESTADÍSTICAS
H0 : µ = 50
H1 : µ 6= 50
8. El dueño de una fábrica sostiene que su producto tiene una vida media de 10 años. Para
comprobar tal afirmación se toma una muestra de 120 productos comprobándose que su vida
media habı́a sido de 9.6 años y su desviación tı́pica de 1.2 años
a) ¿Qué se puede decir de la afirmación del fabricante, supuesto que sus productos siguen
una distribución normal, con un nivel de confianza del 95 %?
b) ¿Cómo se verá afectada la conclusión anterior si la desviación tı́pica hubiese sido de 1.5?
9. Sea X una variable aleatoria distribuida según una N (µ; 32 ). A partir de la muestra: 6, 7, 8,
3, 5, 6, 7, 8, 9, 1, 7, 6, 3, 8, 9, 7, contraste, con un nivel de significación de 0.05, la hipótesis
de que la media real es 5.
10. Se sabe que el promedio de las calificaciones de los estudiantes en la asignatura de Estadı́stica
en los últimos dos años ha sido de 5.6. Tras tomar una muestra aleatoria de 30 estudiantes
111
4.8 Problemas propuestos 4 PRUEBA DE HIPÓTESIS ESTADÍSTICAS
del presente curso, se obtuvo un promedio de 6.4 y una desviación tı́pica de 1.25. Suponiendo
que se distribuyen normalmente, ¿se puede afirmar que los alumnos de este año obtuvieron
calificaciones por encima de lo habitual?
11. Se sabe que ciertas piezas de una máquina tienen una vida media de 1940 horas. Al variar
uno de sus componentes se observa que una muestra de 100 piezas ha dado una duración
media de 2000 horas y una desviación tı́pica de 150 horas. ¿Se puede afirmar a un nivel de
significación del 10 % que el componente modificado ha supuesto un cambio significativo en
la duración media de las piezas?
12. Se tiene que reparar una máquina en cierta fábrica si produce más del 10 % de artı́culos
defectuosos del gran lote de producción de un dı́a. Una muestra aleatoria de 100 artı́culos de
la producción contiene 15 defectuosos y el supervisor decide que debe repararse la máquina.
¿La evidencia de la muestra apoya la decisión del supervisor? Utilice un nivel de significancia
del 1 %.
13. El fabricante de un determinado aparato de medida garantiza que éste tiene una desviación
tı́pica de 0.25 unidades. Transcurrido un periodo de 9 meses, una muestra de 20 medidas
proporcionó una desviación tı́pica de 0.32 unidades. ¿Puede afirmarse con un nivel de signi-
ficación del 5 % que el aparato de medida está estropeado? ¿Y con un 1 % de significación?
14. Durante 100 años la desviación tı́pica de las temperaturas anuales máximas de una ciudad
ha sido de 16º F. Pero en los últimos 12 años se estuvo tomando la temperatura máxima los
dı́as uno de cada mes y dio una desviación tı́pica de 10º F. Supuesto que la temperatura se
distribuye normalmente, ¿se puede afirmar con un 95 % de fiabilidad que la variabilidad de
las temperaturas ha disminuido?
15. Sea X siguiendo una distribución normal N (µ; σ 2 ). Una prueba es necesaria para H0 : σ 2 =
0.04 contra H1 : σ 2 6= 0.04, basado en una muestra aleatoria de tamaño n = 13. Si S 2
observado es 0.058, ¿se rechaza H0 : σ 2 = 0.04 al nivel de significancia del 5 %?
16. Un fabricante de televisores afirma que poco menos del 20 % de sus tubos de imágenes fallan
dentro de 2 años. Se encontró en una muestra aleatoria de tamaño 100 que 18 tubos de
imágenes fallaron en 2 años. ¿Es razonable la afirmación del fabricante?
112
4.8 Problemas propuestos 4 PRUEBA DE HIPÓTESIS ESTADÍSTICAS
17. Se sabe que el porcentaje de curación espontánea de una determinada enfermedad es del
30 %. Para asegurar la eficacia de un nuevo tratamiento se selecciona aleatoriamente una
muestra de 100 enfermos y se les somete a tal tratamiento, obteniéndose que el porcentaje
de personas curadas es del 45 %. ¿Se puede afirmar la eficacia del mencionado tratamiento
con una confianza del 95 %?
18. Una agencia de empleos, critica el hecho de que el 30 % de las personas que son colocadas no
pasan la prueba de trabajo en los tres meses. Se quieren comprobar esta crı́tica y del archivo
de colocación de empleados, selecciona una muestra de 25 empleados y se encuentra que 7
no pasaron la prueba. ¿Se puede justificar esta crı́tica?
H0 : µ=6
H1 : µ=4
Hállese la región crı́tica y la potencia del contraste si el nivel de significancia es igual a 0.05
y la muestra aleatoria es de tamaño 4.
H0 : µ = −5
H1 : µ < −5
H0 : σ2 = 4
H1 : σ 2 6= 4
Tomemos para esto una muestra aleatoria de tamaño 7, cuyo resultado es: 7.1, 5.3, 4.7, 8.0,
9.9, 3.4 y 3.6.
113
4.8 Problemas propuestos 4 PRUEBA DE HIPÓTESIS ESTADÍSTICAS
22. De una población N (µ; 1), se observa una muestra de tamaño 5. Se considera el contraste de
hipótesis:
H0 : µ=1
H1 : µ=3
b) Para la muestra: 2.5, 3, 1.2, 2.1 y 3.2, ¿qué decisión debe tomarse?
23. Se sospecha que el medio de una partida de paquetes de garbanzos no llega a un kilo, tal
como se indica en el envase. Para ello se selecciona una muestra de 9 paquetes, resultando
los siguientes pesos en gramos: 1010, 989, 999, 1005, 956, 989, 992, 1025, 1050.
24. Las normas de fabricación impuestas a los fabricantes sobre la resistencia a rotura de un tipo
de hilo son µ = 300 gramos y σ = 20 gramos. Se pretende contrastar estas normas en un
nuevo proceso de fabricación con un error del 5 %, en los siguientes supuestos:
25. Contrastar la hipótesis de que el contenido medio de las latas de gasolina de una determinada
marca sea 5 litros si los contenidos de 9 recipientes son: 5.1, 4.85, 5.05, 5.15, 5.06, 4.9, 4.95, 5.2,
5.15. Elegir un nivel de significancia del 1 %. Se supone que la distribución de los contenidos
es normal.
26. En el paquete de una marca de cigarrillos se afirma que el contenido medio de nicotina no
excede los 3.5 miligramos. En una muestra de 10 cigarrillos se ha encontrado una media
de 4.1 miligramos con una desviación tı́pica de 1.3. Contrastar la hipótesis con un nivel de
significancia del 5 %.
114
4.8 Problemas propuestos 4 PRUEBA DE HIPÓTESIS ESTADÍSTICAS
27. Después de un cambio tecnológico, una industria que tiene establecida su producción media en
12000 unidades mensuales, observa su producción durante los 12 meses siguientes, obteniendo
las siguientes producciones (en miles de unidades): 12.2, 12.4, 11.6, 13.1, 10.9, 12.4, 11.3, 11.7,
12.2, 12.7, 11.9, 11.8. Contrastar a un nivel de significancia del 5 %, si el cambio tecnológico
ha afectado a la dispersión de la producción que estaba en σ = 1500 unidades por mes.
29. La duración media de una muestra de 10 bombillas es 1250 horas, con una cuasidesviación
tı́pica muestral de 115 horas. Se cambia el material del filamento por otro nuevo y, entonces,
de una muestra de 12 bombillas se obtuvo una duración media de 1340 horas, con una
cuasidesviación tı́pica de 106.
a) ¿Puede aceptarse que las varianzas, antes y después del cambio, son iguales? ¿Bajo qué
hipótesis?
2
H0 : σX = σY2
2
H1 : σX 6= σY2
H0 : µX − µY = 0
H1 : µX − µY > 0
115
4.8 Problemas propuestos 4 PRUEBA DE HIPÓTESIS ESTADÍSTICAS
2. Se cree que los supermercados en Swansea tienden a cobrar más por sus artı́culos que en
Cardiff. Un comprador en Cardiff y un comprador en Swansea acuerdan comprar artı́culos
para luego comparar precios. Las dos ciudades tiene 10 cadenas de supermercado en común,
las cuales llamaremos A, B, . . . , J, y los compradores visitarán cada una a la vez en semanas
consecutivas, se registraron los siguientes precios en libras:
Tienda A B C D E F G H I J
Swansea 12.08 12.81 12.74 13.54 14.86 14.68 12.64 15.23 13.83 12.64
Cardiff 11.62 11.69 12.57 13.32 13.15 14.04 11.76 13.63 12.95 12.59
Utilizando un nivel de confianza del 95 % enuncie cualquier hipótesis y contrástela con dichos
datos. ¿Se apoya la teorı́a que los precios en Swansea son mayores?
3. Para averiguar si difieren los niveles de una determinada sustancia quı́mica en dos grupos de
personas, se toman muestras con los siguientes resultados:
Muestra n X̄ S
Vitaminas 31 8.5 5.5
Normal 25 4.8 5.1
116
4.8 Problemas propuestos 4 PRUEBA DE HIPÓTESIS ESTADÍSTICAS
6. En una encuesta realizada a 200 habitantes de una población A, 95 personas afirmaban que
preferı́an la playa a la montaña para pasar las vacaciones. La misma encuesta realizada a
150 habitantes de otra población B, dio como resultado que 100 personas preferı́an ir a la
playa. ¿Puede pensarse que los habitantes de la población B son más aficionados a la playa
que los de la población A? Contrástese dicha hipótesis al 99 %.
7. En un estudio realizado sobre las tendencias de los fumadores se seleccionó de manera alea-
toria una muestra de 400 hombres de los cuales 190 eran fumadores y otra muestra aleatoria
de 800 mujeres, de las que fumaban 300. ¿Se puede afirmar que la proporción de fumadores
es la misma en hombres que en mujeres con una confianza del 90 %?
8. En dos ciudades se llevó a cabo una encuesta sobre el costo de la vida para obtener el gasto
semanal promedio en alimentación en familias constituidas por cuatro personas. De cada
ciudad se seleccionaron aleatoriamente una muestra de 20 familias y se observaron que en la
primera ciudad se obtuvo una media de $ 135 y una desviación tı́pica de $ 15 y en la segunda
ciudad se obtuvo una media de $ 122 y una desviación tı́pica de $ 10. Se consideran que los
datos referidos a cada población son independientes y con distribución normal.
9. Un grupo de personas participan en un estudio nutricional que trata de analizar los niveles
de Vitamina C en la sangre de fumadores y no fumadores. Los resultados, en mg/l, fueron:
Fumadores 18.3 9.3 12.6 15.7 14.2 13.1 14.3 16.2 18.1 19.4 15.5 11.7
No fumadores 24.9 16 26.3 25.5 19.3 16.8 15.7 24.6 19.9 9.4 17.4
Admitiendo que, en ambos casos, los niveles siguen distribuciones normales, contraste las
siguientes hipótesis H0 : µ1 ≥ µ2 frente a H1 : µ1 < µ2 con un nivel de significancia del 5 %.
10. Para medir la introversión se aplica a 12 individuos un test de personalidad en sus dos
variantes, 1 y 2, que se supone la miden por igual. A partir de los datos de la siguiente tabla:
Individuo 1 2 3 4 5 6 7 8 9 10 11 12
Forma I 12 18 21 10 15 27 31 6 15 13 8 10
Forma II 10 17 20 5 21 24 29 7 9 13 8 11
117
4.8 Problemas propuestos 4 PRUEBA DE HIPÓTESIS ESTADÍSTICAS
11. Para estudiar cuál de los dos tratamientos contra la artrosis es más eficaz se eligen aleato-
riamente dos muestras de 10 y 22 pacientes a los cuales se les somete a los tratamientos 1 y
2, respectivamente. Pasados tres meses se valoran ambos tratamientos de manera que el que
tenga mayor puntuación será más eficaz. La tabla siguiente refleja los resultados obtenidos.
Tratamiento 1 12 15 21 17 38 42 10 23 35 28
Tratamiento 2 21 18 42 25 14 52 65 40 43 35 18
56 29 32 44 15 68 41 37 43 58 42
Asumiendo normalidad de los datos evalué si existe diferencia entre los dos tratamientos.
12. Con el propósito de saber si debe poner neumáticos diferentes en los trenes delanteros (D) y
traseros (T) de sus vehı́culos, un fabricante ha medido el desgaste producido en 20 de ellos
después de 15000 Kms, obteniendo los siguientes resultados:
b) ¿Se puede afirmar que los neumáticos sufren el mismo desgaste en los dos trenes?
13. Una determinada empresa le propone al director de una fábrica un nuevo método que, su-
puestamente, reduce el tiempo empleado en el montaje de uno de sus productos. Con el
propósito de comparar tal método con el empleado habitualmente, seleccionó aleatoriamente
a siete de sus empleados para que llevasen a cabo el montaje con los dos sistemas y anotó
los tiempos empleados en el montaje, obteniendo los siguientes resultados:
Trabajador 1 2 3 4 5 6 7
Método habitual 38 32 41 35 42 32 45
Método nuevo 30 32 34 37 35 26 38
118
4.8 Problemas propuestos 4 PRUEBA DE HIPÓTESIS ESTADÍSTICAS
Supuesto que el tiempo de montaje sigue una distribución normal, ¿se puede afirmar que
efectivamente el nuevo método reduce el tiempo en más de dos minutos?
14. En una empresa los operarios de planta constituyen un colectivo de 528 empleados, de los
cuales 79 sufren problemas de espalda. Los administrativos, por el contrario, son 32, de los
cuáles 7 sufren problemas de espalda. ¿Se tienen evidencias de que los administrativos sufren
más problemas de espalda que los operarios de planta? (Utilı́cese un nivel de significancia
del 5 %).
15. Es un tópico que las mujeres conducen peor que los hombres. Un ingeniero mecánico que
trabaja en cuestiones relativas a seguridad vial quiere realizar una comprobación al respecto
en la población que le atañe. Concretamente, se interesa por el porcentaje de varones cau-
santes de accidentes de tráfico. En una muestra aleatoria de n accidentes, descubre que en
k de ellos fue un varón el causante. Sabiendo que el porcentaje de varones en la población
es del 49 %, ¿tiene evidencias el ingeniero que existan diferencias entre hombres y mujeres
como causantes de accidentes de tráfico? (Utilı́cese un nivel de significación del 5 %).
16. Un fabricante desea comparar la tensión promedio de su hilo con la de su más cercano
competidor. Las tensiones de 100 hilos para cada marca se observaron bajo condiciones
controladas. Las medias y desviaciones estándar de cada marca fueron las siguientes:
S1 = 10.2 S2 = 12.4
Si se supone que el muestreo se llevó a cabo sobre dos poblaciones normales e independientes,
¿existe alguna razón para creer que hay diferencia entre las tensiones promedio de ruptura
de los dos hilos? Utilice un nivel de significancia del 2 %. ¿Cuál es el p-valor?
17. Se cree que el promedio verbal para el número de respuestas correctas para la prueba SAT
para las mujeres es mayor que el de los hombres por más de diez puntos. Las muestras
aleatorias para ambos sexos arrojaron los siguientes resultados:
119
4.8 Problemas propuestos 4 PRUEBA DE HIPÓTESIS ESTADÍSTICAS
18. Se espera que dos operadores produzcan, en promedio, el mismo número de unidades ter-
minadas en el mismo tiempo. Los siguientes datos son los números de unidades terminadas
para ambos trabajadores en una semana de trabajo:
Operador 1 12 11 18 16 13
Operador 2 14 18 18 17 16
Si se supone que el número de unidades terminadas diariamente por los dos trabajadores son
variables aleatorias independientes distribuidas normales con varianzas iguales, ¿se puede
discernir alguna diferencia entre las medias a un nivel de confianza del 99 %?
19. Se llevó a cabo un estudio para determinar el grado en el cual el alcohol entorpece la habilidad
de pensamiento para llevar a cabo determinada tarea. Se seleccionaron al azar diez personas
de distintas caracterı́sticas y se les pidió que participaran en el experimento. Después de
proporcionarles la información pertinente, cada persona llevó a cabo la tarea sin nada de
alcohol en su organismo. Entonces, la tarea volvió a llevarse a cabo, después que cada persona
habı́a consumido una cantidad suficiente de alcohol para tener un contenido en su organismo
de 0.1 %.
a) Discutir los aspectos importantes del control que el experimentador debe considerar al
llevar a cabo el experimento.
b) Supóngase que los tiempos antes y después (en minutos) de los diez participantes son
los siguientes:
Participante 1 2 3 4 5 6 7 8 9 10
Antes 28 22 55 45 32 35 40 25 37 20
Después 39 45 67 61 46 58 51 34 48 30
120
4.8 Problemas propuestos 4 PRUEBA DE HIPÓTESIS ESTADÍSTICAS
¿Puede concluirse a un nivel de confianza del 95 % que el tiempo promedio antes es menor
que el tiempo promedio después por más de 10 minutos?
20. Con objeto de estudiar si las pulsaciones en los hombres pueden considerarse menores que
en las mujeres, se tomaron muestras de 16 hombres y 16 mujeres, obteniéndose los siguientes
datos:
Hombres 74 77 71 76 79 74 83 79 83 72 79 77 81 79 84 80
Mujeres 81 84 80 73 78 80 82 84 80 84 75 82 79 82 79 85
21. Queremos comparar dos métodos rápidos para estimar la concentración de una hormona en
una solución. Tenemos 10 dosis preparadas en el laboratorio y vamos a medir la concentración
de cada una con los dos métodos. Se obtienen los siguientes resultados:
Dosis 1 2 3 4 5 6 7 8 9 10
Método A 10.7 11.2 15.3 14.9 13.9 15.0 15.6 15.7 14.3 10.8
Método B 11.1 11.4 15.0 15.1 14.3 15.4 15.4 16.0 14.3 11.2
Contrastar si los dos métodos proporcionan, en media, las mismas estimaciones (tomar un
nivel de confianza del 90 %).
22. Para contrastar la hipótesis de igualdad de varianzas de las distribuciones N (µ1 ; σ12 ) y
N (µ2 ; σ22 ), con un nivel de significancia del 10 % se toman dos muestras aleatorias inde-
pendientes de tamaño 5 y 10, respectivamente. Los datos se muestran en el siguiente cuadro:
23. Se van a probar dos medicamentos A y B, contra una enfermedad. Para esto, tratamos 100
ratones enfermos con A y otros 100 con B. El número medio de horas que sobreviven con A
es 1200, y el número medio con B es 1400. Suponiendo normalidad en ambos casos se pide:
121
4.8 Problemas propuestos 4 PRUEBA DE HIPÓTESIS ESTADÍSTICAS
b) ¿Es más efectivo el medicamento B? Plantear el contraste adecuado para estudiar esto
con un nivel de confianza del 95 %.
24. Una determinada empresa desea saber si la proporción de personas que compran un deter-
minado electrodoméstico es la misma para hombres que para mujeres, y ası́ poder dirigir su
estrategia de marketing. Para ello toman 50 personas de cada sexo y preguntan si alguna
vez compraron dicho electrodoméstico, siendo afirmativa la respuesta en 10 hombres y 24
mujeres ¿conviene dividir a la población en segmentos según sexo?
25. Un total de nueve adultos se someten a una nueva dieta para adelgazar durante un periodo
de dos meses. Los pesos en kilogramos antes y después de la dieta son los siguientes:
Antes 85 93 84 87 84 79 85 78 86
Después 78 94 78 87 78 77 87 81 80
Contrastar, a un nivel de significancia del 2.5 %, que la dieta no es efectiva frente a que sı́ lo
es.
26. Se afirma que en las zonas rurales se ven más telenovelas que en las urbanas. En una muestra
de 120 televidentes de zonas rurales, 65 siguen regularmente una telenovela, mientras que
para una muestra de 250 televidentes en la zona urbana ese número es de 148. Contrastar la
hipótesis anterior a un nivel de significancia del 5 %.
27. En unos almacenes, para comparar la aceptación de dos productos, se han contabilizado las
ventas de cada uno en 10 y 8 dı́as respectivamente, con los siguientes resultados:
Producto I 9 32 14 25 30 22 19 25 33 26
Producto II 15 22 19 12 21 20 16 18
Admitiendo que las ventas siguen distribuciones normales, contrastar, a un nivel de confianza
del 5 %, la hipótesis nula de que ambos tienen la misma aceptación.
122