You are on page 1of 38

Intervalos de Confianza

Contenido

Estimacin de parmetros
Estimacin de intervalos

Intervalo de confianza para la media

Intervalo de confianza para la varianza

Otros Intervalos de Confianza

Intervalos de tolerancia

Ints. de confianza y regresin lineal

UMSNH-FIE
Estimacin de Parmetros

Parmetros poblacionales y Estadsticos Muestrales


Parmetros:
Histograma de la Poblacion
160

140 Media (m)


120

100
Varianza(s2)

Frecuencia
Datos 80

60
Desv. Est. (s)
(Poblacin de Inters) 40

20

0
Etc.
-4 -2 0 2 4
Clases

Inferencias
Muestreo Histograma de la Muestra
Estadsticos:
16

14

12 Promedio ( X )
Frecuencia

10

Muestras 8 Varianza muestral(S2)


6

4 Desv. Est. muestral(S)


2

0
-4 -2 0 2 4 Etc.
Clases

UMSNH - FIE
Estimacin de Parmetros
Ejemplo: Estimacin de la media de una poblacin

Parmetro que se pretende estimar : La media de la poblacin ( ) que en


general no se conoce, no se puede conocer, o se conoce slo un valor terico:

Estimador: La media muestral ( X ) que se calcula a partir de una muestra de


N datos como sigue:
____
1
X N
(x1 x 2 ... x N )

El estimador (en el ejemplo la media muestral) puede tomar diferentes


valores (aleatorios) dependiendo de la muestra (aleatoria) considerada, es
decir, el estimador es una variable aleatoria

Es natural preguntarse : Cul ser la distribucin de probabilidad del


estimador? De hecho cules sern sus parmetros? tendrn que ver con los
de la poblacin?
UMSNH - FIE
Estimacin de Parmetros
Ejemplo: Lanzamiento de un dado
Poblacin de inters : El conjunto de datos obtenidos al lanzar un dado legal
en diversas ocasiones
Parmetro de inters : La media () de la poblacin
____
1
Estimador: La media muestral ( X ) X N (x 1 x 2 ... x N )

Experimento aleatorio : Lanzar un dado


Variable aleatoria X= nmero obtenido en la cara superior
Espacio muestral = {1, 2 , 3, 4, 5 , 6}
Distribucin de la variable aleatoria X: Uniforme
Media terica: =3.5

UMSNH - FIE
Estimacin de Parmetros
Ejemplo: Lanzamiento de un dado
Distribucin de la variable aleatoria (X) del experimento
Funcin de Probabilidad: f(x) = P(X=x)

x 1 2 3 4 5 6
f(x) 1/6 1/6 1/6 1/6 1/6 1/6
Funcin de Probabilidad
0.2

0.15
f(x)

0.1

m
0.05

0
1 2 3 4 5 6
x

UMSNH - FIE
Estimacin de Parmetros
Ejemplo: Lanzamiento de un dado

Distribucin del estadstico X .

Diferentes clculos de X para N=10:


Muestra x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 X
1 1 3 5 1 1 2 2 4 2 2 2.1
2 1 5 3 6 3 3 6 4 2 5 3.8
3 6 1 5 3 5 4 5 3 2 2 3.2
4 2 5 2 4 1 5 3 6 6 4 3.8
5 3 6 5 4 5 4 3 2 3 4 3.7
... ...
Cada muestra puede considerarse como:
10 valores de la variable aleatoria X,
1 slo valor para 10 variables aleatorias X1,X2,...,X10
UMSNH - FIE
Estimacin de Parmetros
Ejemplo: Lanzamiento de un dado

Distribucin del estadstico X .

Si obtenemos 1000 muestras, obtendremos 1000 valores de X , para


estos 1000 valores realizamos el histograma:
Distribucin de la media muestral
0.25

0.2
frecuencia relativa

0.15

0.1

0.05

0
1 2 3 4 5 6
X
UMSNH - FIE
Estimacin de Parmetros
Ejemplo: Lanzamiento de un dado

Cdigo en Matlab:
%se simula el dado
x=round(rand(N,n)*6+0.5);
M=sum(x)/N;
[X,c]=hist(M,15);
%se grafica el histograma de frecuencia relativa en p.u.
X=X/n;
bar(c,X)

Recordatorio: Cada muestra puede considerarse como:


10 valores de la variable aleatoria X,
1 slo valor para 10 variables aleatorias X1,X2,...,X10
UMSNH - FIE
Estimacin de Parmetros

^ que pretende estimar un parmetro


En general: un estadstico Q
q es una v. a. Que depende de las N variables aleatorias que
forman una muestra, es decir
^
Q = f(X1,X2,...,XN)

As, una muestra es un conjunto de valores (x1,x2,...,xN) tomados


por las variables aleatorias (X1,X2,...,XN).

Es natural suponer que la distribucin f(Xi)=P(Xi=xi) de cada


variable de la muestra es igual a la de la poblacin

Sin embargo, la distribucin f( ^ ^ ^


q) = P( Q = q ) del estadstico
como se vi en el ejemplo del dado es otra cosa.
UMSNH - FIE
Estimacin de Intervalos

^ produce un valor ^
En la explicacin previa, un estimador Q q
que pretende aproximar a un parmetro q. A este enfoque se le
llama estimacin puntual

En el enfoque de estimacin de intervalos, para un parmetro q


no se estima un valor, sino un intervalo de la forma l q u,
donde los valores extremos l, u dependen del valor numrico del
estadstico ^
q para una muestra en particular y de la distribucin
de muestreo de Q ^

Es decir, l,u dependen de la muestra, por lo tanto son valores de


variables aleatorias L, U

UMSNH - FIE
Estimacin de Intervalos

^ , es posible
Partiendo de la distribucin de muestreo para Q
determinar valores de L,U tales que se cumpla lo siguiente:
P(L q U) =1 a
Donde 0 < a < 1

Es decir, se puede garantizar con una probabilidad de 1-a que


la muestra elegida contendr el valor verdadero de q

Al intervalo resultante l q u se le conoce como el intervalo


de confianza del 100(1 a) % para el parmetro desconocido q

UMSNH - FIE
Estimacin de Intervalos

Ejemplo: Construccin repetida de un intervalo de confianza


para la media m:
m

Si los intervalos de confianza mostrados son del 95% significa


que si se construye un gran nmero de ellos, el 95% de ellos
contendr a la media UMSNH - FIE
Estimacin de Intervalos

En la prctica se obtiene solamente una muestra y se calcula con


ella un intervalo de confianza dicho intervalo contiene o no
contiene a m, no es razonable asignar una probabilidad a este
evento.

La proposicin a decuada es que el intervalo contiene a m con


una confianza del 95%

La longitud del intervalo de confianza (u-l) es una medida de la


calidad de la informacin obtenida en la muestra, al semi
intervalo u-q, o q-l se le llama Precisin del estimador.

Qu significado tiene un intervalo grande?


s deseable que sea grande o que sea pequeo?
Qu relacin tiene con el valor de 1-a?
UMSNH - FIE
Estimacin de Intervalos
Intervalo para la Media (Varianza conocida)

Situacin: Se tiene una poblacin con media desconocida m, pero


se supone conocida la varianza s2.

Se toma una muestra aleatoria (X1,X2,...,XN). Con esta muestra


se calcula el estadstico X el cual es un estimador puntual
insesgado para la media m desconocida. Se puede obtener un
intervalo de confianza del 100(1-a) % para m si consideramos
los siguientes hechos acerca de la distribucin de X :

UMSNH - FIE
Intervalo para la media
Intervalo para la Media (Varianza conocida)
1. Si la poblacin es Normal, la distribucin de X es Normal

2. Si la poblacin no es Normal, el Teorema del lmite central nos


garantiza una distribucin de X aproximadamente normal
cuando N

3. La media de X es m ( X es insesgado)

4. La varianza de X es s2/N

Teorema del Lmite Central:


Afirma que la media muestral tiene una distribucin Normal
aunque la poblacin original no la tenga, siempre y cuando la
muestra sea muy grande (de manera prctica N>30)

UMSNH - FIE
Intervalo para la media
Intervalo para la Media (Varianza conocida)
De acuerdo a lo anterior, podemos suponer que la variable
___

Z X
/ N
Tiene una distribucin N(0,1)

a/2 a/2

-za/2 za/2 Z

de la figura: P{-za/2 Z za/2 }=1-a.


Con lo cual el intervalo de confianza del 100(1-a)% para la media es
__ __

xz / N x z /2/ N
/2
UMSNH - FIE
Intervalo para la media
Intervalo para la Media (Varianza conocida)
Ejemplo: Los siguientes son datos de conductividad trmica de cierto tipo de
hierro (en BTU/hr-ft-F):
41.60 41.48 42.34 41.95 41.86
42.18 41.72 42.26 41.81 42.04
Una estimacin puntual para la media, es X = 41.924. Hallar un intervalo de
confianza del 95 % y uno del 99% para la media.
Se supone que la poblacin tiene una distribucin Normal con s=0.3
__ __

Usamos la expresin x z / N x z / N para encontrar el


/2 /2

intervalo de confianza para la media: Usando Matlab para calcular za/2 =


norminv(0.025,0,1)
l = 41.924 - 1.96(0.3)/10 = 41.738, u = 41.924+1.96(0.3)/10 = 42.110
Entonces el intervalo de confianza del 95% es
41.738 m 42.11
Y la longitud de este intervalo es 3.92s/ N
UMSNH - FIE
Intervalo para la media
Intervalo para la Media (Varianza conocida)
Seleccin del tamao de la muestra:
La precisin del intervalo de confianza es za/2s/N esto significa
que al usar X para estimar m, el error de estimacin, dado por
E=| X - m| es menor o igual que za/2s/N, con una confianza de
100(1-a)%.

El problema inverso consiste en calcular N para obtener un error


E con una confianza del 100(1-a)% previamente especificado:
N1/2= za/2s/E

Ejercicio: Calcular el tamao adecuado de la muestra para lograr


que el error de estimacin de conductividad del hierro sea menor
de 0.05 Btu/hr-ft-F con una confianza del 95%

UMSNH - FIE
Intervalo para la media
Intervalo para la Media (Varianza desconocida)
Si no se conoce la varianza s2 de la poblacin, una posibilidad es
utilizar la varianza muestral S2 en las ecuaciones obtenidas para
estimar intervalos en el caso de varianza conocida

Este procedimiento funciona para muestras grandes (N>30), por


ello los intervalos de confianza anteriores se les suele llamar
intervalos de confianza para muestras grandes.

Si las muestras son pequeas el enfoque anterior no funciona y


para lograr un procedimiento vlido se supondr que la poblacin
tiene una distribucin Normal

UMSNH - FIE
Intervalo para la media
Intervalo para la Media (Varianza desconocida)
Si la poblacin es Normal, la siguiente estadstica
X
T= S/ N
Tiene una distribucin t con N-1 grados de libertad

a/2 a/2

-ta/2,N-1 ta/2,N-1 T

UMSNH - FIE
Intervalo para la media
Intervalo para la Media (Varianza desconocida)

X a/2 a/2
T= S/ N

-ta/2,N-1 ta/2,N-1 T

de la figura: P{-ta/2,N-1 T ta/2,N-1 }=1-a. Con lo cual el


intervalo de confianza del 100(1-a)% para la media es
x t /2,N1 s/ N x t /2,N1 s/ N

Ejercicio: Repetir el ejemplo de la conductividad del hierro


suponiendo que no se conoce la varianza

UMSNH - FIE
Intervalo para la Varianza
Intervalo para la Varianza de una distribucin
Normal
Si la Poblacin es Normal, la distribucin muestral del estadstico
siguiente
2
S
X N 1) 2

Donde S2 es la varianza muestral usada como estimador puntual de s2

Es de tipo Ji-cuadrada con N-1 grados de libertad

a/2 a/2

0 c2a/2,N-1 c21a/2,N-1 X

UMSNH - FIE
Intervalo para la Varianza
Intervalo para la Varianza de una distribucin Normal

2 a/2 a/2
S
X N 1) 2

0 c2a/2,N-1 c21a/2,N-1 X

De acuerdo a la figura, P(c21-a/2,N-1 X c2a/2,N-1) = 1-a


Por lo tanto, el intervalo de confianza del 100(1-a)% buscado
para la varianza es
N 1)s 2 N 1)s 2
2
2
1/2,N1 2
/2,N1

Ejercicio: Hallar el intervalo de confianza del 95% para la


varianza en el ejemplo de la conductividad del hierro
UMSNH - FIE
Intervalo para la Varianza
Intervalo para la Varianza de una distribucin Normal

Intervalos de confianza unilaterales.- En el caso de la varianza es


ms comn buscar cotas inferiores o superiores que ambas a la vez

Intervalo de confianza inferior.- Se obtiene reemplazando el lmite


superior por y c21a/2,N-1 por c21a,N-1, obteniendo:

N 1)s 2
2
2
1,N1

Intervalo de confianza superior.- En forma similar, se reemplaza el


lmite inferior por 0 y c2a/2,N-1 por c2a,N-1, obteniendo:
N 1)s 2
2 2
,N1

UMSNH - FIE
Intervalo para la Varianza
Intervalo para la Varianza de una distribucin Normal

Ejercicio: Un fabricante de detergente lquido est interesado


en la efectividad de su proceso para llenar envases de
detergente. La norma dice que no se debe tener una desviacin
estndar s en el proceso mayor de 0.15, ya que de lo contrario
habr envases ms vacos de lo permitido.
Se toma una muestra aleatoria de 20 envases y se obtiene una
varianza muestral s2=0.0153 onzas2. Es esta medicin una
evidencia de que se est cumpliendo la norma con una
confianza del 95% ?

Sugerencia: se puede usar la funcin chi2inv de Matlab

UMSNH - FIE
Otros intervalos de Confianza
Intervalo de confianza para una Proporcin

Se toma una muestra de tamao N de una poblacin muy grande y


resulta que X datos de la muestra pertenecen a alguna clase de
inters. Entonces un estimador puntual de la proporcin p de los
datos de la poblacin que pertenecen a la clase en cuestin es:
^P=X/N

Ntese que N y p son los parmetros de una distribucin binomial

^ se puede considerar
La distribucin de muestreo de P
aproximadamente Normal con media p y varianza p(1-p)/N,
siempre que p no est muy cerca de 0 o de 1 y si N es
relativamente grande

UMSNH - FIE
Otros intervalos de Confianza
Intervalo de confianza para una Proporcin

De lo anterior, la distribucin de la variable


Pp
Z p1p)
N

Es aproximadamente N(0,1)

Entonces, partiendo de P{-za/2 Z za/2 }=1-a

Obtenemos el siguiente intervalo de confianza aproximado del


100(1-a)% para la proporcin p de la poblacin que pertenece a la
clase dada:
p1p) p1p)
p z /2 N p p z /2 N

UMSNH - FIE
Otros intervalos de Confianza
Intervalo de confianza para una Proporcin

Ejemplo: De 1000 casos de cncer pulmonar seleccionados al


azar, 823 son de pacientes que fallecieron. Construya un intervalo
de confianza del 95% para la tasa de mortalidad del cncer
pulmonar

Solucin: La tasa de mortalidad es la proporcin de los que


mueren a los que contraen el cncer pulmonar, de la muestra
tenemos que p^ = 0.823. Por otro lado z0.025=1.96, entonces:
0.82310.823) 0.82310.823)
0.823 1.96 1000 p 0.823 1.96 1000

Es decir, 0.799 p0.847

UMSNH - FIE
Otros intervalos de Confianza
Intervalo de confianza para el cociente de varianzas de dos
distribuciones Normales
Situacin: Se tienen dos poblaciones normales e independientes
con varianzas desconocidas s12, s22 respectivamente. Se tienen
disponibles dos muestras aleatorias de tamaos N1, N2 una de
cada poblacin respectivamente. Sean S12 S22 las varianzas
muestrales respectivas. Se busca un intervalo de confianza del
100(1-a)% del cociente de varianzas s12/ s22

Para hallar el intervalo de confianza se debe recordar que la


distribucin de muestreo del estadstico siguiente
S 22 /22
F S 21 /21

Es de tipo F con N2-1 y N1-1 grados de libertad en el numerador y


denominador respectivamente. (Ver la figura siguiente)
UMSNH - FIE
Otros intervalos de Confianza
Intervalo de confianza para el cociente de varianzas de dos
distribuciones Normales
S 22 /22
F S 21 /21
a/2 a/2

f /2,N2 1,N1 1 f1/2,N11,N 1


2 1
0 fa/2,N2-1,N1-1 f1a/2,N2-1,N1-1 F

As, de la figura: P{fa/2,N2-1,N1-1 F f1a/2,N2-1,N1-1}=1-a

Por lo tanto, el intervalo de confianza buscado es:


S 21 21 S 21
f /2,N 21,N 11
S 22
2 S 2 f 1/2,N 2 1,N 1 1
2 2

UMSNH - FIE
Otros intervalos de Confianza
Intervalo de confianza para el cociente de varianzas de dos
distribuciones Normales
Ejemplo: Una compaa fabrica piezas para turbinas. Tiene dos procesos distintos para
hacer el esmerilado de las piezas y ambos procesos producen terminados con la misma
rugosidad promedio. El ingeniero del proceso desea seleccionar el proceso con la menor
variabilidad en la rugosidad de la superficie. Para ello toma una muestra de 12 piezas
del primer proceso, obteniendo una desviacin estndar muestral s1= 5.1 micropulgadas,
luego toma una muestra de 15 piezas del segundo proceso, obteniendo s2= 4.7. Puede
elegir el primer poceso con una confianza del 90% de tener menor variabilidad en la
rugosidad?

Solucin: Suponiendo que los dos procesos son Normales e independientes.


Usando la funcin finv de Matlab, obtenemos f0.95=2.7386 y f0.05=0.3898, por
lo tanto, 5.1 2 2
0.3898) 2 /2 5.1 2.7386)
4.7 2 1 2 4.7 2

Haciendo operaciones: 0.46 2 /


1
2 3.23
2

Como el intervalo incluye la unidad, no se puede concluir que los procesos


tengan variabilidad sgnificativamente diferente con una confianza del 90%
UMSNH - FIE
Otros intervalos de Confianza
Resumen de intervalos de confianza

Parmetros de inters Suposiciones


Dist. Muestral Normal (o N grande) s2 conocida
La media m
s2 desconocida (Dist. Muestral T)
La varianza s2 Dist. Normal (Dist. Muestral Ji2 )
Proporcin p Dist. Muest. Normal (N grande, p alejado de 0 y de 1)
Cociente de varianzas Dos poblaciones Normales e independientes (Dist.
s12/s22 Muestral tipo F)
s12 y s22 conocidas
Diferencia de medias Distribuciones
s12 = s22 desconocidas (Dist muest T)
m1m2 normales,
s12 s22 desconocidas (Dist muest T)
Diferencia entre dos Dist. Muestral Normal (N1 y N2 grandes, p1 y p2
proporciones p1-p2 alejados de 0 y de 1)
Otras... (Ver libros de estadstica)

UMSNH - FIE
Intervalos de Tolerancia
Concepto

En ocasiones no nos interesa estimar algn parmetro, sino


establecer un rango en donde se puede esperar que caigan
observaciones (datos) individuales en un proceso.

La respuesta es muy sencilla si se conoce la distribucin y los


parmetros de la poblacin, por ejemplo, si se obtuvo una muestra
aleatoria de una poblacin Normal con media m y varianza s2
conocidas, se esperar que el 95% de los datos caern entre los
lmites
m 1.96s
A este intervalo se le llama intervalo de tolerancia y si m y s son
conocidos la cobertura del 95% es exacta

UMSNH - FIE
Intervalos de Tolerancia
Concepto

Si m y s son desconocidos a veces se puede determinar una


constante k tal que los lmites x ks constituyan un intervalo de
tolerancia para una distribucin normal

En este caso los lmites del intervalo son variables aleatorias y la


proporcin de datos cubierta por el intervalo no es exacta.
Entonces se debe introducir un intervalo de confianza para la
proposicin de los lmites del intervalo de tolerancia.

En la bibliografa se pueden consultar tablas para elegir estos


lmites dada una confianza deseada para el caso Normal.

UMSNH - FIE
Intervalos de Confianza y Regresin Lineal
Intervalo de Confianza para la Respuesta Media

En la regresin lineal se supone un modelo de la forma


y = mx + b
Para describir la respuesta y del proceso bajo la entrada x

Para una muestra de N puntos (valores de x, y) se calculan valores


^ ^
estimados m, b de m, b resolviendo las ecuaciones normales, de
manera que se obtiene un modelo estimado ^ y =^ mx + ^b

As, para un dato x0, se puede estimar una prediccin puntual para
my/xo (respuesta media) mediante: my/xo = ^
^ mx0+ ^
b

Se puede encontrar un intervalo de confianza para la respuesta


media my/xo dado un valor x0 como se explica a continuacin
UMSNH - FIE
Intervalos de Confianza y Regresin Lineal
Intervalo de Confianza para la Respuesta Media

Un intervalo de confianza alrededor de la respuesta media my/xo


del 100(1-a)% para el valor de x=x0 est dado por:
x 0 x) 2 x 0 x) 2
Yx 0 t /2 2 N1 S xx Yx 0 Yx 0 t /2 2 N1 S xx

Donde m^y/xo se calcula a partir del modelo de regresin estimado


^ 2 _2
Adems, s = S(yi - (m xi+b) ) /(N-2) y Sxx = S(xi-x) .
2 ^

Obsrvese_ que el ancho de este intervalo


_ de confianza es mnimo
para x0= x y crece a medida que |x0 - x| aumenta. En la siguiente
grfica se muestra un comportamiento tpico de este intervalo

UMSNH - FIE
Intervalos de Confianza y Regresin Lineal
Intervalo de Confianza para la Respuesta Media

Lmites del intervalo de confianza


para la respuesta media

Puntos experimentales

Recta de regresin

Observacin: Estos lmites de intervalo estn basados en los puntos experimentales


dados, no se pueden usar para predecir intervalos sobre datos nuevos. A los lmites
para nuevos datos se les llama lmites de prediccin y son ms amplios que los lmites
para la respuesta media UMSNH - FIE