You are on page 1of 15

CCL2331 ?

Analisis de Datos e Investigacion

Monica Bravo - Rodrigo Rubio

Escuela de Construccion Civil

Pontificia Universidad Catolica de Chile


Primer Semestre 2016

Monica Bravo - Rodrigo Rubio


Inferencia Estadstica-Intervalos de Confianza

Inferencia Estadstica

Estimacion

Como el objetivo principal de la estadstica inferencial es el


estudio de la poblacion y realizar predicciones a cerca de ella
pero a partir de una muestra, no de la poblacion entera, en
principio, tendremos que estimar los parametros de la
poblacion a partir de los parametros correspondientes para la
muestra.
En una primera aproximacion, parece logico pensar que si
queremos determinar la media de una cierta poblacion, si
hemos cogido una muestra representativa de dicha poblacion,
la media de la muestra sera muy parecida a la de la poblacion
y por tanto sirva para estimarla.
Monica Bravo - Rodrigo Rubio
Inferencia Estadstica-Intervalos de Confianza

Inferencia Estadstica

Cual es el problema de la estimacion entonces?. Como vamos


a disponer de una muestra, lo que podemos calcular es x y S
(o bien p), y a partir de estos intentar estimar quienes tienen
que ser y (o bien p), los reales para la poblacion.
En la estimacion por puntos, el conocimiento de un estadstico
muestral nos permitira decidir cual es el correspondiente
parametro de la poblacion. Para ello hemos de conocer cual es
la relacion entre un estadstico y el correspondiente
parametro.
Dicha relacion esta dada por el resultado que se presenta en el
Teorema del lmite central.

Monica Bravo - Rodrigo Rubio


Inferencia Estadstica-Intervalos de Confianza

Inferencia Estadstica

Teorema del lmite central: Sea X1 , ..., Xn un conjunto de


variables aleatorias, independientes e identicamente
distribuidas con media (esperanza) y varianza 2 . Sea

Sn := X1 + . . . + Xn

entonces  
Sn n
lim Pr z = (z)
n n
Es comun encontrarlo con la variable estandarizada Zn en
funcion de la media muestral X n , luego el teorema nos dice
que:
Xn d
N (0, 1)
/ n
Monica Bravo - Rodrigo Rubio
Inferencia Estadstica-Intervalos de Confianza

Inferencia Estadstica
En una variable aleatoria normal cualquiera N (, 2 ), se
verifica que:
1. En el intervalo ( , + ) esta el 68, 26% de la poblacion.
2. En el intervalo ( 2, + 2) esta el 95, 44% de la poblacion.
3. En el intervalo ( 3, + 3) esta el 99, 74% de la poblacion.

En general, dado un porcentaje del N %, siempre es posible


encontrar un intervalo simetrico respecto de la media de forma que
dicho intervalo contenga a dicho porcentaje de poblacion.

Mas explicitamente, se denomina intervalo de confianza a aquel


intervalo para el cual se sabe que hay una seguridad del N % de
que los parametros muestrales se encuentren en dicho intervalo. La
seguridad N viene fijada previamente. Si queremos que el N % de
la poblacion este en el intervalo, denominaremos nivel de
confianza al numero: 1 = N/100.
Monica Bravo - Rodrigo Rubio
Inferencia Estadstica-Intervalos de Confianza

Inferencia Estadstica

Si la poblacion sigue una distribucion de parametros y , y las


muestras son de tamano 30 (o bien la poblacion ya es normal y
las muestras son de cualquier tamano), sabemos que

Xn d
N (0, 1)
/ n
Se trata de encontrar el valor de k como en la figura

Buscamos el valor de k que deje en el intervalo ( k, + k) al


(1 ) 100% de la poblacion.
Monica Bravo - Rodrigo Rubio
Inferencia Estadstica-Intervalos de Confianza

Inferencia Estadstica

Razonemos ahora sobre la normal estandar N (0, 1) que es la que


se encuentra tabulada Si queremos que el intervalo buscado
contenga a la media muestral con una confianza de 1 , entonces
fuera del intervalo el area tiene que ser de , y como la curva es
simetrica, en cada una de las ramas fuera de la region achurada
(figura), tenemos un area de . Llamaremos z/2 al percentil que
separa la region achurada de la otra.

Buscamos el valor de z/2 que deje en el intervalo (z/2 , z/2 ) al


(1 ) 100% de la poblacion en la N (0, 1).
Monica Bravo - Rodrigo Rubio
Inferencia Estadstica-Intervalos de Confianza

Inferencia Estadstica
Es evidente que se cumple que: Pr(Z z/2 ) = /2, de mode que
Pr(Z z/2 ) = 1 /2, probabilidad que se busca dentro de la
tabla como hemos visto anteriormente en clases. Luego, para
encontrar el valor de k debemos estandarizar y por lo tanto
k
= z/2
/ n
de donde despejando tenemos que:

k = + z/2
n
As, dado el nivel de confianza 1 , podemos determinar el
intervalo de confianza para la media poblacional:
 
z/2 , + z/2
n n
Monica Bravo - Rodrigo Rubio
Inferencia Estadstica-Intervalos de Confianza

Inferencia Estadstica

Luego,
 como el intervalo de confianza
 1 para x esta dado por

n z/2 , + n z/2 , se tiene que:


z/2 x + z/2
n n

despejando se obtiene que el intervalo de confianza 1 para


la media poblacional cuando es conocido esta dado por:
 
x z/2 , x + z/2
n n

Se tiene que:
  
Pr x z/2 , x + z/2 =1
n n

Monica Bravo - Rodrigo Rubio


Inferencia Estadstica-Intervalos de Confianza

Inferencia Estadstica

Al valor n z/2 se le denomina error absoluto o error de


estimacion. Y al valor x z/2 se le denomina error relativo, y
corresponde al % del margen de error absoluto respecto de la
estimacion.
Ejemplo: Suponga que la duracion de un componente distribuye
N (, 81). Se prueban 20 componentes y se anotan sus duraciones.
Si la media muestral fue de 100 hrs. Estimar la duracion media
de todos los componentes, con un 95% de confianza.

z/2 = 1, 96

9 9
(100 1, 96 , 100 + 1, 96 ) = (100 3.94, 100 + 3.94)
20 20
= (96.06, 103.94)

Monica Bravo - Rodrigo Rubio


Inferencia Estadstica-Intervalos de Confianza

Inferencia Estadstica

En el ejemplo podemos decir que :la duracion media de los


componentes se estima entre 96.06 y 103.94 horas, con un error de
estimacion de 3.94 hrs y con un coeficiente de variacion estimado
de 0,09. Esto significa que el margen de error relativo, con 95% de
confianza, es 17.64%

En el mismo ejemplo. Que tamano de muestra es necesario para


que el error se reduzca a 1 hora?.
9
1, 96 = 1
n
 1.96 9 2
=n
1
Luego n = 311 componentes.

Monica Bravo - Rodrigo Rubio


Inferencia Estadstica-Intervalos de Confianza

Inferencia Estadstica

Si 2 es desconocido: El estimador muestral de es = S. As,



la variable aleatoria Z = X /(/ n) la reemplazamos por

X
T = tn1 ,
S/ n

que corresponde a la distribucion continua t-student. Y por lo


tanto, basandonos en las ideas anterior tenemos que intervalo de
confianza 1 para la media poblacional cuando es
desconocido esta dado por:
 S S 
x t(n1,1/2) , x + t(n1,1/2)
n n

Monica Bravo - Rodrigo Rubio


Inferencia Estadstica-Intervalos de Confianza

Inferencia Estadstica

La distribucion t-student esta centrada en cero siendo muy similar


a la distribucion normal estandar Z

Ambas distribuciones estan tabuladas y tienen similitud a partir


de un tamano muestral elevado; n > 30.

Monica Bravo - Rodrigo Rubio


Inferencia Estadstica-Intervalos de Confianza

Inferencia Estadstica

Intervalo para la proporcion poblacional: Considere el


siguiente ejemplo: Un candidato desea conocer el % de personas
que votaran a favor de su postulacion. Para ello lleva a cabo una
encuesta de 400 electores elegidos a azar a los cuales se les
pregunta si vota a favor o no de dicho candidato. En este caso, a
las respuestas se les asigna los valores 0 y 1.
Luego, si definimos la variable aleatoria X que representa; Vota a
favor o en contra del candidato, vemos que X Bern(p), donde p
en este caso representa la proporcion poblacional de electores que
vota a favor del candidato, y que se estima por
n
1X
p = xi
n
j=1

Monica Bravo - Rodrigo Rubio


Inferencia Estadstica-Intervalos de Confianza

Inferencia Estadstica

Dado que dicha proporcion es un promedio, usando el Teorema del


Lmite Central:  p(1 p) 
p N p,
n
Luego, el intervalo de confianza 1 para la proporcion
poblacional p esta dado por:
r r
 p(1 p) p(1 p) 
p z1/2 , p + z1/2
n n

Monica Bravo - Rodrigo Rubio

You might also like