You are on page 1of 46

ESTIMACIN

puntual y por intervalo


(

)
V.E.Rohen

Podemos conocer el comportamiento del ser humano?


V.E.Rohen

Podemos usar la informacin contenida en


la muestra para tratar de adivinar
adivinar algn
aspecto de la poblacin bajo estudio y
sustituirla en lo que sera nuestra verdad
desconocida
desconocida
Esto, por supuesto,
implica que la informacin
que obtenemos de
nuestras observaciones
debe ser representativa
del particular aspecto de la poblacin.
V.E.Rohen

Es importante notar que no siempre coincide la


informacin que hemos observado con la
informacin real de la poblacin.

Sin embargo, es una buena aproximacin y la


podemos utilizar para
! la!estimacin de las
caractersticas propias de dicha poblacin.
V.E.Rohen

Podemos entonces dar una


medida de dicha
incertidumbre:

" = # $ #

solo me
equivoco el
5% de las
veces

(Esta medida nos ayudar a crear


estimadores por intervalo para medias y
proporciones muestrales)

V.E.Rohen

La distribucin de la muestra y de las


estadsticas juega un papel crtico en la
inferencia estadstica porque la bondad de
los estimadores se mide en base a la media
y varianza de stas.
Muestra
Estadstica
Estimador
Distribucin
V.E.Rohen

Las muestras son tomadas para Estimar


parmetros y para Probar Hiptesis acerca
de los parmetros
Un parmetro es una medida numrica de algn
aspecto de la poblacin
Cuando no tenemos la informacin sobre toda la
poblacin es necesario estimar el valor del
parmetro en base a la informacin de la muestra
sobre dicho aspecto de inters y tenemos lo que se
llama estadstica
V.E.Rohen

Supongamos que tomamos una muestra de una


poblacin y obtenemos la media muestral.
Si tomamos otra muestra obtendremos otro
valor de la media muestral, y as sucesivamente.
Todas estas medias sern variables aleatorias
que tienen asociada una funcin de densidad.
Lo mismo sucede con las varianzas muestrales
que cambian su valor de muestra a muestra y
con las proporciones muestrales.
V.E.Rohen

Pero el promedio de todas las medias muestrales posibles


con o sin reemplazo (cada una del mismo tamao n) es
igual a la media poblacional .
La fluctuacin en el nmero que representa a estas medias
muestrales se ve en un histograma de todos los posibles
valores de stas. Estas fluctuaciones son menores que las
fluctuaciones de los valores en la poblacin.
Estas variaciones entre las medias muestrales se conoce
como error estndar de la media y se obtiene como

"
"X =
n
V.E.Rohen

Se puede observar que si el tamao de la muestra


aumenta, el error estndar disminuye.
Qu distribucin sigue la media muestral?
Teorema Central del Lmite
Consideremos muestras aleatorias de una poblacin
con media y varianza 2, conforme el tamao de la
muestra crece, la distribucin de las medias
muestrales es aproximadamente NORMAL, sin
importar la forma de la distribucin de la poblacin.
V.E.Rohen

DISTRIBUCIN DE LA MEDIA
MUESTRAL

X
Recordemos que la media muestral X
obtenida de una muestra aleatoria de
tamao n de una poblacin con media y
varianza 2, tiene una distribucin normal
con media y varianza 2/ n
V.E.Rohen

Vamos a poder medir qu tanto se desva la


media muestral de la media poblacional a
travs del valor Z, de la siguiente manera

X "
X " X "
Z=
=
=
#
#X
#
n

Es fcil ver que la Z, que es una estadarizacin


de la media muestral, sigue una distribucin
N(0,1)

V.E.Rohen

0.5

Density

0.4
0.3
0.2
0.1
0.0
-3

-2

-1

C1

V.E.Rohen

Con frecuencia estamos interesados en


determinar si la media de una poblacin es
diferente de la media de otra poblacion.
Si la Poblacin 1 tiene una media 1 y una
desviacin estndar 1 y la Poblacin 2 tiene
una media 2 y una desviacin estndar 2 ,
nos gustara determinar si 1= 2 o si una es
mayor que la otra ( 1> 2 1< 2 )

V.E.Rohen

para lo cual nos basamos en la evidencia que


tenemos al considerar dos muestras aleatorias,
una de cada una de las poblaciones y observar
la diferencia de las medias muestrales X 1 " X 2 .
Como X 1 y X 2 son variables aleatorias
!
normalmente distribuidas, entonces
es una variable aleatoria distribuida
!normalmente con media
X1 " X 2

1 ! 2

2
2
"
"
y con varianza 1 + 2
n1 n 2

.
V.E.Rohen

En muchas ocasiones no conocemos la


probabilidad de xito en un experimento
binomial y tiene que ser estimado de la
muestra. Como p es la probabilidad de xitos
en cualquier prueba, en una poblacin finita,
p mide la proporcin de xitos en esa
poblacin.

V.E.Rohen

As, si en una muestra de tamao n de una


poblacin, X es el nmero de xitos,
estimamos la proporcin de xitos en esta
muestra: X
n

Entonces
!

p =

X
n

tiene una distribucin

normal con media p y varianza p(1-p)/n


siempre
y cuando np(1-p)>5
!

(Rosner)

V.E.Rohen

Muchos problemas estn enfocados en


determinar si la proporcin de gente o cosas en
una poblacin que posee cierta caracterstica es
la misma que la proporcin que posee dicha
caracterstica en otra poblacin: p1 = p2, si es
mayor: p1 > p2 menor: p1 < p2.
Cuando desconocemos estas proporciones es
necesario tomar una muestra de cada poblacin
y estimar dichas proporciones

V.E.Rohen

Tomemos dos muestras de tamao n1 y n2 de


las dos poblaciones bajo estudio.
Encontremos el nmero (X1) de individuos en
la muestra de la Poblacin 1 que posee la
caracterstica de inters y el nmero (X2) de
individuos en la muestra de la Poblacin 2
que poseen la misma caracterstica, entonces
las proporciones muestrales
p1 =

X1
X2

y p2 =
n1
n2

sern los estimadores de p1 y p2 respectivamente


!

V.E.Rohen

La distribucin de la variable aleatoria p 1 ! p 2


es aproximadamente normal con media p1 ! p 2
y varianza
"

2
p1 # p 2

p1 (1# p1 ) p2 (1# p2 )
=
+
n1
n2

siempre y cuando n1 p1(1- p1) > 5, n2 p2(1- p2) > 5


!(Rosner)
V.E.Rohen

z
2
z
! i

"2 !

w1 ! 1
w2 ! 2

x1 , x2 , L , xn

Distribuciones de Muestreo

V.E.Rohen

Algunas distribuciones que se derivan de la


distribucin normal

Si Z ~ N (0,1) entonces Z 2 ~ "12

) para i=1,...,n, entonces


Si Z i ~ N (0,1!

2
2
Z
~
"
! i n
i =1

V.E.Rohen

Z ~ N (0,1) W ~ ! n2
Z
~ tn
W
n
Si

W1 ~ ! n2 y W2 ~ ! m2

independientes,!entonces

y W1 y W2 son

W1
W2

n ~F
n,m
m
V.E.Rohen

Si nuestro inters es sobre la medida de


variacin, tendremos que hacer uso de la
expresin
2
(n "1)S
#2

donde S 2 es la varianza muestral.


Esta estadstica
tiene una distribucin
!

"

2
n !1

con n-1 grados de libertad

V.E.Rohen

Distribucin

Sesgo derecho
Un solo parmetro (grados
de libertad)
Modela entre otras cosas a
espacios continuos entre
eventos discretos

0.2
0.18
0.16

f(x)

0.14
0.12
0.1
0.08

Modela la distribucin de
la varianza muestral

0.06
0.04
0.02
0
1

10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88 91 94 97 100

V.E.Rohen

Cuando desconocemos la varianza poblacional, es


preciso estimarla.
La expresin

X "
Z=
#
n

tiene que
! ser sustituida por

X "
T=
s
n

Esta estadstica tiene una distribucin t con n-1


grados de libertad
!
V.E.Rohen

Distribucin t- Student
Simtrica con
respecto al cero

0.36
0.31

Un solo parmetro
(grados de libertad)

0.26
0.21
0.16

Tiene las colas ms


pesadas que la normal

0.11
0.06
0.01
-5.3

-3.3

-1.3

-0.04
-0.09

0.7

2.7

4.7

Cuando los grados de


libertad aumentan
converge a una normal
estnadar
V.E.Rohen

La comparacin de dos varianzas poblacionales se


realiza por medio del cociente de las mismas.
La estadstica de prueba que involucra este
cociente incluye las varianzas muestrales de la
siguiente manera:

$(n1 "1)S12 '


&
)
2
% #1
(
F=
$(n 2 "1)S22 '
&
)
2
% #2
(

(n1 "1)
(n 2 "1)

que tiene una distribucin F con (n1-1) y (n2-1)


grados de libertad

V.E.Rohen

Distribucin F
Tiene una pareja de grados de
libertad
Tiene sesgo derecho y toma
solo valores positivos

0.09
0.08
0.07

Se usa para contrastar varianzas

0.06
0.05
0.04
0.03
0.02
0.01
0
1

13

19

25

31

37

43

49

55

61

67

73

79

85

91

97

V.E.Rohen

Existen dos tipos principales de estimadores:


Estimadores puntuales que consisten en un slo
valor o estadstica muestral que se usa para estimar
el verdadero valor del parmetro poblacional

X = 1n " X i
S

!
!

X
n

X " X)
#
(
=

n "1

p
V.E.Rohen

Estimadores por Intervalo que consiste en dos


valores entre los cuales esperamos que se
encuente el verdadero valor del parmetro

"1 < " < "2


donde !1 y !2 son funcin del estimador
puntual de

!
V.E.Rohen

Algunas propiedades deseables de los estimadores


son las siguientes:
Que en promedio los estimadores sean igual al
parmetro poblacional que estiman. Es decir, que
el estimador sea Insesgado
Que tenga varianza mas pequea que otros
estimadores. A esta propiedad se le llama eficiencia.
Consistencia cuando la diferencia entre el
estimador y el parmetro se hace mas pequea
conforme el tamao de muestra crece.
V.E.Rohen

Cuando tratamos de evaluar la bondad de un


estimador, tratamos de poner alguna cota en el
error de estimacin que pudiera ocurrir. Este
error de estimacin es " # " , y debe ser menor a
k ("# )
donde k es un factor que especifica los lmites de
confianza en la !distribucin de " (porcentiles de
la Normal o de la t-Student: z/2 t /2 )
Si " tiene una distribucin Normal con media !
!
2
y varianza "# , entonces k toma el valor 1.96
para un nivel de confianza (1) de 0.95 ( 95%)
!

V.E.Rohen

La amplitud de un intervalo de confianza


para la media poblacional depende de tres
factores:
- el nivel de confianza
- la desviacin estndar poblacional
- el tamao de muestra.

V.E.Rohen

V.E.Rohen

Propiedades que satisface un intervalo de confianza.


1. Mientras mayor sea el nivel de confianza (1-) ,
mayor ser el valor de z /2 y ms amplio ser el
intervalo de confianza, manteniendo constantes la
varianza y el tamao de muestra.
2. Mientras mas pequea sea la desviacin estndar,
el intervalo ser mas angosto.
3. Conforme el tamao de muestra se incrementa, la
amplitud del intervalo de confianza ser menor.
V.E.Rohen

El valor indica la proporcin de veces que


supondremos incorrectamente que el intervalo
contiene el parmetro poblacional.
La interpretacin del intervalo de confianza para
es como sigue:
de una gran cantidad de intervalos que se
construyan para el parmetro poblacional ,
100(1)% contendrn a dentro de los lmites
encontrados.
V.E.Rohen

(Intervalos de Confianza)

.
!

.
.

.
. .

V.E.Rohen

Intervalos de confianza del 95% para el parmetro


de una exponencial con media =1

V.E.Rohen

Aclaremos que aunque no conozcamos el valor


real de , ste es una cantidad fija y constante.
Puede suceder que se encuentre entre 1 y 2
pero tambin puede suceder que NO se encuentre
entre esos dos valores, y sera incorrecto asignar
una probabilidad a cualquiera de
! estas
!
posibilidades, an cuando permanezca
desconocida

V.E.Rohen

As, un intervalo de confianza para del 100(1)%


est dado por
%
$
$ (
, X + Z# / 2
' X " Z# / 2
*
&
n
n)

cuando es conocida, pero si sta es desconocida


(casi siempre),
se
sustituye
por
su
estimador
!
puntual y el intervalo queda de la forma
$
s
s '
, X + t(# / 2),n"1
& X " t(# / 2),n"1
)
%
n
n(

si n es muy grande se puede aproximar la t


por medio de la normal

V.E.Rohen

Similarmente, un intervalo de confianza del


100(1)% para la proporcin p de una
poblacin estar dado por
$
p (1" p )
p (1" p ) '
, p + Z# / 2
& p " Z# / 2
)
n
n (
%

X
donde p =
n

Siempre y cuando cuando np > 5 y n(1-p) > 5


!
V.E.Rohen

De manera similar podemos construir


intervalos de confianza para la varianza
poblacional
Usaremos el hecho de que
distribucin 2,

(n "1)S 2
#2

tiene una

de donde es fcilmente verificable que el


!
intervalo de confianza
tiene la forma

% (n "1)S 2 (n "1)S 2 (
, 2
' 2
*
& # (1"$ / 2),n "1 # ($ / 2),n "1 )
V.E.Rohen

Tamao de Muestra
Si queremos que nuestro error de estimacin sea
a lo ms , entonces
% $ (
" = Z# / 2 ' *
& n)
2
#
n = Z"2 / 2 2
$

! Para un nivel de cofianza fijo, un tamao de


error pequeo incrementar el tamao de
!
muestra.
V.E.Rohen

Aumento del tamao de muestra para un nivel


de confianza del 95%, y una varianza de 1,
cuando el error de estimacin disminuye.
V.E.Rohen

Referencias:
http://www.hrc.es/bioest/M_docente.html
Zar, Jerrold H.- Biostatistical Analysis.- 4rd ed.- Prentice
Hall, Inc
Rosner, B.- Fundamentals of Biostatistics. 6th Ed.
Brooks/Cole Publishing Co., 2006

V.E.Rohen

You might also like