You are on page 1of 14

INTRODUCCIN A LA INFERENCIA

ESTADSTICA
DISTRIBUCIN EN EL MUESTREO
Objetivos generales del tema
En este tema se introducir el concepto de estadstico como medio para
extraer informacin acerca de la ley de probabilidad del fenmeno en estudio.
Se ver que, al ser funcin de v.a. tambin es una v.a. y se ver cmo
obtener su distribucin. Por ltimo, se estudiarn algunos casos concretos
de estadstico.
Principales contenidos
Introduccin
Estimacin de la media de una poblacin
Estimacin de la varianza de una poblacin
Estimacin de una proporcin
Estadsticos ordenados
1
1 Introduccin
El muestreo estadstico es la herramienta que la Matemtica utiliza para el
estudio de las caractersticas de una poblacin a travs de una determinada
parte de la misma.
La muestra de estudio debe ser lo ms pequea posible ya que del hecho
de que una muestra sea ms grande, no se desprende necesariamente que la
informacin sea ms able.
Adems, la muestra elegida debe serlo por un proceso aleatorio para que
sea lo ms representativa posible.
Trminos usuales en un estudio estadstico
Poblacin: conjunto de todos los individuos que son objeto del estudio.
Muestra: parte de la poblacin en la que miden las caractersticas
estudiadas.
Muestreo: proceso seguido para la extraccin de una muestra.
Encuesta: proceso de obtener informacin de la muestra.
Los resultados obtenidos del estudio de una muestra no son del todo
ables, pero s en buena medida. Los parmetros que obtienen de una mues-
tra (estimadores estadsticos) nos permitirn arriesgarnos a predecir una serie
de resultados para toda la poblacin. De estas predicciones y del riesgo que
conllevan se ocupa la Inferencia Estadstica.
Las observaciones de una muestra se denotan por x
1
, . . . , x
n
.
2
Sin embargo, antes de hacer un muestreo o de experimentar, cualquier
observacin en particular estar sujeta a incertidumbre (por ejemplo, antes
de saber cul es el gasto medio de una familia de la muestra en alimentacin,
sta podra ser x
1
= 125.000 x
1
= 87.000 muchos otros valores posibles).
Debido a esta incertidumbre, antes de que se disponga de datos numri-
cos concretos, consideramos las observaciones como variables aleatorias y las
denotamos por letras maysculas X
1
, . . . , X
n
.
Esto a su vez implica que hasta que se hayan obtenido los datos, cualquier
funcin de las observaciones (media muestral, varianza de la muestra, etc.)
son funciones de variables aleatorias, y por tanto variables aleatorias con
distribucin de probabilidad propia, llamada distribucin en el muestreo.
Denition 1 Se llama espacio muestral al conjunto de muestras posibles
que pueden obtenerse al seleccionar una muestra aleatoria, de un determinado
tamao, de una cierta poblacin.
Denition 2 Se llama estadstico a cualquier funcin T (X
1
, . . . , X
n
) de
la muestra (X
1
, . . . , X
n
). El estadstico T (X
1
, . . . , X
n
), como funcin de
variables aleatorias (X
1
, . . . , X
n
), es tambin una variable aleatoria, y ten-
dr por tanto una distribucin de probabilidad, llamada distribucin en el
muestreo.
Algunos estadsticos importantes:
T (X
1
, . . . , X
n
) = X =
X
1
+. . . +X
n
n
Media Muestral
T (X
1
, . . . , X
n
) = Min(X
1
, . . . , X
n
)
T (X
1
, . . . , X
n
) = Max(X
1
, . . . , X
n
)
T (X
1
, . . . , X
n
) = S
2
X
=
P
n
i=1

X
i
X

2
n
Varianza Muestral
T (X
1
, . . . , X
n
) =
b
S
2
X
=
P
n
i=1

X
i
X

2
n 1
Cuasivarianza Muestral
3
Example 3 Se est interesado en conocer la probabilidad de obtener cara
con una moneda, es decir, se trata de estudiar la variable aleatoria
X =
(
1 si se obtiene cara
0 si se obtiene cruz
cuya distribucin est caracterizada por
X
i
Probabilidad
1
0 1
que depende del parmetro que vara en el espacio paramtrico = [0, 1].
Se realizan tres lanzamientos, con lo que se dispone de una m.a.s X
1
, X
2
, X
3
.
Puesto que la muestra es aleatoria simple, se verica que
P(X
1
= x
1
, X
2
= x
2
, X
3
= x
3
) = P(X
1
= x
1
) P(X
2
= x
2
) P(X
3
= x
3
)
La probabilidad de todas las muestras posibles es, por tanto, la siguiente:
X
1
X
2
X
3
Probabilidad
1 1 1
3
1 1 0
2
(1 )
1 0 1
2
(1 )
0 1 1
2
(1 )
1 0 0 (1 )
2
0 1 0 (1 )
2
0 0 1 (1 )
2
0 0 0 (1 )
3
Es decir, tenemos la distribucin de la muestra a travs de su funcin de
4
probabilidad. Si nos interesa el estadstico media muestral
X =
X
1
+X
2
+X
3
3
a partir de la distribucin en el muestreo de la muestra, se tiene la siguiente
distribucin en el muestreo para el estadstico:
X Probabilidad
1
3
2/3 3
2
(1 )
1/3 3 (1 )
2
0 (1 )
3
Example 4 De una poblacin X con distribucin de Poisson de
parmetro , Poisson() , se obtiene una m.a.s. de tamao n. De-
terminar la distribucin en el muestreo de la media muestral X.
Si X

Poisson() , entonces P(X = k) = e

k
k!
, k = 0, 1, 2, . . .
Dada una m.a.s. (X
1
, . . . X
n
) , T (X
1
, . . . X
n
) =
1
n
P
n
i=1
X
i
= X. Su
distribucin es:
P

X = k

= P

1
n
P
n
i=1
X
i
= k

= P(
P
n
i=1
X
i
= nk) = e
n
(n)
nk
(nk)!

n
i=1
X
i
Poisson(n)
Denition 5 Estimador Dada una muestra (X
1
, . . . X
n
) , un estimador del
parmetro es una funcin de la muestra T (X
1
, . . . X
n
) que aproxima el valor
de . Se suele denotar por T (X
1
, . . . X
n
) =
b

Denition 6 Estimador Insesgado: Sea T (X


1
, . . . X
n
) un estadstico que
estima un parmetro , denotmoslo por T (X
1
, . . . X
n
) =
b
. El sesgo del
estimador de es
Sesgo
h
b

i
= E
h
b

i
= E[T (X
1
, . . . X
n
)]
5
El estimador es insesgado si Sesgo
h
b

i
= 0, es decir E
h
b

i
= .
Denition 7 Es un estimador asintticamente insesgado si
Sesgo
h
b

i
0 cuando n
Denition 8 Estimador Consistente: Sea T (X
1
, . . . X
n
) un estadstico
que estima un parmetro , denotmoslo por T (X
1
, . . . X
n
) =
b
. El estimador
es consistente si
V ar
h
b

i
= V Ar [T (X
1
, . . . X
n
)] 0 cuando n
2 Estimacin de la media de una poblacin
Sea X
1
, . . . , X
n
una m.a.s. de una variable aleatoria X con media E(X) = y
varianza V ar (X) =
2
. El estimador ms razonable de la media poblacional
es la media muestral
X =
1
n
P
n
i=1
X
i
que verica las siguientes propiedades:
1. Es un estimador insesgado de .
E

= E

1
n
n
X
i=1
X
i
!
=
1
n
n
X
i=1
E(X
i
) =
1
n
n
X
i=1
=
2. Es un estimador consistente en media cuadrtica de , puesto que
es insesgado y su varianza tiende a 0 cuando n .
V ar

= V ar

1
n
n
X
i=1
X
i
!
=
1
n
2
n
X
i=1
V ar (X
i
) =
1
n
2
n
X
i=1

2
=
n
n
2

2
=

2
n
6
3. La distribucin de exacta de X depende de la distribucin de la poblacin
X. Por ejemplo, si X es normal la distribucin de X tambin lo ser.
Para muestras grandes, por el Teorema Central del Lmite, la distribu-
cin de X puede aproximarse por una normal (n 30) .
Theorem 9 Sea X
1
, . . . , X
n
una m.a.s. de una variable aleatoria X

N (, ) ,
entonces
X

N

Example 10 Sea X una poblacin con distribucin N (90, = 20) .


a) Si se obtiene una m.a.s. de tamao 16, cul es la probabil-
idad de que la media muestral X sea mayor o igual que 92?
b) Determinar el tamao muestral para que la probabilidad de
que la media muestral sea menor o igual que 98 sea P

X 98

=
0, 99.
X

N ( = 90, = 20)
E

= = 90
V ar

=

2
n
=
20
2
16

X
=
r
400
16
=
20
4
= 5
_

_
X

N (90, 5)
a) P

X 92

= P(N (90, 5) 92) = P

N (0, 1)
92 90
5

=
= P

Z
2
5

= P(Z 0.4) = 0, 3446


b) 0.99 = P

X 98

= P

90,
20

98

= P

N (0, 1)
98 90
20

n
!
=
= P

n
2
5

n
2
5
= 2, 33 =n =

2, 33 5
2

2
= 33, 9 = n 34
7
3 Estimacin de la varianza de una poblacin
Sea X
1
, . . . , X
n
una m.a.s. de una variable aleatoria X con media E(X) =
y varianza V ar (X) =
2
. El estimador ms razonable de la varianza pobla-
cional
2
es la varianza muestral
S
2
X
=
1
n
n
P
i=1

X
i
X

2
=
1
n
n
P
i=1
X
2
i
X
2
que verica las siguientes propiedades:
1. Es un estimador consistente de
2
.
2. Es un estimador asintticamente insesgado de
2
puesto que
E(S
2
X
) =

2
n
+
2
Puesto que la varianza muestral S
2
es un estimador sesgado (aunque as-
intticamente insesgado), para estimar la varianza
2
se usa la cuasivarianza
muestral:
c
S
x
2
=
1
n 1
n
X
i=1

X
i
X

2
=
n
n 1
S
2
que es un estimador insesgado y consistente de
2
.
E

b
S
2

= E

n
n 1
S
2

=
n
n 1
E

S
2

=
n
n 1


2
n

=
2
3. (Teorema de Fisher) Bajo hiptesis de normalidad (X

N (, )) se
8
verica que
nS
2

2
=
(n 1)
b
S
2

2
=
n
P
i=1

X
i
X

2


2
n1
4. Si conocemos la varianza poblacional , se verica
n
P
i=1
(X
i
)
2

n
5. Bajo hiptesis de normalidad (X

N (, )) , las variables aleatorias
X y
b
S
2
son independientes.
Example 11 Dada una poblacin X

N (6, = 2.5), y tomando una
muestra aleatoria simple X
1
, . . . , X
n
de tamao n = 12, calcular la
probabilidad de que la varianza muestral sea mayor que 4.9.
P(S
2
> 4.9) = 1 P(S
2
4.9) = 1 P

nS
2

2

n 4.9

=
= 1 P

2
n1

12 4.9
2.5
2

= 1 P(
2
11
9.41)
En la tabla de la distribucin de la
2
n
aparecen los siguientes resultados
P(
2
11
7.58) = 0.25
P(
2
11
10.03) = 0.5
Mediante una interpolacin numrica se calcula la probabilidad que in-
9
teresa
x y
7.58 0.25
9.41 p
10.03 0.5
y = y
1
+
y
2
y
1
x
2
x
1
(x x
1
) = 0.25 +
0.5 0.25
10.03 7.58
(x 7.58)
y = 0.102x 0.52347 =p = 0.102 9.41 0.52347 = 0.43635
P(S
2
> 4.9) = 1 P(
2
11
9.41) = 1 0.43635 = 0.56365
3.1 Estadstico t de Student. Estimacin de la media
poblacional cuando
2
es desconocida.
Bajo hiptesis de normalidad (X

N (, )) se verica que X

N

,
o equi-valentemente
X

N (0, 1)
Este resultado puede ser de poca utilidad si la varianza poblacional
2
es
desconocida, ya que entonces no se podr usar esta conclusin para hacer
previsiones acerca de X. Cabe pensar que el resultado no ser muy distinto
si se sustituye por la cuasidesviacin tpica muestral
b
S, puesto que, al
menos para muestras grandes,
2
y
b
S
2
tendrn valores semejantes. Tal idea
llev a Student (pseudnimo de W. Gosset) a considerar el estadstico
X
b
S

n
=
X
S

n 1

t
n1
10
Example 12 Dada una poblacin X

N (1, ), se extrae una m.a.s.
de tamao n = 10 con los siguientes resultados:
1.08, 1.79, 2.54, 0.37, 0.6, 0.53, 0.28, 2.21, 2.66, 1.45
Calcular la probabilidad de que la media muestral X sea mayor que
1.2.
P

X >1.2

= 1 P

X 1.2

= 1 P
_
_
_
_
_
X
b
S

1.2
b
S

n
_
_
_
_
_
S
2
=
1
n
n
P
i=1
X
2
i
X
2
=
1
10
(1.08
2
+1.79
2
+2.54
2
+0.37
2
+0.6
2
+0.53
2
+0.28
2
+2.21
2
+ 2.66
2
+ 1.45
2
) [
1
10
(1.08 + 1.79 + 2.54 + 0.37 + 0.6 + 0.53 +
+0.28 + 2.21 + 2.66 + 1.45)]
2
=
1
10
25.7405 0.609
2
= 2.20317
S =

2.20317 = 1.4843 =
b
S =
r
n
n 1
S
2
=
r
10
9
2.20317 = 1.5646
P

X >1.2

= 1P
_
_
_
_
_
X
b
S

1.2
b
S

n
_
_
_
_
_
=1P
_
_
_
_
t
n1

1.2 (1)
1.5646

10
_
_
_
_
=
= 1P
_
_
_
_
t
9

1.2 (1)
1.5646

10
_
_
_
_
= 1P(t
9
0.4042) = P(t
9
0.4042)
11
Se calcula la probabilidad anterior por interpolacin numrica
x y
0.261 0.6
0.4042 p
0.543 0.7
y = y
1
+
y
2
y
1
x
2
x
1
(x x
1
) = 0.6 +
0.7 0.6
0.543 0.261
(x 0.4042)
y = 0.35462x + 0.456 =p = 0.35462 0.4042 + 0.456 = 0.6
P

X >1.2

= 0.6
4 Estimacin de una proporcin
Se desea estimar la proporcin p de individuos de una poblacin que tiene
una determinada caracterstica. Para ello se toma una m.a.s. de elementos
de la poblacin, anotando un 1 si dicho elemento tiene la caracterstica, y 0
en otro caso, es decir, se tiene una m.a.s. X
1
, . . . , X
n
de una B(1, p)
X =
(
1 (tiene la caract.) con probab. p
0 (no la tiene) con probab. 1 p
, E(X) = p, V ar (X) = p (1 p)
Un estimador razonable de p es la proporcin de elementos de la muestra que
tiene dicha caracterstica, es decir
b p =
X
1
+ +X
n
n
12
Propiedades
1. E(b p) = E

1
n
n
P
i=1
X
i

=
1
n
n
P
i=1
E(X
i
) =
1
n
np = p
2. V ar (b p) = V ar

1
n
n
P
i=1
X
i

=
1
n
2
n
P
i=1
p (1 p) =
p (1 p)
n
3. La distribucin de b p depende de la distribucin de la poblacin X, pero
cuando n es grande
b p

N

p,
r
p (1 p)
n
!
Example 13 En el proceso de produccin de una empresa, el 1%
de los productos sale defectuoso. Para corroborarlo se obtiene una
m.a.s.de tamao n = 25 y se estima la proporcin de productos
defectuosos. Estimar la probabilidad de que la proporcin estimada
sea mayor que el 2%.
P(b p > 0.02) = P
_
_
_
_
b p p
r
p (1 p)
n
>
0.02 p
r
p (1 p)
n
_
_
_
_
' P
_
_
_
_
Z >
0.02 b p
r
b p (1 b p)
n
_
_
_
_
=
= P
_
_
_
_
Z >
0.02 0.01
r
0.01 (1 0.01)
25
_
_
_
_
= P(Z > 0.50) = 0.3085
P(b p > 0.02) = 0.3085
13
5 Estadsticos ordenados
Sea X
1
, . . . , X
n
una m.a.s de una poblacin X con funcin de distribucin
F(x) y densidad f (x) . Es importante estudiar entre qu valores podran
estar los valores muestrales; se consideran entonces X
(1)
, . . . , X
(n)
los es-
tadsticos de orden (los valores muestrales ordenados de menor a mayor

X
(1)
. . . X
(n)

. Aunque X
1
, . . . , X
n
son independientes idnticamente
distribuidos (i.i.d.) por tratarse de una m.a.s., X
(1)
, . . . , X
(n)
no lo son.
Ejemplos
X
(1)
= min (X
1
, . . . , X
n
)
X
(n)
= max (X
1
, . . . , X
n
)
14

You might also like