You are on page 1of 26

7.

Inferencia en poblaciones normales

Informtica. Universidad Carlos III de Madrid

Tema 7: Inferencia en poblaciones normales

1. 2. 3. 4.

Inferencia Inferencia Inferencia Inferencia

en muestras pequeas con la distribucin t de Student sobre sobre

Informtica. Universidad Carlos III de Madrid

1. Inferencia en muestras pequeas

En el tema anterior usamos que si X es una v. aleatoria de inters con distribucin cualquiera y con

si n es grande (n>30)

Construimos mtodos estadsticos basados en la aproximacin a esa normal

Y si n no es grande?
Informtica. Universidad Carlos III de Madrid
3

1. Inferencia en muestras pequeas


Y si n no es grande?
Las propiedades estadsticas de

X / n
cambian!! Dependen de la distribucin de X

X / n S

Los intervalos y los contrastes del tema anterior no seran correctos

En el caso de X normal, se tiene que independientemente del tamao de n

X N (0,1) / n

X / n S

Distribucin t de Student

Informtica. Universidad Carlos III de Madrid

Tema 7: Inferencia en poblaciones normales

1. 2. 3. 4.

Inferencia Inferencia Inferencia Inferencia

en muestras pequeas con la distribucin t de Student sobre sobre

Informtica. Universidad Carlos III de Madrid

2. Inferencia con la distribucin t de Student

La distribucin t de Student es una variable aleatoria continua, simtrica, de media cero, y de perfil muy parecido a la normal estndar. Depende de un parmetro g que se denomina grados de libertad. Su notacin habitual es tg

Informtica. Universidad Carlos III de Madrid

2. Inferencia con la distribucin t de Student

Puede demostrarse que si XN(,),

X tn 1 / n S
Si el tamao muestral es grande

La distribucin cambia con n

X tn 1 N (0,1) / n S
Informtica. Universidad Carlos III de Madrid
7

Tema 7: Inferencia en poblaciones normales

1. 2. 3. 4.

Inferencia Inferencia Inferencia Inferencia

en muestras pequeas con la distribucin t de Student sobre sobre

Informtica. Universidad Carlos III de Madrid

3. Inferencia sobre
Intervalos de confianza para m

en lugar de

z / 2

S IC(1 ) : X tn 1; /2 n

Informtica. Universidad Carlos III de Madrid

Ejemplo

En una explotacin minera las rocas excavadas se someten a un anlisis qumico para determinar su contenido de Cadmio. Despus de analizar 25 rocas se obtiene que

x = 9.77

= 3.164 s

Suponiendo que el contenido de Cadmio sigue una distribucin normal. Se quiere construir un intervalo de confianza al 95% para el contenido medio de Cadmio en las rocas de la mina.

S IC(1 ) : X tn 1; /2 n

Informtica. Universidad Carlos III de Madrid

10

Ejemplo

En una explotacin minera las rocas excavadas se someten a un anlisis qumico para determinar su contenido de Cadmio. Despus de analizar 25 rocas se obtiene que

x = 9.77

= 3.164 s

Suponiendo que el contenido de Cadmio sigue una distribucin normal. Se quiere construir un intervalo de confianza al 95% para el contenido medio de Cadmio en las rocas de la mina.

Para n=25 y a=0.05


a/2=0.025

t24;0.025 = 2.06

3.164 IC(0.95) : 9.77 2.06 = (8.47,11.07) 25


Informtica. Universidad Carlos III de Madrid
11

Para n=25 y a=0.05


a/2=0.025

t24;0.025 = 2.06
Usando la aproximacin N(0,1) como si fuese para muestras grandes...

a/2=0.025

z0.025 = 1.96
Informtica. Universidad Carlos III de Madrid
12

Usando la t de Student: intervalo exacto

3.164 IC(0.95) : 9.77 2.06 = (8.47,11.07) 25


Usando la aproximacin a N(0,1) para muestras grandes

3.164 9.77 1.96 = (8.53,11) 25


Si no usamos la t de Student, daremos un intervalo ms estrecho del que tiene realmente un confianza del 95%. Este intervalo tiene una confianza menor de la que pensamos

Para poblaciones normales usaremos siempre la t de Student


Informtica. Universidad Carlos III de Madrid
13

3. Inferencia sobre

Contraste de hiptesis (a) H0:=0; frente a H1:0, (b) H0:0; frente a H1:>0, (c) H0:0; frente a H1:<0.

Se hacen igual, pero usando las siguientes distribuciones de referencia

X 0 Z0 = N (0,1) / n

X 0 T0 = tn 1 / n S

Informtica. Universidad Carlos III de Madrid

14

PASO 1:

PASO 2:

PASO 4:

H0 : = 0 ; H1 : 0
(a)

Rechazo H0 Acepto H0

Rechazo H0

(a)

z /2 tn 1; /2

z /2 tn 1; / 2
Rechazo H0

H0 : 0 ; H1 : > 0
(b)
PASO 3:

Acepto H0

(b)

z tn 1;

Z 0 N (0,1)
H0 : 0 ; H1 : < 0
(c) (c)

T0 tn 1

Rechazo H0

Acepto H0

z tn 1;

La regin de rechazo est Informtica. Universidad Carlos III de Madrid donde seala H1

15

Ejemplo

Se quiere saber si la media de la ganancia de los transistores BC547B se mantiene el valor nominal =290 H0 : =290 H1: 290

Con 100 datos:

p-valor del test de la chi-cuadrado para el ajuste de una normal: p-value=0.43

Podemos asumir normalidad en X


Informtica. Universidad Carlos III de Madrid
16

Ejemplo

Se quiere saber si la media de la ganancia de los transistores BC547B se mantiene el valor nominal =290 a=0.05 H0 : =290 H1: 290

Con 100 datos:

Rechazo H0 Acepto H0

Rechazo H0

Con un nivel de significacin del 5%, rechazamos H0 La diferencia entre los datos y 290 es significativa

(a)

t99;0.025
-1.98

t99;0.025
1.98 El tamao muestral es grande, y por eso el valor crtico es muy similar al de N(0,1)
17

(z0.025 = 1.96)

Informtica. Universidad Carlos III de Madrid

Tema 7: Inferencia en poblaciones normales

1. 2. 3. 4.

Inferencia Inferencia Inferencia Inferencia

en muestras pequeas con la distribucin t de Student sobre sobre

Informtica. Universidad Carlos III de Madrid

18

4. Inferencia sobre

Estimadores de s2

S2 =

( Xi X )
i =1

2 = S

( Xi X )
i =1

n 1

sesgado

(cuasivarianza) insesgado

En poblaciones normales, la distribucin muestral de estos estimadores est relacionada con la distribucin chi-cuadrado

Informtica. Universidad Carlos III de Madrid

19

4. Inferencia sobre
La distribucin c2 La c2 es una variable aleatoria no negativa. Es asimtrica positiva Depende de un parmetro g que se llama grados de libertad Su notacin es
2 g

Si X es normal

2 (n 1) S

2
nS 2

2 n 1

2 n 1

Informtica. Universidad Carlos III de Madrid

20

4. Inferencia sobre
Intervalos de confianza para Operando igual que en el caso de la media...
2 2 ( 1) ( 1) n s n s 2 ; 2 IC(1 ) : 2 n1; / 2 n1;1 / 2

2 2 ns ns IC(1 ) : 2 ; 2 n1; / 2 n1;1 / 2 2

No son simtricos alrededor de la estimacin

Informtica. Universidad Carlos III de Madrid

21

Ejemplo

En una explotacin minera las rocas excavadas se someten a un anlisis qumico para determinar su contenido de Cadmio. Despus de analizar 25 rocas se obtiene que

x = 9.77

= 3.164 s

2 = 10.01 s

Suponiendo que el contenido de Cadmio sigue una distribucin normal. Se quiere construir un intervalo de confianza al 99% para la varianza poblacional s2

2 2 ( 1) ( 1) n s n s ; 2 IC(1 ) : 2 n1; / 2 n1;1 / 2 2

Informtica. Universidad Carlos III de Madrid

22

Ejemplo

En una explotacin minera las rocas excavadas se someten a un anlisis qumico para determinar su contenido de Cadmio. Despus de analizar 25 rocas se obtiene que

x = 9.77

= 3.164 s

2 = 10.01 s

Suponiendo que el contenido de Cadmio sigue una distribucin normal. Se quiere construir un intervalo de confianza al 99% para la varianza poblacional s2

a/2=0.005

a/2=0.005

Para una confianza del 99% tenemos a/2=0.005

2 24;0.995 = 9.89

2 24;0.005 = 45.6

24 3.1652 24 3.1652 IC (0.99) : , 45.6 9.89


2

IC (0.99) : 2 ( 5.27,24.29 )
Podra ser 2=25?

Informtica. Universidad Carlos III de Madrid

23

4. Inferencia sobre

Contraste de hiptesis para (a): H0 : =0; H1: 0 (b): H0 : 0; H1: >0 (c): H0 : 0; H1: <0 Estadstico de contraste Sigue la misma metodologa que para otros parmetros

X 02 =

2 (n 1) S

02

X 02 =

nS 2

02

Distribucin de referencia
2 X 02 n 1

Informtica. Universidad Carlos III de Madrid

24

PASO 1:

PASO 2:

PASO 4:

H0 : =0; H1: 0 (a)

X 02 =

2 (n 1) S

Rechazo H0 Acepto H0

Rechazo H0

2 0

(a) 2

n 1;1 / 2

n21; / 2

X =
2 0

nS 2

02
Acepto H0

H0 : 0; H1: >0 (b) (b)


PASO 3:

Rechazo H0

n21;
Acepto H0

Rechazo H0

H0 : 0; H1: <0 (c)

2 X 02 n 1
(c)

n21;1

La regin de rechazo est Informtica. Universidad Carlos III de Madrid donde seala H1

25

Ejemplo

Sobre los transistores BC547B mencionados anteriormente, tenamos el objetivo de comprobar si la media no haba cambiado, as como comprobar si la varianza no haba aumentado. Podemos ahora contrastar este segundo punto. Los datos histricos decan que 0=760. Por tanto el contraste es H0:760;H:>760.

Acepto H0

Rechazo H0

Con 100 datos

2 = 766.85 s

2 99;0.05

= 123.2

x =
2 0

2 (n 1) s

02

99 766.85 = 99.89 760

La diferencia entre los datos y la hiptesis no es significativa (con nivel 5%) y puede deberse al azar de la muestra

No rechazamos H0

Informtica. Universidad Carlos III de Madrid

26

You might also like