You are on page 1of 30

Estadstica aplicada

y
Planificacin experimental
ric Le Bouleng
UMSS, Noviembre de 2009

Repaso de mtodos estadsticos

mardi 17 novembre 2009

1. Alimento clsico vs modificado:


Mismo crecimiento?
Dos lotes indpendientes de aelos al azar :
Un lote recibe el alimento A, el otre, el alimento B.
Se mide el crecimiento de cada aelo en un ao.
A
13,3
14,5
13,8
12,7
14,1
13,6
13,9
14,3

B
12,6
13,0
14,2
12,3
11,9
13,6
12,7

Media

13,78

12,90

Varianza

0,33

0,61

Desviacon std.

0,58

0,78

Crecimiento (Kg)

Nmero

Planificacin experimentl, UMSS, Noviembre de 2009

mardi 17 novembre 2009

Muestras independientes
ric Le Bouleng

1. Comparar dos medias:


Test de Student
Si 2A = 2B : t =

S2 =

(YA YB ) ( A B ) ~ St(n
1
2 1
S +
nA nB

(nA 1) SA2 + (nB 1) SB2


nA + n B 2

p=0,95

7 0,33+ 6 0,61
= 0,46
7+6

Test para H0: A = B <> H1: A B

Intrvalo de confianza
para A B

tobs =

13,78 12,90
= 2,49
1 1
0,46 +
p-valor=0,027
8 7

YA YB t SY A YB < A B < YA YB + t SY A YB
0,35 < A B < 0,87 +2,16 0,35
0,87 2,16
0,11 < A B < 1,63

Planificacin experimentl, UMSS, Noviembre de 2009

mardi 17 novembre 2009

A + n B 2)

ric Le Bouleng

2. Comparar cuatro alimentos:


Mismo crecimiento?

Rgime:
Croissance (Kg):

A
13,3
14,5
13,8
12,7
14,1
13,6
13,9
14,3

B
12,6
13,0
14,2
12,3
11,9
13,6
12,7

C
16,2
15,3
15,7
16,1
14,8
15,4
16,0
15,2
14,3
16,4

D
13,0
14,8
12,9
15,1
13,7
13,4
14,6
15,3
14,1

Croissance

Cuatro lotes de aelos reciben cada uno uno de los


alimentos (A, B, C, D) que se quiere comparar.
Se mide el crecimiento de cada aelo en un ao.
17
16
15
14
13
12
11
10

Alimento: A B C D

Muestras independientes
Planificacin experimentl, UMSS, Noviembre de 2009

mardi 17 novembre 2009

ric Le Bouleng

2. Comparar k medias:
El anlisis de varianza (ANOVA)
Modelo (ANOVA 1):

Yij - = i - + Yij - i
Yij - = i + ij

Diferncias:

total = factorial + residual


ij
i

Subtrayendo , solo
quedan las diferncias.

Yij -

Factor:
Nivel n i

Alimento:

A B C D
1 2 3 4

Planificacin experimentl, UMSS, Noviembre de 2009

mardi 17 novembre 2009

ric Le Bouleng

Si el factor no tiene efecto,


las diferncias factoriales i
valdrn todas 0.

2. Resultados del ANOVA 1


Tabla clsica del anlisis de varianza,
test F de Fisher-Snedecor comprobando la igualdad de las medias.
Con un p-valor muy pequeo, se rechaza la igualdad.
Source
Totale
Factorielle
Rsiduelle

SCE
47,82
31,32
16,50

Croissance

16
15

ddl
33
3
30

10,44
0,55

18,98

p-valeur
0,00000043 P<0,0001

Pero donde son las diferncias?

Comparaciones multiples
(realizadas aqu con el JMP)

14
13

CM

12
A

C
Regime

Each Pair
Student's t
0,05

Planificacin experimentl, UMSS, Noviembre de 2009

mardi 17 novembre 2009

ric Le Bouleng

3. Tensin muscular antes/despus


de cortar el niervo scitico
Para 10 sapos, se midi la tensin del
musculo antes, y despus del corte.

Moyenne

50,0

33,0

Variance

451,3

272,7

Ecart-type

21,2

16,5

53
67
21
29
35
27
37
30
21
10

Planificacin experimentl, UMSS, Noviembre de 2009

mardi 17 novembre 2009

Callate-es para
la cincia !

100

Tension

Aprs section

1
2
3
4
5
6
7
8
9
10

Avant section
75
96
32
41
50
39
59
45
30
33

Muscle n

Ay !!!

75
50
25
0

Antes
A

Despus
B

Datos en parejas
ric Le Bouleng

3. Los datos de un mismo sapo


estan correlacionados!
Entonces

No se trata de
dos lotes
independientes.

Y Cuantas dimensiones son necesrias para representar los datos?


Y Como se puede medir la dependncia entre tensiones antes y despues?
Planificacin experimentl, UMSS, Noviembre de 2009

mardi 17 novembre 2009

ric Le Bouleng

3. Los datos de un mismo sapo


estan correlacionados!
Entonces

No se trata de
dos lotes
independientes.

Y Cuantas dimensiones son necesrias para representar los datos?


Y Como se puede medir la dependncia entre tensiones antes y despues?
Planificacin experimentl, UMSS, Noviembre de 2009

mardi 17 novembre 2009

ric Le Bouleng

3. Truco: analisr las diferncias


Avant section
75
96
32
41
50
39
59
45
30
33

Moyenne
Variance
Ecart-type

50,0
451,3
21,2

Aprs section Diffrence

53
67
21
29
35
27
37
30
21
10

22
29
11
12
15
12
22
15
9
23

33,0
272,7
16,5

17,0
43,1
6,6

Antes - Despus

1
2
3
4
5
6
7
8
9
10

Muscle n

Diferencia de tensin
30

Moyenne et I.C.

23
15
8
0
1

Nmero de muestra

Si el corte del niervo no tiene efecto,


la media de las diferncias debera ser 0.
Planificacin experimentl, UMSS, Noviembre de 2009

mardi 17 novembre 2009

ric Le Bouleng

10

10

4. La distncia al borde de la
plantacin influencia el crecimiento
del pino?
En cinco plantaciones elegidas al azar,
se ha medido la circumferencia de tres pinos:
une del borde (1 rango), uno de 2 rango, uno de 3 rango.
Plantation : A B C D E Moyenne
1 range
39 25 29 20 18
26,2
2 range
23 15 26 13 21
19,6
3 range
22 20 23 12 9
17,2
Moyenne 28 20 26 15 16
21,0

El diseo de este experimento generaliza l de


uno que ya hemos visto: Cul?
Planificacin experimentl, UMSS, Noviembre de 2009

mardi 17 novembre 2009

ric Le Bouleng

11

4. ANOVA, De acuerdo !
Pero cuantos factores?
R Pl

DF

Sum of
Squares

Total
14
Rangee
2
Plantation 4
Interaction 8
Error
0

774
217,2
408
148,8
0

Source

Mean
Square
55,3
108,6
102
18,6

F Value Pr > F
5,84

0,0273

El efecto del rango


es significativo

La varianza residul no se puede estimar

Nota: Este es el diseo en bloques aleatrios completos.


Planificacin experimentl, UMSS, Noviembre de 2009

mardi 17 novembre 2009

ric Le Bouleng

12

5. Crecimiento del tomate:


Depende de la temperatura?
25
L 20
o
n 15
g
.
10

10h
16h

c
m 5
0
12

14

16

18

20

22

24

26

Temprature (C)

Se mide el largo alcanzado, un ms despus de germinr, por 12


pis de tomate - 4 plantas por temperatura.
Planificacin experimentl, UMSS, Noviembre de 2009

mardi 17 novembre 2009

ric Le Bouleng

13

5. Es un factor cuantitativo, su efecto


se puede "modelisar": Regresin
Largo (Y) = + * Temperatura (x) +

A propsito: Mejr 3 temperaturas y 4 plantas por temperature, 12


temperaturas y una planta por temperatura?
Planificacin experimentl, UMSS, Noviembre de 2009

mardi 17 novembre 2009

ric Le Bouleng

14

5. Planificr, llave del xito!


El anlisis de varianza indica que el efecto de la temperatura es significativo
(p-val=0,0018)
Analysis of Variance
Source
DF
Model
Error
C. Total

1
10
11

Sum of
Squares
128,0
72,0
200,0

Mean Square
128,0
7,2

F Ratio
17,7778
Prob > F
0,0018

La relacin estimada es : Crecimiento (cm) = 2,8 + 0,8 * Temperatura (C)


Linear Fit
Y = 2,8 + 0,8*T

Pero el modelo es mal ajustado:


El test de "Lack-Of-Fit" (mal ajuste) es casi significativo (p-val=0,06).
Lack Of Fit
Source

DF

Lack Of Fit
Pure Error
Total Error

1
9
10

Este test necesita

Sum of
Squares
24,0
48,0
72,0

24,0
5,3

F Ratio
4,5000
Prob > F
0,0629

n (obs) > s (puntos soportes) > p (parmetros)

Planificacin experimentl, UMSS, Noviembre de 2009

mardi 17 novembre 2009

Mean Square

ric Le Bouleng

15

6. Crecimiento del tomate segn


dos factores: T y Largo del da
25
L 20
o
n 15
g
.
10

10h
16h

c
m 5

Dos pis de tomate por


temperatura y por largo de da.

0
12

14

16

18

20

22

24

26

Temprature (C)

Depende el crecimiento de la temperatura? Y del largo del da? Cambian los efectos de la
temperatura dependiente del largo del da? Son lineales estos efectos?

Planificacin experimentl, UMSS, Noviembre de 2009

mardi 17 novembre 2009

ric Le Bouleng

16

6. Modelizr una respuesta


cuantitativa dependiendo de k factores
Regresin mltiple (superficie de respuestas: factores cuantitativos) y
Modelizacin linel generl (factores cualquieras)
Matriz "Design"
1
1
1
1
1
1
1
1
1
1
1
1

X
-1
-1
-1
-1
-1
-1
1
1
1
1
1
1

-1
-1
0
0
1
1
-1
-1
0
0
1
1

Es Ts

Y = 18 + 4T + 1E R2 = 0,7
Source

DF

Model
Error
Corrected Total

2
9
11

Variable
INTERCEP
TS
ES

DF
1
1
1

Parameter
Estimate
18,0
4,0
1,0

Planificacin experimentl, UMSS, Noviembre de 2009

mardi 17 novembre 2009

Sum of
Squares
140
60
200

Mean
F Value
Square
70
10,5
6,67

Standard
Error
0,745
0,913
0,745

ric Le Bouleng

Pr > F

Test generl:
Sirve el modelo?

0,0044

T for H0:
Parameter=0 Prob>|T|
24,15
0,0001
4,38
0,0018
1,34
0,2126

17

6. Comparacin de modelos
Modelo saturado:
s=6, p=6

Y = 20 + 4T -3T2+ 2E - 1,5 T*E - 1,5 T2*E


R2 = 0,94
Variable
INTERCEP
TS
TTS
ES
TES
TTES

X
1
1
1
1
1
1
1
1
1
1
1
1

-1
-1
-1
-1
-1
-1
1
1
1
1
1
1

-1
-1
0
0
1
1
-1
-1
0
0
1
1

1
1
0
0
1
1
1
1
0
0
1
1

1
1
0
0
-1
-1
-1
-1
0
0
1
1

-1
-1
0
0
-1
-1
1
1
0
0
1
1

DF
1
1
1
1
1
1

Parameter
Estimate
20,0
4,0
-3,0
2,0
-1,5
-1,5

Standard
Error
0,707
0,500
0,866
0,707
0,500
0,866

T for H0:
Parameter=0 Prob>|T|
28,28
0,0001
8,0
0,0002
-3,46
0,0134
2,83
0,0300
-3,00
0,0240
-1,73
0,1340

Y = 20 + 4T -3T2+ 1E - 1,5 T*E


R2 = 0,91
Variable
INTERCEP
TS
TTS
ES
TES

DF
1
1
1
1
1

Parameter
Estimate
20,0
4,0
-3,0
1,0
-1,5

Standard
Error
0,802
0,567
0,982
0,463
0,567

T for H0:
Parameter=0 Prob>|T|
24,94
0,0001
7,06
0,0002
-3,06
0,0185
2,16
0,0676
-2,65
0,0331

Never fall in love with your model


Planificacin experimentl, UMSS, Noviembre de 2009

mardi 17 novembre 2009

ric Le Bouleng

18

6. Modelo seleccionado:
Como se ven sus efectos?
Herramientas para interpretar:
Efectos principales e interacciones
Herramientas para predecr:
Curvas de iso-respuesta y
superficies de respuesta.

23,1892
20
1,8959

Ecl

25

Ecl

14

18

Y
21

19 20

15

1617

15

24

20

16

13

16

10

19

24

14

10

10

Ecl

14
0

25

10
16
Ecl

Ecl

15
10

12
11
14

15

20

24

25 10 12 14 16

Planificacin experimentl, UMSS, Noviembre de 2009

mardi 17 novembre 2009

Y
10

20

13

ric Le Bouleng

19

7. El "sex-ratio" del corzo


En una muestra de 50 corzos, se han observado 18
machos.
Pregunta: Hay tantos machos como hembras?

H0: P(macho) = 0,5


H1: P(macho) 0,5

Para 1ddl:

2
Corr

Mles
(i=1)
Femelles (i=2)

18
32

25
25

1,96 1,69
1,96 1,69

Total

50

50

3,92 3,38

(Oi Ei )2

i=1

Ei

=
i=1

( Oi Ei 0, 5)2
Ei

Planificacin experimentl, UMSS, Noviembre de 2009

mardi 17 novembre 2009

2Corr

Ei

Stat. del Chi2: =

Oi

Para
=0,05 :

P(2 > 3,92) = 0,048 : RH0


P(2 > 3,38) = 0,066 : AH0

ric Le Bouleng

20

7. Hay muchos mtodos para inferir


acerca de
Adems del Chi2, existe un mtodo exacto
basado en la ley Binomil, une aproximacin
Normal y sobre todo, la transformacin LOGIT,
base de la regresin logstica.
Odds para un evento:
Oi
Mles

pi

Cotei

18 0,36 18/32=0,56

Femelles 32 0,64 32/18=1,78

La observacin de una hembra es 0,78 veces ms frecuente que la


observacin de un macho (, se observa 1,78 hembras por macho)

Nota: El Odds para machos se llama sex-ratio


Planificacin experimentl, UMSS, Noviembre de 2009

mardi 17 novembre 2009

ric Le Bouleng

21

7. Odds y Logit
Probabilidad :
Odds :
ln(odds) (Logit) :

0
0
-

0,5
1
0

El concepto de Odds es la base de la regresin logstica.

Nota:
Olympic Marsiglia esta 4 contra 1 en las apuestas <=> pierde 4 veces por vez que gana.
Planificacin experimentl, UMSS, Noviembre de 2009

mardi 17 novembre 2009

ric Le Bouleng

22

8. Variaciones de peso de geotrupes


Se ha pesado 500 geotrupes en tres stios en
el Norte, tres stios en el Centro, y tres stios
en el Sur de Polonia.
Pregunta: El peso depende de la latitud?

Planificacin experimentl, UMSS, Noviembre de 2009

mardi 17 novembre 2009

ric Le Bouleng

23

8. Modelo: ANOVA 2 con jerarchia


Un geotrupe pertenece a uno (y un solo) stio.
Un stio pertenece a una (et una sola) latitud.

Latitud Stio

Planificacin experimentl, UMSS, Noviembre de 2009

mardi 17 novembre 2009

ric Le Bouleng

24

8'. Variaciones de peso de geotrupes


Se pesaron 250 geotrupes machos y 250 hembras en tres
stios del Norte, tres stios del Centro y tres stios del Sur
de Polonia.
Preguntas: El peso depende de la latitud? Del sexo? El
efecto de la latitud cambia con el sexo?

Planificacin experimentl, UMSS, Noviembre de 2009

mardi 17 novembre 2009

ric Le Bouleng

25

8'. Modelo: ANOVA 3 "parcialmente


jerarquizado"
Un geotrupe pertenece a uno (y un solo) stio.
Un stio pertenece a una (y una sola) latitud.
Pero un macho es un macho, cualquieres sean el
stio y la latitud de su recoleccin.

Sexo Latitud Stio

Planificacin experimentl, UMSS, Noviembre de 2009

mardi 17 novembre 2009

ric Le Bouleng

26

9. Diferenciacin morfomtrica entre


poblaciones locales de ratas almizcleras
Se capturaron 144 ondatras en 9
afluentes del rio La Houille.
Se tomaron 10 medidas
crniometricas y se peso el cristalino
del ojo..
ME
MB

MF
MA

MC

MD
MG

Preguntas: Las poblaciones locales difieren morfologicamente entre


si? Se puede hablar de aislamiento por distancia?
Planificacin experimentl, UMSS, Noviembre de 2009

mardi 17 novembre 2009

ric Le Bouleng

27

9. Mtodos: ACP within, ANCOVA,


Correlaciones
El anlisis muestra, que la diferencia crece
como la distancia entre poblaciones.
Pero la mejor medida de la distancia, no
es geogrfica: es social!
6

geographicas (km)
Zone
C
E
J
L
N
O
T

E
3,8

J
5,2
4,0

L
6,4
5,6
1,5

N
3,8
6,1
4,5
4,7

O
4,0
7,0
5,9
6,2
1,5

morfomtricas (D2 total)


T
6,1
6,8
3,3
2,5
3,1
4,5

Zone
C
E
J
L
N
O
T

Planificacin experimentl, UMSS, Noviembre de 2009

mardi 17 novembre 2009

Age-free

Distncias:
E
4,9

J
5,3
9,3

L
N
O
4,0 8,0 13,0
6,0 12,0 16,5
3,6 5,1 15,1
4,6 7,4
7,1

ric Le Bouleng

T
8,0
6,2
7,7
2,3
7,0
7,3

5
3
2
0
0

10

Decisions

28

10. Como esta estructurada la


especie Rhinanthus minor ?
Se han descrito los Rhinanthus en vrias regiones
indices moleculares chloroplsticos,
indices nucleares (AFLP),
medidas morfmtricas.

Pregunta: Se pueden ver agrupamientos


geogrficos?

Planificacin experimentl, UMSS, Noviembre de 2009

mardi 17 novembre 2009

ric Le Bouleng

29

10. Mtodo: Clasificacin automtica


1. Comparar 2. Agrupar 3. Representar (dendrograma)

Jrme Vrancken, 2008


Planificacin experimentl, UMSS, Noviembre de 2009

mardi 17 novembre 2009

ric Le Bouleng

30

You might also like