You are on page 1of 18

CURSO PRCTICO: DISEO EXPERIMENTAL Y PROCESAMIENTO DE

DATOS CON EL INFOSTAT 1/Profesional Y EL STATISTIX 8


Instructor: Ing. Agr. Carlos Marn R.
Tlf/FAX Oficina: (0243) 2402911 / 0414-4617255
E-mail's: cmarin@inia.gov.ve / carlmarinr@cantv.net / cmarinr@cantv.net
1.- JUSTIFICACIN
Curso prctico de estadstica y diseo experimental que incluye el
aprendizaje de tcnicas de procesamiento de datos con apoyo de la
computadora. El curso implica la utilizacin de un software especializado
para el diseo experimental y el anlisis estadstico paramtrico univariado.
El procesamiento de los datos se hace con la finalidad de generar
indicadores que faciliten el anlisis de los diseos de campo con fines de
experimentacin en mejoramiento gentico y agronmico.
2.- OBJETIVOS
1. Adiestrar a los cursantes en el manejo de tcnicas estadsticas como
herramientas de trabajo para diagnstico, evaluacin, inferencia y base
para toma de decisiones.
2. Adiestrar a los cursantes en el manejo del software estadstico para un
eficiente manejo y rpido procesamiento de datos.
3. Utilizar las pruebas estadsticas ms apropiadas para el manejo de los
datos a los fines de realizar anlisis de ensayos agronmicos y para
realizar anlisis de medias.
4. Generar habilidades generales para el manejo de datos e informacin en
el entorno de trabajo.
3. MATERIALES Y MTODOS
Clases Tericas
08 horas
Clases Prcticas
16 horas
Duracin: 3 das (SEGUNDA SEMANA DE MAYO DAS 11, 12 Y
13)
Apoyo Audiovisual
- Clases orales y prcticas con Video Beam.
- Software estadstico: INFOSTAT v 1/P Statistix 8.
- Manual del software empleado.
4. CONTENIDO PROGRAMTICO
1. Conceptos bsicos de estadstica. Divisin de la estadstica: Estadstica
descriptiva, Inferencia estadstica. Variables. Tipos de variables. Escalas de
medicin.
2. Estadstica descriptiva. Anlisis de normalidad. Conceptos de archivos.
Manejo de archivos. Tipos de archivo. Presentacin de los datos en

PROCESAMIENTO DE DATOS SAS v 8.2

Ing. Agr. Carlos Marn R.

Categoras y en tablas.
3. Aplicaciones que manipulan archivos de datos. Hojas de clculo
electrnica. Arreglo de datos. Archivos ASCII. Archivos propios de los
programas.
4. INFOSTAT Y STATISTIX 8: Manejo de archivos. Procesamiento de datos.
Anlisis de normalidad. Anlisis de varianza, anlisis factorial. Anlisis de
regresin.

5. ESTRATEGIA DE EVALUACIN
6. MATERIAL DE APOYO
1.- Textos clsicos de estadstica y diseo experimental.
2.- Gua de uso rpido preparada por el instructor (anexa).
7. CONOCIMIENTOS REQUERIDOS POR PARTICIPANTES
1. Estadstica Bsica y Aplicada. Ajuste de normalidad. Conceptos bsicos de
diseo experimental y de anlisis de regresin.
2. Conceptos bsicos en el manejo de computadoras personales. Ambiente
Windows y MS Excel. Conocimientos bsicos del ingls.
3. Nivel de instruccin requerido: TSU y Profesional Universitario.

Ing. Agr. Carlos A. Marn R.

DISEO EXPERIMENTAL Y PROCESAMIENTO DE


DATOS CON EL INFOSTAT Y EL STATISTIX 8

1.- INTRODUCCIN
Curso prctico de estadstica y diseo experimental
sobre tcnicas de procesamiento de datos con apoyo de la
computadora. El curso comprende la utilizacin de un
software

especializado

para

el

anlisis

estadstico

paramtrico univariado y el diseo experimental (bloques al


azar, arreglos factoriales). El procesamiento de los datos se
hace con la finalidad de generar indicadores que faciliten los
diseos

de

campo

con

fines

de

experimentacin

en

mejoramiento agronmico y mejoramiento gentico.

2.- OBJETIVOS
Adiestrar a los cursantes en el manejo de tcnicas
estadsticas.
Adiestrar a los cursantes en el manejo de programas
estadsticos.
Utilizar las pruebas estadsticas ms apropiadas para el
manejo de los datos a los fines de realizar anlisis de
medias y anlisis de varianza.

PROCESAMIENTO DE DATOS SAS v 8.2

Ing. Agr. Carlos Marn R.

Generar habilidades generales para el manejo de datos e


informacin.

3. CONTENIDO
3.1 CONCEPTOS BSICOS DE ESTADSTICA:
Ciencia aplicada que estudia la naturaleza de los datos y los
reagrupa en cuadros, tablas y grficos (informacin). Dato.
Informacin. Teora de sistemas.
ENTRADA PROCESO SALIDA

DIAGNSTICO CARACTERIZACIN ANLISIS


INFERENCIA

3.2 VARIABLES:
TIPOS DE VARIABLES:
Variable Cualitativa
Nominal (Doble estado y Multi estado): Color, aspecto, forma

PROCESAMIENTO DE DATOS SAS v 8.2

Ing. Agr. Carlos Marn R.

Ordinal: Orden
Variable Cuantitativa
V. Cuantitativa Discreta: Discontinuidad (Conteos)
V. Cuantitativa Continua: Continuidad (Escalas de medicin)
Representacin de las variables: cuadros y grficos estadsticos.
CAMPOS DE ESTUDIO DE LA ESTADSTICA
NO PARAMTRICO (Variables cualitativas)

Prueba de los Signos. Prueba de la Mediana de las Rachas.


Kolmogorov-Smirnov. Prueba de concordancia de Mc Nemar.
Prueba de Ji al cuadrado. Anlisis de la Varianza segn Friedman.
Anlisis de la Varianza de Kruskal y Wallis. Regresin no
paramtrica.

PARAMTRICO UNIVARIADO (Variables cuantitativas)

Anlisis de normalidad. Estadstica Descriptiva. Estadstica


Inferencial. Prueba de Medias. Anlisis de la Varianza. Regresin
Lineal.

Regresin

Lineal

Mltiple.

(exponencial, logartmica, polinomial, tc.)

Diseo Experimental

Regresin

no

lineal

PROCESAMIENTO DE DATOS SAS v 8.2

Ing. Agr. Carlos Marn R.

MULTIVARIADO PARAMTRICO Y NO PARAMTRICO

Anlisis de Componentes Principales de la Varianza Total. Anlisis


de Clasificacin Jerrquica (Cluster). Anlisis de Coordenadas
Factoriales

DIVISIN DE LA ESTADSTICA:
ESTADSTICA DESCRIPTIVA
Datos no agrupados en frecuencias y datos agrupados en intervalos y
frecuencias. Distribucin de frecuencias. Histogramas y polgonos de
frecuencias. Percentiles, deciles y cuartiles.
MEDIDAS DE TENDENCIA CENTRAL
Media aritmtica:

n
( )
2

n
( 1)
2

Mediana:

Me

Moda:

Valor que ms se repite

para n par;

Me X

n 1
)
2

MEDIDAS DE DISPERSIN
Rango/Amplitud de variacin: Mximo - Mnimo.
Desviacin Media:

xi x
n

para n impar

PROCESAMIENTO DE DATOS SAS v 8.2

Desviacin Estndar:

Varianza:

Ing. Agr. Carlos Marn R.

xi X ;

n 1

xi x ; s2 = (s)2;
2

s2

Error Estndar:

f x

n 1

s
2

2
i

f x

f x
i

(f x

n 1
2
i

)2

n 1

s2
es
n

Coeficiente de Variacin:
Intervalo de Confianza:

CV (%)
s

n
x

s
* 100
x

; n 1
2

s
n

s
n
s
n

; n 1
2

n < 30
n 30

ESTADSTICA INFERENCIAL:
Estimacin de parmetros de una poblacin a partir de estadsticos de
una muestra.

MEDIA ARITMTICA
DESVIACIN ESTNDAR
VARIANZA
TAMAO
Muestreo: (representatividad)
Muestreo aleatorio o al azar.

PARMETROS

2
N (>30)

ESTADSTICOS
X

S
s2
n (30)

PROCESAMIENTO DE DATOS SAS v 8.2

Ing. Agr. Carlos Marn R.

DISTRIBUCIONES MUESTRALES: Distribuciones de probabilidad.


Distribuciones de funcin de densidad. Esperanza matemtica.
DISTRIBUCIONES TERICAS DE PROBABILIDAD:
DISTRIBUCIONES DE PROBABILIDAD DISCRETA:
Binomial, Poisson, Bernoulli
DISTRIBUCIONES

DE

(PROBABILIDAD CONTINUA):

FUNCIN

DE

DENSIDAD
1 x


1
F x
e 2
2

t de student y Distribucin Normal (z). Distribucin de Ji-Cuadrado


(2).
Distribucin de F. Aproximacin de la distribucin binomial a la
normal.

ANLISIS INFERENCIAL:
ESTIMACIN DE MEDIAS
Intervalos de confianza. Estimacin de a partir de muestras grandes.
Estimacin de a partir de muestras pequeas.
CONTRASTE DE HIPTESIS
Fundamentos: Error tipo I y error tipo II. Contraste de hiptesis
respecto a la media (). Contraste de hiptesis de diferencia de dos
medias muestrales (1 - 2). Contraste de hiptesis respecto 2.

PROCESAMIENTO DE DATOS SAS v 8.2

Ing. Agr. Carlos Marn R.

Contraste de hiptesis con respecto a dos varianzas (i2 / j2 ). i2 > j2


ANLISIS DE NORMALIDAD:
ALEATORIEDAD / INDEPENDENCIA (Prueba de las
rachas)
ADITIVIDAD (Prueba de Tukey)
NORMALIDAD (Prueba de Wilk-Shapiro)
HOMOCEDASTICIDAD (Prueba de Bartlett, Prueba
de F Cochran)
HOMOGENEIDAD (Segn coeficiente de variacin)

ANLISIS DE LA VARIANZA (ANAVAR):


ANLISIS

DE:

UNA

COLA;

DOS

COLAS;

ARREGLOS

FACTORIALES; PARCELA DIVIDIDA.


Y = + T(i) + e(ij) (DTA)
Y = + T(i) + B(j) + e(ij) (DBCA)
Y = + A(i) + T(j) + B(k) + AT(ij) + e(ijk) (DBCA + ARREGLO
FACTORIAL)
Y = + A(i) + B(j) + AB(ij) + T(k) + AT(ik) + e(ijk)
Esperanza de los Cuadrados Medios
PRUEBA DE MEDIAS: MDS, DUNCAN, TUKEY, BONFERRONI,

PROCESAMIENTO DE DATOS SAS v 8.2

Ing. Agr. Carlos Marn R.

10

SCHEFFE, WALLER-DUNCAN, S-N-K.


CONTRASTES O PARTICIONES ORTOGONALES
INTRODUCCIN AL ANLISIS DE REGRESIN. REGRESIN
LINEAL SIMPLE: Ajuste a una lnea recta. Supuestos del modelo de
regresin. Anlisis de correlacin.
Y b0 b1 X ;
b1

b0
r

Modelo mnimos cuadrados

n XY Y X
n X 2 X

; Pendiente Ho: b1 = 0 (Prueba t)

Y b1 X ; Intercepto Ho: b = 0 (Prueba t)


0
n

n XY X Y

n X

X n Y 2 Y
2

(Prueba t)
r ;
2

Coeficiente

determinacin.

Correlacin r Ho: r = 0
2 (exp licada )
de r 2
(exp licada ) 2 ( no exp licada )
2

2 ( regresin )
Prueba de F ------ F 2
( residual )
APLICACIONES ESPECIALIZADAS EN EL MANEJO DE DATOS:
Hojas de clculo electrnica. Arreglo de datos. Archivos
ASCII. Archivos propios de los programas.
Rutinas bsicas: Manejo de archivos. Importar Archivos

PROCESAMIENTO DE DATOS SAS v 8.2

Ing. Agr. Carlos Marn R.

11

desde Excel y de tipo ASCII. Crear Archivos. Guardar


Archivos.

DISEO TOTALMENTE ALEATORIZADO


(ANLISIS DE UN FACTOR O UNA COLA)
EJ: 5 TRATAMIENTOS REPETIDOS 4 VECES
T1

T5

T2

T4

T4

T3

T2

T4

T5

T3

T5

T3

T5

T1

T2

T1

T4

T3

T2

T1

Y = + T(i) + e(ij)
ANAVAR
Fuente de
variacin
Entre
Tratamiento
Dentro
Tratamiento
Total

Grados de Suma de Cuadrados F


libertad
cuadrados medios
(5-1)=4
SCTrat
CMTrat
CMTrat/CMTratxRep
5(4-1)=15

SCTratxRep

(5x4)-1=19 SCTotal

CMTratxRep
CMTotal

PROCESAMIENTO DE DATOS SAS v 8.2

Ing. Agr. Carlos Marn R.

DISEO BLOQUES COMPLETOS AL AZAR


(ANLISIS DE DOS COLAS)
EJ: 5 TRATAMIENTOS REPETIDOS EN TRES BLOQUES
NORTE
BI

T1

T3

T5

T2

T4

B II

T5

T2

T3

T4

T1

B III

T2

T4

T5

T1

T3

Y = + T(i) + B(j) + e(ij)

ANAVAR
Fuente de
variacin
Tratamiento
Bloque
Error
Total

Grados de
libertad
(5-1)=4
(3-1)=2
(4x2)=8
(5x3)-1=14

Suma de
cuadrados
SCTrat
SCBloq
SCError
SCTotal

Cuadrados F
medios
CMTrat
CMTrat/CMError
CMBloq
CMBloq/CMError
CMError
CMTotal

12

PROCESAMIENTO DE DATOS SAS v 8.2

Ing. Agr. Carlos Marn R.

DISEO CUADRADO LATINO


(ANLISIS DE UN FACTOR, FILAS Y COLUMNAS)
EJ: 5 TRATAMIENTOS REPETIDOS 5 FILAS Y 5 COLUMNAS
F1

C1
T1

C2
T2

C3
T3

C4
T4

C5
T5

F2

T2

T3

T4

T5

T1

F3

T3

T4

T5

T1

T2

F4

T4

T5

T1

T2

T3

F5

T5

T1

T2

T3

T4

Y = + F(i) + C(j) + T(k) + e(ijk)

ANAVAR
Fuente de
variacin
Tratamiento
Filas
Columnas
Error
Total

Grados de
libertad
(5-1)=4
(5-1)=4
(5-1)=4
(5-1)x(5-2)=12
(52)-1=24

Suma de
cuadrados
SCTrat
SCFila
SCCol
SCError
SCTotal

Cuadrados
medios
CMTrat
CMFila
CMCol
CMError
CMTotal

F
CMTrat/CMError
CMFila/CMError
CMCol/CMError

13

PROCESAMIENTO DE DATOS SAS v 8.2

Ing. Agr. Carlos Marn R.

14

DISEO DE LTTICE SIMPLES O CUADRADOS Y


RECTANGULARES
EJ: 25 TRATAMIENTOS DISTRIBUIDOS EN 5 BLOQUES Y
REPETIDOS EN DOS BLOQUES
Bloque

REPETICIN I
T9 T2 T19 T8 T12

REPETICIN II
T21 T2 T22 T25 T2

1
Bloque

3
T11 T2 T17 T5

4
3
T20 T1 T16 T18 T1

2
Bloque
3
Bloque
4
Bloque

T13

T4

T1 T15 T1 T12

T6

4
1
T8 T10 T9

T7

T5

T1

T4

T2

T3

7
9
T13 T1 T15 T11 T1
T6

4
T8 T10

T9

2
T7

T5

T1

T3

T4

T2

Y = + R(j) + T(i) + Tajust.(i) + B(k) + e(ijk)

ANAVAR
Fuente de
variacin
Repeticin

Grados de
libertad
(2-1)=1

Suma de Cuadrados
cuadrados medios
SCRep
CMRep

F
CMRep/CMError

PROCESAMIENTO DE DATOS SAS v 8.2

Tratamiento
Trat(ajust)
Bloque
Error
Total

(25-1)=24
(25-1)=24
(5-1)=4
5x(5-1)=20
(25x2)-1=49

Ing. Agr. Carlos Marn R.

SCTrat
SCTrat(ajust)
SCBloq
SCError
SCTotal

CMTrat
CMTrat(ajust)
CMBloq
CMError
CMTotal

15

CMTrat/CMError
CMTrat(ajust)/CMError
CMBloq/CMError

BLOQUES AUMENTADOS DE FEDERER


EJ: 6 TESTIGOS REPETIDOS 3 VECES

T6 V16 V3
V11 V4

T3 V10

V21 T1 V32 V25 T4

T6 V48

T5 V13 V19

T3 V38 V26 V36 V29

V47 T2

V5 V4
3
4
V4 V5
0
V4

V1

T4 V15 V12 V5

V33 V22 T2 V27 V30

V39 V46

V6

V8 V14 T2

V24 V28 V20 T5 V37

T4 V43 T3

V35 T6 V31 V23 V34

V42 V57

V18 T1

V2

V7

V9 V17

ANAVAR
Grados de Suma de Cuadrados F
libertad
cuadrados medios
(6-1)=5
SCTrat
CMTrat
CMTrat/CMError

V51

T1 V54
V4

5
V5 V4

Y = + T(i) + B(j) + e(ij)

Fuente de
variacin
Testigos

V56

V52
T5

PROCESAMIENTO DE DATOS SAS v 8.2

Bloque
Error
Total

(3-1)=2
SCBloq
(5x2)=10
SCError
(6x3)-1=17 SCTotal

Ing. Agr. Carlos Marn R.

CMBloq
CMError
CMTotal

CMBloq/CMError

16

PROCESAMIENTO DE DATOS SAS v 8.2

Ing. Agr. Carlos Marn R.

17

PRUEBAS ESTADSTICAS SEGN TIPO DE VARIABLE Y CASOS MUESTRALES

CASOS

UNIVARIADO
No Paramtrico (V.
Paramtrico (V. Cuantitativa)
Cualitativa)
Nominal
Ordinal
Discreta
Continua

Una Muestra

Est.
Descriptiva
Bondad de
ajuste
Pruebas:
Binomial y
Multinomial
(ji-cuadrado)

Est. Descriptiva
Bondad de
ajuste Pruebas:
Multinomial
KolmogorovSmirnov
Rachas
(aleatoriedad)

Est. Descriptiva
Bondad de
ajuste Pruebas:
Multinomial,
Normal,
Funcin de
Densidad

Dos Muestras
Relacionadas
Dos Muestras
Independientes

Mc Nemar

Signos, Signos
de Wilcoxon
Kolmogorov
Smirnov,
Rangos de
Wilcoxon,
Mediana, U
Mann-Whitney

K-muestras
Relacionadas

Q Cochran

Prueba de t
pareada
M. Pequeas:
Prueba de t N y
VAR iguales
Prueba de t N y
VAR desiguales
M. Grandes:
Prueba de Z
Anlisis de la
varianza de dos
colas
Diseos
Experimentales
Arreglos
Factoriales

Exacta de
Fisher, jicuadrado

Friedman
Cuadrado
Latino de
Zimmerman
Regresin No
Paramtrica

MULTIVARIADO
Cualitativa

Cuantitativa

Cualitativa y
Cuantitativa
Est. Descriptiva Est. Descriptiva Est. Descriptiva Est. Descriptiva
Bondad de ajuste Bondad de
Bondad de
Bondad de ajuste
Pruebas:
ajuste Pruebas: ajuste
Pruebas
Multinomial,
Multinomial,
Pruebas
Multinomial,
Funcin de
Matriz de
Multinomial,
Funcin de
Densidad,
similitud
Funcin de
Densidad, Normal
Normal
Matriz de
Densidad,
Matriz de
Media muestral disimilitud
Normal
similitud
vs parmetro
Vector de
Matriz de
medias
disimilitud
Matriz
(Coeficientes de
VARCOV
asociacin y de
Matriz CORR
distancia)
2
Prueba de t
T Hottelling
pareada
M. Pequeas:
T2 Hottelling
Prueba de t N y
VAR iguales
Prueba de t N y
VAR desiguales
M. Grandes:
Prueba de Z
Anlisis de la
Anlisis de la
Anlisis de la
varianza de dos varianza
varianza
colas
multivariado
multivariado
Diseos
(ANAVARM) (ANAVARM)
Experimentales Anlisis de
Correlaciones
Arreglos
Coordenadas
Cannicas
Factoriales
Factoriales
Funcin

PROCESAMIENTO DE DATOS SAS v 8.2

CASOS

K-muestras
Independientes

Ing. Agr. Carlos Marn R.

UNIVARIADO
No Paramtrico (V.
Paramtrico (V. Cuantitativa)
Cualitativa)
Nominal
Ordinal
Discreta
Continua

Ji-cuadrado

Anlisis en el
Tiempo y el
Espacio
MLG: Modelo
Lineal General
Anlisis de
Regresin
Lineal y
Mltiple
Regresin No
Lineal
Kruskall-Wallis Anlisis de la
Cuadrado
varianza de una
Latino de
cola
Zimmerman
Diseos
Anlisis de
Experimentales
Regresin No Arreglos
Paramtrica
Factoriales
Anlisis en el
Tiempo y en el
Espacio
MLG: Modelo
Lineal General

18

MULTIVARIADO
Cualitativa

Cuantitativa

Anlisis en el
Tiempo y el
Espacio
MLG: Modelo
Lineal General
Anlisis de
Regresin Lineal
y Mltiple
Regresin No
Lineal

Anlisis de
Clasificacin
Jerrquica
Ascendente
Correlaciones
Cannicas
Funcin
Discriminante

Dicriminante

Anlisis de la
varianza de una
cola
Diseos
Experimentales
Arreglos
Factoriales
Anlisis en el
Tiempo y en el
Espacio
MLG: Modelo
Lineal General

Anlisis de la
varianza
multivariado
(ANAVARM)
Anlisis de
Coordenadas
Factoriales
Anlisis de
Clasificacin
Jerrquica
Ascendente
Correlaciones
Cannicas
Funcin
Discriminante

Anlisis de la
varianza
multivariado
(ANAVARM)
Anlisis de
Componentes
Principales de la
Varianza Total
Anlisis de
Clasificacin
Jerrquica
Ascendente
Correlaciones
Cannicas
Funcin
Discriminante

Cualitativa y
Cuantitativa

You might also like