Professional Documents
Culture Documents
2
y
= / n; donde
2
es la varianza de los datos y n el nmero de rplicas.
La implicacin prctica de esto es que si el nmero de rplicas es pequea (n=1)
probablemente no se podra obtener inferencias satisfactorias con respecto al
efecto del tratamiento; es decir, que la diferencia observada podra ser resultado,
exclusivamente, del error experimental. El nmero de rplicas afecta la precisin
de las estimaciones de las medias de tratamientos y la potencia de las pruebas
estadsticas para detectar las diferencias entre las medias de los grupos en los
tratamientos. Pero puede ser muy costosa econmicamente la incorporacin de
una rplica en el Experimento.
Leccin 4: Las tcnicas utilizadas en el diseo de experimentos
17
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES
CONTENIDO DIDCTICO DEL CUSO: 90001 METODOLOGA DE TRABAJO ACADMICO
Igualmente Cochran & Cox (2001) describen que las tcnicas que se deben utilizar
en un Diseo de experimento son:
El Bloqueo
El bloqueo proporciona control local del ambiente para reducir la variabilidad
natural. Las unidades experimentales se distribuyen en grupos de unidades
similares, con base en un factor o factores que se espera o se sabe que tienen
alguna relacin con la variable respuesta o con la medicin que se supone
responde de manera diferente a los diversos tratamientos.
Es decir, que consiste en la distribucin de las unidades experimentales en
bloques de tal manera que las unidades dentro de un bloque sean relativamente
homogneas; ya que unidades experimentales heterogneas producen valores
grandes en la varianza del error experimental, es as que la mayor parte de la
variacin predecible entre las unidades queda confundida con el efecto de los
bloques.
Los cuatro criterios que se usan con ms frecuencia para llevar a cabo el bloque
en las unidades experimentales son:
1) Proximidad (parcelas vecinas).
2) Caractersticas Fsicas (edad o peso).
3) Tiempo (Tiempo de desarrollo).
4) Administracin de tareas en el experimento.
Balanceo: Es el bloqueo y la asignacin de los tratamientos a las unidades
experimentales de modo que resulte una configuracin balanceada. La
comparacin precisa entre los tratamientos requiere la seleccin de unidades
experimentales uniformes para reducir el error experimental. La naturaleza del
experimento seala el equilibrio entre la variedad de las condiciones y la
18
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES
CONTENIDO DIDCTICO DEL CUSO: 90001 METODOLOGA DE TRABAJO ACADMICO
uniformidad de las unidades experimentales. Por ejemplo, si se trata de un
experimento con vacas lecheras, la uniformidad de las unidades experimentales
requiere elegir vacas de la misma cra, en la misma etapa de lactancia y con un
nmero similar de lactancia.
Agrupamiento: Es la colocacin de un conjunto de unidades experimentales
homogneas en grupos, de modo que los diferentes grupos puedan sujetarse a
distintos tratamientos. Estos grupos pueden constar de diferente nmero de
unidades experimentales.
En los tres principios analizados anteriormente el objetivo principal es disminuir en
gran medida la Variabilidad Natural o error experimental, a continuacin se
presenta un ejemplo en el cual se evidencia este objetivo.
Ejemplo
Se hace una investigacin sobre el efecto de administrar 10 mg. de vitamina B12
por libra de racin a cerdos en crecimiento, se tomaron ocho lotes de seis cerdos,
cada uno tratados por pares. Los lotes se separaron por la administracin de
diferentes niveles de aureomicina. Se mide el aumento diario promedio del peso
de tres cerdos (libras).
Tratamientos Sin B12
Con B12
Unidades experimentales Cerdos
Variable Respuesta Aumento de peso
Para llevar a cabo este experimento se deben agrupar los cerdos de la misma
raza, edad y sexo, de forma aleatoria; ya que estas tres situaciones afectan
significativamente en el peso de los cerdos. Y es as como se obtiene una muestra
lo ms homognea posible, y que en el experimento slo intervenga la variabilidad
natural, reduciendo as el error experimental.
19
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES
CONTENIDO DIDCTICO DEL CUSO: 90001 METODOLOGA DE TRABAJO ACADMICO
Leccin 5: Control local, aleatorizacin y procedimiento para el diseo
experimental
Bicking (s.f), Cochran & Cox (2001) describen que la aleatorizacin es realizada
cuando las unidades se han agrupado y los tratamientos han sido asignados al
azar a las unidades dentro de cada grupo.
Ejemplo: Se llev a cabo un experimento para determinar la eficacia de 6
fertilizantes de nitrgeno para una cierta variedad de maz. Se contaba con 24
parcelas experimentales.
Considerando que puede existir mucha variabilidad entre las parcelas
experimentales, se decidi usar un diseo de experimento que pudiera tener la
capacidad de controlar esta variabilidad. Cada uno de los seis fertilizantes fue
aplicado a cuatro parcelas experimentales, siguiendo el mtodo de aleatorizacin
del diseo utilizado y cada parcela experimental tena cinco surcos de plantas de
maz. Luego se obtuvo la cosecha de plantas, de cada una de las parcelas se
tomaron solamente tres surcos y fueron los centrales. Las plantas cosechadas se
llevaron al laboratorio para determinar el rendimiento por medio del peso de las
semillas, haciendo esto separadamente para cada una de las parcelas.
En el ejemplo planteado se puede observar:
Hay seis tratamientos que son los seis fertilizantes.
Hay veinticuatro unidades experimentales, que son las parcelas
experimentales.
La unidad muestral no es la totalidad de la unidad experimental sino
una parte de ella (las 4 parcelas).
El investigador toma la decisin de cosechar tres surcos centrales
en cada unidad experimental; ya que considera que de esta manera se
20
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES
CONTENIDO DIDCTICO DEL CUSO: 90001 METODOLOGA DE TRABAJO ACADMICO
puede evitar cualquier efecto del fertilizante que se aplica a una parcela y
que pueda influir el resultado de las parcelas vecinas.
El nmero de rplicas es igual a cuatro por cada tratamiento.
Existe un control local ya que el investigador habr usado un diseo
(por ejemplo: El Diseo de Bloques Aleatorios; el cual se estudiara en el
detalle en la siguiente unidad programtica), que controla la variabilidad
entre las parcelas en el campo experimental.
La variable respuesta en este experimento es el rendimiento.
Forma de aleatorizar un experimento
1) Asignar nmeros a cada una de las parcelas experimentales de 1
a 24.
2) Elaborar cuadrados de papel con los mismos nmeros de las
parcelas (1 a 24) y luego colocarlos en un recipiente.
3) Sacar al azar una por una las tarjetas del recipiente.
4) Existen 6 tratamientos, que son los seis fertilizantes y como el
nmero de rplicas es igual a cuatro entonces los primeros cuatro nmeros
sacados que corresponden a las primeras cuatro parcelas sern asignadas
al fertilizante nmero uno.
5) Los segundos cuatro nmeros sacados que corresponden a las
segundas cuatro parcelas sern asignadas al fertilizante nmero dos.
6) Y as sucesivamente hasta obtener los ltimos cuatro nmeros
que corresponden a las cuatro parcelas que sern asignadas al fertilizante
nmero seis.
21
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES
CONTENIDO DIDCTICO DEL CUSO: 90001 METODOLOGA DE TRABAJO ACADMICO
En general, un experimento de este tipo puede tener simultneamente otras
variables respuestas como por ejemplo: altura de plantas, grosor de las plantas,
determinacin del contenido de humedad de los granos, etc. Pero en el anlisis
del experimento el rendimiento es la variable de inters para el investigador.
A pesar de haber tomado todas las precauciones necesarias en la conduccin del
experimento, se podr decir que siempre existir el Error Experimental en
cualquier experimento, no importa que tan bien sea planteado y conducido el
experimento. Basta con observar y comparar los valores del rendimiento para dos
ms parcelas que han recibido la aplicacin de un mismo fertilizante. Estos
valores no sern iguales y por lo tanto el error experimental no es nulo y existe.
Algunas de las razones por las cuales puede surgir el Error Experimental en este
experimento son las siguientes:
1) Las parcelas experimentales en el campo deben tener variacin en la fertilidad
del suelo, textura del suelo, pH del suelo, pendiente, la cantidad de luz solar que
puede recibir cada planta, etc.
2) El nmero total de plantas por cada parcela podra no ser igual. Esto puede
ocurrir por defectos en la calidad de las semillas y el mtodo de siembra utilizado.
3) Puede existir prdida del material experimental cosechado que se lleva al
laboratorio para determinar el peso.
4) Puede existir limitacin y defectos en la mquina que se usa para determinar el
peso del material que se ha cosechado.
5) Puede existir variacin de criterios y tcnicas que usan diferentes personas que
han trabajado en la conduccin del experimento.
Control Local: Consiste en el uso de tcnicas de bloqueo, balanceo y
agrupamiento de las unidades experimentales para asegurar que el diseo usado
22
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES
CONTENIDO DIDCTICO DEL CUSO: 90001 METODOLOGA DE TRABAJO ACADMICO
sea eficiente; ya que los objetivos de la mayora de los experimentos son las
comparaciones claras y exactas entre los tratamientos a travs de un conjunto
apropiado de condiciones. Estos objetivos requieren estimaciones precisas de las
medias y poderosas pruebas estadsticas, lo cual se puede obtener reduciendo la
varianza del error experimental. El uso adecuado del control local describe las
acciones que emplea un investigador para reducir o controlar la magnitud de la
estimacin del error experimental; incrementando la exactitud de las
observaciones y estableciendo la base de la inferencia del estudio.
23
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES
CONTENIDO DIDCTICO DEL CUSO: 90001 METODOLOGA DE TRABAJO ACADMICO
CAPITULO 2-U_1
CONTRASTE DE HIPTESIS COMPARACIONES SIMPLES.
Etimolgicamente Hiptesis es la suposicin de una verdad que debe ser
verificada o rechazada.
Es una explicacin que al comienzo de una investigacin se le da a un hecho, es
una conjetura a la realidad.
Y sirve para orientar al investigador en el encuentro de una verdad.(Ver modulo de
trabajo de grado ciclo tecnolgico y ciclo profesional del mismo compilador)
Una hiptesis estadstica es una afirmacin sobre los valores de los parmetros de
una poblacin o proceso, que es susceptible de probarse a partir de la informacin
contenida en una muestra representativa obtenida de una poblacin. Por ejemplo,
la afirmacin "este proceso produce menos del 6% de defectuosos" se puede
plantear estadsticamente, en trminos de, proporcin p desconocida de artculos
defectuosos que genera el proceso.
Ho : p =0.06 (la proporcin de defectuosos es 0.06)
HA: p < 0.06 (la proporcin es menor a 0.06)
Lecciones - C_2-U_1
Leccin 1: Comprobacin de hiptesis
Para las siguiente leccin se tomaron como referente a Bavaresco (1979), Bunge
(1980) y Berenson, Levine & Krehbiel (2001).
24
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES
CONTENIDO DIDCTICO DEL CUSO: 90001 METODOLOGA DE TRABAJO ACADMICO
Formulacin y prueba de hiptesis
Una hiptesis es una afirmacin acerca de algo.
En estadstica, puede ser una suposicin acerca del valor de un parmetro
desconocido.
La prueba es el medio de verificacin para saber si algo es verdadero o falso y
hasta qu grado podemos decir que sea verdadero o falso.
Pasos en la prueba de hiptesis:
-hiptesis.
Calcular una estadstica de muestra.
Recomendacin se debe hablar de "no rechazar" una hiptesis en lugar de
"aceptar", ya que las pruebas no son concluyentes.
Estadstico de prueba.
Una vez planteada la hiptesis, se toma una muestra aleatoria (o se obtienen
datos mediante un experimento planeado de acuerdo a la hiptesis de la poblacin
en estudio). El estadstico de prueba es un nmero calculado a partir de los datos
y la hiptesis nula, cuya magnitud permite discernir si se rechaza o se acepta la
hiptesis nula Ho Al conjunto de posibles valores del estadstico de prueba que
llevan a rechazar Ho,se le llama regin o interur de rechazo para la prueba, y a los
25
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES
CONTENIDO DIDCTICO DEL CUSO: 90001 METODOLOGA DE TRABAJO ACADMICO
posibles valores donde no se rechaza Hl les llama regin o intervalo de
aceptacin.
Por ejemplo, para las hiptesis planteadas el estadstico de prueba est dado por
0.08 Zo = vlO.08(1- 0.08) / n'
Anlisis de datos. (2, 3, 7 y varios autores)
El anlisis depende del nivel de medicin de las variables, de la manera como se
hayan formulado las hiptesis, el inters del investigador en el problema que est
investigando.
Podemos usar una serie de nmeros conocidos como estadstica sumaria para
describir las caractersticas del conjunto de datos. Dos de estas caractersticas
son de particular importancia para los responsables de tomar decisiones: la de
tendencia central y la de dispersin, entre los cuales tenemos la mediana, la
moda, medidas de tendencia central, desviacin media, la dispersin, sesgo en
curvas y graficas, curtosis, la media aritmtica, la mediana, la moda, la dispersin,
distribucin de frecuencias, histogramas, la varianza de una poblacin,
puntuaciones Z, razones y tazas, anlisis de varianza.
Pruebas de hiptesis.
En general una prueba de hiptesis comienza con una teora o aseveracin
relativa a cierto parmetro de una poblacin para lo cual se definen dos hiptesis
conocidas como:
- La Hiptesis nula H
o
la cual es la hiptesis que se prueba siempre.
- Y la Hiptesis alternativa H
1
que se establece como el opuesto a la
hiptesis nula y representa la conclusin que se apoya si la hiptesis nula
se rechaza.
26
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES
CONTENIDO DIDCTICO DEL CUSO: 90001 METODOLOGA DE TRABAJO ACADMICO
En lo que se conoce como metodologa de prueba de hiptesis clsica, se
recomiendan los siguientes puntos a tener en cuenta:
- La Hiptesis nula H
o
siempre se refiere a un valor especifico del parmetro
de poblacin (como ) , no al estadstico maestral ( como )
A partir de este numeral se deben consultar las tablas que se encuentran e textos
de estadstica como las tablas t-Student, de distribucin F, comparacin de medias
de Duncan, etc.
Ejemplo y procedimiento a desarrollar para una prueba de hiptesis propiamente
dicha.
Una organizacin de consumidores esta interesada en determinar si existe
diferencia en el peso entre diferentes marcas de cajas de 500 gramos de cereales
para el desayuno, para lo cual acepta una varianza de 10 gramos.
Para el efecto el estudiante (de ser posible) recopilara 25 datos, los almacenara en
una tabla y los analizara; se aconseja trabajar con una significancia del 5%.
Los pasos a seguir para la prueba de hiptesis son los siguientes:
1. Establezca la hiptesis nula H
o
. sta debe expresarse en trminos estadsticos.
Por ejemplo: Al probar si la cantidad promedio de llenado es 500 gramos, la
hiptesis nula asegura que ( ) es igual a 500gramos.
2. Establezca la hiptesis alternativa H
1
. Tambin debe expresarse en trminos
estadsticos.
Al probar si la cantidad promedio de llenado es de 500 gramos, la hiptesis
alternativa asegura que ( ) es inferior a 500 gramos.
27
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES
CONTENIDO DIDCTICO DEL CUSO: 90001 METODOLOGA DE TRABAJO ACADMICO
3. Elija el nivel de significancia. ste se determina despus de tomar en cuenta los
riesgos especificados de cometer errores tipo I y tipo II en una situacin particular.
La compaia eligi = 0.05.
4. Elija el tamao de la muestra n. ste se determina despus de tomar en cuenta
los riesgos especificados de cometer errores tipo I y tipo II (es decir, los niveles
seleccionados de a y de considerar las restricciones de presupuesto al realizar el
estudio.
En este caso se pesaron 25 cajas de cereal seleccionadas al azar.
5. Determine la tcnica estadstica adecuada y la estadstica de prueba
correspondiente que se usar. Dado que si se conoce por que la compaa
especific que eran 15 gramos, se eligi una prueba Z.
6. Establezca los valores crticos que dividen las regiones de rechazo y no
rechazo. Una vez especificadas las hiptesis nula y alternativa y determinados el
nivel de significancia y el tamao de la muestra, se pueden encontrar los valores
crticos para la distribucin estadstica adecuada, de manera que se puedan
indicar las regiones de rechazo y no rechazo.
Para el caso se utilizaran los valores + 1.96 Y - 1 .96 para definir las regiones
porque el estadstico Z se refiere a la distribucin normal estndar.
7. Recopile los datos y calcule el valor muestral del estadstico de prueba
adecuado.
Realice una toma de datos (determinacin) y calcule la X media = ....... gramos,
entonces y obtenga el valor Z = + ...........
8. Determine si el estadstico de prueba est en la regin de rechazo o de no
rechazo. El valor calculado del estadstico de prueba se compara con los valores
28
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES
CONTENIDO DIDCTICO DEL CUSO: 90001 METODOLOGA DE TRABAJO ACADMICO
crticos de la distribucin muestral apropiada para determinar en qu regin se
encuentra.
En este caso, . Z= +...... est en la regin de rechazo o no rechazo porque - 1.96 <
Z == +.... < + 1 .96.
9. Tome una decisin estadstica. Si el estadstico d prueba est en la regin de
no rechazo, la hiptesis nula, Ho no se puede rechazar; si el estadstico de prueba
est en la regin de rechazo, la hiptesis nula se rechaza.
10. Exprese la decisin estadstica en trminos de una situacin particular.
De ser afirmativa la diferencia entre las cantidades, que accin correctiva
propondras y aplicaras?
Error experimental
En todo proceso experimental se presentan dos clases de variaciones: la variacin
inherente al material experimental, al que se aplican los tratamientos y la que
proviene de la falta de uniformidad en la realizacin fsica del experimento o
variaciones externas a la experimentacin (como las ambientales, etc) que tienden
a enmascarar el efecto de los tratamientos.
Para expresar estas variaciones ajenas a los tratamientos los estadsticos aplican
el trmino error experimental; trmino que no quiere decir equivocacin, sino que
incluye todo tipo de variacin externa ajena al material experimental.
Este error experimental es la medida de variacin que existe entre las
observaciones de unidades experimentales en el mismo tratamiento, es decir, la
variacin no proveniente de los tratamientos.
Para los fines de clculo en las ecuaciones se expresa con la letra
c
Errores tipo I y tipo II. (8)
29
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES
CONTENIDO DIDCTICO DEL CUSO: 90001 METODOLOGA DE TRABAJO ACADMICO
Cuando se contrastan o se prueban las hiptesis se pueden cometer dos tipos de
errores por los siguientes motivos:
- La prueba de hiptesis comienza con una suposicin, llamada hiptesis,
que hacemos con respecto a un parmetro de poblacin.
- Despus recolectamos y clasificamos los datos, aplicamos la estadstica
seleccionada a las muestras y usamos esta informacin para decidir qu
tan probable es que sea correcto nuestro parmetro de poblacin acerca
del cual hicimos la hiptesis.
- Debemos establecer el valor supuesto (hipotetizado) del parmetro de
poblacin antes de comenzar a tomar la muestra.
- La suposicin que deseamos probar se conoce como hiptesis nula, y se
simboliza por H
0
.
- Siempre que rechazamos la hiptesis, la conclusin que s aceptamos se
llama hiptesis alternativa y se simboliza por H
1
.
*** El rechazo de una hiptesis nula cuando es cierta se denomina error de tipo
I, y su probabilidad (que es tambin el nivel de significancia) se simboliza como
o . ***
*** El hecho de aceptar una hiptesis nula cuando es falsa se denomina error
de tipo II, y su probabilidad se simboliza como | . ***
- La probabilidad de cometer un tipo de error puede reducirse slo si
deseamos incrementar la probabilidad de cometer el otro tipo de error.
Con el propsito de obtener una (probabilidad) | baja, tendremos que tolerar una
probabilidad o alta; sin embargo el nivel de significancia adecuado se debe
decidir acorde con los costos y desventajas vinculadas con ambos tipos de
errores.
Las modalidades ms recomendadas para disminuir el error son:
En toda marcha experimental que se realice se debe
a) Utilizar unidades experimentales muy uniformes, como materias primas
homogneas, procesos, densidad de muestras, etctera.
b) Tamao adecuado de la unidad experimental.
e) Eliminacin de la competencia entre tratamientos.
d) Distribucin adecuada de los tratamientos mediante sorteos (azar).
e) Usar el nmero adecuado de repeticiones para cada tratamiento.
30
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES
CONTENIDO DIDCTICO DEL CUSO: 90001 METODOLOGA DE TRABAJO ACADMICO
f) Poner todos los tratamientos en igualdad de condiciones, de manera que si
alguno es superior a los dems, se pueda probar.
Leccin 2: Prueba de t
Para Christensen (1990), Dawson & Trapp (2002) y Cochran & Cox (2001) la
prueba de t es conocida a veces como prueba de t de Student, por recibir el
nombre de la persona que la estudi primero, en 1890. Student en realidad era un
matemtico llamado William Gosset, empleado por la Cervecera Guiness, quien
se vio obligado a usar el pseudnimo de Student, debido a que por poltica de la
compaa se tena prohibido a los empleados publicar sus investigaciones.
Gosset descubri que cuando una observacin procede de una distribucin
normal, las medias se distribuyen de manera normal, slo s se conoce la
verdadera desviacin estndar de la poblacin.
La prueba de t se emplea mucho en todas las reas de la ciencia.
La distribucin de t, es similar a la distribucin de z la cual se explic en numeral
anterior y, uno de sus mayores usos, es responder a interrogantes de
investigacin sobre medias y cuando se desconoce la verdadera desviacin
estndar.
Ecuacin 1
S, es la desviacin estndar
31
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES
CONTENIDO DIDCTICO DEL CUSO: 90001 METODOLOGA DE TRABAJO ACADMICO
Para usar una prueba t con una muestra, se supone que los datos numricos se
obtienen de una manera independiente y representan una muestra aleatoria de
una poblacin que sigue una distribucin normal.
En la prctica, se ha encontrado que siempre que la muestra no es muy pequea
y la poblacin no tenga un sesgo grande, la distribucin t proporciona una
aproximacin a la distribucin muestral de la media cuando (sigma) no se conoce.
Ejercicio resuelto-ver ejemplo en el apndice 1.
Prueba de t para la diferencia entre dos medias
El clculo de la prueba de t para la diferencia entre dos medias se realiza con
Ecuacin 2 y Ecuacin
3
S
2
p
= varianza combinada
X
1,2
= medias de la muestra tomadas de las poblaciones respectivamente
S
1,2
= varianzas de la muestra tomadas de las poblaciones respectivamente
Ejercicio resuelto
Leccin 3: Anlisis de varianza-ANDEVA
Para Christensen (1990), Dawson & Trapp (2002) y Cochran & Cox (2001) el
anlisis de varianza fue ideado por Sir Ronald Fisher en 1925, de gran aplicacin
cuando en una investigacin se tiene el propsito de corrobar por medio del
32
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES
CONTENIDO DIDCTICO DEL CUSO: 90001 METODOLOGA DE TRABAJO ACADMICO
anlisis estadstico los efectos de uno o ms factores sobre el comportamiento de
una caracterstica o variable dependiente.
El ANAVA (Analysis of variance) o Anova; es una tcnica estadstica que sirve
para analizar la variacin total de los resultados experimentales de un diseo en
particular, descomponindolo en fuentes de variacin independientes atribuibles a
cada uno de los efectos en que constituye el diseo experimental, compara dos o
ms medias.
Esta tcnica tiene como objetivo identificar la importancia de los diferentes
factores tratamientos en estudio y determinar cmo interactan entre s.
El ANOVA es una prueba semejante a la prueba t de Student, en cuanto a la
prctica, pero la comparacin entre grupos no es a travs de la media y su
desviacin estndar, sino a travs de la varianza de la variable numrica y, en
cada grupo de la variable categrica x.
Bsicamente el anlisis de Varianza, se utiliza para corroborar si la significacin
de diferencias entre medias de dos o ms grupos, son o no debidas al azar.
La cifra estadstica obtenida con el ANOVA es la razn F.
F= Estimacin entre los tratamientos / Estimacin dentro de los tratamientos.
Suponiendo que se analizan 2 grupos, el ANAVA o el ANOVA, analiza las
variaciones entre los dos grupos (inter-grupal) y la compara con la variacin dentro
de cada grupo (intra-grupal), para obtener mediante una suma de cuadrados el
valor de F.
Si las diferencias de varianza entre cada grupo son mayores que las intra-
grupales, seguramente existen diferencias significativas entre los grupos que no
son debidas al azar.
33
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES
CONTENIDO DIDCTICO DEL CUSO: 90001 METODOLOGA DE TRABAJO ACADMICO
Los grupos se definen como en la prueba t eligiendo una variable categrica. La
variable a analizar debe ser numrica y de distribucin simtrica.
Bases del anlisis de la varianza.
Los supuestos que validan el anlisis varianza son:
a. Los errores son independientes
b. Los errores estn normalmente distribuidos con media cero y varianza constante
c. Existe homogeneidad de varianza entre los tratamientos.
Supnganse k muestras aleatorias independientes, de tamao n, extradas de una
nica poblacin normal. A partir de ellas existen dos maneras independientes de
estimar la varianza de la poblacin (S
2
)
1) Una varianza dentro de los grupos (ya que slo contribuye a ella la varianza dentro
de las muestras), o varianza de error, o cuadrados medios del error, y
habitualmente representada por SC
Error
(Mean Square Error) que se calcula como
la media de las k varianzas muestrales (cada varianza muestral es un estimador
centrado de S
2
y la media de k estimadores centrados es tambin un estimador
centrado y ms eficiente que todos ellos).
SC
Error
es un cociente: al numerador se le llama suma de cuadrados del error y se
representa por SC
E
y al denominador grados de libertad por ser los trminos
independientes de la suma de cuadrados.
2) Otra llamada varianza entre grupos (slo contribuye a ella la varianza entre las
distintas muestras), o varianza de los tratamientos, o cuadrados medios de los
tratamientos y representada por SC
trat
o MSB (Mean Square Between).
34
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES
CONTENIDO DIDCTICO DEL CUSO: 90001 METODOLOGA DE TRABAJO ACADMICO
Se calcula a partir de la varianza de las medias muestrales y es tambin un
cociente; al numerador se le llama suma de cuadrados de los tratamientos (se le
representa por SC
trat
) y al denominador (k-1) grados de libertad.
SC
trat
y SC
Error
, estiman la varianza poblacional en la hiptesis de que las k
muestras provengan de la misma poblacin.
La distribucin muestral del cociente de dos estimaciones independientes de la
varianza de una poblacin normal es una razn con distribucin F con los grados
de libertad correspondientes al numerador y denominador respectivamente, por lo
tanto se puede contrastar dicha hiptesis usando esa distribucin.
Variacin total = Variacin dentro de los tratamientos+ Variacin entre los
tratamientos
Suma de cuadrados total = Suma de cuadrados dentro+Suma de cuadrados entre
Variacin total =
Tabla 3. Ejemplo de un reporte del anlisis de varianza
Fuente de
variacin
Grados
de
Libertad
SC
Suma de
cuadrados
CM
Cuadrados
medios
F
0
Razn
F
p-valor
Entre
Tratamientos
k-1 SC
tratamient
SC
trat
/(K-1) SC
trat
/
SCM
E
P (F>F
0
)
Dentro del Error N-k SC
E
SC
E
/(N-K)
Total N-1 SC
T
SC
Total
/ (KN
- 1)
35
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES
CONTENIDO DIDCTICO DEL CUSO: 90001 METODOLOGA DE TRABAJO ACADMICO
K= Numero de tratamientos o niveles o grupos del factor de inters
N= Nmero total datos reportados
n = Nmero total de datos por grupo
Ejemplos de resolucin de ANAVAS o ANOVAS se realizaran en captulos
siguientes y apndices al final del mdulo.
Los grados de libertad son uno menos que el nmero de observaciones para cada
fuente de variacin.
Leccin 4: Prueba de diferencia significativa mnima (DSM) de Fisher
Diferencia mnima significativa (LSD). Es la diferencia mnima que debe haber
entre dos medias mustrales para poder considerar que dos tratamientos son
diferentes.
Discusin
Cuando para un diseo experimental se rechaza la hiptesis de igualdad entre los
tratamientos el investigador se pregunta cual(es) de ellos son diferentes entre s.
Para averiguarlo se emplean los mtodos de comparacin de medias, uno de
estos mtodos (formulas) es el LSD o (DMS) o diferencia minina significativa. Esta
debe ser utilizada solo para comparar medias adyacentes en un arreglo ordenado,
aunque tambin se puede emplear para comparar las medias con un testigo o
tratamiento estndar.
La DMS es una prueba de t de Student que utiliza la varianza combinada.
Ecuacin 4 ..t=
36
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES
CONTENIDO DIDCTICO DEL CUSO: 90001 METODOLOGA DE TRABAJO ACADMICO
Ecuacin 5.S
d
r = Nmero de repeticiones
CME = Cuadrado medio del error Ecuacin 5
El valor de t se toma de la tabla de los apndices con los grados de libertad del
error. Usualmente la significancia es considerada entre 1% y 5%.
Ejemplo
En un experimento desarrollados por un grupo de profesionales se
determino el efecto de tres tratamientos de fertilizacin en la altura de
arboles de una especie forrajera, obtenindose los siguientes resultados.
Tabla 4, Tratamientos de experimento sobre fertilizacin
Tratamiento IBIOM (cm3)
Media CV (%)
T1 1064 a * 93
T2 1838 a * 60
T3 1886 a * 61
Diferencia Mnima Significativa DMS 962 cm3
37
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES
CONTENIDO DIDCTICO DEL CUSO: 90001 METODOLOGA DE TRABAJO ACADMICO
Los valores acompaados por igual letra no presentan diferencias
estadsticamente significativas al 95% de confianza.
X
1
X
2
X
3
X
1
- 1064 - 1838 1064-1886
X
2
- - 1838-1886
X
3
- - -
Leccin 5: Modelo estadstico
La finalidad de una serie de experimentos es determinar un modelo estadstico
que refleje la creencia respecto a la relacin entre los tratamientos y las
observaciones.
Cada resultado del experimento si este se repite n veces, est determinado por la
media general y el efecto del tratamiento.
La identificacin de este fenmeno y la comprobacin de las suposiciones se
hacen en el momento de proponerlo basndose en el siguiente modelo
matemtico:
Modelo matemtico Ecuacin 6
En donde
i= 1,., k numero de tratamientos
38
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES
CONTENIDO DIDCTICO DEL CUSO: 90001 METODOLOGA DE TRABAJO ACADMICO
j=1,., r nmero de repeticiones
u= promedio de todas las unidades experimentales del experimento = o segn el
caso.
i
t
= la diferencia entre el promedio (
J=Y
Jjf
Yi..1
Yi..2
Yi..3
Yi..4
Yi..,,
Yi..f
Yj.. Y1.. Y2.. Yj.. Yj.. Ynj.. Yj.. <!--[if
!supportMisalignedColumns]-
->
La eleccin del cuadro latino se realiza antes de la obtencin de los datos.
Procedimiento estadstico para la comprobacin de hiptesis en un diseo de
bloques en cuadro latino.
Ver apndice 3.
55
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES
CONTENIDO DIDCTICO DEL CUSO: 90001 METODOLOGA DE TRABAJO ACADMICO
Leccin5. Diseo en cuadro greco latino
Cuando se tiene un cuarto factor de bloque a controlar activamente en el diseo
de cuadro latino como por ejemplo si en el ejercicio del numeral 1.19.5 se decide
considerar el sitio de realizacin del experimento o la procedencia de un
ingrediente para el producto considerado.
Este diseo se denomina cuadro greco latino (DCGL), en el cual los niveles de el
nuevo factor se denotan por las letras griegas a; representndose los tratamiento
con las letras latinas A, B, C y D.
En el diseo en cuadrado greco-latino se superponen dos cuadrados latinos,
resultando el siguiente modelo matemtico:
ijl k l j i ijl
Y c | o t + + + + + =
Ecuacin 10
i= 1,., l numero de tratamientos
j=1,., b numero de bloques
i
t
= efecto debido al bloque 1
j
=
n
j
ij
y Yij
1
7+9 +5+10+8+9+10+9+12 = 79
2- Podemos calcular la media por tratamiento y la gran media.
a= nmero de tratamientos.
r=repeticiones de haberse realizado.
N= total de mediciones-datos (N= anr).
r=1 solo una medida por tratamiento.
n Yij ij Y = 1
7+9 +5= 21 21/ 3 = 7
70
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES
CONTENIDO DIDCTICO DEL CUSO: 90001 METODOLOGA DE TRABAJO ACADMICO
10+8+9= 27 27/3 = 9
10+9+12= 31 31/3= 10.33
Gran media 79/ 9 = 8.77
79 =
- -
Y Obsrvese que es igual a
=
=
n
j
ij
y Yij
1
3- Elevamos al cuadrado cada uno de los datos u observaciones registradas.
Cada observacin de cada tratamiento se eleva al cuadrado.
( )
= =
n
j
ij
a
i
y
1
2
1
= {(7)
2
+ (9)
2
+ (5)
2
+ (10)
2
+ (8)
2
+ (9)
2
+ (10)
2
+ (9)
2
+ (12)
2
} =
(49)+ 81+25+100+64+81+100+81+144= 725
3.1. Calculamos
| | N Y
2
..
= {(79)
2
/3x3} = 693.4444
Conocido tambin como factor de correccin
4- Elevamos al cuadrado la suma horizontal de los tratamientos (hallados en
2) estos valores (cuadrados) para cada tratamiento se suman.
Aplicamos la frmula para calcular la suma de cuadrados por tratamiento= SCt.
SC
tratamientos
= [{(21)
2
+ (27)
2
+ (31)
2
}]/3 -- {(79)
2
/3x3} =
SC
tratamientos
= {441 + 749+ 961}/ 3 693.44444= 717- 693.4444= 23.5555
5- Todos los valores-determinaciones (producto cuadrado) se suman, con esta
calculamos la suma total de cuadrados.
( ) | | N Y y SC
n
j
ij
a
i
Total
2
1
2
1
.. =
= =
SC
Total
= {(7)
2
+ (9)
2
+ (5)
2
+(10)
2
+ (8)
2
+ (9)
2
+ (10)
2
+(9)
2
+ (12)
2
}- {(79)
2
/3x3 }=
71
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES
CONTENIDO DIDCTICO DEL CUSO: 90001 METODOLOGA DE TRABAJO ACADMICO
SC
Total
= 725 693.4444= 31.5556
SC
T
=SC
E
+SCt
SC
T
SCt = SC
E
SC
E
= 31.5556 - 23.5555= 8.0
6- Calculo de los grados de libertad
6.1. Libertad de los tratamientos= 3-1 = 2
6.2. Libertad total= 9-1= 8
6.3. Libertad total - Libertad de los tratamientos = 8-2 = 6
7. Calculo de los cuadrados medios
7.1 . Cuadrado medio de los tratamientos
CMtratamient = SCtrata/ libertad tratamieno
CMtratamient = 23.5555/ 2 = 11.77775
7.2 . Cuadrado medio del error
CMerror = SCerror/ libertad error
CMerror = 8 / 6 = 1.3333
7.3. Cuadrado medio total
CMtotal = SCtotal/ libertad total
CMtotal =31.5556 / 8 = 3.9445
Tabla 14. Anlisis de varianza para evaluar el efecto de los aditivos en la
elaboracin de rosquillas.
Fuente de
variacin
Grados
de
Libertad
Ecuac
SC
Suma de
cuadrados
Ecuac
CM
Cuadrados
medios
Ecuac
F
0
Razon
Ecuac
p-valor
Tratamientos 3-1=2 23.5555 11.77775 8.83 0,1004
Error 6 8 1.3333
72
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD
ESCUELA DE CIENCIAS SOCIALES, ARTES Y HUMANIDADES
CONTENIDO DIDCTICO DEL CUSO: 90001 METODOLOGA DE TRABAJO ACADMICO
Total (9-1)=8 31.5556
SS
Totales
/ (kn -1)
Como la razn de varianza calculada-8.83 para los tratamientos es menor que la
reportada-propuesta en la tablas de valores criticos de distribucin F -19.3 para 2
grados de libertad en el numerador (tratamientos) y 6 en el denominador (error)
para una significancia-alfa de 5%, concluimos que al menos un tratamiento es
diferente.
Entonces la pregunta del investigador es: Cul de ellos?.
U establecer especficamente cules son las medias que difieren entre s en forma
significativa.
Para el efecto utilizamos los llamados mtodos de comparaciones mltiples como
la mnima diferencia significativa (LSD), el mtodo de Tuckey y el mtodo de
Dunnett.
La Diferencia Mnima Significativa (DMS) esta es la diferencia entre dos medias,
basadas en la prueba t de Student, empleando el valor de la varianza del error. El
valor de la LSD se encuentra referido a la distribucin de t por la siguiente
relacin:
to A - Media del tratamiento B = Sd (t)
-k
N-K = grados de libertad del error = 6
2
/ n) )