You are on page 1of 21

DIESÑO DE UN EXPERIMENTO

En resumen, el diseño de un experimento consiste, en la secuencia completa y


planificada de pasos previstos de antemano para asegurar que se tomarán los datos apropiados
con el fin de realizar un análisis objetivo de un problema determinado y que conducirán a
conclusiones válidas.
Los objetivos del diseño experimental son los siguientes:
- Determinar cuáles de las variables independientes (factores) tienen mayor influencia en
la variable respuesta.
- Determinar el mejor valor de las variables independientes que influyen en la variable
respuesta, de modo que tenga en lo posible un valor muy cercano al valor deseado.
- Determinar el mejor valor de las variables independientes que influyen en la variable
respuesta, de modo que la variabilidad de esta sea lo más pequeño posible.
- Determinar el mejor valor de las variables independientes que influyen en la variable
respuesta, de tal manera que se minimicen los efectos de las variables exógenos que no son
controladas.

PRINCIPIOS BÁSICOS DE UN DISEÑO DE EXPERIMENTOS


En todo campo del saber humano siempre existen algunos pioneros quienes con sus
preclaros estudios aportaron a la ciencia conocimientos fundamentales, a partir de los cuales se
hacen nuevos descubrimientos, dentro de ellos tenemos al famoso Sir Ronald A. Fisher quien
fue el precursor de los Diseños Experimentales, dos de sus principales obras: “Principios
Estadísticos para Investigadores”(1925) y “Diseños de Experimentos” (1935), fueron muy
requeridas por los investigadores de la época, en la segunda obra se estableció por primera vez
los principios básicos de los Diseños Experimentales, que son: La Reproducción, la
Aleatorización y el Control Local.
a) REPRODUCCIÓN.- Es la repetición del experimento básico o tratamiento en diferentes
unidades experimentales, cuyas razones son los siguientes:
- Proporciona una estimación del error experimental, que actúa como una unidad básica de
medida para indicar el significado de las diferencias observadas o para determinar la amplitud
de un intervalo de confianza.
- Permite obtener una estimación más precisa del efecto medio de cualquier factor, puesto que
la varianza de la media es igual a 2/n.

b) ALEATORIZACIÓN.- Es la asignación de las unidades experimentales en forma aleatoria a


los diferentes tratamientos, con la finalidad de estimar con mayor precisión el error
experimental, y eliminar el error sistemático que pudiera haber al medir las respuestas.
C) CONTROL LOCAL.- Es la forma y ponderación del balanceo, bloqueo y agrupamiento de las
unidades experimentales que se emplean en el diseño experimental adoptado y su función es
hacer que el diseño sea más eficiente.

DEFINICIÓN DE TÉRMINOS USADOS


Para los Diseños Experimentales, la Inferencia Estadística es una herramienta
fundamental en la obtención de las conclusiones del trabajo realizado, por lo que los
conocimientos previos que se deben tener en este campo deben ser muy claros; aparte de los
términos usados en Inferencia Estadística existen otros que se usarán muy frecuentemente en
este texto y que son necesarios conocerlos, tales como:

FACTOR.- Es la VARIABLE INDEPENDIENTE que el investigador tiene bajo control y que debe
ser aplicada a las unidades experimentales y esperar el efecto o respuesta que puedan tener.
Ejemplo: En la eficiencia del lavado de ropa, los factores pueden ser: tipo de agua, tiempo de
lavado, la temperatura del agua, el tipo de máquina lavadora, la clase de agente limpiador, etc.
En el rendimiento académico de un alumno los factores que puedan influir son muchos, tales
como: el docente, el método que emplea el docente, la situación socio-económica del alumno,
la hora de las clases, los medios y materiales usados, etc.
En la mayoría de los casos el investigador trata con más de una variable independiente
o factor para observar los cambios que ocurren en la variable respuesta. Como cualquier
variable, el factor puede ser cualitativo o cuantitativo, sin embargo, salvo estudios teóricos o
simulaciones las variables son usadas en niveles que los convierten en cualitativos.
VARIABLE DEPENDIENTE.- Es la VARIABLE RESPUESTA que refleja el efecto que pueda
producir la variable independiente o factor en la unidad experimental asignada.
Ejemplo: Supongamos que queremos estudiar el rendimiento de la papa por hectárea, los
factores pueden ser muchos, tales como: el abono, el suelo, el riego, el tiempo de sembrío, los
insecticidas etc., en tanto que el rendimiento será la cantidad de papa cosechada, la calidad, el
tamaño, el sabor, etc.
VARIABLE EXÓGENA.- En todo experimento, además de las variables independientes en
estudio, existen otras que el investigador no los controla pero que pueden influir en la variable
respuesta, a estas variables se les conoce como variables exógenas, generalmente forman parte
del error, el investigador debe tener la capacidad de reducir su influencia usando el diseño
adecuado.
Ejemplo: El estudio que se hace sobre el rendimiento académico de un alumno, si el factor en
estudio es el método de enseñanza, entonces los demás factores citados anteriormente se
convierten en exógenos.
NIVEL DE UN FACTOR.- Son las diversas cantidades, valores, categorías o clasificaciones de
los factores, que deben ser aplicadas a las unidades experimentales, en otras palabras es el grado
de intensidad de un factor que se debe aplicar a un unidad experimental.
Ejemplo: En el estudio del lavado de ropa, sí el factor es la temperatura los niveles pueden ser
50º c., 60º c., 70º c. etc. En el rendimiento académico del alumno, sí el factor es el método de
enseñanza, los niveles son los diferentes métodos usados. En el rendimiento de la papa, sí el
factor es el abono, los niveles pueden ser abono animal, nitrogenado, fosfatado, o sí se usa un
tipo de abono los niveles pueden ser las cantidades usadas como 1 kg. por planta, 2kgs. por
planta, etc. En un estudio sociológico los factores pueden ser la edad, el sexo, la instrucción,
etc. Y los niveles pueden ser para la edad: menos de 10 años, de 10 a 20 años, de 20 a 30 años
y más de 30 años; para el sexo los niveles son: mujer y varón; para la instrucción los niveles
pueden ser sin educación, con primaria, con secundaria, con superior.
TRATAMIENTO.- Son cada uno de los niveles escogidos de un factor que deben ser aplicados a
una unidad experimental; en términos más amplios es el conjunto particular de condiciones
experimentales que se deben aplicar a las unidades experimentales. En caso de hayan más de
un factor o variable independiente en estudio, un tratamiento es la combinación específica de
los niveles de los factores en estudio o de los que intervienen en el experimento.
Ejemplo: Si se está estudiando el rendimiento de la papa como consecuencia de la variedad
(factor A) con tres niveles Variedad a, b y c, y el tipo de fertilizante (factor B) con tres niveles
también: Fosfatado, nitrogenado y animal; entonces un tratamiento puede ser el uso del abono
animal aplicado a la variedad “a” de la papa; en este caso habrían 9 tratamientos, una de ellas
es la indicada.
ERROR EXPERIMENTAL.- Describe el fracaso de llegar a resultados idénticos con dos unidades
experimentales tratadas idénticamente, este error puede surgir de errores experimentales en sí,
de errores de observación, de errores de medición de la variabilidad del material experimental,
de los efectos combinados de todos los factores extraños o exógenos que pudieran influir y que
no han sido considerados o controlados.
UNIDAD EXPERIMENTAL.- Es el ente más pequeño o elemental al cual se le aplica un
tratamiento en una reproducción del experimento básico. La unidad experimental dependerá del
tipo de estudio que se realiza, por lo tanto puede ser una persona, un animal, o cosa; así en
biología la unidad experimental puede ser una muestra de tejido fibroso, un ratón, una colonia
de bacterias, etc., en un experimento agrícola la unidad experimental podría ser una parcela de
terreno, una planta, un surco, una hoja, etc.
MEDIDA.- Una medida es el valor de la variable dependiente o respuesta mediante el cual se
determina el efecto de un tratamiento aplicado a una unidad experimental.
Ejemplo: En el estudio del rendimiento académico de un alumno, la medida será la nota que el
alumno obtiene después de aplicarse el método de enseñanza y luego de la correspondiente
evaluación.
CONFUSIÓN.- Es sinónimo de entremezclados, esto significa que es posible que dos o más
efectos se confundan en un experimento, por lo tanto es improbable separar sus efectos cuando
se lleva a cabo el respectivo análisis estadístico, sin embargo un buen diseño debe suprimir la
confusión, pero en otros casos se usa este hecho para simplificar análisis tedioso que se deben
hacer al usar muchos factores.
BALANCEO.- Es la obtención y distribución de las unidades experimentales adecuadas, el
agrupamiento, el bloqueo y la asignación de los tratamientos a las unidades experimentales de
tal manera que resulte una configuración balanceada, equilibrada y ponderada.
AGRUPAMIENTO.- Es la asignación o colocación de un conjunto de unidades experimentales
homogéneas en grupos de modo que los diferentes grupos puedan sujetarse a los diferentes
tratamientos, estos grupos pueden tener diferente número de unidades experimentales.
BLOQUEO.- Es la distribución de las unidades experimentales en bloques o grupos de tal manera
que las unidades experimentales dentro de cada bloque sean homogéneas, de esta manera la
mayor parte de la variación predecible entre las unidades experimentales queda confundida con
el efecto de los bloques, en otros términos el objetivo de este proceso es separar de la variación
del error experimental la variación debida a la heterogeneidad de las unidades experimentales,
por lo tanto se reducirá el valor del error experimental, y por consiguiente los resultados serán
más precisos.
INTERACCIÓN.- Es la respuesta diferencial de un nivel de un factor en combinación con los
diferentes niveles de otro u otros factores aplicados simultáneamente, es decir la interacción es
un efecto adicional debido a la influencia combinada de 2 o más factores.
El número de interacciones depende del número de factores que intervienen en el diseño, así
por ejemplo, con un factor no existe interacción, con dos factores existe una sola interacción,
con tres factores existen tres interacciones dobles y una triple, con cuatro factores existen seis
interacciones dobles, cuatro triples y una cuádruple, etc.
EFECTO PRINCIPAL.- El efecto principal de un factor, es una medida del cambio en la variable
respuesta correspondiente a cambios en el nivel de un factor promediado sobre todos los niveles
de los otros factores, es decir, permaneciendo fijos los otros factores. El número de factores
principales es igual al número de factores que intervienen en el diseño.
ANÁLISIS DE VARIANZA (ANVA).- Es un procedimiento aritmético-estadístico, mediante el cual
la variación total de un conjunto de datos se divide en dos o más componentes independientes,
y a cada uno de los cuales se les puede atribuir una causa diferente de variación.
Las suposiciones del Análisis de Varianza (ANVA), de observación única son los siguientes.
- Las t muestras observadas se toman en forma aleatoria e independiente.
- Las t poblaciones de los tratamientos están normalmente distribuidas.
- Las varianzas de las t poblaciones de los tratamientos son todas homogéneas.

ANÁLISIS DE COVARIANZA (ANCOVA).- Es una técnica estadística que se usa con la finalidad
de controlar o separar los efectos de las variables exógenas que pudieran influir en la variable
respuesta, y consiste en introducir una o más variables no aleatorias al modelo en estudio y
realizar un análisis de varianza y de regresión con ellas.
VALIDEZ INTERNA.- Se dice que un experimento es válido internamente, si arroja resultados
que estén libres de sesgos y esto depende de un buen control del error experimental y de las
variables exógenas.
VALIDEZ EXTERNA.- Es la capacidad de generalización que tienen los resultados de un
experimento, la validez externa depende del empleo de una adecuada aleatorización y de la
suficiente repetición del experimento.

PASOS PARA EJECUTAR UN DISEÑO DE EXPERIMENTOS


Los pasos para realizar un trabajo usando los diseños experimentales varían de acuerdo
a las necesidades y exigencias del trabajo a realizar, sin embargo se deben tener en cuenta por
lo menos los siguientes:
- Enunciado del problema.
- Planteamiento de los objetivos.
- Formulación de las hipótesis.
- Selección de la técnica experimental, así como del diseño de acuerdo a los objetivos,
tratamientos escogidos, el tamaño de la muestra y las unidades experimentales disponibles, de
tal manera que pueda proporcionar la mayor información posible con el menor costo..
- Identificación de todas las fuentes posibles de variación.
- Consideración de los posibles resultados desde el punto de vista de los procedimientos
estadísticos a usar, con la condición de que satisfagan los requisitos y supuestos dados.
- Ejecución del experimento, es decir aplicación de los tratamientos a las unidades
experimentales.
- Recolección de los datos previstos.
- Procesamiento de los datos recolectados, usando los medios adecuados.
- Obtención de conclusiones con las medidas de confiabilidad planteadas.
- Evaluación y presentación de los resultados finales.
CONSIDERACIONES PARA DISEÑAR UN EXPERIMENTO
1.- SELECCIÓN DE VARIABLES.- La selección de la variable o variables independientes
depende de los objetivos formulados, estas variables pueden interactuar entre sí o no, algunas
de ellas son más influyentes que otras en la variable respuesta, para su selección se les tendrá
que analizar con la ayuda de los expertos. En cuanto a la variable respuesta o dependiente, el
investigador lo seleccionará dependiendo de que éste tenga la característica de ser el mejor
indicador de los efectos de los tratamientos aplicados; esta variable debe ser susceptible de ser
medido, además debe ser sensible y confiable. Se dice que una variable dependiente es
insensible cuando no refleja ninguna diferencia entre los efectos de tratamientos que están
presentes; en tanto que la confiabilidad de una variable consiste en la consistencia de los
resultados cuando se toman varias medidas sobre la misma unidad experimental.
2.- MÉTODOS PARA CONTROLAR LAS VARIABLES EXÓGENAS:
 Mantener constante la variable exógena para todas las unidades experimentales.
 Asignar al azar las unidades experimentales en los niveles de tratamientos, con la finalidad
de eliminar los errores sistemáticos.
 Aparear las unidades experimentales según la variable exógena, mientras sólo se tenga que
controlar uno o dos variables exógenas, este método es confiablemente factible, sin embargo,
como sucede con otros métodos de control las dificultades 1aumentan a menudo que aumentan
las variables exógenas.
 Emplear el control estadístico, se puede controlar los efectos de las variables exógenas por
medio de una técnica que se conoce con el nombre de Análisis de Covarianza.

3.- SELECCIÓN DE LAS UNIDADES EXPERIMENTALES.


En la mayoría de los experimentos, uno de los objetivos del investigador es tener la
capacidad de inferir a partir de los resultados obtenidos, en base a una muestra de unidades
experimentales, por lo que es de vital importancia la selección de la unidad experimental, pues
este será la que nos proporcione la información deseada después de que se les haya aplicado los
tratamientos en estudio.
4.- POTENCIA Y EFICIENCIA RELATIVA.
La potencia de una prueba es la probabilidad de rechazar una hipótesis nula que es falsa,
viene expresado por (1 - ), en tanto que la eficiencia relativa sirve para comparar la cantidad
de información proporcionada por dos diseños experimentales, para lo cual se usan las
varianzas.
Ejemplo:
(n1 + 1)(n2 + 3)S21
ER = ---------------------
(n1 + 1)(n2 + 3) S22
Donde los S21 y S22 son los cuadrados medios del error de los diseños 1 y 2 respectivamente.
5.- ANÁLISIS DE LOS DATOS.- Para analizar los datos se deben usar métodos estadísticos de
modo que los resultados y conclusiones sean objetivos y no subjetivos, sí el experimento se
diseñó correctamente los resultados deben ser los que corresponden a la realidad objetiva y no
suposiciones, salvo los niveles de error permisibles dados, existen paquetes estadísticos para el
procesamiento de los datos obtenidos, como es el SPSS.
CAPITULO II
DISEÑO CON UN FACTOR
1) DISEÑO COMPLETAMENTE ALEATORIO

Un Diseño Completamente Aleatorio (DCA), es aquel en el cual los tratamientos son


asignados completamente al azar a las unidades experimentales o viceversa, este diseño no
impone ningún tipo de restricción, salvo que las unidades experimentales sean totalmente
homogéneas.
Ventajas:
a) Es fácil de planificar y analizar, siendo muy flexible al número de tratamientos y
repeticiones.
b) El número de repeticiones por tratamiento puede ser diferente, a pesar de que es
recomendable tener el mismo número de repeticiones por tratamiento.
Desventajas:
El diseño es eficiente solo para un pequeño número de tratamientos y para material
experimental homogéneo.

1.- DISEÑO CON UNA OBSERVACIÓN POR UNIDAD EXPERIMENTAL Y CON


IGUAL NÚMERO REPETICIONES.
MODELO ESTADÍSTICO

Yij =  + i + ij  i = 1, 2, 3……....t j = 1,2,3,……..n


Donde:
Yij : Es el valor de la respuesta o rendimiento observado, en el i-ésimo tratamiento y en la j-
ésima repetición. Son variables aleatorias
 : Es el efecto medio verdadero.
i : Es el efecto del i-ésimo tratamiento. Son variables distribuidas en forma normal
con media cero y varianza 2t , sí el modelo a usar es a efectos aleatorios. Sí el modelo es a
efectos fijos, entonces  i = 0
ij : Es el efecto del error experimental en el i-ésimo tratamiento, de la j-ésima
repetición. Incluye efectos de factores exóneos no considerados en el estudio.
t : Es el número de tratamientos.
n : Es el número de repeticiones.

SUPUESTOS
El modelo estadístico debe cumplir los siguientes supuestos:
1.- Aditividad, los efectos del modelo son aditivos.
2.- Linealidad, las relaciones entre los efectos del modelo son lineales.
3.- Normalidad, los errores o residuos son variables aleatorias y deben tener una distribución
normal con media cero y varianza constante 2
4.- Independencia, los resultados obtenidos en el experimento son independientes entre si.
5.- Homogeneidad de varianzas, Las diferentes poblaciones generadas por la aplicación de
los diferentes tratamientos deben tener varianzas iguales (2)
TIPOS DE MODELOS:
Los t niveles del factor en el experimento pueden elegirse de dos maneras:
a) MODELO I (MODELO A EFECTOS FIJOS) Modelo de Análisis de Varianza, es cuando
el investigador selecciona los t tratamientos en forma específica y desea probar la hipótesis
sobre la igualdad de las medias de los tratamientos escogidos y las conclusiones no pueden
extenderse a los demás tratamientos que no fueron considerados.
b) MODELO II (MODELO A EFECTOS VARIABLES) Modelo de Componentes de Varianza,
es cuando el investigador selecciona una muestra aleatoria de t tratamientos de una población
grande de tratamientos, en este caso las conclusiones se extiende a todos los tratamientos de la
población, considerados o no en el experimento, en este caso los i son variables aleatorias.

I) MODELO A EFECTOS FIJOS

En este caso se hará el ANVA según el modelo I, en consecuencia se probará la igualdad


de los efectos de los tratamientos, es decir H0: i = 0  i = 1, 2,3….t; por otro lado, los efectos
de los tratamientos i se considerará como desviaciones de la media global , esto es:
i =  + i
i =  - i
 i = 0
Por otro lado, para los cálculos se usará la siguiente simbología:
Ti = Yi. = total de las observaciones bajo el i-ésimo tratamiento
n
Yi. =  Yij
j 1

n
Y i   Yij /n , Es el promedio de las observaciones bajo el i-ésimo tratamiento
j 1

t n
Y.. = T = Yij
i 1 j 1
Es el gran total de todas las observaciones.

_
Y.. = media total de todas las observaciones
t n
Y .. =  Yij /N
i 1 j 1
= T/nt

N = nt

Fc = T2/nt = Factor de corrección

Fc = Myy = Suma de cuadrados debido a la media


Tyy = Suma de cuadrados de los tratamientos.
n
= (  Ti 2 /n) - Myy
i 1

SCT =  Y2 - Myy
t n
 Y2 =  Yij 2
i 1 j 1

SCE = Eyy =  Y2 - Tyy - Myy


CUADRO DEL ANVA
FUENTE DE GRADOS DE SUMA DE CUADRADOS Fe
VARIACIÓN LIBERTAD CUADRADOS MEDIOS EXPERIMENTAL
Debido a la M = Myy/1
Media 1 M yy = Myy --
Debido a los
Tratamientos t-1 Tyy Tr = Tyy/(t-1) Fe = Tr/E
Debido al
Error t(n-1) Eyy E = Eyy/t(n-1) --
Total N = tn  Y2 -- --
CUADRO DE RECOPILACIÓN DE DATOS
Tratamientos
Muestra 1 2 3 ……… t Totales *
01 Y11 Y21 Y31 ……… Yt1 Y.1
02 Y12 Y22 Y32 ……… Yt2 Y.2
03 Y13 Y23 Y33 ……… Yt3 Y.3
04 Y14 Y24 Y34 ……… Yt4 Y.4
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
n Y1n Y2n Y3n …….. Ytn Y.n
Total T1 T2 T3 …….. Tt T = Y..
Medias Y1 Y2 Y3 Yt Y ..
*Estos totales servirán cuando las muestras se conviertan en bloques, por otro lado, los
tratamientos y las muestras pueden cambiar de posición.
La prueba de Hipótesis consiste en probar la igualdad de las medias 1, 2, 3,…. ,t de
los t tratamientos, si usamos la igualdad i = 0, equivale a plantear la hipótesis:
Ho: 1 =2 =3 =………=t
H1: 1 2 3 ……….t, o
: i = 0 para algún i = 1, 2,3,…..t
Por lo tanto, sí la hipótesis nula es verdadera, entonces cada observación estará
constituida por la media global  más un error aleatorio ij, esto equivale a afirmar que todas
las n observaciones se toman de una población con distribución normal con media  y varianza
2 y que los cambios en los niveles del factor no tienen efecto sobre la respuesta promedio.
Además, tanto el cuadrado medio del error experimental y el cuadrado medio de los
tratamientos, son estimaciones de 2, por consiguiente Fe = Tr/E está distribuida como una F
con (t-1) y t (n-1) grados de libertad, y si el valor de Fe excede al valor de la Fo tabular con un
nivel de significancia  dado se rechaza la hipótesis nula, en consecuencia se concluye que
existen diferencias significativas entre los t tratamientos.
El valor esperado de los cuadrados medios de los tratamientos y el error depende del
tipo de modelo, estos son:
Modelo I:
t
E (Tr) = 2 + n 
1
i2/ (t-1); E (CME) = 2

CME = Cuadrado Medio del Error

Modelo II
E (Tr) = 2 + n2t ; E (CME) = 2
En ambos casos la Fe es igual a Tr/E.
Como se sabe, el ANVA divide a la variabilidad total de los datos contenidos en la muestra en
dos componentes:
SUMA DE CUADRADOS = SUMA DE CUADRADOS + SUMA DE CUADRADOS
DEL TOTAL ENTRE TRATAMIENTOS DENTRO DE TRATAMIENTOS (ERROR)

SCT = SCT + SCE


t n t n
SCT =  (Yij  Y ..)2 = 
i 1 j 1 i 1 j 1
(Yij - Y i. + Y i. - Y ..)2
t n t t n
=  (Yij  Y ..)2 = n  (Yi. - Y ..)2
i 1 j 1 i 1
+  (Yij  Y i.)2
i 1 j 1

Puesto que el doble producto es cero


t n t n
2  (Yi. - Y ..) (Yij - Y i.) = 2  (Yi. - Y ..)  ( Yij - Y i.)
i 1 j 1 i 1 j 1

t n t
2  (Yi. - Y ..)(Yi.- n Y i.) = 2  (Yi. - Y ..)(Yi.- nYi./n) = 0
i 1 j 1 1

Ejemplo Nº 1
Un fabricante de papel para bolsas, está interesado en mejorar la resistencia a la tensión
del producto, el grupo de ingeniería de la empresa piensa que la resistencia a la tensión es una
función de la concentración de madera dura en la pulpa, para lo cual se sometieron a prueba 24
especímenes en un probador de tensión de laboratorio en un orden aleatorio, probando seis
especímenes por cada uno de los cuatro niveles dados, los resultados se presentan en el cuadro
siguiente, pruebe sí existe diferencia significativa entre los cuatro niveles con un 99% de
seguridad.
Concentración Observaciones
de madera % 1 2 3 4 5 6 Total Promedio
5% 7 8 15 11 9 10 60 10,00
10% 12 17 13 18 19 15 94 15,67
15% 14 18 19 17 16 18 102 17,00
20% 19 25 22 23 18 20 127 21,17
Total 383 15,96

Solución:
1) Ho: 1 = 2 = 3 = 4
H1: 1  2  3  4
2)  = 0,01
3) La función pivotal es una F con 3 y 20 grados de libertad.
4) Se rechazará Ho si Fe es mayor a Fo = 4,94
5) T = 383

Myy = (383)2/24 = 6112,04


Tyy = (602 + 942 + 1022 + 1272)/6 – 6112,04 = 382,79
Y2 = 72 + 82 +152+………..+ 202 = 6625
SCE = Eyy = 6625 – 6112,04 – 382,79 = 130,17

Cuadro del ANVA


Fuente de Grados de Suma de Cuadrados
Variación Libertad Cuadrados Medios Fe
Media 1 6112,04 6112,04 --
Tratamientos 3 382,79 127,60 19,6
Error Exp. 20 130,17 6,51 --
Total 24 6625,00 -- --

6) Como Fe = 19,6  Fo = 4,94, se rechaza Ho, por lo tanto hay diferencias significativas en
la resistencia media entre los 4 niveles de concentración de madera, siendo el del 20% el
que da mayor resistencia.
Ahora Usted puede analizar la gráfica y sacar sus conclusiones
G.1. GRÁFICO DE CAJAS
30

20

10
RESISTENCIA

0
N= 6 6 6 6

5 10 15 20

CONCENTRACION DE MADERA
COEFICIENTE DE VARIACIÓN:
Es una medida de variabilidad o de dispersión indica el grado de dispersión de los datos
respecto a su promedio y sirve para analizar el grado de homogeneidad de los resultados
experimentales, para una mejor apreciación es necesario compararlo con un estándar o con otro
experimento de similares características. En el DCA el CME es el estimador de la varianza de
los datos en estudio y el coeficiente de variación se calcula usando la siguiente fórmula.
CME
CV(X) = x 100
Y ..
El coeficiente de variación para el ejemplo es el siguiente:
6,51
CV(X) = x 100 = 15,99%
15,96

Ejemplo Nº 2
Se realizó un experimento con cuatro métodos diferentes de enseñanza, para lo cual se
escogió 20 alumnos con rendimientos homogéneos, a quienes se les asignó al azar a cada grupo
compuesto por cinco alumnos cada uno y a cada grupo se le asignó un método también en forma
aleatoria; se quiere probar si los cuatro métodos son iguales, con esa finalidad después de
aplicado los métodos se les evaluó, obteniendo los resultados que se dan en el siguiente cuadro.
Use  = 0,01
Tratamientos
Muestras 1 2 3 4 Total
1 73 74 67 70
2 74 75 66 71
3 72 74 68 72
4 73 76 69 70
5 75 73 70 72
Total 367 372 340 355 1434
Media 73,4 74,4 68,0 71,0 71,7

Solución:
1) Ho: 1 = 2 = 3 = 4 : 1 = 2 = 3 = 4
H1: 1  2  3  4 : 1  2  3  4
2)  = 0,01
3) La función pivotal es una F con 3 y 16 grados de libertad.
4) Se rechazará Ho si Fe es mayor a Fo = 5,29
5) T = 1434

Myy = (1434)2/20 = 102817, 8

Tyy = (3672 + 3722 + 3402 + 3552)/5 – 102817,8 = 121,8

Y2 = 732 + 742 +722+………..+ 722 = 102964

SCE = Eyy = 102964 – 102817,8 - 121,8 = 24,4


Cuadro del ANVA
Fuente de Grados de Suma de Cuadrados
Variación Libertad Cuadrados Medios Fe
Media 1 102817,8 102817,8 --
Tratamientos 3 121,8 40,6 26,6
Error Exp. 16 24,4 1,525 --
Total 20 102964,0 -- --

6) Como Fe = 26,6  Fo = 5,29 se rechaza Ho, en consecuencia hay diferencias significativas


en el rendimiento promedio entre los 4 métodos de enseñanza, siendo el método Nº 2 el que
mejores resultados produce.

Ejemplo Nº 3:
Se supone que la cantidad de carbón usado en la producción de acero tiene un efecto en
su resistencia a la tensión, con los datos que se presentan en el siguiente cuadro, efectúe el
análisis correspondiente, con un 99% de seguridad.
Espécimen Porcentaje de carbón Total
10% 15% 20% 25% 30%
1 25 23 42 47 28
2 26 30 38 43 29
3 28 31 43 45 33
4 24 33 34 43 35
5 22 29 37 42 34
6 23 32 34 48 33
Total 148 178 228 268 192 1014
Promedio 24,67 29,67 38,00 44,67 32.00 33,80

Solución:
1) Ho: i = 0  i = 1,2,3,4,5
H1: i  0 Para algún i

2)  = 0,01
3) La función pivotal es una F con 4 y 25 grados de libertad.
4) Se rechazará Ho si Fe es mayor a Fo = 4,18
5) T = 1014

Myy = (1014)2/30 = 34273,2


Tyy = (1482 + 1782 + 2282 + 2682 + 1922)/6 – 34273,2 = 1436,8
Y2 = 252 + 262 +282+………..+ 332 = 35940
SCE = Eyy = 35940 – 34273,2 – 1436,8 = 230
Cuadro del ANVA
Fuente de Grados de Suma de Cuadrados
Variación Libertad Cuadrados Medios Fe
Media 1 34273,2 34273,2 --
Tratamientos 4 1436,8 359,2 24,99
Error Exp. 16 230 14,375 --
Total 20 102964,0 -- --

6) Como Fe = 24,99  Fo = 4,18 se rechaza Ho, en consecuencia hay diferencias significativas


en el rendimiento promedio entre los 5 niveles de porcentajes de carbón, siendo el de mejor
rendimiento con 25% de carbón.
En algunos experimentos unifactoriales, el número de observaciones tomadas para cada
tratamiento pueden ser diferentes, en este caso se dice que el diseño no está balanceado, aún
con esto puede emplearse el análisis de varianza descrito anteriormente, sin embargo, es
necesario hacer algunas ligeras modificaciones a las fórmulas dadas para la suma de cuadrados,
sea ni el número de repeticiones en el tratamiento i, luego las fórmulas serán como sigue:
t ni
T=  y
i 1 j 1
ij

SCT = Y2 - Myy


t ni

 y
2
Y2 =
ij
i 1 j 1

2
y t
Tyy =  i.
- Myy
n i 1 i

Eyy = Y2 – Myy - Tyy


La selección de un diseño balanceado tiene dos ventajas importantes:
- El procedimiento de prueba es relativamente insensible a alejamientos pequeños de la
hipótesis de varianzas iguales, sí los tamaños de las muestras son iguales, este no es el caso para
tamaños de muestra diferentes.
- La potencia de la prueba es máxima si las muestras tienen el mismo tamaño.

Ejemplo Nº 4:
Una compañía que fabrica computadoras ha instituido 4 programas diferentes de
entrenamiento para los empleados que trabajan en operaciones de ensamblado. 24 trabajadores
repartidos en grupos de seis, tomaron los programas de entrenamiento, después del
entrenamiento se registraron los tiempos medios necesarios para el ensamblado de un
determinado circuito, para cada uno de los trabajadores, 4 trabajadores renunciaron a su empleo
durante el programa de entrenamiento, los datos se presentan en el siguiente cuadro, haga un
ANVA con un 95% de seguridad.

Trabajador Programa
Nº A B C D Total
1 60 80 97 67
2 80 81 84 84
3 69 73 93 90
4 65 69 79 78
5 -- 75 92 61
6 -- 72 -- --
Total 274 450 445 380 1549
ni 4 6 5 5 20
Promedio 68,5 75 89 76 77,45

Solución:
1) Ho: i = 0  i = 1,2,3,4
H1: i  0 Para algún i

2)  = 0,05
3) La función pivotal es una F con 3 y 16 grados de libertad.
4) Se rechazará Ho si Fe es mayor a Fo = 3,24
5) T = 1549

Myy = (1549)2/20 = 119970,05


Tyy = (2742/4 + 4502/6 + 4452/5 + 3802/5) – 119970,05 = 1033,95

Y2 = 602 + 802 +692+………..+ 612 = 122115

SCE = Eyy = 122115 - 119970,05 - 1033,95 = 1111

Cuadro del ANVA


Fuente de Grados de Suma de Cuadrados
Variación Libertad Cuadrados Medios Fe
Media 1 119970,05 119970,05 --
Tratamientos 3 1033,95 344,65 4,96
Error Exp. 16 1111,00 69,44 --
Total 20 122115,00 -- --

6) Como Fe = 4,96  Fo = 3,24 se rechaza Ho, en consecuencia hay diferencias significativas


en el tiempo promedio de ensamblado entre los 4 programas de capacitación, siendo el
programa c el recomendable.

Ejemplo Nº 5:
Un ingeniero de producción está interesado en maximizar la resistencia a la tensión de
una nueva fibra sintética empleada para fabricar tela para pantalones, se sabe que la resistencia
depende del porcentaje de algodón que contiene la tela, el ingeniero decide probar muestras de
tela en 5 niveles de porcentaje de algodón, hace seis repeticiones para cada nivel, las muestras
fueron asignados al azar cada nivel, los resultados fueron los siguientes. Haga un ANVA con
un 95% de seguridad.

% de Observaciones
Algodón 1 2 3 4 5 6 Total Promedio
15 7 15 11 15 11 13 72 12,0
20 7 11 7 9 15 11 60 10,0
25 12 17 13 15 18 15 90 15,0
30 19 25 22 20 23 23 132 22,0
35 15 18 16 17 19 17 102 17,0
Total 456 15,2

G.2. GRAFICO DE CAJAS


30

20

10
RESISTENCIA

0
N= 6 6 6 6 6

15 20 25 30 35

PORCENTAJE

Solución:
1) Ho: i = 0  i = 1,2,3,4,5
H1: i  0 Para algún i

2)  = 0,05
3) La función pivotal es una F con 4 y 25 grados de libertad.
4) Se rechazará Ho si Fe es mayor a Fo = 2,60
5) T = 456

Myy = (456)2/30 = 6931, 2


Tyy = (722 + 602 + 902 + 1322 + 1022)/6 – 6931,2 = 520,8

Y2 = 72 + 152 +112+………..+ 232 = 7604

SCE = Eyy = 7604 – 6931,2 – 520,8 = 152,0

Cuadro del ANVA


Fuente de Grados de Suma de Cuadrados
Variación Libertad Cuadrados Medios Fe
Media 1 6931,2 6931,2 --
Tratamientos 4 520,8 130,2 21,4
Error Exp. 25 152,0 6,08 --
Total 30 7604,0 -- --

6) Como Fe = 21,4  Fo = 2,60 se rechaza Ho, en consecuencia hay diferencias significativas


en la resistencia promedio entre los cinco niveles de porcentaje de algodón, siendo
recomendable usar el del 30%.
INTERVALOS DE CONFIANZA PARA LA MEDIA DEL i-ÉSIMO TRATAMIENTO
Se puede estimar los promedios poblacionales en forma interválica usando la siguiente fórmula:
Se sabe que: i =  + i  i = 1, 2,3,….t

El estimador puntual de  es  = Y .., si los errores están distribuidos normalmente, entonces
el promedio de cada tratamiento estará distribuido de manera normal con media i y varianza
2/n, por lo tanto, sí se conoce 2 , entonces se puede usar la distribución normal para construir
un intervalo de confianza, si empleamos el CME como estimador de 2 , entonces se puede usar
la distribución t:

Y i.  ui
t =  es una t con t(n-1) g.l.
CME
N
Luego para un  dado se tiene:
CME CME
P ( Yi . - t/2  i  Yi . + t/2 )=1-
n n
Ejemplo:
Use los datos del ejemplo anterior para obtener los intervalos confidenciales para estimar los 5
promedios, con un 95% de seguridad.
Solución:
CME = 6,08
 = 0,05 /2 = 0,025
t0.975, 25 = 2,06
6,08
n = 6; = 1,0066446
6
_ _ _ _ _
Y1. = 12; Y2 = 10; Y3 = 15; Y4 = 22; Y5 = 17

1) 12 ±2,06(1,0066446) ; P(12 – 2,07  1  12 + 2,07) = 0,95


12 ±2,07 P (9,93  1  14,07) = 0,95
2) 10 ±2,06 (1,0066446); P (10 – 2,07  1  10 + 2,07) = 0,95
10 ±2,07 P (7,93  1  12,07) = 0,95
3) 15 ±2,06 (1,0066446); P (15 – 2,07  1  15 + 2,07) = 0,95
15 ±2,07 P (13,93  1  17,07) = 0,95
4) 22 ±2,06 (1,0066446); P (22 – 2,07  1  22 + 2,07) = 0,95
22±2,07 P (20,93  1  24,07) = 0,95
5) 17 ±2,06 (1,0066446); P (17 – 2,07  1  17 + 2,07) = 0,95
17 ±2,07 P (15,93  1  19,07) = 0,95

II) MODELO A EFECTOS ALEATORIOS


En muchas situaciones, el factor de interés puede tener un número muy grande de
niveles posibles, además el analista puede estar interesado en obtener conclusiones sobre toda
la población de niveles de dicho factor, sí el investigador escoge una muestra aleatoria de
niveles del factor, entonces se dice que los efectos son aleatorios, las conclusiones alcanzadas
deben ser extendidas a la población de niveles; el modelo a usar es el siguiente:
Yij =  + i + ij  i = 1, 2,3,….t
J = 1, 2,3,….n

En este caso los efectos del tratamiento i y los errores ij son variables aleatorias
independientes, aún cuando el modelo es lo mismo que en el caso de los efectos fijos, pero los
parámetros tienen interpretaciones diferentes, pues:

V (Yij) = 2t + 2
A las varianzas 2t y 2 se les conoce como componentes de varianza, razón por el
cual al modelo se le conoce también como componentes de varianza. Para probar la hipótesis
se supone que los errores ij tienen distribución normal e independiente con media cero y
varianza constante 2  DNI (0, 2), asimismo los i  DNI (0, 2t)
De acuerdo a la esperanza de los cuadrados medios de los tratamientos, no tiene sentido probar
i = 0, pues resulta más apropiado probar Ho: 2t = 0, frente a H1: 2t  0, sí 2t = 0, entonces
todos los tratamientos tienen idénticos efectos, pero sí 2t  0, entonces significa que existe
variabilidad entre los efectos de los tratamientos, en tanto que el ANVA sigue siendo lo mismo

Tyy /(t  1)
Fe =  Es una F con (t-1) y t(n-1) g.l., sí Ho es cierta.
Eyy / t (n  1)

Ejemplo:
Una compañía textil produce tela en varios telares, la compañía tiene interés en conocer
si la variabilidad en la resistencia a la tensión se debe a los telares, para investigar esto un
ingeniero de producción seleccionó al azar cuatro telares y determinó la resistencia a la tensión
de las muestras de tela tomadas aleatoriamente de cada telar. Los resultados se presentan en el
siguiente cuadro. Haga un ANVA con un 99% de seguridad.
Observaciones
Telar 1 2 3 4 Total Promedio
1 98 97 99 96 390 97,5
2 91 90 93 92 366 91,5
3 96 95 97 95 383 95,8
4 95 96 99 98 388 97,0
Total 1527 95,45

Solución:
1) Ho: 2t = 0
H1: 2t  0
2)  = 0,01
3) La función pivotal es una F con 3 y 12 grados de libertad.
4) Se rechazará Ho si Fe es mayor a Fo = 5,95
5) T = 1527
Myy = (1527)2/16 = 145733, 06
Tyy = (3902 + 3662 + 3832 + 3882)/4 – 145733, 06 = 89, 19

Y2 = 982 + 912 +962+………..+ 982 = 145845

SCE = Eyy = 145845 – 145733, 06 – 89, 19 = 22, 75

Cuadro del ANVA


Fuente de Grados de Suma de Cuadrados
Variación Libertad Cuadrados Medios Fe
Media 1 145733,06 145733,06 --
Tratamientos 3 89, 19 29,73 15,68
Error Exp. 12 22, 75 1,896 --
Total 16 145845,00 -- --

7) Como Fe = 15,68  Fo = 5,95 se rechaza Ho, en consecuencia hay diferencias


significativas en la resistencia promedio a la tensión entre los telares, en este caso no sería
razonable dar alguna recomendación para usar un telar determinado.

ANALISIS DEL RESIDUO


El ANVA de un solo factor supone que las observaciones se distribuyen normal e
independientemente, con la misma varianza en todos los tratamientos o niveles del factor. Estas
suposiciones se pueden verificar examinando los residuos o errores:
eij = Yij - Y i.
Es decir, la diferencia entre cada observación y su media del tratamiento
correspondiente.
Las suposiciones de normalidad puede verificarse graficando los residuos en el papel de
probabilidad normal (eij , zi ), o por medio del ajuste de curvas o bondad de ajuste,; para
comprobar la suposición de varianzas iguales en cada tratamiento, se puede usar la prueba de
Bartlett o de Cochran, pero también se pueden graficar los residuos con los niveles del factor y
comparar la dispersión de los residuos; también es útil graficar los residuos contra los
promedios Y i., la variabilidad de los residuos no debe depender de los promedios Y i. de
ninguna manera, cuando aparece un patrón en estas gráficas, esto suele indicar que debe
transformarse la variable, pudiendo ser con las expresiones conocidas como logY, Y , 1/x,
etc. Las suposiciones de independencia se pueden verificar graficando los residuos contra el
tiempo u orden de la serie en que se ejecutó el experimento; un patrón en esta gráfica tal como
la secuencia de residuos positivos o negativos puede indicar que las observaciones no son
independientes, además indica que el tiempo u orden de la serie es importante, o que las
variables que cambian con el tiempo son importantes pero se han obviado en el diseño.
Ejemplo:
Use los datos del ejemplo anterior para analizar los residuos.
Usaremos los ei. = Yij - Y i., es decir, vamos a restar cada dato del promedio i-ésimo o telar,
dichos residuos se encuentran en el siguiente cuadro.
Cuadro de Residuos:
Observación
Telar 1 2 3 4 Promedio
1 0.50 -0.50 1.50 -1.50 97.50
2 -0.50 -1.50 1.50 0.50 91.50
3 0.25 -0.75 1.25 -0.75 95.75
4 -2.00 -1.00 2.00 1.00 97.00

G.3. GRAFICO DE CAJAS


3

-1
RESIDUO

-2

-3
N= 4 4 4 4

1 2 3 4

TELAR

G.4. GRAFICO DE CAJAS


3

-1
RESIDUO

-2

-3
N= 4 4 4 4

91.5 95.8 97.0 97.5

PROMEDIO
Como se puede apreciar no existe un patrón definido entre los residuos, por lo tanto la
variable respuesta original no necesita de transformaciones.

You might also like