Professional Documents
Culture Documents
DEL PERÚ
FACULTAD DE CIENCIAS APLICADAS
ESTADÍSTICA Aplicada a la
Investigación
Autora:
OCTUBRE-2016
Curso: Tesis Catedrática: Msc. Shalin Carhuallanqui Avila
DISEÑOS EXPERIMENTALES
PRINCIPIOS DEL DISEÑO EXPERIMENTAL
1. INTRODUCCIÓN
Este capítulo es una introducción al planeamiento y conducción de experimentos en relación con los objetivos, el
análisis y la eficiencia. Si aceptamos la premisa que el conocimiento nuevo se obtiene muy frecuentemente a
través del análisis e interpretación cuidadosa de los datos, entonces es muy importante que se deba dedicar
tiempo y esfuerzo considerables al planeamiento y recolección de los mismos con el objeto de obtener la
máxima información con el menor costo de recursos.
2. EXPERIMENTO
Es una búsqueda planeada para obtener nuevos conocimientos o para confirmar o no resultados de
experimentos previos, con lo que tal indagación ayuda a la toma de decisiones. Se dispone cada experimento
para proporcionar respuestas a una o más preguntas. Con esto en mente, los investigadores deciden que
comparaciones de tratamientos proporcionarán información relevante. Entonces realizan un experimento para
medir o probar hipótesis que tiene que ver con diferencias entre tratamientos en condiciones
comparables. Toman mediciones y observaciones sobre el material experimental. A partir de la información
obtenida en un experimento que se ha completado con éxito, responden a las preguntas planteadas al comienzo.
Tales experimentos se clasifican en tres categorías: preliminar, crítico y demostrativo.
4. ERROR EXPERIMENTAL
Es una medida de la variación existente entre observaciones sobre medidas experimentales tratadas en forma
similar.
La variación proviene de dos fuentes principales, primero, existe la variabilidad inherente al material
experimental al cual se aplican los tratamientos. Segundo, existe una variación resultante de cualquier falta
de uniformidad en la realización física del experimento.
Es importante hacer todo el esfuerzo posible para reducir el error experimental; para ello debe atenderse a las
dos principales fuentes de error experimental:
a) Manejar el material experimental de tal manera que se logre reducir los efectos debidos a la variabilidad
inherente.
b) Refinar la técnica experimental.
EL DISEÑO EXPERIMENTAL
El control del error experimental consiste en el diseño de un experimento de tal manera que parte de la
variación natural entre el conjunto de unidades experimentales se trate materialmente de modo que no contribuya
en nada a las diferencias entre medias de tratamientos. Cuando se agrupan las unidades experimentales en
5. REPETICIONES
Cuando un tratamiento aparece más de una vez en un experimento se dice que está repetido. Se hace
repeticiones para:
a. Permitir una estimación del error experimental.
b. Mejorar la precisión de un experimento mediante la reducción de la desviación estándar de una media de
tratamiento.
c. Aumentar el alcance de la inferencia del experimento a través de la selección y del uso apropiado de unidades
experimentales más variables.
d. Ejercer control sobre la varianza del error.
6. ALEATORIZACIÓN
La función de la aleatorización consiste en asegurarse que obtengamos un estimativo válido o insesgado del error
experimental, de las medias de tratamientos y de las diferencias entre las mismas. La aleatorización
generalmente supone el empleo de un dispositivo de azar, tal como el lanzamiento de una moneda o el uso de
tablas de números aleatorios. Aleatoriedad y azar no son equivalentes. Para evitar el sesgo de las comparaciones
entre medias de tratamientos, es necesario disponer de alguna manera de asegurar que un tratamiento particular
no resulte favorecido en forma consistente en repeticiones sucesivas por alguna fuente externa de variación
conocida o desconocida. O sea que cada tratamiento debe tener igual oportunidad de ser asignado a una unidad
experimental, sea favorable o desfavorable. La aleatoriedad ofrece el procedimiento de igual oportunidad.
7. VARIABLE RESPUESTA
Es el resultado obtenido de una unidad experimental, de un atributo particular. Corrientemente su expresión
es numérica. La respuesta puede ser el rendimiento de un cultivo, la altura de una planta, la eficiencia de una
máquina, la resistencia de un material, etc. Usualmente se mide varias respuestas en el mismo ensayo.
8. PARÁMETRO
Es un valor fijo relacionado a una población, que generalmente desconocemos, utilizando como representantes
de ellos a sus estimaciones.
9. COEFICIENTE DE VARIACIÓN
El Coeficiente de Variación (CV) es una medida de dispersión, utilizado para medir el grado de homogeneidad
relativa de un grupo de datos, frente a otros que presentan diferentes unidades o escalas de medida. El CV se
expresa porcentualmente y se obtiene dividiendo la desviación estándar de los datos por la media de los mismos.
MINITAB
INTRODUCCION
El Minitab usará funciones, creará gráficas y generará
estadísticas. La mayoría de los análisis estadísticos requiere una serie de pasos, con frecuencia orientados por
un conocimiento previo o por el área en cuestión que se investiga.
INICIO DE MINITAB
Antes de comenzar su análisis, inicie Minitab y examine el diseño de las ventanas.
En la barra de tareas de Windows, elija Inicio ➤ Programas ➤ Minitab
Solutions ➤ Software estadístico Minitab 16 Español.
Puede abrir una nueva hoja de trabajo vacía en cualquier momento. También puede abrir uno o más archivos con
datos. Cuando abre un archivo, usted copia su contenido en el proyecto Minitab actual. Los cambios que efectúa
en la hoja de trabajo mientras se encuentra en el proyecto no afectan el archivo original. Los datos de los tres
centros de envío se guardan en la hoja de trabajo
DATOSENVÍO.MTW.
DISEÑO
COMPLETAMENTE AL AZAR (DCA)
Donde:
Yij = =Valor observado en la j-ésima repetición para el i-ésimo tratamiento.
Es la ganancia de peso obtenida en el j-ésima cuy alimentado para el i-ésimo mezcla alimenticia (trat)
m= Efecto de la media general (Efecto de la media general de la ganancia de peso).
eij = Efecto aleatorio del error experimental con el j-esima repetición con el i-esimo tratamiento
t = Numero de tratamientos.
ri = Número de repeticiones del i-esimo tratamiento
El efecto del i-ésimo tratamiento esta dado por ti , siendo la expresión: t i = mi - m , donde µi es la
media del i-ésimo tratamiento y µ la media general.
- FC
S .C (trat ) FC =
CMTrat
CME
r G.L (trat )
Hipótesis:
Ho: La variable sigue una distribución Normal (u, ϭ2)
H1: La variable NO sigue una distribución Normal (u, ϭ2)
PASOS:
1. Colocar los datos de los
tratamientos del problema
2. Estadifica / Estadística básica/
Prueba de normailidad/
Seleccionarla variable respuesta
(Rendimiento)
Otra manera
3. Ir a Grafica: Grafica de
probabilidades – Individual Aceptar
4. Variable de gráfica: Seleccionar la
variable respuesta en estudio
5. Distribución. Esta Normal y Aceptar
CONCLUSION:
El Valor P = 0.419 es mayor a 0.05%, por lo tanto se acepta Ho que la variable sigue una distribución
Normal (u, ϭ2)
Esta prueba se utiliza para evaluar si existe homogeneidad de variancias entre k ( 2 o más muestras)
poblacionales ( en el caso de un diseño experimental, las poblaciones corresponderán a los
tratamientos), Los supuestos para la aplicación de esta prueba son que las poblaciones tienen
distribución normales e independientes, y que las muestras son tomadas al azar.
Hipótesis:
Ho: ϭ21= ϭ22 =…. = ϭ2k = ϭ2
H1: Al menos un ϭ2i es diferente
PASOS:
1. Colocar los datos de los tratamientos del
problema
2. Estadifica / ANOVA/ Prueba de variancias iguales
Seleccionar la variable respuesta y luego factor
(tratamiento) y Aceptar
Ejemplo 1: En un ensayo con macetas se aplicaron cinco tratamientos de abonos a clones de pasto
estrella. Se tomaron cuatro macetas por tratamiento. Los rendimientos se presentan en la tabla 1.
Ha: Al menos uno de los tratamientos tiene un efecto diferente en su rendimiento promedio del pasto estrella.
o Ha: Al menos un µi es diferente a los demás i=1,2, 3, 4 y 5
Tabla 1.
Rendimiento del Ensayo con Macetas
Tratamiento
Maceta 1 2 3 4 5
1 101 51 83 67 29
2 93 61 68 40 45
3 93 59 72 46 51
4 96 58 75 52 42
TOTAL 383 229 298 205 167 1282
Media 95.75 57.25 74.50 51.21 41.75
1. PASOS EN EL MINITAB
Ir a Estadística
Anova
Un solo factor
Respuesta → Poner: Rendimiento
(Variable dependiente o variable respuesta)
Factor → Poner tratamiento
Poner el cuadro de Aceptar
Tabla 2.
Análisis de varianza de los tratamientos para el rendimiento del pasto estrella.
Fuente GL SC CM F P
CONCLUSIÓN ESTADÍSTICA
Hay evidencia estadística a un α de 0.05 de rechazar la Hp y aceptar la Ha. E xiste suficiente evidencia
estadística de que al menos un tratamiento produce un efecto diferente en rendimiento promedio en el pasto
estrella.
ó Existe suficiente evidencia estadística para aceptar que al menos uno de los tratamientos produce un
efecto diferente en rendimiento promedio en el pasto estrella.
Ir a Estadística
ANOVA
Un solo factor
Respuesta → Poner: Rendimiento (Variable dependiente o variable respuesta)
Factor → Poner tratamiento
Comparaciones
Poner ( X) De Tuckey
Poner Aceptar
Tabla 3.
Comparación de medias de Tuckey de los tratamientos en el el rendimiento del pasto
estrella.
Tratamientos --+---------+---------+---------+-------
2 (---*---)
3 (---*---)
4 (---*---)
5 (---*---)
--+---------+---------+---------+-------
-60 -30 0 30
Tratamientos = 2 restado de:
Tratamientos --+---------+---------+---------+-------
3 (---*---)
4 (---*---)
5 (---*---)
--+---------+---------+---------+-------
-60 -30 0 30
Tratamientos --+---------+---------+---------+-------
4 (---*---)
5 (---*---)
--+---------+---------+---------+-------
-60 -30 0 30
Tratamientos --+---------+---------+---------+-------
5 (---*---)
--+---------+---------+---------+-------
-60 -30 0 30
INTERPRETACIÓN
T2- T1: es -55,25 -21.47 es la comparación entre T2-T1
Si el Intervalo Confidencial CONTIENE AL CERO LAS MEDIAS SON IGUALES Y SI NO INCLUYE AL CERO
SON DIFERENTES, en este ejemplo no incluye entonces T2-T1 es diferente
CONCLUSION
El tratamiento 1 (X) tiene un mayor valor de rendimiento promedio y es 95.750; son diferentes significativamente
con los tratamientos 3, 2, 4 y 5.
El tratamiento 3 tiene un valor de rendimiento promedio de 74.5 y es diferente significativamente en cuanto al
valor rendimiento promedio de los tratamientos 2, 4 y 5.
En los tratamientos 2, 4 y 5 no hay diferencia significativa en cuanto al valor del rendimiento promedio.
GRAFICOS EN EL MINITAB
Ir a Estadística
Anova
Un solo factor
Respuesta → Poner: Rendimiento (Variable dependiente o variable respuesta)
Factor → Poner tratamiento
Graficas→ Se selecciona y se selecciona en diagrama de caja de datos
Poner el cuadro de Aceptar Gráfica de caja de Rendimiento
110
100
90
80
iento
70
Rendim
60
50
40
30
20
1 2 3 4 5
Tratamientos
Tabla 4.
Ganancia de peso de los cuyes de 5 alimentos balanceados
5 Tipos de Alimento Dosis de alimentos
(n) observaciones A1 A2 A3 A4 A5
1 1.3 0.9 2.1 2.3 2.6
2 1.8 1.1 2.5 2.8 2.3
3 1.6 0.8 2.9 2.0 2.5
4 1.5 1.0 2.5 2.6 2.1
5 1.5 0.9 2.8 2.7 2.5
6 1.4 1.3 2.9 2.1 2.7
TOTALES
NRO REPET
PROMEDIO
El nombre de bloques se debe a que el área experimental se divide en partes iguales llamados estratos o
bloques, de modo que exista uniformidad dentro del bloque y heterogeneidad entre los bloques. Los bloques son
completos porque todos los tratamientos están presentes en cada uno de los bloques, y son al azar porque los
tratamientos son distribuidos al azar y en forma independiente en cada uno de los bloques.
Debe prevenirse la perdida de unidades experimental. Si pese a todas las precauciones se pierden una o dos
unidades experimentales el proceso de análisis estadístico sufre algunas modificaciones afectando los resultados.
Una alternativa es estimar el valor de la unidad experimental perdida y luego realizar el análisis estadístico. El
número máximo de tratamientos que pueda tener un bloque depende de la homogeneidad. En la práctica el
numero recomendable de tratamientos varía entre 5 y 8.
t = Numero de tratamientos
b = Numero de Bloques o de días
Donde:
Yij = Valor observado de la unidad experimental sujeto al i-ésimo tratamiento en el j-ésimo bloque.
µ : es la media general, estimada por la media del experimento : ..
Tabla 5
Análisis de varianza simbólica del DBCA (ANVA) (ANOVA)
Tratamiento t-1
SCTrat =
�(Yi.) 2
- FC
S .C (trat )
FC =
CMTrat
b G.L (trat ) CMError
Bloques b-1
SCTbloque =
�(Y . j ) 2
- FC
S .C (bloques)
t G.L(bloques)
Error (t-1)(b-1) SCerror S .C ( Error )
G.L ( Error )
Total Tb-1 t b
Y..2
��Yij2 -
i =1 j =1 tb
EJEMPLO 1: Tres diferentes soluciones están siendo estudiadas para evaluar su efectividad en el retardo del
crecimiento de bacterias en contenedores de leche de 5 galones. Los análisis son hechos en un laboratorio y solo
tres ensayos pueden efectuarse en un día dado. Debido a que los días pueden ser una fuente de variabilidad, el
investigador decide utilizar un diseño de bloques completos al azar. Las observaciones fueron tomadas en cuatro
días y datos (en UFC) se muestran en la siguiente tabla:
Ho: Las tres soluciones son igualmente efectivas en el retardo de crecimiento de bacterias promedio en
contenedores de la leche. Ho = u1=u2=u3
Ha: Al menos una de las soluciones tiene una efectividad diferente en el retardo del crecimiento de bacterias
promedio en contenedores de la leche.
Tabla 6.
Efectividad en el retardo del crecimiento de bacterias en contenedores de leche
Solución
Días 1 2 3
1 13 16 5
2 22 24 4
3 18 17 1
4 39 44 22
TOTAL 92 101 32
REPETICIONES 4 4 4
PROMEDIO 23 25.25 8
Tabla 7.
Análisis de varianza de las soluciones en la efectividad en el retardo del crecimiento de bacterias en
contenedores de leche
Fuentes de Grados Suma de cuadrados Cuadrados medios F F
variación de libertad S .C. Calculado Tabla
C .M . =
G. L 1% 5%
Tratamiento 2 703.5 351.75 40.72 10.92 5.14
Bloques 3 1106.92 368.97 42.71 9.78 4.76
1. PASOS EN EL MINITAB
Ir a Estadística
ANOVA
Modelo lineal general
Respuesta → Crecimiento (Variable respuesta)
Modelo: Tratamiento Días
Tabla 8.
Análisis de varianza de los efectividad en el retardo del crecimiento de bacterias en contenedores de
leche
Fuente GL SC Sec. SC Ajust. CM Ajust. F P
Tratamientos 2 703.50 703.50 351.75 40.72 0.000
Dias 3 1106.92 1106.92 368.97 42.71 0.000
Error 6 51.83 51.83 8.64
Total 11 1862.25
CONCLUSION:
Hay evidencia estadística a un α de 0.05 de rechazar la Hp y aceptar la Ha. E xiste suficiente evidencia
estadística para aceptar que las tres soluciones producen un efecto diferente en el retardo del
crecimiento de bacterias en contenedores de la leche.
GRAFICA DE INTERACCIONES
Ir a Estadística
ANOVA
Grafica de interacciones
Aceptar
Gráfica de interacción para Crecimiento
Medias de datos
50 Tratamientos
1
2
40 3
30
Me dia
20
10
0
1 2 3 4
Dias
Tabla 9.
Comparación de medias de TUKEY de las soluciones en la efectividad en el retardo del crecimiento de
bacterias en contenedores de leche.
CONCLUSION
El tratamiento (solución) 2 y 1 tienen un valor de efectividad promedio en el retardo del crecimiento de bacterias
en contenedores de leche de 25.3 y 23.0. Los dos tratamientos (soluciones) no presentan diferencia significativa
en cuanto a su efectividad en el retardo del crecimiento de bacterias.
El tratamiento 3 tiene un valor de efectividad promedio en el retardo del crecimiento de bacterias en
contenedores de leche de 8.0 y presenta una diferencia significativa con los tratamientos 2 y 1.
Ejemplo 2:
Se presenta los resultados de seis variedades de Frijol (Rendimiento expresado en g/ parcela) en el que se
usaron cuatro repeticiones por tratamiento. Se quiere probar la siguiente hipótesis:
Tabla 10.
Rendimiento de seis variedades de frijol
Variedades TOTAL
Repeticiones Bayo Gastelum Mantequilla Testigo Cuyo Zirate
1 42 32 25 18 35 36
2 46 38 32 20 42 25
3 38 31 28 26 46 22
4 41 30 26 24 40 26
TOTAL 167 131 111 88 163 109
REPETICIONES 4 4 4 4 4 4
PROMEDIO 41.75 32.75 27.75 22 40.75 27.25
EXPERIMENTOS FACTORIALES
Estos experimentos son útiles también en campos de estudio más complejos en los que se sabe que
un factor no actúa independientemente sino en estrecha relación con otros factores. En este
capítulo se trataran los experimentos factoriales con dos factores conducidos bajo los lineamientos de
un DCA y DBCA.
Donde:
Yijk = Es el valor o rendimiento observado con el i-esimo nivel del factor A, j-esimo nivel del factor B, k-esima
repetición
m = Es el efecto de la media general.
i = Es el efecto del i- esimo nivel del factor A.
b j = Es el efecto del j- esimo nivel del factor B
(b ) ij = Es el efecto de la interacción en el i-esimo nivel del factor A, j-esimo nivel del factor B.
e ijk = Es el efecto del error experimental en el i- esimo nivel del factor A, j- esimo nivel del factor B, k-esima
repetición
p = Es el numero de niveles del factor A.
q = Es el numero de niveles del factor B.
rij = Es el número de repeticiones en el i- esimo nivel del factor A, j- esimo nivel del factor B,
A1 A2 A3
B1 B2 B1 B2 B1 B2
A1B1=T1 A1B2=T2 A2B1=T3 A2B2=T4 A3B1=T5 A3B2=T6
1 5 3 3 3 2 2
2 6 3 2 2 4 6
3 6 4 4 8 2 10
4 7 4 3 5 2 6
TOTAL 24 14 12 18 10 24
PROMEDIO 6 3.5 3 4.5 2.5 6
A1 A2 A3 TOTAL
B1 24 12 10 46
B2 14 18 24 56
TOTAL 38 30 34 102
Tabla 12.
ANVA de un arreglo factorial de 3x2 con un diseño completamente al azar (DCA)
1. PASOS EN EL MINITAB
Estadística
ANOVA
Modelo lineal general
Respuesta → Peso (Variable dependiente, variable respuesta)
Modelo → Poner: Factor A factor B Factor A*Factor B
Ejemplo: Alimento raza (selecciona nuevamente Alimento*raza)
Aceptar
Tabla 13.
CONCLUSION:
Hay evidencia estadística a un α de 0.05 de ACEPTAR la Hp y rechazar la Ha. E xiste suficiente evidencia
estadística para aceptar que los tres tipos de alimentos concentrado producen el mismo efecto en el
aumento de la ganancia de peso de los ovinos.
Hay evidencia estadística a un α de 0.05 de ACEPTAR la Hp y rechazar la Ha. E xiste suficiente evidencia
estadística para aceptar que en las dos razas de ovinos producen el mismo efecto en el aumento de la
ganancia de peso.
Para la Interacción:
Hay evidencia estadística a un α de 0.05 de rechazar la Hp y aceptar la Ha. Existe suficiente evidencia
estadística para aceptar la interacción entre los tipos de alimentos concentrado y la raza de ovino; por
lo tanto, será necesario analizar los efectos simples de los factores en vez de sus efectos principales.
Tabla 14.
Comparación de medias de TUKEY para los tres tipos de alimentos concentrados y la ganancia de peso
Tabla 16.
Comparación de medias de TUKEY para los Alimento*Raza ovino y la ganancia de peso
GRAFICA DE FACTORES
Estadística
ANOVA
Modelo lineal general, ya esta todos los
datos
Entrar al cuadro de Grafica de Factores
Ingresar factores: Alimento y luego
Ingresar Factores: Peso
O También
Ingresar factores: Ovino y luego Ingresar
Factores: Peso Efecto de la ganacia de peso
O También 5
Aceptar
Media
Estadística 0
3
1 2 3
Alimento
ANOVA
Media
Error
estándar
de la
Alimento*Raza Media media
1 1 6.000 0.9204
1 2 3.500 0.9204
2 1 3.000 0.9204
2 2 4.500 0.9204
3 1 2.500 0.9204
3 2 6.000 0.9204
Tabla 18.
Análisis de varianza (ANVA) del rendimiento de maíz obtenido con dos tipos de abono a tres dosis
CONCLUSION:
Hay evidencia estadística a un α de 0.05 de rechazar la Hp y aceptar la Ha. E xiste suficiente evidencia
estadística para aceptar que los dos tipos de abono producen un efecto diferente en el rendimiento de
maíz.
Hay evidencia estadística a un α de 0.05 de rechazar la Hp y aceptar la Ha. E xiste suficiente evidencia
estadística para aceptar que los tres dosis de abono producen un efecto diferente en el rendimiento de
maíz.
Para la Interacción:
Hay evidencia estadística a un α de 0.05 de rechazar la Hp y aceptar la Ha. E xiste suficiente evidencia
estadística para aceptar la interacción entre los tipos de abono y las dosis de abono; por lo tanto, será
necesario analizar los efectos simples de los factores en vez de sus efectos principales.
Hay evidencia estadística a un α de 0.05 de rechazar la Hp y aceptar la Ha. E xiste suficiente evidencia
estadística para aceptar que los bloques producen un efecto diferente en el rendimiento de maíz.
Tabla 19.
Comparación de medias de TUKEY para los dos tipos de abono
Estadística
ANOVA
Modelo lineal general
Seleccionar el cuadro de Comparación
X en comparaciones
Términos: Factor B
Aceptar
Tabla 20.
Comparación de medias de TUKEY para las tres dosis de abono
Estadística
ANOVA
Modelo lineal general
Seleccionar el cuadro de Comparación
X en comparaciones
Términos: Factor A* Factor B. Ejemplo (Abono*Dosis)
Aceptar
Tabla 21.
Comparación de medias de TUKEY para los dos tipos de abono * las tres dosis
Factor A Factor B N Media Agrupación
2 3 4 3.1 A
2 2 4 3.1 A
1 3 4 2.7 A B
1 2 4 2.3 B C
2 1 4 2.1 C
1 1 4 2.1 C
Nota: Las medias que no comparten una letra son significativamente diferentes.
Método de Tukey y una confianza de 95.0%