You are on page 1of 17

Actividad 10 Trabajo Colaborativo 2

Inferencia Estadstica

Grupo Colaborativo: 100403_9

Fernando Montao Rivillas Cdigo: 16.346.117 Pedro Nel Maya Olaya Cdigo: 16840171 Ferney Chacn Cdigo: William Ortiz Cdigo:

Director: Doctora Jeammy Julieth Sierra

Universidad Nacional Abierta y a Distancia UNAD. Programa de Ingeniera Industrial

Mayo de 2013

TABLA DE CONTENIDO

INTRODUCCION

3 4 4 4 4 4 5 5 6 6 7 7 7 7 8 12 14 14 2

TEMA 1. PLANTEAMIENTO DE HIPOTESIS.. Caso a - De las petroleras Canacol y Hocol. Caso b Horas Laboradas .... Caso c Desviaciones.. TEMA 2. NIVEL DE CONFIANZA... Caso a Zona de Rechazo ... Nivel de Confianza de 90 %... Nivel de confianza de 92%. Nivel de confianza de 94%. TEMA 3. VARIABLES Caso b Metales.. Caso c Ingeniero....... TEMA 4. ANOVA Y PRUEBA DE TUKEY .. Caso a ANOVA .... Caso b - Prueba de Tukey .. TEMA 5. CUADRO.. Caso a Cuadro relacional

CONCLUSIONES.... BIBLIOGRAFIA

16 17

INTRODUCCION En el presente documento, encontraran el desarrollo del aporte de la actividad 10 referente al trabajo colaborativo 2 del curso de Inferencia Estadstica sobre los temas tratados y estudiados en la unidad 2. Inicialmente se realizan 3 ejercicios sobre el planteamiento de las pruebas de hiptesis con el propsito de adquirir habilidades en realizar conclusiones a travs de la comparacin para determinar si estas deben ser aprobadas o rechazadas para valorar el grado de significacin en un determinado caso. Luego se realiza un ejercicio tabulado en una prueba de hiptesis para determina la zona de rechazo la cual puede estar ubicada en un solo extremo y determinar con esto el valor total de las colas. Posteriormente se plantean 3 ejercicios para identificar las variables dependientes e independientes antes de realizacin de un ANOVA de cualquiera de las 3 propuestas de estudio Aparece a continuacin el desarrollo de un ANOVA con la prueba de Tukey en un caso donde nos guiamos con lo estudiado en la segunda parte del modulo y el tutorial suministrado, considerando este ejercicio como el resultado del tema tratado. Finalmente se realiza una correlacin condicional de la terminologa mas relevante en la parte de este curso.

TEMA 1- PLANTEAMIENTO DE HIPOTESIS Plantee solamente las hiptesis de los siguientes casos (paso 1 de un contraste):

CASO A DE LAS PETROLERAS CANACOL Y HOCOL Se seleccionan dos muestras de empleados de tamaos respectivamente, se quiere probar si existen diferencias entre los salarios de las petroleras. Hiptesis: Se puede aceptar un nivel de significancia igual al 1.0% Para determinar que no existe diferencia en un numero igual de muestra de empleados entre las dos empresas?

CASO B HORAS LABORADAS En diciembre del 2012 las horas extras promedio laboradas por 40 obreros de una petrolera de la regin fue de 48 horas con una desviacin estndar de 2 horas, mientras que 40 obreros de la misma petrolera en Febrero del 2013 tenan un promedio de horas extras laboradas igual a 47.5 horas con una desviacin de 2.8 horas. El Gerente de Recursos Humanos de la empresa mantiene que el promedio de horas extras laboradas por los obreros de la empresa en el 2012 es ms alto que el promedio de horas extras laboradas por los obreros en el 2013.

Hiptesis: Se puede determinar con el dato de desviacin estndar del ao 2012 comparada con la desviacin estndar del 2013, que el promedio de horas de diciembre de 2012 es mayor? 4

CASO C DESVIACIONES La tasa media de rendimiento de dos tipos de acciones es 40% y 45%, con desviaciones de 6 y 3. Al seleccionar dos muestras respectivamente, Se desea saber si el rendimiento promedio es diferente a un nivel de significancia del 0.10.

Hiptesis: Con los porcentajes de 40 y 45% y la desviacin estndar de 6 y 3, se puede determinar el nivel de significancia?

TEMA 2. NIVEL DE CONFIANZA CASO A ZONA DE RECHAZO La zona de rechazo en una prueba de hiptesis puede estar ubicada a un slo extremo o distribuida en el extremo ya sea inferior o superior. Para el caso de muestras grandes en una prueba unilateral es necesario cargar todo el nivel de significancia alfa a un slo lado, en dicho caso, cul es el valor en las colas si el nivel de confianza es:

Nivel de Confianza 90% 92% 94%

Valor en las Colas 3,49 3,49 3,49

Nivel de confianza de 90% Para este caso el valor de la cola es el de un solo lado = 0,9 + 0,1 = 1,0 1- = 0,90 (Nivel de confianza) Valor de la cola = 0,1 Ahora buscamos en la tabla de distribucin normal el dato equivalente a 1,00 = 3,49 Nivel de confianza de 92% Para este caso el valor de la cola es el de un solo lado = 0,92 + 0,08 = 1,0 6

1- = 0,92 (Nivel de confianza) Valor de la cola = 0,08 Ahora buscamos en la tabla de distribucin normal el dato equivalente a 1,00 = 3,49 Nivel de confianza de 94% Para este caso el valor de la cola es el de un solo lado = 0,94 + 0,06 = 1,0 1- = 0,94 (Nivel de confianza) Valor de la cola = 0,06 Ahora buscamos en la tabla de distribucin normal el dato equivalente a 1,00 = 3,49 TEMA 3. VARIABLES Para poder realizar un ANOVA es importante identificar las variables a estudiar. Por tal motivo, en los siguientes casos slo se le pide identificar la variable dependiente e independiente: CASO A CULTIVO DE PLANTAS Un agrnomo aplica a un cultivo de plantas que est dividido en tres parcelas, tres tipos diferentes de abono simple, a saber: nitrogenado, fosfatado y potsico, para establecer con cual crece ms la planta. Respuesta/ Variable dependiente abono (Nitrogenado, fosfatado, y potsico).y la independiente el crecimiento de la planta. CASO B - METALES Para la transmisin de datos se utilizan metales. Se sabe que el oro es muy buen conductor, pero es muy costoso, por tanto un grupo de ingenieros metalrgicos intentan producir una aleacin que tenga un alto poder de conduccin (baudio= 7

unidad de transmisin de datos) a menor costo; para lo cual experimentan con cuatro tipo de aleaciones. Respuesta/ Variable dependiente El Baudio (Tiempo de transmisin de datos)y la independiente los 4 tipos de aleaciones. CASO C INGENIERO Un ingeniero industrial quiere empacar tilapia para comercializar y que pueda conservarse para el consumo humano por varias semanas, para lo cual lleva a cabo cinco procesos diferentes de empacado, entre los cuales est el enlatado. Respuesta/ Variable dependiente es el tiempo de vida de anaquel del paquete de tilapias y la variable independiente es el enlatado y las 4 formas de empacado.

TEMA 4. ANOVA Y PRUEBA DE TUKEY CASO A - ANOVA Estudiantes de odontologa realizan una investigacin para identificar la tcnica ms apropiada para la preparacin incisal (Clic para ver: Qu es la preparacin incisal?). Para ello, comparan los resultados de tres tcnicas diferentes aplicadas a 36 unidades dentales (dientes), la variable dependiente en este caso es la resistencia a la compresin, la cual se mide en mega pascales y la variable independiente (cualitativa) es la tcnica usada. Para identificar si hay diferencias entre las tcnicas debe hacer el ANOVA y la prueba de Tukey para determinar entre que par de tcnicas hay diferencias.

La siguiente es la tabla con los datos recogidos para cada una de las tcnicas usadas:
N 1 2 3 4 5 6 7 8 9 10 11 12 Tecnica A 73,95 50,99 78,18 85,89 75,65 73,15 100,09 73,95 66,03 77,9 91,82 95,4 Tecnica B 148,36 66,01 84,81 55,57 97,66 78,94 60 55,35 66,01 56,72 82,78 56,78 Tecnica C 173,98 183,28 179,01 180,72 193,77 225,53 168,11 163,66 163,84 185,75 212,55 176,41

Desarrollo Anlisis del ANOVA Con base en la tabla anterior

N 1 2 3 4 5 6 7 8 9 10 11 12 Media Varianza n Suma

Tecnica A 73,95 50,99 78,18 85,89 75,65 73,15 100,09 73,95 66,03 77,90 91,82 95,40 78,58 179,51 12 943

Tecnica B 148,36 66,01 84,81 55,57 97,66 78,94 60,00 55,35 66,01 56,72 82,78 56,78 75,75 716,10 12 908,99

Tecnica C 173,98 183,28 179,01 180,72 193,77 225,53 168,11 163,66 163,84 185,75 212,55 176,41 183,88 355,00 12 2206,61

Total

112,74 36 4058,6

Resumen
Analisis de Varianza de un Factor Grupo Tecnica A Tecnica B Tecnica C Cuenta 12 12 12 Suma 943 908,99 2206,61 Promedio 78,58 75,75 183,88 Varianza 179,51 716,10 355,00

Luego mediante la utilizacin del Excel, se procede a elaborar la tabla del Anlisis de Varianza, Ver resultado cuadro siguiente

10

Anlisis de varianza de un factor RESUMEN Grupos Tecnica A Tecnica B Tecnica C Cuenta 12 12 12 Suma 943 908,99 2206,61 Promedio Varianza 78,58333333 179,50933 75,74916667 716,10297 183,8841667 355,0015

ANLISIS DE VARIANZA Origen de las variaciones Suma de cuadrados Grados de libertad Promedio de los cuadrados Entre grupos Dentro de los grupos Total 91157,90491 13756,75185 104914,6568 2 33 35 416,8712682 F Probabilidad Valor crtico para F 3,284917651 45578,95245 109,3358 2,76513E-15

El promedio de los cuadrados dentro de la fila de los grupos, corresponde al cuadrado medio del error, para poder plantear la hiptesis de que no hay diferencias entre las medias, para esto se compara el estadstico F con el valor critico para F F > VCF 109,3358 > 3,2849 Por lo tanto no se puede aceptar que las medias son iguales o sea que la Hiptesis Nula se Rechaza Para identificar si hay diferencias entre las medias, se compara el estadstico F con el valor crtico para F

CASO B PRUEBA DE TUKEY 11

Los datos para la tabla de comparacion multiple Tukey son sacados del ANOVA, el dato del Estadistico Q DE Tukey sale de la tabla anterior, como tenemos 3 tecnicas nos ubicamos en la columna 3 y en la fila nos ubicamos en la 33 porque ese es el dato que nos da en el analisis de varianza, como el dato resultante no esta en la tabla , se procede a realizar una interpolacion para encontrarlo como se muestra a continuacion.

12

INTERPOLACION X1 Y1 X2 Y2 30 3,49 40 3,44 Dato menor conocido en X Dato menor conocido en Y Dato mayor conocido en X Dato mayor conocido en Y

33

Dato base para calculo

3,48

Resultado de la interpolacion

El resultado 3,48, se lleva a la tabla


Comparacion Multiple Tukey Media de tecnica A n de la tecnica A Media de tecnica B n de la tecnica B Media de tecnica C n de la tecnica C Cuadrado medio del error - CME Estadistico Q de Tukey Comparacion del grupo 1 con el 2 Diferencia Absoluta Error estandar de la diferencia Amplitud critica Medias del grupo 1 y 2 son Comparacion del grupo 1 con el 3 Diferencia Absoluta Error estandar de la diferencia Amplitud critica Medias del grupo 1 y 3 son Comparacion del grupo 2 con el 3 Diferencia Absoluta Error estandar de la diferencia Amplitud critica Medias del grupo 2 y 3 son 108,14 105,30 2,83 78,58 12 75,75 12 183,88 12 416,8712682 3,48

13

TEMA 5. CUADRO CASO A CUADRO RELACIONAL Segn la caracterstica que aparece en la primera columna, indique en la otra, el elemento que cumple con esa condicin (ver ejemplo): Caracterstica Ejemplo: Al hacer una prueba de hiptesis para la media, elemento que se calcula restndole uno (1) al tamao de la muestra En un experimento de conductividad con tres tipos de metales: Modelo de prueba no paramtrico que quiere probar el grado de ajuste del tipo de metal a una distribucin uniforme. La prueba de hiptesis sobre la diferencia de dos muestras relacionadas en la estadstica No paramtrica, es aplicada en Prueba Wilcoxon de Suma de Rangos de Prueba
cuadrado)

Elemento Grados de Libertad

de

Bondad

de

Ajuste(Chi-

14

forma adecuada a travs de la prueba Prueba no paramtrica que requiere de Prueba de Signo una muestra de pareja de valores, por ejemplo, antes de una dieta y despus de la dieta, para realizar las restas de cada par de valores, asignndoles un signo (+) o (-) dependiendo de si la resta es positiva o negativa.

CONCLUSIONES 15

Con cada uno de los temas tratados en la realizacin de este trabajo se clarifican conceptos que anteriormente se presentaban un poco difusos como es el del Planteamiento de una Hiptesis, con el que se pueden realizar estudios de comportamiento de variables en varias situaciones, esto se complementa con el anlisis para determinar si estos planteamientos son aceptados o rechazados con las diferentes pruebas contempladas en este estudio. El desarrollo del anlisis de varianza ANOVA, prueba la interpretacin de estas hiptesis partiendo de la informacin inicial o sea que los resultados consecuentes son la respuesta al objetivo planteado siendo reafirmado con la prueba de Tukey que compara las medias de este tratamiento en la evaluacin de las mismas.

BIBLIOGRAFIA 16

Rondn Danis Brito, Jorge (2012) Curso de Inferencia estadstica, Universidad Nacional Abierta y a Distancia UNAD

http://www.youtube.com/watch?v=8sMzWVGiBQ4

17

You might also like