You are on page 1of 31

Universidad Nacional de Cajamarca

Facultad de Ingeniera
Escuela Acadmico Profesional de Ingeniera Civil

CURSO

ESTADSTICA APLICADA

TEMAS

ESTIMACIN DE PARMETROS PUEBAS DE HIPOTESIS ANALISIS DE VARIANZA (ANOVA) Mg. MACETAS HERNNDEZ, Miguel ngel

PROFESOR

ALUMNOS

PAREDES GARRIDO, Deener Olavi BUENO HERRERA, Pablo Enrique

CICLO GRUPO

: :

III B

Cajamarca, Julio del 2013

UNIVERSIDAD NACIONAL DE CAJAMARCA FACULTAD DE INGENIERA ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

I.

INTRODUCCIN. Al realizar una investigacin estadstica a menudo se sabe o se supone que la poblacin definida por una variable aleatoria x (discreta o continua), de la cual se selecciona una muestra aleatoria, tiene una forma funcional especfica f(x) cuyos parmetros se intenta determinar. Si el parmetro desconocido que queremos determinares denotado por , entonces, la distribucin de la poblacin de x ser denotada por f(x, ). Los mtodos de inferencia estadstica, bsicamente consisten n seleccionar una muestra aleatoria de la poblacin en estudio, y con la informacin que se obtenga de esta llegar a: a) Estimar el valor o los posibles valores del parmetro desconocido. b) Tomar la decisin de aceptar o rechazar una afirmacin hecha sobre el valor o los posibles valores del parmetro desconocido. El primero de estos dos procedimientos se denomina estimacin de parmetros. El segundo mtodo se conoce como prueba de hiptesis del parmetro. El mtodo de estimacin de un parmetro puede ser puntual o por intervalo. En el primer caso, la estimacin del parmetro es un nmero. Mientras que en el segundo caso la estimacin del parmetro es un intervalo de los posibles valores que puede tener.

II.

OBJETIVOS. 1. Estimar los valores de los parmetros de resistencia a la compresin simple de los ensayos realizados. 2. Realizar la estimacin de parmetros para las distribuciones ms importantes de variables aleatorias continuas.

III.

MARCO TERICO. En inferencia estadstica se llama estimacin al conjunto de tcnicas que permiten dar un valor aproximado de un parmetro de una poblacin a partir de los datos proporcionados por una muestra. Por ejemplo, una estimacin de la media de una determinada caracterstica de una poblacin de tamao N podra ser la media de esa misma caracterstica para una muestra de tamao n.1 La estimacin se divide en tres grandes bloques, cada uno de los cuales tiene distintos mtodos que se usan en funcin de las caractersticas y propsitos del estudio:

UNIVERSIDAD NACIONAL DE CAJAMARCA FACULTAD DE INGENIERA ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

Estimacin puntual:

Mtodo de los momentos; Mtodo de la mxima verosimilitud; Mtodo de los mnimos cuadrados;

Estimacin por intervalos. Estimacin bayesiana.

Estimador Estimacin puntual Consiste en la estimacin del valor del parmetro mediante un slo valor, obtenido de una frmula determinada. Por ejemplo, si se pretende estimar la talla media de un determinado grupo de individuos, puede extraerse una muestra y ofrecer como estimacin puntual la talla media de los individuos. Lo ms importante de un estimador, es que sea un estimador eficiente. Es decir, que sea insesgado (ausencia de sesgos) y estable en el muestreo o eficiente (varianza mnima) Estimacin puntual Sea X una variable poblacional con distribucin F , siendo desconocido. El problema de estimacin puntual consiste en, seleccionada una muestra X1, ..., Xn, encontrar el estadstico T(X1, ..., Xn) que mejor estime el parmetro . Una vez observada o realizada la muestra, con valores x1, ..., xn, se obtiene la estimacin puntual de , T(x1, ..., xn) = . Vemos a continuacin dos mtodos para obtener la estimacin puntual de un parmetro: mtodo de los momentos y mtodo de mxima verosimilitud. Mtodo de los momentos: consiste en igualar momentos poblacionales a momentos muestrales. Deberemos tener tantas igualdades como parmetros a estimar. Momento poblacional de orden r r = E(Xr ) Momento muestral de orden r ar = Xn i=1 Xr i n Mtodo de mxima verosimilitud: consiste en tomar como valor del parmetro aquel que maximice la probabilidad de que ocurra la muestra observada. Si X1, ..., Xn es una muestra seleccionada de una poblacin con distribucin F o densidad f(x), la probabilidad de que ocurra una realizacin x1, ..., xn viene dada por: L(x1, ..., xn) = Yn i=1 f(xi ) A L(x1, ..., xn) se le llama funcin de verosimilitud.(credibilidad de la muestra observada). Buscamos entonces el valor de que maximice la funcin de verosimilud, y al valor obtenido se le llama estimacin por mxima verosimilitud de . Nota: si la variable X es discreta, en lugar de f(xi ) consideramos la funcin masa de probabilidad p(xi ). Ejemplo 7.1: Sea X N(, ), con desconocido. Seleccionada una m.a.s. X1, ..., Xn, con realizacin x1, ..., xn, estimamos el parmetro por ambos mtodos. Segn el mtodo de los momentos: E(X) = Xn

UNIVERSIDAD NACIONAL DE CAJAMARCA FACULTAD DE INGENIERA ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

i=1 Xi n = X, y al ser = E(X) se obtiene que = x. Por el mtodo de mxima verosimilitud: L(x1, ..., xn) = Yn i=1 f(xi ) = = Yn i=1 1 2 e (xi) 2 2 Estimacin por Intervalos de conanza 109 y maximizamos en tal funcin; en este caso resulta ms fcil maximizar su logaritmo: lnL(x1, ..., xn) = 1 2 2 Xn i=1 (xi ) 2 n ln( 2) lnL(x1, ..., xn) = 1 2 Xn i=1 (xi ) = n x n 2 = 0 = Estimacin por intervalos Consiste en la obtencin de un intervalo dentro del cual estar el valor del parmetro estimado con una cierta probabilidad. En la estimacin por intervalos se usan los siguientes conceptos: Intervalo de confianza El intervalo de confianza es una expresin del tipo [1, 2] 1 2, donde es el parmetro a estimar. Este intervalo contiene al parmetro estimado con una determinada certeza o nivel de confianza. Pero a veces puede cambiar este intervalo cuando la muestra no garantiza un axioma o un equivalente circunstancial. Variabilidad del Parmetro Si no se conoce, puede obtenerse una aproximacin en los datos aportados por la literatura cientfica o en un estudio piloto. Tambin hay mtodos para calcular el tamao de la muestra que prescinde de este aspecto. Habitualmente se usa como medida de esta variabilidad la desviacin tpica poblacional y se denota . Error de la estimacin Es una medida de su precisin que se corresponde con la amplitud del intervalo de confianza. Cuanta ms precisin se desee en la estimacin de un parmetro, ms estrecho deber ser el intervalo de confianza y, si se quiere mantener o disminuir el error, ms ocurrencias debern incluirse en la muestra estudiada. En caso de no incluir nuevas observaciones para la muestra, ms error se comete al aumentar la precisin. Se suele llamar E, segn la frmula E = 2 - 1. Lmite de Confianza Es la probabilidad de que el verdadero valor del parmetro estimado en la poblacin se site en el intervalo de confianza obtenido. El nivel de confianza se denota por (1-), aunque habitualmente suele expresarse con un porcentaje ((1)100%). Es habitual tomar como nivel de confianza un 95% o un 99%, que se corresponden con valores de 0,05 y 0,01 respectivamente. 3

UNIVERSIDAD NACIONAL DE CAJAMARCA FACULTAD DE INGENIERA ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

Valor Tambin llamado nivel de significacin. Es la probabilidad (en tanto por uno) de fallar en nuestra estimacin, esto es, la diferencia entre la certeza (1) y el nivel de confianza (1-). Por ejemplo, en una estimacin con un nivel de confianza del 95%, el valor es (100-95)/100 = 0,05 Valor crtico Se representa por Z/2. Es el valor de la abscisa en una determinada distribucin que deja a su derecha un rea igual a /2, siendo 1- el nivel de confianza. Normalmente los valores crticos estn tabulados o pueden calcularse en funcin de la distribucin de la poblacin. Por ejemplo, para una distribucin normal, de media 0 y desviacin tpica 1, el valor crtico para = 0,1 se calculara del siguiente modo: se busca en la tabla de la distribucin ese valor (o el ms aproximado), bajo la columna "rea"; se observa que se corresponde con -1,28. Entonces Z/2 = 1,64. Si la media o desviacin tpica de la distribucin normal no coinciden con las de la tabla, se puede realizar el cambio de variable t =(X-)/ para su clculo. Con estas definiciones, si tras la extraccin de una muestra se dice que "3 es una estimacin de la media con un margen de error de 0,6 y un nivel de confianza del 99%", podemos interpretar que el verdadero valor de la media se encuentra entre 2,7 y 3,3, con una probabilidad del 99%. Los valores 2,7 y 3,3 se obtienen restando y sumando, respectivamente, la mitad del error, para obtener el intervalo de confianza segn las definiciones dadas. Para un tamao fijo de la muestra, los conceptos de error y nivel de confianza van relacionados. Si admitimos un error mayor, esto es, aumentamos el tamao del intervalo de confianza, tenemos tambin una mayor probabilidad de xito en nuestra estimacin, es decir, un mayor nivel de confianza. Otros usos del trmino El trmino estimacin tambin se utiliza en ciencias aplicadas para hacer referencia a un clculo aproximado, que normalmente se apoya en la herramienta estadstica aunque puede no hacerlo. En este sentido, un ejemplo clsico son los poco conocidos pero tiles en economa problemas de Fermi.

UNIVERSIDAD NACIONAL DE CAJAMARCA FACULTAD DE INGENIERA ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

PRUEBA DE HIPTESIS Hiptesis estadsticas Un test estadstico es un procedimiento para, a partir de una muestra aleatoria y significativa, extraer conclusiones que permitan aceptar o rechazar una hiptesis previamente emitida sobre el valor de un parmetro desconocido de una poblacin. La hiptesis emitida se designa por H0 y se llama hiptesis nula. La hiptesis contraria se designa por H1 y se llama hiptesis alternativa. Contrastes de hiptesis 1. Enunciar la hiptesis nula H0 y la alternativa H1. Bilateral H0=k H0 k Unilateral H0 k H1> k H1 k H1 < k

2. A partir de un nivel de confianza 1 o el de significacin . Determinar: El valor z/2 (bilaterales), o bien z (unilaterales) La zona de aceptacin del parmetro muestral (x o p'). 3. Calcular: x o p', a partir de la muestra. 4. Si el valor del parmetro muestral est dentro de la zona de la aceptacin, se acepta la hiptesis con un nivel de significacin . Si no, se rechaza.

Contraste bilateral Se presenta cuando la hiptesis nula es del tipo H0: = k (o bien H0: p = k) y la hiptesis alternativa, por tanto, es del tipo H1: k(o bien H1: p k).

El nivel de significacin se concentra en dos partes (o colas) simtricas respecto de la media. 5

UNIVERSIDAD NACIONAL DE CAJAMARCA FACULTAD DE INGENIERA ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

La regin de aceptacin en este caso no es ms que el correspondiente intervalo de probabilidad para x o p', es decir:

O bien:

Se sabe que la desviacin tpica de las notas de cierto examen de Matemticas es 2,4. Para una muestra de 36 estudiantes se obtuvo una nota media de 5,6. Sirven estos datos para confirmar la hiptesis de que la nota media del examen fue de 6, con un nivel de confianza del 95%? 1. Enunciamos las hiptesis nula y alternativa: H0 : = 6 La nota media no ha variado. H1 : 6 La nota media ha variado. 2. Zona de aceptacin Para = 0.05, le corresponde un valor crtico: z/2 = 1.96. Determinamos el intervalo de confianza para la media: (6-1,96 0,4 ; 6+1,96 0,4) = (5,22 ; 6,78) 3. Verificacin. Valor obtenido de la media de la muestra: 5,6. 4. Decisin Aceptamos la hiptesis nula H0, con un nivel de significacin del 5%. Contraste unilateral Caso 1 La hiptesis nula es del tipo H0: k (o bien H0: p k). La hiptesis alternativa, por tanto, es del tipo H1: < k (o bien H1: p < k). Valores crticos 1 0.90 0.95 0.99 0.10 0.05 0.01 z 1.28 1.645 2.33

UNIVERSIDAD NACIONAL DE CAJAMARCA FACULTAD DE INGENIERA ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

El nivel de significacin se concentra en una parte o cola. La regin de aceptacin en este caso ser:

O bien:

Un socilogo ha pronosticado, que en una determinada ciudad, el nivel de abstencin en las prximas elecciones ser del 40% como mnimo. Se elige al azar una muestra aleatoria de 200 individuos, con derecho a voto, 75 de los cuales estaran dispuestos a votar. Determinar con un nivel de significacin del 1%, si se puede admitir el pronstico. 1. Enunciamos las hiptesis nula y alternativa: H0 : 0.40 La abstencin ser como mnimo del 40%. H1 : < 0.40 La abstencin ser como mximo del 40%; 2. Zona de aceptacin Para = 0.01, le corresponde un valor crtico: z = 2.33. Determinamos el intervalo de confianza para la media:

3. Verificacin.

UNIVERSIDAD NACIONAL DE CAJAMARCA FACULTAD DE INGENIERA ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

4. Decisin Aceptamos la hiptesis nula H0. Podemos afirmar, con un nivel de significacin del 1%, que la abstencin ser como mnimo del 40%. Caso 2 La hiptesis nula es del tipo H0: k (o bien H0: p k). La hiptesis alternativa, por tanto, es del tipo H1: > k (o bien H1: p > k).

El nivel de significacin se concentra en la otra parte o cola. La regin de aceptacin en este caso ser:

O bien:

Un informe indica que el precio medio del billete de avin entre Canarias y Madrid es, como mximo, de 120 con una desviacin tpica de 40 . Se toma una muestra de 100 viajeros y se obtiene que la media de los precios de sus billetes es de 128 . Se puede aceptar, con un nivel de significacin igual a 0,1, la afirmacin de partida?

UNIVERSIDAD NACIONAL DE CAJAMARCA FACULTAD DE INGENIERA ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

1. Enunciamos las hiptesis nula y alternativa: H0 : 120 H1 : > 120 2. Zona de aceptacin Para = 0.1, le corresponde un valor crtico: z = 1.28. Determinamos el intervalo de confianza:

3. Verificacin. Valor obtenido de la media de la muestra: 128 . 4. Decisin. No aceptamos la hiptesis nula H0. Con un nivel de significacin del 10%. Errores de tipo I y tipo II Error de tipo I. Se comete cuando la hiptesis nula es verdadera y, como consecuencia del contraste, se rechaza. Error de tipo II. Se comete cuando la hiptesis nula es falsa y, como consecuencia del contraste se acepta. La probabilidad de cometer Error de tipo I es el nivel de significacin . La probabilidad de cometer Error de tipo II depende del verdadero valor del parmetro. Se hace tanto menor cuanto mayor sea n.

ANLISIS DE LA VARIANZA (ANOVA) 1. Introduccin El anlisis de la varianza (o Anova: Analysis of variance) es un mtodo para comparar dos o ms medias, que es necesario porque cuando se quiere comparar ms de dos medias es incorrecto utilizar repetidamente el contraste basado en la t de Student. Por dos motivos: En Primer lugar, y como se realizaran simultnea e independientemente varios contrastes de hiptesis, la probabilidad de encontrar alguno significativo por azar aumentara. En cada contraste se rechaza la H0 si la t supera el nivel crtico, para lo que, en la hiptesis nula, hay una probabilidad . Si se realizan m contrastes independientes, la probabilidad de que, en la hiptesis nula, ningn estadstico supere el valor crtico es (1 - ) m, por lo tanto, la probabilidad de que alguno lo supere es 1 - (1 - ) m, que para valores de prximos a 0 es aproximadamente igual a m. Una primera solucin, denominada mtodo de Bonferroni, consiste en

UNIVERSIDAD NACIONAL DE CAJAMARCA FACULTAD DE INGENIERA ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

bajar el valor de , usando en su lugar /m, aunque resulta un mtodo muy conservador.

Por otro lado, en cada comparacin la hiptesis nula es que las dos muestras provienen de la misma poblacin, por lo tanto, cuando se hayan realizado todas las comparaciones, la hiptesis nula es que todas las muestras provienen de la m H0 Verdadera Falsa i s Decisn m correcta Decisin incorrecta: a Aceptar Probabilidad = ERROR DE TIPO II p 1 o b l a c Rechazar i n ERROR DE TIPO I Decisin correcta Probabilidad =

y, sin embargo, para cada comparacin, la estimacin de la varianza necesaria para el contraste es distinta, pues se ha hecho en base a muestras distintas.

El mtodo que resuelve ambos problemas es el anova, aunque es algo ms que esto: es un mtodo que permite comparar varias medias en diversas situaciones; muy ligado, por tanto, al diseo de experimentos y, de alguna manera, es la base del anlisis multivariante. 2. Bases del anlisis de la varianza Supnganse k muestras aleatorias independientes, de tamao n, extradas de una nica poblacin normal. A partir de ellas existen dos maneras independientes de estimar la varianza de la poblacin 2: 1) Una llamada varianza dentro de los grupos (ya que slo contribuye a ella la varianza dentro de las muestras), o varianza de error, o cuadrados medios del error, y habitualmente representada por MSE (Mean Square Error) o MSW (Mean Square Within) que se calcula como la media de las k varianzas muestrales (cada varianza muestral es un estimador centrado de2 y la media de k estimadores centrados es tambin un estimador centrado y ms eficiente que todos ellos). MSE es un cociente: al numerador se le llama suma de 10

UNIVERSIDAD NACIONAL DE CAJAMARCA FACULTAD DE INGENIERA ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

cuadrados del error y se representa por SSE y al denominador grados de libertad por ser los trminos independientes de la suma de cuadrados.

2) Otra llamada varianza entre grupos (slo contribuye a ella la varianza entre las distintas muestras), o varianza de los tratamientos, o cuadrados medios de los tratamientos y representada por MSA o MSB (Mean Square Between). Se calcula a partir de la varianza de las medias muestrales y es tambin un cociente; al numerador se le llama suma de cuadrados de los tratamientos (se le representa por SSA) y al denominador (k-1) grados de libertad. MSA y MSE, estiman la varianza poblacional en la hiptesis de que las k muestras provengan de la misma poblacin. La distribucin muestral del cociente de dos estimaciones independientes de la varianza de una poblacin normal es una F con los grados de libertad correspondientes al numerador y denominador respectivamente, por lo tanto se puede contrastar dicha hiptesis usando esa distribucin. Si en base a este contraste se rechaza la hiptesis de que MSE y MSA estimen la misma varianza, se puede rechazar la hiptesis de que las k medias provengan de una misma poblacin. Aceptando que las muestras provengan de poblaciones con la misma varianza, este rechazo implica que las medias poblacionales son distintas, de modo que con un nico contraste se contrasta la igualdad de k medias. Existe una tercera manera de estimar la varianza de la poblacin, aunque no es independiente de las anteriores. Si se consideran las kn observaciones como una nica muestra, su varianza muestral tambin es un estimador centrado de s 2: Se suele representar por MST, se le denomina varianza total o cuadrados medios totales, es tambin un cociente y al numerador se le llama suma de cuadrados total y se representa por SST, y el denominador (kn -1) grados de libertad. Los resultados de un anova se suelen representar en una tabla como la siguiente: Fuente de variacin G.L. Entre grupos k-1 Tratamientos Dentro Error Total (n-1)k SS SSA MS SSA/(k-1) F MSA/MSE

SSE

SSE/k(n-1)

kn-1

SST

Y el cociente F se usa para realizar el contraste de la hiptesis de medias iguales. La regin crtica para dicho contraste es F > F(k-1,(n-1)k). 11

UNIVERSIDAD NACIONAL DE CAJAMARCA FACULTAD DE INGENIERA ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

Algunas propiedades Es fcil ver en la tabla anterior que GLerror+ GLtrata = (n - 1) k + k - 1 = nk - k + k - 1 = nk - 1 = GLtotal No es tan inmediato, pero las sumas de cuadrados cumplen la misma propiedad, llamada identidad o propiedad aditiva de la suma de cuadrados: SST = SSA + SSE El anlisis de la varianza se puede realizar con tamaos muestrales iguales o distintos, sin embargo es recomendable iguales tamaos por dos motivos: La F es insensible a pequeas variaciones en la asuncin de igual varianza, si el tamao es igual. Igual tamao minimiza la probabilidad de error tipo II. 3. Modelos de anlisis de la varianza El anova permite distinguir dos modelos para la hiptesis alternativa: Modelo I o de efectos fijos en el que la H1 supone que las k muestras son muestras de k poblaciones distintas y fijas. Modelo II o de efectos aleatorios en el que se supone que las k muestras, se han seleccionado aleatoriamente de un conjunto de m>k poblaciones. Un ejemplo de modelo I de anova es que se asume que existen cinco poblaciones (sin tratamiento, con poca sal, sin sal, etc.) fijas, de las que se han extrado las muestras. Un ejemplo de modelo II sera: un investigador est interesado en determinar el contenido, y sus variaciones, de grasas en las clulas hepticas de cobayas; toma del animalario 5 cobayas al azar y les realiza, a cada una, 3 biopsias hepticas. La manera ms sencilla de distinguir entre ambos modelos es pensar que, si se repitiera el estudio un tiempo despus, en un modelo I las muestras seran iguales (no los individuos que las forman) es decir corresponderan a la misma situacin, mientras que en un modelo II las muestras seran distintas. Aunque las asunciones iniciales y los propsitos de ambos modelos son diferentes, los clculos y las pruebas de significacin son los mismos y slo difieren en la interpretacin y en algunas pruebas de hiptesis suplementarias. Anlisis de la varianza de dos factores. Es un diseo de anova que permite estudiar simultneamente los efectos de dos fuentes de variacin. En cualquier caso, el investigador puede estar interesado en estudiar si hay, o no, diferencia en la evolucin segn el sexo. En un anova de dos vas se clasifica a los 12

UNIVERSIDAD NACIONAL DE CAJAMARCA FACULTAD DE INGENIERA ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

individuos de acuerdo a dos factores (o vas) para estudiar simultneamente sus efectos. En este ejemplo se haran cinco grupos de tratamiento para los hombres y otros cinco para las mujeres, en total diez grupos; en general, si el primer factor tiene a niveles y el segundo tiene b, se tendrn ab muestras o unidades experimentales, cada una con n individuos o repeticiones. Una observacin individual se representa como: El primer subndice indica el nivel del primer factor, el segundo el nivel del segundo factor y el tercero la observacin dentro de la muestra. Los factores pueden ser ambos de efectos fijos (se habla entonces de modelo I), de efectos aleatorios (modelo II) o uno de efectos fijos y el otro de efectos aleatorios (modelo mixto). El modelo matemtico de este anlisis es: Modelo I Modelo II Modelo mixto donde m es la media global, a i o Ai el efecto del nivel i del 11 factor, j o Bj el efecto del nivel j del 2 factor y ijk las desviaciones aleatorias alrededor de las medias, que tambin se asume que estn normalmente distribuidas, son independientes y tienen media 0 y varianza s 2. A las condiciones de muestreo aleatorio, normalidad e independencia, este modelo aade la de aditividad de los efectos de los factores. A los trminos (a b )ij, (AB)ij, (a B)ij, se les denomina interaccin entre ambos factores y representan el hecho de que el efecto de un determinado nivel de un factor sea diferente para cada nivel del otro factor. Para entender mejor este concepto de interaccin veamos un ejemplo sencillo sobre un anova de dos factores, cada uno con dos niveles: supngase un estudio para analizar el efecto de un somnfero teniendo en cuenta el sexo de los sujetos. Se eligen al azar dos grupos de hombres y otros dos de mujeres. A un grupo de hombres y otro de mujeres se les suministra un placebo y a los otros grupos el somnfero. Se mide el efecto por el tiempo que los sujetos tardan en dormirse desde el suministro de la pldora. Se trata de un anova de dos factores (sexo y frmaco) fijos, cada uno con dos niveles (hombre y mujer para el sexo y somnfero y placebo para el frmaco). Los dos tipos de resultados posibles se esquematizan en la figura

13

UNIVERSIDAD NACIONAL DE CAJAMARCA FACULTAD DE INGENIERA ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

AB En la figura A se observa que las mujeres tardan ms en dormirse, tanto en el grupo tratado como en el grupo placebo (hay un efecto del sexo) y que los tratados con placebo tardan ms en dormirse que los tratados con somnfero en ambos sexos (hay un efecto del tratamiento). Ambos efectos son fcilmente observables. Sin embargo en la figura B es difcil cuantificar el efecto del somnfero pues es distinto en ambos sexos y, simtricamente, es difcil cuantificar el efecto del sexo pues es distinto en ambos grupos de tratamiento. En este caso, se dice que existe interaccin. Podra, incluso, darse el caso de que se invirtieran los efectos de un factor para los distintos niveles del otro, es decir, que las mujeres se durmieran antes con el somnfero y los hombres antes con el placebo. La interaccin indica, por tanto, que los efectos de ambos factores no son aditivos: cuando se dan juntos, su efecto no es la suma de los efectos que tienen cuando estn por separado, por lo que, si en un determinado estudio se encuentra interaccin entre dos factores, no tiene sentido estimar los efectos de los factores por separado. A la interaccin positiva, es decir, cuando el efecto de los factores actuando juntos es mayor que la suma de efectos actuando por separado, en Biologa se le denomina sinergia o potenciacin y a la interaccin negativa inhibicin. En el ejemplo de la figura B, se dira que el ser mujer inhibe el efecto del somnfero, o que el ser hombre lo potencia (segn el sexo que se tome como referencia). 4. Contrates de hiptesis en un anlisis de la varianza de dos factores Del mismo modo que se hizo en el anova de una va, para plantear los contrastes de hiptesis habr que calcular los valores esperados de los distintos cuadrados medios. Los resultados son: Modelo I MS MSA Valor esperado

14

UNIVERSIDAD NACIONAL DE CAJAMARCA FACULTAD DE INGENIERA ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

MSB

MSAB

MSE

Por lo tanto, los estadsticos MSAB/MSE, MSA/MSE y MSB/MSE se distribuyen como una F con los grados de libertad correspondientes y permiten contrastar, respectivamente, las hiptesis: No existe interaccin (MSAB/MSE) No existe efecto del primer factor, es decir, diferencias entre niveles del primer factor (MSA/MSE) No existe efecto del segundo factor (MSB/MSE) Si se rechaza la primera hiptesis de no interaccin, no tiene sentido contrastar las siguientes. En este caso lo que est indicado es realizar un anlisis de una va entre las ab combinaciones de tratamientos para encontrar la mejor combinacin de los mismos. IV. ANLISIS DE DATOS.

Para el presente trabajo se tomaron dos ensayos de compresin simple con 500 probetas cada uno, de los cuales se van a hacer las estimacin por intervalos y prueba de hiptesis. El primer ensayo de 500 probetas de concreto sometidos a compresin simple arrojan los siguientes resultados en kilogramos sobre centmetros cuadrado que servirn como base de datos para el anlisis estadstico. Ensayo N1 N 1 2 3 4 Resistenci a (kg/cm2) 293 350 413 318 5 6 7 8 9 356 302 364 305 295 15 10 11 12 13 14 314 401 375 345 346 15 16 17 18 19 364 380 402 352 376

UNIVERSIDAD NACIONAL DE CAJAMARCA FACULTAD DE INGENIERA ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59

317 328 368 305 341 267 381 304 298 340 387 367 344 277 360 260 388 265 341 368 341 335 327 312 322 302 416 340 312 279 311 336 322 363 412 356 408 366 419 411

60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99

262 350 274 371 393 344 310 362 410 352 359 327 399 300 262 322 280 268 267 343 352 260 296 333 362 337 382 366 363 408 289 310 282 360 363 342 273 327 262 329 16

100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139

340 317 405 368 402 299 381 345 377 261 298 262 302 339 303 338 319 316 367 302 410 395 390 266 277 336 343 363 373 386 336 398 353 295 293 289 352 262 292 295

140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179

361 377 322 407 382 268 419 384 373 376 279 299 273 314 302 349 278 379 267 351 392 401 401 360 288 363 413 379 418 414 283 326 398 364 280 381 405 336 341 265

UNIVERSIDAD NACIONAL DE CAJAMARCA FACULTAD DE INGENIERA ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219

286 265 387 278 350 347 310 337 320 329 342 292 413 265 298 296 285 327 292 301 341 263 320 327 383 262 383 362 304 302 361 397 317 371 267 410 396 416 274 282

220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259

270 399 362 376 304 366 339 348 420 332 342 334 283 354 399 279 347 322 310 391 376 378 380 380 381 372 305 292 343 337 362 320 356 290 261 403 385 272 393 396 17

260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299

365 303 390 420 386 374 413 301 417 391 368 315 328 269 279 260 277 306 286 385 411 398 344 320 408 269 310 262 345 382 372 410 413 341 390 328 301 342 396 373

300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339

301 276 419 393 265 334 383 359 347 268 311 389 390 274 314 309 310 404 260 335 346 383 280 361 407 386 361 420 339 361 353 283 375 378 315 303 285 348 322 419

UNIVERSIDAD NACIONAL DE CAJAMARCA FACULTAD DE INGENIERA ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379

369 341 274 405 393 261 351 345 347 398 349 376 419 277 292 307 355 379 303 397 414 411 291 347 327 404 263 413 357 396 359 377 310 417 417 330 358 358 262 268

380 381 382 383 384 385 386 387 388 389 390 391 392 393 394 395 396 397 398 399 400 401 402 403 404 405 406 407 408 409 410 411 412 413 414 415 416 417 418 419

372 294 290 316 304 404 354 294 412 397 395 367 368 351 262 290 386 337 393 385 293 408 275 344 399 399 334 414 356 303 332 365 282 269 269 373 399 314 404 265 18

420 421 422 423 424 425 426 427 428 429 430 431 432 433 434 435 436 437 438 439 440 441 442 443 444 445 446 447 448 449 450 451 452 453 454 455 456 457 458 459

385 269 318 268 288 294 375 277 418 311 356 286 411 261 355 260 293 414 412 321 346 340 277 300 261 314 380 332 335 385 347 397 344 380 282 387 314 317 285 286

460 461 462 463 464 465 466 467 468 469 470 471 472 473 474 475 476 477 478 479 480 481 482 483 484 485 486 487 488 489 490 491 492 493 494 495 496 497 498 499

267 287 316 408 397 311 305 338 310 382 319 404 279 417 398 388 275 321 312 339 347 317 319 415 323 330 357 360 326 369 359 407 341 296 343 354 383 265 356 408

UNIVERSIDAD NACIONAL DE CAJAMARCA FACULTAD DE INGENIERA ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

500

343

De los cuales se calcularon todos sus parmetros haciendo uso del anlisis de datos de la ficha anlisis de Excel obteniendo los siguientes resultados. Resistencia (kg/cm2) Media Error tpico Mediana Moda Desviacin estndar Varianza de la muestra Curtosis Coeficiente de asimetra Rango Mnimo Mximo Suma Cuenta Nivel de confianza(95.0%) 340.598 2.08795208 343 262 46.6880278 2179.77194 -1.14017176 -0.06587546 160 260 420 170299 500 4.10226081

1) Estimacin por intervalos de la media muestral.

Queremos estimar la media de la resistencia a compresin de 47 valores elegidos aleatoriamente del ensayo 1 obteniendo los siguientes estimadores con un 95% de confianza. a) Primer caso: Se conoce la varianza de la poblacin La muestra es normal y presenta ms de 30 datos Modelo probabilstico Z [

19

UNIVERSIDAD NACIONAL DE CAJAMARCA FACULTAD DE INGENIERA ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

muestra aleatoria 1er 388 ensayo 265 345 341 346 368 364 341 380 335 402 327 352 312 376 322 317 302 328 416 368 340 305 312 341 279 267 311 381 336 304 322 298 363 340 412 387 356 367 408 344 366 277 419 360 411 260 De los cuales se calcularon todos sus estimadores haciendo uso del anlisis de datos de la ficha anlisis de Excel obteniendo los siguientes resultados muestra aleatoria 1 del 1er ensayo Media Error tpico Mediana Moda Desviacin estndar Varianza de la muestra Curtosis Coeficiente de asimetra Rango Mnimo 20 343.851064 6.03619814 341 341 41.3820896 1712.47734 -0.50257375 -0.09487379 159 260

UNIVERSIDAD NACIONAL DE CAJAMARCA FACULTAD DE INGENIERA ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

Mximo Suma Cuenta Nivel de confianza(95.0%)

419 16161 47 12.1502367

Usaremos el modelo probabilstico distribucin normal de Excel. [

y la tabla de distribucin normal o la funcin

El error estndar est dado por:

Para Entonces

= 95 % entonces Z=1.96

b) Segundo caso Se desconoce la varianza de la poblacin La muestra es normal y presenta menos de 30 datos Modelo probabilstico T
( )

n-1 : Grados de libertad error estndar

nivel de confianza del 95 % 21

UNIVERSIDAD NACIONAL DE CAJAMARCA FACULTAD DE INGENIERA ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

Para este caso elegimos una muestra 2 con menos de 30 datos del primer ensayo de compresin simple 311 336 322 363 412 356 408 366 419 411 262 350 274 De los cuales se calcularon todos sus estimadores haciendo uso del anlisis de datos de la ficha anlisis de Excel obteniendo los siguientes resultados muestra aleatoria 2 del 1er ensayo Media Error tpico Mediana Moda Desviacin estndar Varianza de la muestra Curtosis Coeficiente de asimetra Rango Mnimo Mximo Suma Cuenta Nivel de confianza(95.0%) 343.5 9.30462718 338 312 45.5831777 2077.82609 -0.6583078 0.20298114 157 262 419 8244 24 19.2480878 muestra aleatoria 1er ensayo 368 341 335 327 312 322 302 416 340 312 279

22

UNIVERSIDAD NACIONAL DE CAJAMARCA FACULTAD DE INGENIERA ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

Usaremos el modelo probabilstico correspondiente de Excel. [

y la tabla de distribucin T o la funcin

El error estndar est dado por:

Para

= 95 % entonces
( ) ( )

Entonces

2) Estimacin por intervalos de la varianza [ (


(

)
)

(
(

)
)

: modelo probabilstico chi cuadrado, se obtiene por tabla o usando la funcin de Excel. Nivel de confianza de 95%

Para estimar a la varianza usaremos la muestra aleatoria 1 del 1er ensayo muestra aleatoria 1 del 1er ensayo Media Error tpico Mediana 23 343.851064 6.03619814 341

UNIVERSIDAD NACIONAL DE CAJAMARCA FACULTAD DE INGENIERA ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

Moda Desviacin estndar Varianza de la muestra Curtosis Coeficiente de asimetra Rango Mnimo Mximo Suma Cuenta Nivel de confianza(95.0%) (
(

341 41.3820896 1712.47734 -0.50257375 -0.09487379 159 260 419 16161 47 12.1502367 ( )
( )

)
)

Entonces (
(

)
)

(
(

)
)

3) Estimacin por intervalos de razn de dos varianzas

: modelo probabilstico f de Fischer , se obtiene por tabla o usando la funcin de Excel. Nivel de confianza de 95%

24

UNIVERSIDAD NACIONAL DE CAJAMARCA FACULTAD DE INGENIERA ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

Para estimar a la varianza usaremos la muestra aleatoria 1 del 1er ensayo y la muestra aleatoria del 2do ensayo, del segundo ensayo elegimos una muestra aleatoria. muestra aleatoria 1 del 1er ensayo Media Error tpico Mediana Moda Desviacin estndar Varianza de la muestra Curtosis Coeficiente de asimetra Rango Mnimo Mximo Suma Cuenta Nivel de confianza(95.0%) 343.851064 6.03619814 341 341 41.3820896 1712.47734 -0.50257375 -0.09487379 159 260 419 16161 47 12.1502367

muestra eleatoria 2do ensayo Media Error tpico Mediana Moda Desviacin estndar Varianza de la muestra Curtosis Coeficiente de asimetra Rango Mnimo Mximo Suma Cuenta Nivel de confianza(95.0%) 25 326.386364 6.79783698 318.5 275 45.0917493 2033.26586 -0.66462695 0.3497703 158 251 409 14361 44 13.7091448

UNIVERSIDAD NACIONAL DE CAJAMARCA FACULTAD DE INGENIERA ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

Entonces

4) Estimacin por intervalos para la diferencia de medias.

Queremos estimar la diferencia de medias de la resistencia a compresin de las dos muestras aleatorias del ensayo 1 y 2 obteniendo los siguientes estimadores con un 95% de confianza.

muestra aleatoria 1 del 1er ensayo Media Error tpico Mediana Moda Desviacin estndar Varianza de la muestra Curtosis Coeficiente de asimetra Rango 343.851064 6.03619814 341 341 41.3820896 1712.47734 -0.50257375 -0.09487379 159 26

Mnimo Mximo Suma Cuenta Nivel de confianza(95.0%)

260 419 16161 47 12.1502367

muestra eleatoria 2do ensayo Media Error tpico 326.386364 6.79783698

UNIVERSIDAD NACIONAL DE CAJAMARCA FACULTAD DE INGENIERA ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

Mediana Moda Desviacin estndar Varianza de la muestra Curtosis Coeficiente de asimetra [(

318.5 275 45.0917493 2033.26586 -0.66462695 0.3497703

Rango Mnimo Mximo Suma Cuenta Nivel de confianza(95.0%)

158 251 409 14361 44 13.7091448

Se conoce la varianza de las muestras La muestra es normal y presenta ms de 30 datos Modelo probabilstico Z )

para 95% de confianza es 1.96


( (

PRUEBAS DE HIPOTESIS Con la media: o La constructora asegura que la resistencia media de las primeras 500 probetas de concreto no baja de para lo cual se hizo la siguiente prueba de hiptesis con un 5% de significancia. Entonces:

27

UNIVERSIDAD NACIONAL DE CAJAMARCA FACULTAD DE INGENIERA ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

Para

= 95 % entonces Z=1.96

Entonces

Como la estimacin de media de la poblacin est dentro de la regin de aceptacin aceptamos la hiptesis y decimos que la resistencia media de las 500 probetas de concreto no baja de Con la varianza. o La constructora asegura que la resistencia media de las primeras 500 probetas de concreto no presentan una varianza mayor a 2700 para lo cual se hizo la siguiente prueba de hiptesis con un 5% de significancia.

Entonces:

(
(

)
)

Para

= 95 % entonces Z=1.96

Como la estimacin de la varianza de la poblacin no est dentro de la regin de aceptacin si no en la regin crtica rechazamos la hiptesis y decimos que la resistencia media de las 500 probetas no presenta una dispersin menor a 2700 sino a 2701.427

28

UNIVERSIDAD NACIONAL DE CAJAMARCA FACULTAD DE INGENIERA ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

V.

CONCLUSIONES.

29

UNIVERSIDAD NACIONAL DE CAJAMARCA FACULTAD DE INGENIERA ESCUELA ACADMICO PROFESIONAL DE INGENIERA CIVIL

VI.

BIBLIOGRAFA. Manuel Crdova Zamora. Estadstica Aplicada. Primera edicin. Manual de Excel. Tecnologa de los Materiales. Estadstica aplicada a los negocios y la economa.

30

You might also like