Professional Documents
Culture Documents
Distribuciones Mustrales En estudios pasados de Estadsticas centramos nuestra atencin en tcnicas que describen los datos, tales como organizar datos en distribuciones de frecuencias y calcular diferentes promedios y medidas de variabilidad. Estbamos concentrados en describir algo que ya ocurri. Tambin comenzamos a establecer los fundamentos de la estadstica inferencial, con el estudio de los conceptos bsicos de la probabilidad, las distribuciones de probabilidad discretas y continuas. Distribuciones que son principalmente generadas para evaluar algo que podra ocurrir. Ahora veremos otro tipo de distribucin de probabilidad, que se llaman distribuciones mustrales. Por qu muestrear? Muestrear es una forma de evaluar la calidad de un producto, la opinin de los consumidores, la eficacia de un medicamento o de un tratamiento. Muestra es una parte de la poblacin. Poblacin es el total de resultados de un experimento. Hacer una conclusin sobre el grupo entero (poblacin) basados en informacin estadstica obtenida de un pequeo grupo (muestra) es hacer una inferencia estadstica. A menudo no es factible estudiar la poblacin entera. Algunas de las razones por lo que es necesario muestrear son: 1. La naturaleza destructiva de algunas pruebas 2. La imposibilidad fsica de checar todos los elementos de la poblacin. 3. El costo de estudiar a toda la poblacin es muy alto. 4. El resultado de la muestra es muy similar al resultado de la poblacin. 5. El tiempo para contactar a toda la poblacin es inviable. Distribucin Muestral de las Medias El ejemplo de los ratings de eficiencia muestra como las medias de muestras de un tamao especfico varan de muestra a muestra. La media de la primera muestra fue 101 y la media de la segunda fue 99.5. En una tercera muestra probablemente resultara una media diferente. Si organizamos las medias de todas las posibles muestras de tamao 2 en una distribucin de probabilidad, obtendremos la distribucin muestral de las medias. Distribucin muestral de las medias. Es una distribucin de probabilidad de todas las posibles medias muestrales, de un tamao de muestra dado, seleccionadas de una poblacin.
El grfico que se obtiene muestra la forma acampanada de las dos curvas gaussianas. Al modificar la media se traslada horizontalmente el eje de la curva y el cambio en la desviacin tpica provoca una dilatacin o una contraccin de la misma.
muestrales es normal con el valor esperado y la varianza dados anteriormente, es decir, de acuerdo con lo anterior la siguiente variable aleatoria tiene una distribucin normal estndar: Por lo tanto, con base en la expresin anterior se pueden realizar inferencias con respecto a la diferencia de medias poblacionales, bajo el supuesto de que las varianzas sean conocidas. Si adems, son iguales, la expresin anterior se puede expresar como: b) Distribucin de la diferencia entre dos medias cuando las varianzas son desconocidas pero iguales ( = = ) Cuando las varianzas son desconocidas, se debe realizar previamente una prueba estadstica para verificar si stas son iguales o diferentes. Para realizar esta prueba debemos hacer uso de la distribucin F para verificar si la relacin de varianzas es igual a uno o diferente de uno. Para cada una de las dos muestras se definen sus respectivas varianzas como: Adems tienen distribuciones chi cuadrado con n11 y n21 grados de libertad respectivamente. Por lo tanto su suma tambin sigue otra distribucin chi cuadrado con n1+n22 grados de libertad. Es decir: Ahora bien, si Z es una variable normal (0,1) y Y tiene una distribucin chi cuadrado con n grados de libertad, entonces la variable tiene una distribucin t con n grados de libertad. Para nuestro caso la variable Z corresponde a la distribucin de la diferencia de las dos medias, con varianzas conocidas, y la variable chi cuadrado corresponde a la variable Y acabada de definir. Por lo tanto donde es un estimador ponderado de la varianza poblacional s obtenida ponderando las varianzas poblacionales por sus respectivos grados de libertad. c) Distribucin de la diferencia entre dos medias cuando las varianzas son desconocidas y diferentes ( ) Cuando las varianzas son diferentes se puede demostrar que la siguiente variable aleatoria T sigue una distribucin t con n grados de libertad, donde y el nmero de grados de libertad n est dado por: Ejemplo. El gerente de una refinera piensa modificar el proceso para producir gasolina a partir de petrleo crudo. El gerente har la modificacin slo si la gasolina promedio que se obtiene por este nuevo proceso (expresada como un
porcentaje del crudo) aumenta su valor con respecto al proceso en uso. Con base en un experimento de laboratorio y mediante el empleo de dos muestras aleatorias de tamao 12, una para cada proceso, la cantidad de gasolina promedio del proceso en uso es de 24.6 con una desviacin estndar de 2.3, y para el proceso propuesto fue de 28.2 con una desviacin estndar de 2.7. El gerente piensa que los resultados proporcionados por los dos procesos son variables aleatorias independientes normalmente distribuidas con varianzas iguales. Con base en esta evidencia, debe adoptarse el nuevo proceso?