You are on page 1of 7

Distribuciones Mustrales Introduccin

Distribuciones Mustrales En estudios pasados de Estadsticas centramos nuestra atencin en tcnicas que describen los datos, tales como organizar datos en distribuciones de frecuencias y calcular diferentes promedios y medidas de variabilidad. Estbamos concentrados en describir algo que ya ocurri. Tambin comenzamos a establecer los fundamentos de la estadstica inferencial, con el estudio de los conceptos bsicos de la probabilidad, las distribuciones de probabilidad discretas y continuas. Distribuciones que son principalmente generadas para evaluar algo que podra ocurrir. Ahora veremos otro tipo de distribucin de probabilidad, que se llaman distribuciones mustrales. Por qu muestrear? Muestrear es una forma de evaluar la calidad de un producto, la opinin de los consumidores, la eficacia de un medicamento o de un tratamiento. Muestra es una parte de la poblacin. Poblacin es el total de resultados de un experimento. Hacer una conclusin sobre el grupo entero (poblacin) basados en informacin estadstica obtenida de un pequeo grupo (muestra) es hacer una inferencia estadstica. A menudo no es factible estudiar la poblacin entera. Algunas de las razones por lo que es necesario muestrear son: 1. La naturaleza destructiva de algunas pruebas 2. La imposibilidad fsica de checar todos los elementos de la poblacin. 3. El costo de estudiar a toda la poblacin es muy alto. 4. El resultado de la muestra es muy similar al resultado de la poblacin. 5. El tiempo para contactar a toda la poblacin es inviable. Distribucin Muestral de las Medias El ejemplo de los ratings de eficiencia muestra como las medias de muestras de un tamao especfico varan de muestra a muestra. La media de la primera muestra fue 101 y la media de la segunda fue 99.5. En una tercera muestra probablemente resultara una media diferente. Si organizamos las medias de todas las posibles muestras de tamao 2 en una distribucin de probabilidad, obtendremos la distribucin muestral de las medias. Distribucin muestral de las medias. Es una distribucin de probabilidad de todas las posibles medias muestrales, de un tamao de muestra dado, seleccionadas de una poblacin.

Distribucin Muestral De Media Varianza Conocida


Si recordamos a la distribucin normal, esta es una distribucin continua, en forma de campana en donde la media, la mediana y la moda tienen un mismo valor y es simtrica. Con esta distribucin podamos calcular la probabilidad de algn evento relacionado con la variable aleatoria, mediante la siguiente frmula: En donde z es una variable estandarizada con media igual a cero y varianza igual a uno. Con esta frmula se pueden a hacer los clculos de probabilidad para cualquier ejercicio, utilizando la tabla de la distribucin z. Sabemos que cuando se extraen muestras de tamao mayor a 30 o bien de cualquier tamao de una poblacin normal, la distribucin muestral de medias tiene un comportamiento aproximadamente normal, por lo que se puede utilizar la frmula de la distribucin normal con y , entonces la frmula para calcular la probabilidad del comportamiento del estadstico, en este caso la media de la muestra

Teorema Del Limite Central


El Teorema Central del Lmite dice que si tenemos un grupo numeroso de variables independientes y todas ellas siguen el mismo modelo de distribucin (cualquiera que ste sea), la suma de ellas se distribuye segn una distribucin normal. Ejemplo : la variable tirar una moneda al aire sigue la distribucin de Bernouilli. Si lanzamos la moneda al aire 50 veces, la suma de estas 50 variables (cada una independiente entre si) se distribuye segn una distribucin normal. Este teorema se aplica tanto a suma de variables discretas como de variables continuas. Lo anterior constituye uno de los ms importantes teoremas en inferencia estadstica y se conoce como TEOREMA DEL LIMITE CENTRAL. Los parmetros de la distribucin normal son: Media: n * m (media de la variable individual multiplicada por el nmero de variables independientes) Varianza: n * s2 (varianza de la variable individual multiplicada por el nmero de variables individuales).

Distribucin Muestral De Proporcin


DISTRIBUCIONES MUESTRALES. DISTRIBUCIN DE LA PROPORCIN Sea X1, X2,,Xn una muestra aleatoria tomada de una poblacin con una distribucin de Bernoulli con parmetro q. Por lo tanto su funcin de probabilidad, su media y su varianza estn dadas por: E(X) = q, V(X) = q(1 - q) Si P es la proporcin muestral, definida como con: En virtud del Teorema Central del Lmite, como P es la media muestral de los diferentes valores de Xi, entonces P tiende a seguir una distribucin normal con los parmetros dados anteriormente, es decir, P ~ . tambin la variable aleatoria Sigue una distribucin normal estndar con media cero y varianza unitaria, cuando el tamao de la muestra n es grande.

Distribucin Muestral Diferencia De Medias Y De Diferencia De Proporciones


Teorema del lmite central Si se seleccionan muestras aleatorias de n observaciones de una poblacin con media y desviacin estndar, entonces, cuando n es grande, la distribucin muestral de medias tendr aproximadamente una distribucin normal con una media igual a y una desviacin estndar de. La aproximacin ser cada vez ms exacta a medida de que n sea cada vez mayor. En general se tiene: Cuando las muestras se toman de una poblacin pequea y sin reemplazo, se puede usar la formula siguiente para encontrar x .donde es la desviacin estndar de la poblacin de donde se toman las muestras, n es el tamao de la muestra y N el de la poblacin. Como refleja de clculo, si el muestreo se hace sin reemplazo y el tamao de la poblacin es al menos 20 veces el tamao de la muestra (N20), entonces se puede usar la frmula. El factor se denomina factor de correccin para una poblacin finita.

Distribucin Muestral De Media Varianza Desconocida


Distribuciones continuas Distribucin normal La distribucin normal o de Gauss es sin duda la ms importante de cuantas hay, tanto por razones prcticas como tericas. Formalmente, una variable aleatoria es normal de media y varianza , lo que se expresa como , si su funcin de densidad es La funcin de probabilidad acumulada, o funcin de distribucin, tiene la forma la cual slo se puede evaluar numricamente para los diferentes valores de . Como queda indicado, la media y varianza de la variable aleatoria normal son y , respectivamente. Caso 1 Supngase que el cociente intelectual (CI) de nios de educacin elemental, segn la medida de cierto examen, tiene una media de 100 y una desviacin tpica 12. En una clase de 30, cuntos se espera que tengan un CI de 120 o ms? Solucin La proporcin de alumnos con CI mayor que 120 coincide con siendo una variable aleatoria , (%i1) load(distrib)$ (%i2) 1 - disnormal(120,100,12), numer; (%o2) 0.0477903522728147 (%i3) /* el smbolo % se refiere al ltimo resultado */ 30 * %; (%o3) 1.433710568184441 Luego la proporcin de alumnos es 0.0478 y en el grupo de 30 se espera que haya un total de 1.4 alumnos con esta caracterstica. Caso 2 Investguese grficamente cmo vara el modelo normal con el cambio de los parmetros. Solucin (%i3) plot2d(([dennormal(x,0,1),dennormal(x,1,1/3)]),[x,3,3], [gnuplot_preamble, set grid; set size 0.8, 0.8; set terminal png; set out grafico1.png])$

El grfico que se obtiene muestra la forma acampanada de las dos curvas gaussianas. Al modificar la media se traslada horizontalmente el eje de la curva y el cambio en la desviacin tpica provoca una dilatacin o una contraccin de la misma.

Distribucin Muestral Diferencia Medias


DISTRIBUCIONES MUESTRALES DISTRIBUCIN DE LA DIFERENCIA ENTRE DOS MEDIAS Sean X1 y X2 dos variables aleatorias con valores esperados m1 y m2 y varianzas y , respectivamente. Por ejemplo, X1 puede ser la duracin de una batera para carro de una marca, y X2 la duracin de una batera de otra marca diferente. Si los medias m1 y m2 son desconocidas, podramos estar interesados en conocer si ambas bateras tienen la misma duracin media. En forma similar, si las varianzas son desconocidas, podramos estar interesados en saber si son iguales o no. Para realizar estas inferencias, se pueden someter a pruebas idnticas diferentes bateras, controlando los factores externos, de tal forma que las diferencias se deban exclusivamente a la clase de marca probada Inicialmente estaremos interesados en verificar si ambas distribuciones tienen la misma media poblacional, es decir si m1 = m2 equivalentemente m1 - m2 = 0. Suponga que es una muestra aleatoria de tamao n1 tomada de una poblacin con media m1 y varianza , es otra muestra aleatoria de tamao n2 tomada de una poblacin con media m2 y varianza . Si deseamos realizar alguna inferencia sobre m1 - m2, nos podemos basar en la distribucin de la diferencia de las medias muestrales. Por el TCL sabemos que tanto como se distribuyen normalmente con los siguientes parmetros: , Ahora bien, para la diferencia de las medias muestrales se tiene: Para conocer la distribucin muestral de las diferencias entre las medias se debe saber si las varianzas poblacionales son conocidas o desconocidas, y en caso de que sean desconocidas, se debe saber si son iguales o diferentes. Cada uno de estos tres casos se analizar por separado. a) Distribucin de la diferencia entre dos medias cuando las varianzas son conocidas. Si las varianzas y son conocidas, tanto como se distribuyen normalmente. Por lo tanto la distribucin de la diferencia entre las medias

muestrales es normal con el valor esperado y la varianza dados anteriormente, es decir, de acuerdo con lo anterior la siguiente variable aleatoria tiene una distribucin normal estndar: Por lo tanto, con base en la expresin anterior se pueden realizar inferencias con respecto a la diferencia de medias poblacionales, bajo el supuesto de que las varianzas sean conocidas. Si adems, son iguales, la expresin anterior se puede expresar como: b) Distribucin de la diferencia entre dos medias cuando las varianzas son desconocidas pero iguales ( = = ) Cuando las varianzas son desconocidas, se debe realizar previamente una prueba estadstica para verificar si stas son iguales o diferentes. Para realizar esta prueba debemos hacer uso de la distribucin F para verificar si la relacin de varianzas es igual a uno o diferente de uno. Para cada una de las dos muestras se definen sus respectivas varianzas como: Adems tienen distribuciones chi cuadrado con n11 y n21 grados de libertad respectivamente. Por lo tanto su suma tambin sigue otra distribucin chi cuadrado con n1+n22 grados de libertad. Es decir: Ahora bien, si Z es una variable normal (0,1) y Y tiene una distribucin chi cuadrado con n grados de libertad, entonces la variable tiene una distribucin t con n grados de libertad. Para nuestro caso la variable Z corresponde a la distribucin de la diferencia de las dos medias, con varianzas conocidas, y la variable chi cuadrado corresponde a la variable Y acabada de definir. Por lo tanto donde es un estimador ponderado de la varianza poblacional s obtenida ponderando las varianzas poblacionales por sus respectivos grados de libertad. c) Distribucin de la diferencia entre dos medias cuando las varianzas son desconocidas y diferentes ( ) Cuando las varianzas son diferentes se puede demostrar que la siguiente variable aleatoria T sigue una distribucin t con n grados de libertad, donde y el nmero de grados de libertad n est dado por: Ejemplo. El gerente de una refinera piensa modificar el proceso para producir gasolina a partir de petrleo crudo. El gerente har la modificacin slo si la gasolina promedio que se obtiene por este nuevo proceso (expresada como un

porcentaje del crudo) aumenta su valor con respecto al proceso en uso. Con base en un experimento de laboratorio y mediante el empleo de dos muestras aleatorias de tamao 12, una para cada proceso, la cantidad de gasolina promedio del proceso en uso es de 24.6 con una desviacin estndar de 2.3, y para el proceso propuesto fue de 28.2 con una desviacin estndar de 2.7. El gerente piensa que los resultados proporcionados por los dos procesos son variables aleatorias independientes normalmente distribuidas con varianzas iguales. Con base en esta evidencia, debe adoptarse el nuevo proceso?

Distribucin Muestral De La Varianza


La varianza de las muestras sigue un proceso distinto a los de la media y proporcin. La causa es que el promedio de todas las varianzas de las muestras no coincide con la varianza de la poblacin s2. Se queda un poco por debajo. En concreto, se verifica que Hemos usado el subndice n para recordar que en la varianza se divide entre n. Si deseamos que la media de la varianza coincida con la varianza de la poblacin, tenemos que acudir a la cuasivarianza o varianza insesgada, que es similar a la varianza, pero dividiendo las sumas de cuadrados entre n-1. Su raz cuadrada es la cuasidesviacin tpica o desviacin estndar. Si se usa esta varianza, si coinciden su media y la varianza de la poblacin lo que nos indica que la cuasivarianza es un estimador insesgado, y la varianza lo es sesgado. Distribucin muestral de la varianza La suma de cuadrados de la varianza, dividida entre la varianza de la poblacin se distribuye segn una chi-cuadrado c2 con n-1 grados de libertad.

You might also like