La distribución hipergeométrica describe situaciones de muestreo sin reemplazo de una población finita, donde la probabilidad de obtener cada resultado varía con cada muestra. La distribución hipergeométrica multivariada generaliza esto para múltiples categorías de resultados. Ambas distribuciones son análogas a la binomial y multinomial respectivamente, pero aplican cuando no hay reemplazo entre muestras.
La distribución hipergeométrica describe situaciones de muestreo sin reemplazo de una población finita, donde la probabilidad de obtener cada resultado varía con cada muestra. La distribución hipergeométrica multivariada generaliza esto para múltiples categorías de resultados. Ambas distribuciones son análogas a la binomial y multinomial respectivamente, pero aplican cuando no hay reemplazo entre muestras.
La distribución hipergeométrica describe situaciones de muestreo sin reemplazo de una población finita, donde la probabilidad de obtener cada resultado varía con cada muestra. La distribución hipergeométrica multivariada generaliza esto para múltiples categorías de resultados. Ambas distribuciones son análogas a la binomial y multinomial respectivamente, pero aplican cuando no hay reemplazo entre muestras.
que proporcionansituaciones en las que se realizaban pruebas que entraaban una dicotoma (proceso de Bernouilli) de manera que en cada experiencia la probabilidad de obtener cada uno de los dos posibles resultados se mantena constante. Si el proceso consista en una serie de extracciones o selecciones ello implicaba la reposicin de cada extraccin o seleccin , o bien la consideracin de una poblacin muy grande. Sin embargo si la poblacin es pequea y las extracciones no se remplazan las probabilidades no se mantendrn constantes . En ese caso las distribuciones anteriores no nos servirn para la modelizar la situacin. La distribucin hipergeomtrica viene a cubrir esta necesidad de modelizar procesos de Bernouilli con probabilidades no constantes (sin reemplazamiento) .
La distribucin hipergeomtrica es especialmente til en todos
aquellos casos en los que se extraigan muestras o se realizan experiencias repetidas sin devolucin del elemento extrado o sin retornar a la situacin experimental inicial.
Modeliza , de hecho, situaciones en las que se repite un
nmero determinado de veces una prueba dicotmica de manera que con cada sucesivo resultado se ve alterada la probabilidad de obtener en la siguiente prueba uno u otro resultado. Es una distribucin .fundamental en el estudio de muestras pequeas de poblaciones .pequeas y en el clculo de probabilidades de, juegos de azar y tiene grandes aplicaciones en el control de calidad en otros procesos experimentales en los que no es posible retornar a la situacin de partida.
La distribucin hipergeomtrica puede derivarse de un
proceso experimental puro o de Bernouilli con las siguientes caractersticas:
El proceso consta de n pruebas , separadas o separables
de entre un conjunto de N pruebas posibles. Cada una de las pruebas puede dar nicamente dos resultados mutuamente excluyentes: A y no A.
En la primera prueba las probabilidades son : P(A)= p y
P(A)= q ; con p + q = l.
Las probabilidades de obtener un resultado A y de obtener un
resultado no A varan en las sucesivas pruebas, dependiendo de los resultados anteriores.
Derivacin de la distribucin: Si estas circunstancias
aleatorizamos de forma que la variable aleatoria X sea el nmero de resultados A obtenidos en n pruebas la distribucin de X ser una Hipergeomtrica de parmetros N, n, p as
X -> H (N, n, p)
Un tpico caso de aplicacin de este modelo es el
siguiente: Supongamos la extraccin aleatoria de n elementos de un conjunto formado por N elementos totales, de los cuales Np son del tipo A y Np son del tipo A(p + q = l). Si realizamos las extracciones sin devolver los elementos extrados , y llamamos X. al nmero de elementos del tipo A que extraemos en n extracciones X seguir una distribucin hipergeomtrica de parmetros N , n , p.
FUNCIN DE CUANTA
La funcin de cuanta de una distribucin Hipergeomtrica har
corresponder a cada valor de la variable X (x = 0,1,2, . . . n) la probabilidad del suceso "obtener x resultados del tipo A ", y (n- x) resultados del tipo no A en las n pruebas realizadas de entre las N posibles.
Veamos :
Hay un total de formas distintas de obtener x
resultados del tipo A y n-x del tipo A , si partimos de una poblacin formada por Np elementos del tipo A y Nq elementos del tipo A. Por otro lado si realizamos n pruebas o extracciones hay un
total de posibles muestras ( grupos de n elementos)
aplicando la regla de Laplace tendramos:
Figura 4.2.1 Funcin de Cuanta
Que para valores de X comprendidos entre el conjunto de
enteros 0,1,. .n ser la expresin de la funcin de cuanta de una distribucin , Hipergeomtrica de parmetros N, n, p.
MEDIA Y VARIANZA
Considerando que una variable hipergeomtrica de parmetros
N, n, p puede considerarse generada por la reiteracin de un proceso dicotmico n veces en el que las n dicotomas NO son independientes ; podemos considerar que una variable hipergeomtrica es la suma de n variables dicotmicas NO independientes.
Es bien sabido que la media de la suma de variables
aleatorias (sean stas independientes o no) es la suma de las medias y por tanto la media de una distribucin hipergeomtrica ser , como en el caso de la binomial :
En cambio si las variables sumando no son independientes
la varianza de la variable suma no ser la suma de las varianzas.
Si se evala el valor de la varianza para nuestro caso se
obtiene que la varianza de una distribucin hipergeomtrica de parmetros N, n, p es : si
X -> H (N, n, p) Figura 4.2.2 Frmula de Varianza
Esta forma resulta ser la expresin de la varianza de una
binomial (n, p) afectada por un coeficiente corrector [N-n/N-1], llamado coeficiente de exhaustividad o Factor Corrector de Poblaciones Finitas (F.C.P.F.) y que da cuenta del efecto que produce la no reposicin de los elementos extrados en el muestreo.
Este coeficiente es tanto ms pequeo cuanto mayor es el
tamao muestral (nmero de pruebas de n ) y puede comprobarse como tiende a aproximarse a 1 cuando el tamao de la poblacin N es muy grande . Este ltimo hecho nos confirma lo ya comentado sobre la irrelevancia de la reposicin o no cuando se realizan extracciones sucesivas sobre una poblacin muy grande. Con una poblacin muy grande se cual fuere el tamao de n , el factor corrector sera uno lo que convertira , en cierto modo a la hipergeomtrica en una binomial (ver D. Binomial) . As
Lmite de la distribucin hipergeomtrica cuando N
tiende a infinito.
Hemos visto como la media de la distribucin hipergeomtrica
[ H ( N, n, p ) ], tomaba siempre el mismo valor que la media de una distribucin binomial [ B ( n, p ) ] tambin hemos comentado que si el valor del parmetro N creca hasta aproximarse a infinito el coeficiente de exhaustividad tenda a ser 1, y, por lo tanto, la varianza de la hipergeomtrica se aproximaba a la de la binomial : puede probarse asimismo , cmo la funcin de cuanta de una distribucin hipergeomtrica tiende a aproximarse a la funcin de cuanta de una distribucin binomial cuando
N->
Puede comprobarse en la representacin grfica de una
hipergeomtrica con N =100000 como sta ,es idntica a la de una binomial con los mismos parmetros restantes n y p , que utilizamos al hablar de la binomial.
Figura 4.2.3 Grfica de la distribucin hipergeomtrica
De manera anloga a como se obtena la moda en la
distribucin binomial es fcil obtener la expresin de sta para la distribucin hipergeomtrica. De manera que su expresin X0 sera la del valor o valores enteros que verificasen.
Figura 4.2.4 Moda de la distribucin hipergeomtrica
HIPERGEOMTRICA MULTIVARIADA
Justo como la distribucin hipergeomtrica toma el lugar de
distribucin binomial para el muestreo sin reemplazo, tambin existe una distribucin multivariada anloga a la distribucin multinomial que aplica al muestreo sin reemplazo. Para derivar esta formula, consideremos un conjunto de N elementos, de los cuales M1, son elementos de la primera clase, M2 son elementos de la segundo clase . y Mk son elementos de la k-esima clase tales que. Figura 4.2.5 Frmula Hipergeomtrica Multivariada
Como en relacin con la distribucin multinomial, estamos
interesados en la probabilidad de obtener X1 elementos (resultados) de la primera clase, X2 elementos de la segunda clase . y Xk elementos de la k-esima clase, pero ahora estamos escogiendo sin reemplazo, n de los N elementos del conjunto.
Hay maneras de escoger X1 de los M1 elementos de la
primera clase maneras de escoger X2 elementos de los M2
elementos de la segunda clase, ..y manera de escoger Xk
elementos de los Mk elementos de la k-esima clase, y por
tanto, maneras de escoger
elementos requeridos. Puesto que hay maneras de
escoger n de los N elementos en el conjunto y suponemos que todas son igualmente posibles (que es lo que queremos decir cuando afirmamos que la seleccin es al azar), se sigue que la probabilidad
deseada esta dada por
Figura 4.2.6 Distribucin Hipergeomtrica Multivariada
As la distribucin conjunta de las variables aleatorias bajo consideracin, esto es, la distribucin de los nmeros de resultados de la diferentes clases, es una distribucin hipergeomtrica multivariada con los parmetros n, M1, M2, y Mk.