You are on page 1of 7

Hipergeomtrica e Hipergeomtrica Multivariada

HIPERGEOMTRICA

Hasta ahora hemos analizado distribuciones


que proporcionansituaciones en las que se realizaban pruebas
que entraaban una dicotoma (proceso de Bernouilli) de
manera que en cada experiencia la probabilidad de obtener
cada uno de los dos posibles resultados se mantena constante.
Si el proceso consista en una serie de extracciones o
selecciones ello implicaba la reposicin de cada extraccin o
seleccin , o bien la consideracin de una poblacin muy
grande. Sin embargo si la poblacin es pequea y las
extracciones no se remplazan las probabilidades no se
mantendrn constantes . En ese caso las distribuciones
anteriores no nos servirn para la modelizar la situacin. La
distribucin hipergeomtrica viene a cubrir esta necesidad de
modelizar procesos de Bernouilli con probabilidades no
constantes (sin reemplazamiento) .

La distribucin hipergeomtrica es especialmente til en todos


aquellos casos en los que se extraigan muestras o se realizan
experiencias repetidas sin devolucin del elemento extrado o
sin retornar a la situacin experimental inicial.

Modeliza , de hecho, situaciones en las que se repite un


nmero determinado de veces una prueba dicotmica de
manera que con cada sucesivo resultado se ve alterada la
probabilidad de obtener en la siguiente prueba uno u otro
resultado. Es una distribucin .fundamental en el estudio de
muestras pequeas de poblaciones .pequeas y en el clculo
de probabilidades de, juegos de azar y tiene grandes
aplicaciones en el control de calidad en otros procesos
experimentales en los que no es posible retornar a la situacin
de partida.

La distribucin hipergeomtrica puede derivarse de un


proceso experimental puro o de Bernouilli con las siguientes
caractersticas:

El proceso consta de n pruebas , separadas o separables


de entre un conjunto de N pruebas posibles.
Cada una de las pruebas puede dar nicamente dos
resultados mutuamente excluyentes: A y no A.

En la primera prueba las probabilidades son : P(A)= p y


P(A)= q ; con p + q = l.

Las probabilidades de obtener un resultado A y de obtener un


resultado no A varan en las sucesivas pruebas, dependiendo
de los resultados anteriores.

Derivacin de la distribucin: Si estas circunstancias


aleatorizamos de forma que la variable aleatoria X sea el
nmero de resultados A obtenidos en n pruebas la
distribucin de X ser una Hipergeomtrica de parmetros
N, n, p as

X -> H (N, n, p)

Un tpico caso de aplicacin de este modelo es el


siguiente: Supongamos la extraccin aleatoria de n elementos
de un conjunto formado por N elementos totales, de los cuales Np son
del tipo A y Np son del tipo A(p + q = l). Si realizamos las extracciones sin
devolver los elementos extrados , y llamamos X. al nmero de elementos del
tipo A que extraemos en n extracciones X seguir una distribucin
hipergeomtrica de parmetros N , n , p.

FUNCIN DE CUANTA

La funcin de cuanta de una distribucin Hipergeomtrica har


corresponder a cada valor de la variable X (x = 0,1,2, . . . n) la
probabilidad del suceso "obtener x resultados del tipo A ", y (n-
x) resultados del tipo no A en las n pruebas realizadas de entre
las N posibles.

Veamos :

Hay un total de formas distintas de obtener x


resultados del tipo A y n-x del tipo A , si partimos de una
poblacin formada por Np elementos del tipo A y Nq elementos
del tipo A.
Por otro lado si realizamos n pruebas o extracciones hay un

total de posibles muestras ( grupos de n elementos)


aplicando la regla de Laplace tendramos:

Figura 4.2.1 Funcin de Cuanta

Que para valores de X comprendidos entre el conjunto de


enteros 0,1,. .n ser la expresin de la funcin de cuanta de
una distribucin , Hipergeomtrica de parmetros N, n, p.

MEDIA Y VARIANZA

Considerando que una variable hipergeomtrica de parmetros


N, n, p puede considerarse generada por la reiteracin de un
proceso dicotmico n veces en el que las n dicotomas NO son
independientes ; podemos considerar que una variable
hipergeomtrica es la suma de n variables dicotmicas NO
independientes.

Es bien sabido que la media de la suma de variables


aleatorias (sean stas independientes o no) es la suma de las
medias y por tanto la media de una distribucin hipergeomtrica
ser , como en el caso de la binomial :

En cambio si las variables sumando no son independientes


la varianza de la variable suma no ser la suma de las
varianzas.

Si se evala el valor de la varianza para nuestro caso se


obtiene que la varianza de una distribucin hipergeomtrica de
parmetros N, n, p es : si

X -> H (N, n, p)
Figura 4.2.2 Frmula de Varianza

Esta forma resulta ser la expresin de la varianza de una


binomial (n, p) afectada por un coeficiente corrector [N-n/N-1],
llamado coeficiente de exhaustividad o Factor Corrector de
Poblaciones Finitas (F.C.P.F.) y que da cuenta del efecto que
produce la no reposicin de los elementos extrados en el
muestreo.

Este coeficiente es tanto ms pequeo cuanto mayor es el


tamao muestral (nmero de pruebas de n ) y puede
comprobarse como tiende a aproximarse a 1 cuando el tamao
de la poblacin N es muy grande . Este ltimo hecho nos
confirma lo ya comentado sobre la irrelevancia de la reposicin
o no cuando se realizan extracciones sucesivas sobre una
poblacin muy grande. Con una poblacin muy grande se cual
fuere el tamao de n , el factor corrector sera uno lo que
convertira , en cierto modo a la hipergeomtrica en una binomial
(ver D. Binomial) . As

Lmite de la distribucin hipergeomtrica cuando N


tiende a infinito.

Hemos visto como la media de la distribucin hipergeomtrica


[ H ( N, n, p ) ], tomaba siempre el mismo valor que la media de
una distribucin binomial [ B ( n, p ) ] tambin hemos comentado
que si el valor del parmetro N creca hasta aproximarse a
infinito el coeficiente de exhaustividad tenda a ser 1, y, por lo
tanto, la varianza de la hipergeomtrica se aproximaba a la de
la binomial : puede probarse asimismo , cmo la funcin de
cuanta de una distribucin hipergeomtrica tiende a
aproximarse a la funcin de cuanta de una distribucin binomial
cuando

N->

Puede comprobarse en la representacin grfica de una


hipergeomtrica con N =100000 como sta ,es idntica a la de
una binomial con los mismos parmetros restantes n y p , que
utilizamos al hablar de la binomial.

Figura 4.2.3 Grfica de la distribucin hipergeomtrica

De manera anloga a como se obtena la moda en la


distribucin binomial es fcil obtener la expresin de sta para
la distribucin hipergeomtrica. De manera que su expresin
X0 sera la del valor o valores enteros que verificasen.

Figura 4.2.4 Moda de la distribucin hipergeomtrica

HIPERGEOMTRICA MULTIVARIADA

Justo como la distribucin hipergeomtrica toma el lugar de


distribucin binomial para el muestreo sin reemplazo, tambin existe
una distribucin multivariada anloga a la distribucin multinomial que
aplica al muestreo sin reemplazo. Para derivar esta formula,
consideremos un conjunto de N elementos, de los cuales M1, son
elementos de la primera clase, M2 son elementos de la segundo clase
. y Mk son elementos de la k-esima clase tales que.
Figura 4.2.5 Frmula Hipergeomtrica Multivariada

Como en relacin con la distribucin multinomial, estamos


interesados en la probabilidad de obtener X1 elementos (resultados) de
la primera clase, X2 elementos de la segunda clase . y Xk elementos
de la k-esima clase, pero ahora estamos escogiendo sin reemplazo, n de
los N elementos del conjunto.

Hay maneras de escoger X1 de los M1 elementos de la

primera clase maneras de escoger X2 elementos de los M2

elementos de la segunda clase, ..y manera de escoger Xk


elementos de los Mk elementos de la k-esima clase, y por

tanto, maneras de escoger

elementos requeridos. Puesto que hay maneras de


escoger n de los N elementos en el conjunto y suponemos que todas
son igualmente posibles (que es lo que queremos decir cuando
afirmamos que la seleccin es al azar), se sigue que la probabilidad

deseada esta dada por

Figura 4.2.6 Distribucin Hipergeomtrica Multivariada


As la distribucin conjunta de las variables aleatorias bajo
consideracin, esto es, la distribucin de los nmeros de
resultados de la diferentes clases, es una distribucin
hipergeomtrica multivariada con los parmetros n, M1, M2,
y Mk.

You might also like