You are on page 1of 24

ESTADISTICA Distribucin de Probabilidad Utilizando Mathematica Cesar Carrasco Bocangel 2012

Dr(c) Csar Carrasco Bocangel

2 | Distribicin de Probabilidad con Mathematica

Distribucin de Probabilidad CLCULO DE PROBABILIDADES

Conceptos generales Uno de los objetivos de la estadstica es el conocimiento cuantitativo de una determinada parcela de la realidad. Para ello, es necesario construir un modelo de esta realidad particular objeto de estudio, partiendo de la premisa de que lo real es siempre ms complejo y multiforme que cualquier modelo que se pueda construir. De todas formas, la formulacin de modelos aceptados por las instituciones responsables y por los usuarios, permite obviar la existencia del error o distancia entre la realidad y el modelo. Los modelos tericos a los que se hace referencia se reducen en muchos casos a (o incluyen en su formulacin) funciones de probabilidad. La teora de la probabilidad tiene su origen en el estudio de los juegos de azar, que impulsaron los primeros estudios sobre clculo de probabilidades en el siglo XVI, aunque no es hasta el siglo XVIII cuando se aborda la probabilidad desde una perspectiva matemtica con la demostracin de la ley dbil de los grandes nmeros segn la cual, al aumentar el nmero de pruebas, la frecuencia de un suceso tiende a aproximarse a un nmero fijo denominado probabilidad. Este enfoque, denominado enfoque frecuentista, se modela matemticamente en el siglo XX cuando Kolmogorov formula la teora axiomtica de la probabilidad1. Dicha teora define la probabilidad como una funcin que asigna a cada posible resultado de un experimento aleatorio un valor no negativo, de forma que se cumpla la propiedad aditiva. La definicin axiomtica establece las reglas que deben cumplir las probabilidades, aunque no asigna valores concretos. Uno de los conceptos ms importantes de la teora de probabilidades es el de variable aleatoria que, intuitivamente, puede definirse como cualquier caracterstica medible que toma diferentes valores con probabilidades determinadas. Toda variable aleatoria posee una distribucin de probabilidad que describe su comportamiento (vale decir, que desagrega el 1 a lo largo de los valores posibles de la variable). Si la variable es discreta, es decir, si toma valores aislados dentro de un intervalo, su distribucin de probabilidad especifica todos los valores posibles de la variable junto con la probabilidad de que cada uno ocurra. En el caso continuo, es decir, cuando la variable puede tomar cualquier valor de un intervalo, la distribucin de probabilidad permite determinar las probabilidades correspondientes a con subintervalos de valores. Una forma usual de describir la distribucin de probabilidad de una variable aleatoria es mediante la denominada funcin de densidad, en tanto que lo que se conoce como funcin de distribucin representa las probabilidades acumuladas2-7. Una de las preocupaciones de los cientficos ha sido construir modelos de distribuciones de probabilidad que pudieran representar el comportamiento terico de diferentes fenmenos aleatorios que aparecan en el mundo real. La pretensin de modelar lo observable ha constituido siempre una necesidad bsica para el cientfico emprico, dado que a travs de esas construcciones tericas, los modelos, poda experimentar sobre aquello que la realidad no le permita. Por otra parte, un modelo resulta extremadamente til, siempre que se corresponda con la realidad que pretende representar o predecir, de manera que ponga de relieve las propiedades ms importantes del mundo que nos rodea, aunque sea a costa de la simplificacin que implica todo modelo. En la prctica hay unas cuantas leyes de probabilidad tericas, como son, por ejemplo, la ley binomial o la de Poisson para variables discretas o la ley normal para variables continuas, que sirven de modelo para representar las distribuciones empricas ms frecuentes.
Dr(c) Csar Carrasco Bocangel

As, por ejemplo, la variable talla de un recin nacido puede tener valores entre 47 cm y 53 cm, pero no todos los valores tienen la misma probabilidad, porque las ms frecuentes son las tallas prximas a los 50 cm. En este caso la ley normal se adapta satisfactoriamente a la distribucin de probabilidad

resulta extremadamente til, siempre que se corresponda con la realidad que pretende representar o predecir, de manera que ponga de relieve las propiedades ms importantes del mundo que nos rodea, aunque sea a costa de la simplificacin que implica todo modelo. Distribucin de Probabilidad con Mathematica| 3 En la prctica hay unas cuantas leyes de probabilidad tericas, como son, por ejemplo, la ley binomial o la de Poisson para variables discretas o la ley normal para variables continuas, que sirven de modelo para representar las distribuciones empricas ms frecuentes. As, por ejemplo, la variable talla de un recin nacido puede tener valores entre 47 cm y 53 cm, pero no todos los valores tienen la misma probabilidad, porque las ms frecuentes son las tallas prximas a los 50 cm. En este caso la ley normal se adapta satisfactoriamente a la distribucin de probabilidad emprica, que se obtendra con una muestra grande de casos. Distribucin de Bernoulli Experimento de Bernoulli: solo son posibles dos resultados: xito o fracaso. Podemos definir una variable aleatoria discreta X tal que: xito 1 fracaso 0 Si la probabilidad de xito es p y la de fracaso 1 - p, podemos construir una funcin de probabilidad: Un tpico experimento de Bernoulli es el lanzamiento de una moneda con probabilidad p para cara y (1p) para cruz PDF@BernoulliDistribution@pDD . 1-p . x0 . . p x 1 , ListableF FunctionB. x, . 0 True 80, 1, 0, 1, 1, 0, 0, 0, 0, 1< p

RandomVariate@BernoulliDistribution@0.3D, 10D Mean@BernoulliDistribution@pDD

H1 - pL p

Variance@BernoulliDistribution@pDD

Dr(c) Csar Carrasco Bocangel

4 | Distribicin de Probabilidad con Mathematica

DiscretePlot@Table@PDF@BernoulliDistribution@pD, xD, 8p, 80.3, 0.5, 0.7, 0.9<<D, 8x, 0, 1<, AxesOrigin 81 2, 0<, PlotMarkers AutomaticD

0.8

0.6

0.4

0.2

0.0

0.2

0.4

0.6

0.8

1.0

Distribucin Binomial Distribucin Binomial (n,p)


La distribucin binomial es una distribucin discreta muy importante que surge en muchas aplicaciones bioestadsticas. Esta distribucin aparece de forma natural al realizar repeticiones independientes de un experimento que tenga respuesta binaria, generalmente clasificada como xito o fracaso. Por ejemplo, esa respuesta puede ser el hbito de fumar (s/no), si un paciente hospitalizado desarrolla o no una infeccin, o si un artculo de un lote es o no defectuoso. La variable discreta que cuenta el nmero de xitos en n pruebas independientes de ese experimento, cada una de ellas con la misma probabilidad de xito igual a p, sigue una distribucin binomial de parmetros n y p. Este modelo se aplica a poblaciones finitas de las que se toma elementos al azar con reemplazo, y tambin a poblaciones conceptualmente infinitas, como por ejemplo las piezas que produce una mquina, siempre que el proceso de produccin sea estable (la proporcin de piezas defectuosas se mantiene constante a largo plazo) y sin memoria (el resultado de cada pieza no depende de las anteriores). Un ejemplo de variable binomial puede ser el nmero de pacientes ingresados en una unidad hospitalaria que desarrollan una infeccin nosocomial. Un caso particular se tiene cuando n=1, que da lugar a la distribucin de Bernoulli.

Valores: x: 0, 1, 2, ..., n Parmetros: n: nmero de pruebas, n > 0 entero p: probabilidad de xito, 0 < p < 1
Dr(c) Csar Carrasco Bocangel

Tablero de Galton o quincunx

Valores: x: 0, 1, 2, ..., n
Distribucin de Probabilidad con Mathematica| 5

Parmetros: n: nmero de pruebas, n > 0 entero p: probabilidad de xito, 0 < p < 1 Tablero de Galton o quincunx

Sir Francis Galton (1822-1911) PDF@BinomialDistribution@n, pDD . FunctionBx .,

RandomVariate@BinomialDistribution@5, 0.3D, 10D 82, 3, 0, 2, 1, 1, 1, 2, 1, 1< np Mean@BinomialDistribution@n, pDD

. . . . .+n px . Binomial@n, xD 0 x n H1 - pL-x . . , ListableF 0 True

n H1 - pL p

DiscretePlot@ Evaluate Table@PDF@BinomialDistribution@40, pD, kD, 8p, 80.1, 0.5, 0.7<<D, 8k, 36<, PlotRange All, PlotMarkers AutomaticD
0.20

Variance@BinomialDistribution@n, pDD

0.15

0.10

0.05


5 10 15 20 25 30 35

Ejemplo Demostrativo Cul es la probabilidad de que en una familia de 4 hijos exactamente 2 sean nias?
Dr(c) Csar Carrasco Bocangel

6 | Distribicin de Probabilidad con Mathematica

Cul es la probabilidad de que en una familia de 4 hijos exactamente 2 sean nias?

Probability@x == 2, x BinomialDistribution@4, 0.5DD 0.375 Distribucin Multinomial Cuando hay ms de dos acontecimientos posibles (A1, A2, A3 ...) con probabilidades p1 , p2 , p3 ... constantes y tales que:

PDF@ MultinomialDistribution@n, 8p1, p2<D, 8x, y<D RandomVariate@ MultinomialDistribution@5, 80.1, 0.7, 0.2<D, 10D 880, 4, 1<, 81, 4, 0<, 80, 2, 3<, 80, 5, 0<, 80, 5, 0<, 80, 4, 1<, 81, 2, 2<, 81, 3, 1<, 80, 5, 0<, 80, 3, 2<< ProbabilityBx2 > 0 && x3 > 0, Probability@x1 > 0 && x2 > 0 && x3 > 0, 8x1, x2, x3< MultinomialDistribution@5, 81 3, 1 3, 1 3<DD 1 1 1 83, x2, x3< MultinomialDistributionB5, : , , >FF 3 3 3 Binomial@n, yD px 1 p2 x + y n && x 0 && y 0 0 True
y

8n p1, n p2<

Mean@ MultinomialDistribution@n, 8p1, p2<DD

Ejemplo Demostrativo

8n H1 - p1L p1, n H1 - p2L p2<

Variance@ MultinomialDistribution@n, 8p1, p2<DD

Un mtodo de diagnstico tiene 3 resultados posibles: positivo (P), negativo (N) y dudoso (D). Se sabe que, en la poblacin, el 10% de los sujetos son positivos, el 70% negativos y el resto dudosos. Qu probabilidad hay de, en una muestra de 5 individuos, obtener exactamente 1 positivo, 1 negativo y 3 dudosos ?
Dr(c) Csar Carrasco Bocangel

Distribucin de Probabilidad con Mathematica| 7

Un mtodo de diagnstico tiene 3 resultados posibles: positivo (P), negativo (N) y dudoso (D). Se sabe que, en la poblacin, el 10% de los sujetos son positivos, el 70% negativos y el resto dudosos. Qu probabilidad hay de, en una muestra de 5 individuos, obtener exactamente 1 positivo, 1 negativo y 3 dudosos ?

Probability@x1 1 && x2 1 && x3 3, 8x1, x2, x3< MultinomialDistribution@5, 80.10, 0.70, 0.20<DD 0.0112

Distribucin Geomtrica Supngase, que se efecta repetidamente un experimento o prueba, que las repeticiones son independientes y que se est interesado en la ocurrencia o no de un suceso al que se refiere como xito, siendo la probabilidad de este suceso p. La distribucin geomtrica permite calcular la probabilidad de que tenga que realizarse un nmero k de repeticiones hasta obtener un xito por primera vez. As pues, se diferencia de la distribucin binomial en que el nmero de repeticiones no est predeterminado, sino que es la variable aleatoria que se mide y, por otra parte, el conjunto de valores posibles de la variable es ilimitado. CDF@GeometricDistribution@pDD . FunctionBx .,

RandomVariate@GeometricDistribution@0.3D, 10D 86, 0, 0, 0, 0, 1, 0, 0, 2, 1<

. xD . 1 - H1 - pL1+Floor@. x . 0 , ListableF 0 True

data = RandomVariate@GeometricDistribution@0.3D, 10 000D; Show@ Histogram@data, 8- 0.5, 40.5, 2<, "PDF"D, DiscretePlot@PDF@d, xD, 8x, 0, 40<, PlotStyle PointSize@ MediumDDD
0.25 0.20

0.15

0.10

0.05

10

20

30

40

Dr(c) Csar Carrasco Bocangel

8 | Distribicin de Probabilidad con Mathematica

-1 +

Mean@GeometricDistribution@pDD 1 p Variance@GeometricDistribution@pDD 1-p p2

Ejemplo Demostrativo La probabilidad de que una muestra de aire contenga una molcula rara es 0.01. Si se supone que las muestras son independientes respecto a la presencia de la molcula. Determine cul es la probabilidad de que sea necesario analizar 125 muestras antes de detectar una molcula rara

Probability@x 125, x GeometricDistribution@0.01DD 0.00284708 Distribucin Binomial Negativa Puede definirse como una generalizacin del modelo Geomtrico o de Pascal. As, dado un suceso A y su complementario Ac, cuando X representa el nmero de veces que se da Ac (ausencias, fallos, etc.) hasta que se produce r veces el suceso A, en una serie de repeticiones de la experiencia aleatoria en condiciones independientes, decimos que X sigue la distribucin Binomial negativa. Ntese que, cuando r = 1, tenemos exactamente el modelo geomtrico. Este modelo queda definido por dos parmetros p (la probabilidad de A: p = P(A)) y r (el nmero de veces que debe producirse A para que detengamos la experiencia). La funcin de densidad viene dada por:

donde q representa el complementario de p: q = 1 - p. Propiedades del modelo Binomial negativo 1) Esperanza: E(X) = r q/p 2) Varianza: V(X) = r q/p2 3) Se cumplen las siguientes propiedades respecto la funcin de densidad: 4) Este modelo se ajusta bien a contajes (nmeros de individuos por unidad de superficie) cuando se produce una distribucin contagiosa (los individuos tienden a agruparse). 5) La distribucin Binomial negativa puede definirse con mayor generalidad si tomamos r como un nmero real positivo cualquiera (no necesariamente entero). Pero, en dicho caso, se pierde el carcter Dr(c) Csar Carrasco Bocangel intuitivo del modelo y se complican ligeramente los clculos. Por dichas razones, se ha excluido dicha posibilidad en esta presentacin.

3) Se cumplen las siguientes propiedades respecto la funcin de densidad:


Distribucin de Probabilidad con Mathematica| 9

4) Este modelo se ajusta bien a contajes (nmeros de individuos por unidad de superficie) cuando se produce una distribucin contagiosa (los individuos tienden a agruparse). 5) La distribucin Binomial negativa puede definirse con mayor generalidad si tomamos r como un nmero real positivo cualquiera (no necesariamente entero). Pero, en dicho caso, se pierde el carcter intuitivo del modelo y se complican ligeramente los clculos. Por dichas razones, se ha excluido dicha posibilidad en esta presentacin. PDF@NegativeBinomialDistribution@n, pDD . FunctionBx .,
. . pn Binomial@- 1 + . H1 - pLx x . + n, - 1 + nD 0

RandomVariate@NegativeBinomialDistribution@5, 0.3D, 10D 815, 12, 7, 38, 20, 3, 37, 5, 15, 4< n H1 - pL p n H1 - pL p2 Mean@NegativeBinomialDistribution@n, pDD

. x . 0 , ListableF True

Variance@NegativeBinomialDistribution@n, pDD DiscretePlot@Table@PDF@NegativeBinomialDistribution@2, pD, kD, 8p, 80.1, 0.2, 0.3<<D, 8k, 25<, PlotMarkers AutomaticD
0.12

0.10

0.08
0.06

0.04 0.02 5 10 15 20 25

Ejemplo Demostrativo Una aeronave tiene 3 computadoras idnticas. Slo una de ellas se emplea para controlar la nave, las otras 2 son de reservas por si falla la primera. Durante una hora de operacin la probabilidad de falla 0.0005 Cul es la probabilidad de que las 3 fallen durante un vuelo de 3 horas?

Dr(c) Csar Carrasco Bocangel

10 | Distribicin de Probabilidad con Mathematica

Probability@x == 3, x NegativeBinomialDistribution@3, 0.0005DD 1.24813 10-9

Distribucin de Poisson La distribucin de Poisson, que debe su nombre al matemtico francs Simen Denis Poisson (1781-1840), ya haba sido introducida en 1718 por Abraham De Moivre como una forma lmite de la distribucin binomial que surge cuando se observa un evento raro despus de un nmero grande de repeticiones10. En general, la distribucin de Poisson se puede utilizar como una aproximacin de la binomial, Bin(n, p), si el nmero de pruebas n es grande, pero la probabilidad de xito p es pequea; una regla es que la aproximacin Poisson-binomial es buena si n 20 y p 0,05 y muy buena si n 100 y p 0,01. La distribucin de Poisson tambin surge cuando un evento o suceso raro ocurre aleatoriamente en el espacio o el tiempo. La variable asociada es el nmero de ocurrencias del evento en un intervalo o espacio continuo, por tanto, es una variable aleatoria discreta que toma valores enteros de 0 en adelante (0, 1, 2,...). As, el nmero de pacientes que llegan a un consultorio en un lapso dado, el nmero de llamadas que recibe un servicio de atencin a urgencias durante 1 hora, el nmero de clulas anormales en una superficie histolgica o el nmero de glbulos blancos en un milmetro cbico de sangre son ejemplos de variables que siguen una distribucin de Poisson. En general, es una distribucin muy utilizada en diversas reas de la investigacin mdica y, en particular, en epidemiologa. El concepto de evento raro o poco frecuente debe ser entendido en el sentido de que la probabilidad de observar k eventos decrece rpidamente a medida que k aumenta. Para que una variable recuento siga una distribucin de Poisson deben cumplirse varias condiciones: 1. En un intervalo muy pequeo (p. e. de un milisegundo) la probabilidad de que ocurra un evento es proporcional al tamao del intervalo. 2. La probabilidad de que ocurran dos o ms eventos en un intervalo muy pequeo es tan reducida que, a efectos prcticos, se puede considerar nula. 3. El nmero de ocurrencias en un intervalo pequeo no depende de lo que ocurra en cualquier otro intervalo pequeo que no se solape con aqul. Estas propiedades pueden resumirse en que el proceso que genera una distribucin de Poisson es estable (produce, a largo plazo, un nmero medio de sucesos constante por unidad de observacin) y no tiene memoria (conocer el nmero de sucesos en un intervalo no ayuda a predecir el nmero de sucesos en el siguiente). El parmetro de la distribucin, lambda, representa el nmero promedio de eventos esperados por unidad de tiempo o de espacio, por lo que tambin se suele hablar de lambda como la tasa de ocurrencia del fenmeno que se observa. A veces se usan variables de Poisson con intervalos que no son espaciales ni temporales, sino de otro tipo. Por ejemplo, para medir la frecuencia de una enfermedad se puede contar, en un perodo dado, el nmero de enfermos en cierta poblacin, dividida en intervalos de, por ejemplo, 10.000 habitantes. Dr(c) Carrasco Bocangel Al Csar nmero de personas enfermas en una poblacin de tamao prefijado, en un instante dado, se le denomina prevalencia de la enfermedad en ese instante y es una variable que sigue una distribucin de Poisson. Otra medida para la frecuencia de una enfermedad es la incidencia, que es el nmero de

El parmetro de la distribucin, lambda, representa el nmero promedio de eventos esperados de lambda Probabilidad con Mathematica| 11 por unidad de tiempo o de espacio, por lo que tambin se suele Distribucin hablar de como la tasa de ocurrencia del fenmeno que se observa. A veces se usan variables de Poisson con intervalos que no son espaciales ni temporales, sino de otro tipo. Por ejemplo, para medir la frecuencia de una enfermedad se puede contar, en un perodo dado, el nmero de enfermos en cierta poblacin, dividida en intervalos de, por ejemplo, 10.000 habitantes. Al nmero de personas enfermas en una poblacin de tamao prefijado, en un instante dado, se le denomina prevalencia de la enfermedad en ese instante y es una variable que sigue una distribucin de Poisson. Otra medida para la frecuencia de una enfermedad es la incidencia, que es el nmero de personas que enferman en una poblacin en un periodo determinado. En este caso, el intervalo es de personas- tiempo, habitualmente personas-ao, y es tambin una variable con distribucin de Poisson. Habitualmente, ambas medidas se expresan para intervalos de tamao unidad o, dicho de otro modo, en lugar de la variable nmero de enfermos, se usa el parmetro lambda (el riesgo, en el caso de la prevalencia, y la densidad de incidencia, en el de incidencia). La distribucin de Poisson tiene iguales la media y la varianza. Si la variacin de los casos observados en una poblacin excede a la variacin esperada por la Poisson, se est ante la presencia de un problema conocido como sobredispersin y, en tal caso, la distribucin binomial negativa es ms adecuada. Valores: x: 0, 1, 2, ... Parmetros: lambda: media de la distribucin, lambda > 0 PDF@PoissonDistribution@m1D, kD
-m1 m1k k!

k0

True

RandomVariate@PoissonDistribution@5D, 10D 82, 10, 11, 4, 6, 4, 5, 2, 5, 7< m1 Mean@PoissonDistribution@m1DD

m1

Variance@PoissonDistribution@m1DD

Dr(c) Csar Carrasco Bocangel

12 | Distribicin de Probabilidad con Mathematica

DiscretePlot@ Evaluate Table@PDF@PoissonDistribution@lD, kD, 8l, 85, 10, 20<<D, 8k, 0, 30<, PlotRange All, PlotMarkers AutomaticD

0.15

0.10

0.05

10

15 20 25 30

Ejemplo Demostrativo
Se necesita estimar la cantidad de llegadas a la ventanilla de servicio en automviles de un banco, durante un perodo de 15 minutos en las maanas de los das hbiles. Los datos histricos indican que en este perodo la cantidad de automviles en promedio es 10. A la gerencia le interesa saber cual es la probabilidad exacta de que lleguen 5 automviles en 15 minutos

Probability@x 5, x PoissonDistribution@10.DD 0.0378333

Dr(c) Csar Carrasco Bocangel

Distribucin de Probabilidad con Mathematica| 13

Distribucin de Probabilidad Continua Distribucin Normal La distribucin normal es, sin duda, la distribucin de probabilidad ms importante del Clculo de probabilidades y de la Estadstica. Fue descubierta por De Moivre (1773), como aproximacin de la distribucin binomial. De todas formas, la importancia de la distribucin normal queda totalmente consolidada por ser la distribucin lmite de numerosas variables aleatorias, discretas y continuas, como se demuestra a travs de los teoremas centrales del lmite. Las consecuencias de estos teoremas implican la casi universal presencia de la distribucin normal en todos los campos de las ciencias empricas: biologa, medicina, psicologa, fsica, economa, etc. En particular, muchas medidas de datos continuos en medicina y en biologa (talla, presin arterial, etc.) se aproximan a la distribucin normal. Junto a lo anterior, no es menos importante el inters que supone la simplicidad de sus caractersticas y de que de ella derivan, entre otras, tres distribuciones (Ji-cuadrado, t y F) que se mencionarn ms adelante, de importancia clave en el campo de la contrastacin de hiptesis estadsticas. La distribucin normal queda totalmente definida mediante dos parmetros: la media (m) y la desviacin estndar (Sigma). Campo de variacin: <x<

Parmetros: Mu: media de la distribucin, -< m < Sigma: desviacin estndar de la distribucin, Sigma > 0 PDF@NormalDistribution@m, sD, xD
Hx-mL2 2 s2

2p s RandomVariate@NormalDistribution@5, 0.3D, 10D 85.11104, 5.51797, 4.83107, 5.2136, 5.01697, 4.72921, 5.43523, 5.02684, 4.63002, 5.08949< m Mean@NormalDistribution@m, sDD Variance@NormalDistribution@m, sDD

s2

Dr(c) Csar Carrasco Bocangel

14 | Distribicin de Probabilidad con Mathematica

Plot@Evaluate Table@CDF@NormalDistribution@0, sD, xD, 8s, 8.75, 1, 2<<D, 8x, - 6, 6<, Filling AxisD
1.0 0.8

0.6

0.4

0.2

-6

-4

-2

Distribucin LogNormal La variable resultante al aplicar la funcin exponencial a una variable que se distribuye normal con media Mu y desviacin estndar Sigma, sigue una distribucin lognormal con parmetros m (escala) y Sigma (forma). Dicho de otro modo, si una variable X se distribuye normalmente, la variable lnX, sigue una distribucin lognormal. La distribucin lognormal es til para modelar datos de numerosos estudios mdicos tales como el perodo de incubacin de una enfermedad, los ttulos de anticuerpo a un virus, el tiempo de supervivencia en pacientes con cncer o SIDA, el tiempo hasta la seroconversin de VIH+, etc. Campo de variacin: 0<x< Parmetros: Mu: parmetro de escala, <m< Sigma: parmetro de forma, Sigma > 0 PDF@LogNormalDistribution@m, sD, xD

H-m+Log@xDL2 2 s2

x>0

2p xs

True

RandomVariate@LogNormalDistribution@5, 0.3D, 10D 8182.329, 108.517, 166.293, 182.373, 167.425, 220.786, 149.573, 113.878, 136.898, 104.271< m+ 2 Mean@LogNormalDistribution@m, sDD
s2

Dr(c) Csar Carrasco Bocangel

Distribucin de Probabilidad con Mathematica| 15

2 m+s I- 1 + s M
2 2

Plot@Table@PDF@LogNormalDistribution@m, 2D, xD, 8m, 8- 1, 2, 3<<D, 8x, 0, 4<, Filling Axis, PlotRange 80, 1<D
1.0 0.8

Variance@LogNormalDistribution@m, sDD

0.6

0.4

0.2

Distribucin Logistica La distribucin logstica se utiliza en el estudio del crecimiento temporal de variables, en particular, demogrficas. En biologa se ha aplicado, por ejemplo, para modelar el crecimiento de clulas de levadura, y para representar curvas de dosis respuesta en bioensayos. La ms conocida y generalizada aplicacin de la distribucin logstica en Ciencias de la Salud se fundamenta en la siguiente propiedad: si U es una variable uniformemente distribuida en el intervalo [0,1], entonces la variable X ln
U 1-U

sigue una distribucin logstica. Esta transformacin,

denominada logit, se utiliza para modelar datos de respuesta binaria, especialmente en el contexto de la regresin logstica. Campo de variacin: <x< Parmetros: a: parmetro de posicin, <a< b: parmetro de escala, b > 0 PDF@LogisticDistribution@m, bD, xD
x-m b

J1 +

x-m b

N b
2

Dr(c) Csar Carrasco Bocangel

16 | Distribicin de Probabilidad con Mathematica

RandomVariate@LogisticDistribution@5, 2D, 10D 86.05017, 10.0082, 5.49693, 3.7554, 0.532909, 3.29606, 4.33103, 8.45216, 11.4307, 21.0462< m Mean@LogisticDistribution@m, bDD p2 b2 3 Variance@LogisticDistribution@m, bDD Plot@Evaluate Table@PDF@LogisticDistribution@m, 2D, xD, 8m, 8- 2, 0, 3<<D, 8x, - 10, 10<, Filling AxisD
0.12 0.10

0.08

0.06

0.04

0.02

-10

-5

10

Distribucin Beta La distribucin beta es posible para una variable aleatoria continua que toma valores en el intervalo [0,1], lo que la hace muy apropiada para modelar proporciones. En la inferencia bayesiana, por ejemplo, es muy utilizada como distribucin a priori cuando las observaciones tienen una distribucin binomial. Uno de los principales recursos de esta distribucin es el ajuste a una gran variedad de distribuciones empricas, pues adopta formas muy diversas dependiendo de cules sean los valores de los parmetros de forma p y q, mediante los que viene definida la distribucin. Un caso particular de la distribucin beta es la distribucin uniforme en [0,1], que se corresponde con una beta de parmetros p=1 y q=1, denotada Beta(1,1). Campo de variacin: 0 x 1 Parmetros: p: parmetro de forma, p > 0 q: parmetro de forma, q > 0

Dr(c) Csar Carrasco Bocangel

Distribucin de Probabilidad con Mathematica| 17

PDF@BetaDistribution@a, bD, xD 0 RandomVariate@BetaDistribution@5, .5D, 10D Mean@BetaDistribution@a, bDD a a+b


H1-xL-1+b x-1+a Beta@a,bD

0<x<1 True

80.976758, 0.685592, 0.594925, 0.966064, 0.996464, 0.975684, 0.959573, 0.970067, 0.796784, 0.967393<

Variance@BetaDistribution@a, bDD Plot@Table@PDF@BetaDistribution@2, bD, xD, 8b, 81 4, 2, 4<<D, 8x, 0, 1<, Filling AxisD
3.5 3.0 2.5 2.0 1.5 1.0 0.5

Ha + bL H1 + a + bL
2

ab

0.2

0.4

0.6

0.8

1.0

Distribucin Gamma La distribucin gamma se puede caracterizar del modo siguiente: si se est interesado en la ocurrencia de un evento generado por un proceso de Poisson de media lambda, la variable que mide el tiempo transcurrido hasta obtener n ocurrencias del evento sigue una distribucin gamma con parmetros a= n lambda (escala) y p=n (forma). Se denota Gamma(a,p). Por ejemplo, la distribucin gamma aparece cuando se realiza el estudio de la duracin de elementos fsicos (tiempo de vida). Esta distribucin presenta como propiedad interesante la falta de memoria. Por esta razn, es muy utilizada en las teoras de la fiabilidad, mantenimiento y fenmenos de espera (por ejemplo en una consulta mdica tiempo que transcurre hasta la llegada del segundo paciente). Campo de variacin: 0<x< Parmetros: a: parmetro de escala, a > 0 p: parmetro de forma, p > 0
Dr(c) Csar Carrasco Bocangel

Esta distribucin presenta como propiedad interesante la falta de memoria. Por esta razn, es muy utilizada en las teoras de la fiabilidad, mantenimiento y fenmenos de espera (por ejemplo en una 18 | Distribicin de Probabilidad con que Mathematica consulta mdica tiempo transcurre hasta la llegada del segundo paciente). Campo de variacin: 0<x< Parmetros: a: parmetro de escala, a > 0 p: parmetro de forma, p > 0 PDF@GammaDistribution@a, bD, xD 0 RandomVariate@GammaDistribution@6, 2D, 10D Mean@GammaDistribution@a, bDD
b x-1+a b-a Gamma@aD
x

x>0

True

818.3091, 7.78838, 10.827, 8.80372, 9.52106, 13.1389, 7.80144, 16.481, 15.3635, 11.497< ab Variance@GammaDistribution@a, bDD

a b2

Plot@Evaluate Table@PDF@GammaDistribution@2, bD, xD, 8b, 82, 4, 6<<D, 8x, 0, 20<, Filling AxisD
0.15

0.10

0.05

10

15

20

Distribucin Exponencial La distribucin exponencial es el equivalente continuo de la distribucin geomtrica discreta. Esta ley de distribucin describe procesos en los que interesa saber el tiempo hasta que ocurre determinado evento; en particular, se utiliza para modelar tiempos de supervivencia. Un ejemplo es el tiempo que tarda una partcula radiactiva en desintegrarse. El conocimiento de la ley que sigue este evento se utiliza, por ejemplo, para la datacin de fsiles o cualquier materia orgnica mediante la tcnica del carbono 14. Una caracterstica importante de esta distribucin es la propiedad conocida como falta de memoria. Esto significa, por ejemplo, que la probabilidad de que un individuo de edad t sobreviva x aos ms, hasta la edad x+t, es la misma que tiene un recin nacido de sobrevivir hasta la edad x. Dicho de manera ms general, el tiempo transcurrido desde cualquier instante dado t0 hasta que ocurre el evento, no depende de lo que haya ocurrido antes del instante t0.
Dr(c) Csar Carrasco Bocangel

La distribucin exponencial se puede caracterizar como la distribucin del tiempo entre sucesos consecu-

utiliza, por ejemplo, para la datacin de fsiles o cualquier materia orgnica mediante la tcnica del carbono 14.
Distribucin de Probabilidad con Mathematica| 19

Una caracterstica importante de esta distribucin es la propiedad conocida como falta de memoria. Esto significa, por ejemplo, que la probabilidad de que un individuo de edad t sobreviva x aos ms, hasta la edad x+t, es la misma que tiene un recin nacido de sobrevivir hasta la edad x. Dicho de manera ms general, el tiempo transcurrido desde cualquier instante dado t0 hasta que ocurre el evento, no depende de lo que haya ocurrido antes del instante t0. La distribucin exponencial se puede caracterizar como la distribucin del tiempo entre sucesos consecutivos generados por un proceso de Poisson; por ejemplo, el tiempo que transcurre entre dos heridas graves sufridas por una persona. La media de la distribucin de Poisson, lambda, que representa la tasa de ocurrencia del evento por unidad de tiempo, es el parmetro de la distribucin exponencial, y su inversa es el valor medio de la distribucin. Tambin se puede ver como un caso particular de la distribucin gamma(a,p), con a=lambda y p=1. El uso de la distribucin exponencial ha sido limitado en bioestadstica, debido a la propiedad de falta de memoria que la hace demasiado restrictiva para la mayora de los problemas. Campo de variacin: 0<x< Parmetros: lambda: tasa, lambda > 0 PDF@ExponentialDistribution@lD, xD -x l l x 0 0 True RandomVariate@ExponentialDistribution@0.0625D, 10D 82.52593, 38.3246, 30.0242, 18.2917, 2.30441, 0.848802, 3.51018, 48.6254, 37.0882, 16.4061< Mean@ExponentialDistribution@lDD 1 l

Variance@ExponentialDistribution@lDD 1 l2

Dr(c) Csar Carrasco Bocangel

20 | Distribicin de Probabilidad con Mathematica

Plot@Table@PDF@ExponentialDistribution@lD, xD, 8l, 81 2, 1, 2<<D, 8x, 0, 3<, Filling Axis, PlotRange AllD
2.0 1.5

1.0

0.5

0.5

1.0

1.5

2.0

2.5

3.0

Distribucin Xi-Cuadrado Un caso especial, muy importante, de la distribucin Gamma se obtiene cuando a=1/2 y p=n/2. La distribucin resultante se conoce con el nombre de Ji-cuadrado con n grados de libertad. Es la distribucin que sigue la suma de los cuadrados de n variables independientes N(0,1). La Ji-cuadrado es una distribucin fundamental en inferencia estadstica y en los tests estadsticos de bondad de ajuste. Se emplea, entre muchas otras aplicaciones, para determinar los lmites de confianza de la varianza de una poblacin normal, para contrastar la hiptesis de homogeneidad o de independencia en una tabla de contingencia y para pruebas de bondad de ajuste. La distribucin Ji-cuadrado queda totalmente definida mediante sus grados de libertad n. Campo de variacin: 0 x< Parmetros: n: grados de libertad, n>0 PDF@ChiSquareDistribution@nD, xD 0
2-n2 -x2 x n GammaA 2 E
-1+
n 2

x>0

True

RandomVariate@ChiSquareDistribution@2D, 10D Mean@ChiSquareDistribution@nDD

80.581388, 1.36556, 2.625, 0.298062, 0.887185, 2.18523, 0.0268979, 5.94243, 1.3175, 0.506867< n Variance@ChiSquareDistribution@nDD

2n

Dr(c) Csar Carrasco Bocangel

Distribucin de Probabilidad con Mathematica| 21

Plot@Table@PDF@ChiSquareDistribution@nD, xD, 8n, 80.5, 3, 5<<D, 8x, 0, 6<, Filling AxisD


0.4 0.3

0.2

0.1

Distribucin t student La distribucin t de Student se construye como un cociente entre una normal y la raz de una Jicuadrado independientes. Esta distribucin desempea un papel importante en la inferencia estadstica asociada a la teora de muestras pequeas. Se usa habitualmente en el contraste de hiptesis para la media de una poblacin, o para comparar las medias de dos poblaciones, y viene definida por sus grados de libertad n. A medida que aumentan los grados de libertad, la distribucin t de Student se aproxima a una normal de media 0 y varianza 1 (normal estndar).

Campo de variacin: <x< Parmetros: n: grados de libertad, n>0 CDF@StudentTDistribution@m, s, nD, xD


1 2

RandomVariate@StudentTDistribution@5, 0.3, 2D, 10D 84.041, 5.38102, 2.88493, 5.17437, 4.66216, 6.01129, 4.98512, 4.80281, 5.19653, 5.05095< Mean@StudentTDistribution@m, s, nDD m n>1 Indeterminate True

BetaA n , 1 E 2 2

Hx-mL Hypergeometric2F1B 2 ,
1

BetaA n , 1 E 2 2

1+n 3 Hx-mL2 , 2 ,F 2 n s2

Dr(c) Csar Carrasco Bocangel

22 | Distribicin de Probabilidad con Mathematica

Variance@StudentTDistribution@m, s, nDD
n s2 -2+n

n>2

Indeterminate True Plot@Evaluate Table@PDF@StudentTDistribution@1, 2, nD, xD, 8n, 80.1, 0.5, 4<<D, 8x, - 3, 5<, Filling AxisD
0.15

0.10

0.05

-2

Distribucin F Otra de las distribuciones importantes asociadas a la normal es la que se define como el cociente de dos variables con distribucin Ji-cuadrado divididas por sus respectivos grados de libertad, n y m. En este caso la variable aleatoria sigue una distribucin F de Snedecor de parmetros n y m. Hay muchas aplicaciones de la F en estadstica y, en particular, tiene un papel importante en las tcnicas del anlisis de la varianza y del diseo de experimentos. Campo de variacin: 0 x< Parmetros: n: grados de libertad del numerador, n>0 m: grados de libertad del denominador, m>0 PDF@FRatioDistribution@n, m D, xD 0
mm2 nn2 x 2 Hm+n xL 2 n m BetaA 2 , 2 E
-1+
n 1

H-m-nL

x>0

True

RandomVariate@FRatioDistribution@5, 10D, 10D

82.00449, 0.272982, 0.762358, 1.60316, 2.47143, 0.516527, 0.541773, 1.50007, 2.14559, 0.449475<

Dr(c) Csar Carrasco Bocangel

Distribucin de Probabilidad con Mathematica| 23

Mean@FRatioDistribution@n, m DD
m -2+m

m>2

Indeterminate True

Variance@FRatioDistribution@n, m DD Indeterminate True Plot@Table@PDF@FRatioDistribution@n, 10D, xD, 8n, 82, 5, 20<<D, 8x, 0, 2<, PlotRange 80, 1<, Filling Axis, Exclusions NoneD
1.0 0.8

2 m2 H-2+m+nL H-4+mL H-2+mL2 n

m>4

0.6

0.4

0.2

0.0

0.5

1.0

1.5

2.0

Plot@Table@PDF@FRatioDistribution@10, m D, xD, 8 m, 81, 5, 20<<D, 8x, 0, 2<, PlotRange 80, 1<, Filling Axis, Exclusions NoneD
1.0 0.8

0.6

0.4

0.2

0.0

0.5

1.0

1.5

2.0

Dr(c) Csar Carrasco Bocangel

24 | Distribicin de Probabilidad con Mathematica

BIBLIOGRAFA

1. Kolmogorov AN. Grundbegriffe der Wahrscheinlichtkeitsrechnung. Berlin: Springer-Verlag; 1933. (Traducido al ingls: Morrison N. Foundations of the Theory of Probability. New York: Chelsea; 1956). 2. Martn Pliego FJ, Ruiz-Maya L. Estadstica I: Probabilidad. Madrid: Editorial AC; 1997. 3. Meyer PL. Probabilidad Iberoamericana; 1986. y Aplicaciones Estadsticas. Mxico: Addison-Wesley

4. Pea D. Modelos y mtodos. 1. Fundamentos. Madrid: Alianza Universidad Textos; 1993. 5. Katz DL. Epidemiology, Biostatistics and Preventive Medicine Review. USA: W.B. Saunders Company; 1997. 6. Domnech JM. Mtodos Estadsticos en Ciencias de la Salud. Barcelona: Signo; 1997. 7. Hospital Ramn y Cajal. Material docente de la unidad de bioestadstica clnica. Disponible en: http://www.hrc.es/bioest/M_docente.html 8. Biggeri A. Negative Binomial Distribution. En: Armitage P, Colton T editores. Encyclopedia of Biostatistics. Vol. 4. Chichester: John Wiley & Sons; 1998. p. 2962-7. 9. Kemp AW, Kemp CD. Accident Proneness. En: Armitage P, Colton T editores. Encyclopedia of Biostatistics. Vol. 1. Chichester: John Wiley & Sons; 1998. p. 35-7. 10. Palmgren J. Poisson Distribution. En: Armitage P, Colton T editores. Encyclopedia of Biostatistics. Vol. 4. Chichester: John Wiley & Sons; 1998. p. 3398-3402. 11. Lehmer DH. Mathematical methods in large-scale computing units. En: Proceedings of the Second Symposium on Large Scale Digital Computing Units Machinery. Cambridge, Mass.: Harvard University Press; 1951. p. 141-6.

Dr(c) Csar Carrasco Bocangel