Prebas de Bondad y Ajuste-Generacion Variables Aleatorias

PRUEBA _ 2
Este tipo de pruebas sirven para verificar si ciertos datos se ajusten algn modelo probabilstico
bien definido tal como el normal, binomial, Poisson, uniforme, etc.
El procedimiento inicia formulando la hiptesis nula de que una poblacin dada tiene una
probabilidad especfica, o funcin de densidad tal como el modelo (normal, uniforme, binomial,
etc.).
La estadstica de prueba es:
con k 1 m grados de libertad.
El nmero de grados de libertad depende del nmero de parmetros que se deben estimar para
calcular la frecuencia esperada. Si no se reemplaza ningn parmetro por su estimacin muestral
en el clculo, el nmero de grados de libertad ser k1. Si se reemplazan uno o dos parmetros
por las estimaciones maestrales, el nmero de grados de libertad ser k-2 o bien k3,
respectivamente.
Un punto que cabe destacar en la aplicacin de este procedimiento de prueba se refiere a la
magnitud de las frecuencias esperadas. Si estas frecuencias esperadas son muy pequeas,
entonces el estadstico de prueba no reflejar la desviacin de las frecuencias observadas y las
esperadas, sino nicamente la pequea magnitud de las frecuencias esperadas. No hay consenso
generalizado en cuanto al valor mnimo de las frecuencias esperadas pero valores de 3, 4, 5 se
usan ampliamente como mnimos. Algunos autores proponen que una frecuencia esperada podra
ser tan pequea, como 1 o 2, siempre que la mayora de ellas excedan 5. Cuando una frecuencia
esperada es muy pequea, puede combinarse con la frecuencia esperada de un intervalo de clase
adyacente. Las frecuencias observadas correspondientes tambin se combinaran, y k se reducira
una unidad.
PASOS
1. Sacamos los subintervalos:
2. Clasificamos cada nmero de ri en los m intervalos
3. Segn cada intervalo se contarn los nmeros de ri, que ser la frecuencia observada Oi.
4. Se calcula la frecuencia esperada con la frmula.
5. Y finalmente se calcula el estadstico de Chi-Cuadrada (form. Arriba)
El alfa del valor de la tabla se lo saca as:
En el ejercicio nos darn un nivel de confianza, ste lo restamos de 100%. Por ejemplo nos dan el
95, entonces 100 95=5, como es porcentaje, nos queda: 0.05; y buscaremos en la tabla ese nivel,
con un grado de libertad que sera el m-1.

| |
=
k
i
e
e o
i
i i
f
f f
1
2
2
_
n m =
m
n
E
i
=
Prueba de Kolmogorov Smirnov
La prueba de de Kolmogorov Smirnov, bautizada as en honor de los estadsticos A.N.
Kolmogorov y N.V Smirnov que la desarrollaron, se trata de un mtodo no paramtrico sencillo
para probar si existe una diferencia significativa entre una distribucin de frecuencia observada y
una distribucin de frecuencia terica. La prueba de K-S es, por consiguiente, otra medida de la
bondad de ajuste de una distribucin de frecuencia terica, como la prueba de ji cuadrada.
Sin embargo la prueba de K-S tiene varias ventajas sobre la prueba de _
2
: es una prueba ms
poderosa, y es ms fcil de usar, puesto que no requiere que los datos se agrupen de alguna
manera.
El estadstico de prueba es: D
n
= mx
o e
F F
Es particularmente til para juzgar qu tan cerca est la distribucin de frecuencia observada de la
distribucin de frecuencia esperada, porque la distribucin de probabilidad de D
n
depende del
tamao de la muestra n, pero es independiente de la distribucin de frecuencia esperada (D
n
es un
estadstico de distribucin libre). La prueba de K-S slo encuentra las distribuciones acumuladas
relativas tanto para las frecuencias observadas como las frecuencias esperadas y despus prueba
qu tan lejanas estn. Si la distancia no es significativa, entonces la distribucin terica describe
bien a la distribucin observada. La prueba de K-S siempre es una prueba de una cola, porque
siempre se prueba si las diferencias son mayores que el nivel especificado.
PASOS
1. Formular la hiptesis nula, H0. Teniendo en cuenta que los nmeros que se van a generar
provienen de una distribucin uniforme.
2. Se selecciona una muestra de tamao n de nmeros pseudoaleatorios n.
3. Se hallan los parmetros de acuerdo a la distribucin que se est utilizando y dems datos que
sirvan de base para la realizacin de la prueba. Ej.: para el caso de una distribucin normal se
deben hallar los parmetros respectivos (Media, desviacin estndar) y otros datos de utilidad.
4. Se debe calcular la funcin de distribucin acumulada para despus hallar las frecuencias
respectivas.
5. Antes de poder hallar el estadstico de prueba se debe hallar la frecuencia observada y la
frecuencia relativa de cada uno de los intervalos establecidos de acuerdo al rango.
6. Se aplica la ecuacin D= Frecuencia observada relativa-Frecuencia esperada relativa para
hallar la discrepancia de las mismas o error estadstico.
7. Posteriormente, se halla el estimador Smirnov-Kolmogorov que es: Valor mximo entre todos
los valores hallados para cada intervalo. En Excel sera =Mx. [Frecuencia observada relativa-
Frecuencia esperada relativa].
8. Se hallan tambin los grados de libertad de acuerdo a la distribucin estadstica utilizada. A su
vez se establece un nivel de significancia de acuerdo al planteamiento.
9. Con base a lo anterior se consulta la tabla de lmites de aceptacin para la prueba de
Kolmogorov-Smirnov para un tamao de muestra n y un determinado nivel de riesgo alfa, Si el
estimador de la prueba es menor al valor buscado en la tabla se acepta H0 o hiptesis nula, en
caso contrario se rechaza.
Prueba de Anderson - Darling
La prueba de Anderson-Darling se utiliza para comprobar si los datos de una muestra proceden de
una poblacin con una distribucin especfica. Se trata de una modificacin de la prueba de
Kolmogorov-Smirnov (KS). Pero a diferencia de la estadstica K-S, que se enfoca en los valores
centrales de la distribucin, la estadstica A-D destaca las diferencias entre los extremos de la
distribucin adoptada y los datos de entrada. La prueba de KS es una distribucin libre en el
sentido de que los valores crticos no dependen de la distribucin especfica que se est
ensayando. La prueba de Anderson-Darling hace uso de la distribucin especfica para el clculo
de los valores crticos. Esto tiene la ventaja de permitir una prueba ms sensible y la desventaja
de que los valores crticos deben ser calculados para cada distribucin. Actualmente, tablas de
valores crticos estn disponibles para la distribucin normal, lognormal, exponencial y Weibull.
Los valores tabulado y las frmulas se han publicado (Stephens, 1974, 1976, 1977, 1979) para
unas distribuciones especficas (normal, lognormal, exponencial, Weibull, logstica).
La estadstica de prueba de Anderson-Darling se define como S N AD =
dnde
( ) ( ) ( ) | |
i N i
N
i
Y F Y F
N
i
S
+
=
+
=
1
1
1 ln ln
) 1 2 (

F es la funcin de distribucin acumulada de la distribucin especificada. Tenga en cuenta que la
variable Y
i
refiere a los datos ordenados.
En la siguiente tabla se encuentran los valores crticos para la estadstica de prueba de AD
ajustada:
1 - o
Caso Estadstica de prueba ajustada 0.900 0.950 0.975 0.990
Todos los parmetros conocidos 5 > n para AD 1.933 2.492 3.070 3.857
( ) ( ) ( ) n S n X N
2
,
AD
n n
|
.
|
\
|
+
2
25 4
1 0.632 0.751 0.870 1.029
( ) ( ) n X Expo AD
n
|
.
|
\
|
+
6 . 0
1 1.070 1.326 1.587 1.943
( ) | o

,
Weibull AD
n
|
|
.
|
\
|
+
2 . 0
1 0.637 0.757 0.877 1.038
( ) | o

,
log istic Log AD

n
|
|
.
|
\
|
+
25 . 0
1 0.563 0.660 0.769 0.906

GENERACIN DE NMEROS ALEATORIOS
MTODO DE TRANSFORMACIN INVERSA
El mtodo de la transformada inversa puede utilizarse para simular variables aleatorias continuas,
lo cual se logra mediante la funcin acumulada f{x) y la generacin de nmeros pseudoaleatorios
r. ~ 1/(0,1).
El mtodo consiste en:
1. Definir la funcin de densidad F{x) que represente la variable a modelar.
2. Calcular la funcin acumulada F(x).
3. Despejar la variable aleatoria x y obtener la funcin acumulada inversa F(x)~1.
4. Generar las variables aleatorias x, sustituyendo valores con nmeros pseudoaleatorios
r ~ 1/(0,1) en la funcin acumulada inversa.

El mtodo de la transformada inversa tambin puede emplearse para simular variables aleatorias
de tipo discreto, como en las distribuciones de Poisson, de Bernoulli, binomial, geomtrica,
discreta general, etc. La generacin se lleva a cabo a travs de la probabilidad acumulada P(x) y la
generacin de nmeros pseudoaleatorios r ~ U(0,1).

El mtodo consiste en:

1. Calcular todos los valores de la distribucin de probabilidad p(x) de la variable a modelar.
2. Calcular todos los valores de la distribucin acumulada P{x).
3. Generar nmeros pseudoaleatorios r ~ 1/(0,1).
4. Comparar con el valor de P(x) y determinar qu valor de x corresponde a P(x).

Este mtodo genera distribuciones, uniforme, exponencial y bernoulli.

MTODO DE CONVOLUCION

En algunas distribuciones de probabilidad la variable aleatoria a simular, V, puede generarse
mediante la suma de otras variables aleatorias X de manera ms rpida que a travs de otros
mtodos. Entonces, el mtodo de convolucin se puede expresar como:

Y = X
1
+X
2
+ ... +X
k

Las variables aleatorias de cuatro de las distribuciones ms conocidas (de Erlang, normal, binomial
y de Poisson) pueden ser generadas a travs de este mtodo.

MTODO DE COMPOSICIN

El mtodo de composicin conocido tambin como mtodo mixto permite generar variables
aleatorias x cuando stas provienen de una funcin de densidad fx que puede expresarse como la
combinacin convexa de m distribuciones de probabilidad f7(x). Entonces, la combinacin convexa
se puede expresar como:

Algunas de las distribuciones ms conocidas que pueden expresarse como una combinacin
convexa son: triangular, de Laplace y trapezoidal. El procedimiento general de generacin es el
siguiente:
1. Calcular la probabilidad de cada una de las distribuciones f(x).
2. Asegurar que cada funcin f^x) sea funcin de densidad.
3. Obtener, mediante el mtodo de la transformada inversa, las expresiones para generar
variables aleatorias de cada una de las distribuciones f(x).
4. Generar un nmero pseudoaleatorio r que permita definir el valor de lA{x).
5. Seleccionar la funcin generadora correspondiente a la funcin f(x).
6. Generar un segundo nmero pseudoaleatorio f, y sustituirlo en la funcin generadora anterior
para obtener Y.

METODO DE ACEPTACIN Y RECHAZO
Cuando f(x) es una funcin acotada y x tiene un rango finito, como a x b, se utiliza este mtodo
para encontrar los valores de las variables aleatorias. El mtodo consiste en normalizar el rango de
f mediante un factor de escala c, luego definir a x como una funcin lineal de r, despus se
generan parejas de nmeros aleatorios r1 , r2 y por ltimo si el nmero encontrado se elige al azar
dentro del rango (a,b) y r b, se utiliza este mtodo para encontrar los valores de las variables
aleatorias. El mtodo consiste en normalizar el rango de f mediante un factor de escala c, luego
definir a x como una funcin lineal de r, despus se generan parejas de nmeros aleatorios r1 , r2
y por ltimo si el nmero encontrado se elige al azar dentro del rango (a,b) y r cf (x) se acepta, en
caso contrario se rechaza. El problema de este mtodo es la cantidad de intentos que se realizan
antes de encontrar una pareja exitosa.

MTODO DE INVERSIN

Prebas de Bondad y Ajuste-Generacion Variables Aleatorias

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Prebas de Bondad y Ajuste-Generacion Variables Aleatorias

Uploaded by

Copyright:

Available Formats

PRUEBA _ 2

log istic Log AD

You might also like