You are on page 1of 12

CALCULO NUMERO DE SIMULACIONES – CALCULO NUMERO DE REPLICAS –VALIDACION

Selección del tamaño de la muestra


La elección del tamaño de la muestra depende del grado de precisión que se espere del resultado. Este grado
de precisión está representado por el intervalo de confianza, esto es, la característica de un intervalo de
confianza deseado puede conducir a la determinación del propio tamaño. Paradójicamente, para encontrar
los parámetros de la población necesarios para el tamaño de la muestra, el modelo debe ser primero
simulado. En otras palabras, para encontrar el tamaño de la muestra (que afecta la longitud de la simulación)
dados el deseado intervalo y nivel de confianza, primero se debe simular el modelo para una longitud de
corrida arbitraria para estimar la desviación estándar de la variable aleatoria. El valor de la desviación
estándar es requerido en la relación del intervalo de confianza. El valor del tamaño de la muestra es
entonces calculado usando estas estimaciones iniciales de la desviación estándar y la amplitud deseada del
intervalo de confianza.

Tamaño de la muestra basado en la media de la población

Dado un intervalo de confianza para la media de una cierta variable en el sistema que está siendo simulada,
un analista pudiera desear encontrar el tamaño apropiado del tamaño de la muestra para realizar un
experimento de simulación que produce las características de los intervalos de confianza. Si se denota a k
como la mitad del ancho del tamaño del intervalo de confianza (ejemplo; la mitad del ancho de la diferencia
entre los límites inferior y superior), entonces de acuerdo a la definición de los intervalos de confianza
tenemos
P  x - k    x + k  = 1-

La anterior ecuación asume que el intervalo de confianza es simétrico alrededor de la media. Comparando
esta ecuación con la ecuación de los intervalos de confianza para la media, la siguiente relación es obtenida:

S
k = Z  /2
n

Ahora podemos derivar el tamaño de la muestra de la ecuación anterior

n=
 S Z  /2 
2

2
k

Note que la desviación estándar de la población debe de ser conocida para determinar el tamaño de la
muestra: En raros ocasiones y para ciertas variables en el modelo la información sobre la desviación estándar
puede ser obtenida usando datos históricos. En la mayoría de las ocasiones, sin embargo, no hay datos
históricos aplicables disponibles. Como se menciono previamente, la alternativa es correr el modelo para
una muestra de tamaño arbitrario elegida. El producto de esta simulación piloto puede proveer un estimado
(tal vez uno burdo) de el valor de la desviación estándar para la variable en cuestión. Este estimado puede
entonces ser usado en la ecuación anterior para él cálculo del tamaño de la muestra

Debe ser notado que el tamaño de la muestra puede ser estimado independientemente de la desviación
estándar de la población si el tamaño del intervalo de confianza es expresado en términos del número de la
desviación estándar de la población de la variable aleatoria. Por ejemplo, si se desea que k sea 2/10 de la
desviación estándar de la población, entonces substituyendo el valor de d en la ecuación del tamaño de la
muestra produce lo siguiente;

n=
 S Z  /2 
2

2
 2   n = 25Z 2 / 2
 S
 10 

Note que los cálculos del tamaño de la muestra anterior requieren únicamente el valor de la variable
estándar normal para un dado nivel de confianza. Sin embargo, debido a que k esta expresado en términos
de una desviación estándar desconocida, el tamaño actual del intervalo de confianza no es conocido en este
caso.

Ejemplo: Basado en el problema #1, suponga que una estación de gasolina está localizada en la autopista
que conecta dos ciudades A y B. El administrador de la estación ordena de gasolina desde las dos ciudades.
El intervalo de tiempo entre las órdenes a la ciudad A se distribuye uniformemente entre 5 y 9 horas. El
intervalo entre órdenes a la ciudad B esta uniformemente distribuido entre 10 y 14 horas. El tiempo del viaje
de los camiones de gasolina desde la ciudad A se distribuye normalmente con media de 7 horas y una
desviación estándar de .5 de hora. El tiempo del viaje de los camiones de gasolina desde la cuidad B se
distribuye normalmente con media de 12 horas y una desviación estándar de 2 horas.

Asuma que inmediatamente después de que se realiza la orden de gasolina, un camión es enviado a la
estación de gasolina. Se desea estimar el tiempo promedio entre arribos de los camiones a la estación de
gasolina tal que la probabilidad sea 0.95 de que nuestras estimaciones este dentro de .1 hora de la media de
la población. Para obtener una estimación para la desviación estándar de la población usada en la fórmula
del tamaño de la muestra, se tomará el resultado de una simulación realizada como una prueba piloto con
una muestra de 100, como se especificó es este ejemplo.

De acuerdo al resultado de la simulación piloto, se obtuvo una desviación estándar del tiempo del sistema de
2.39 horas.

n=
 (2.39) (1.96)
2
= 2194
(0.1 ) 2
1/m
 s 
IC x  x   t r 1, 2 
 r
Validación de varianzas y de medias

x1  x2 103.87  104.90
texp  texp   0.35
n   n2
2 2
1 1 8(40.57)  10(36.96) 1 1
1 1 2
   
n1  n2 n1 n2 8  10 8 10

2.12
Prueba de Forma Chi-Cuadrada (  2 )

Antes de poder usar un proceso generador en un estudio de simulación, se debe demostrar que
los datos empíricos pueden ser conocidos. Un número de pruebas estadísticas puede ser
utilizado para probar la bondad de ajuste de una distribución teórica a un conjunto dado de datos.
Una de las pruebas más frecuentemente utilizada es la Chi-cuadrada (2).

La prueba 2 es un procedimiento para probar la Hipótesis de que una muestra aleatoria de


tamaño n de la variable aleatoria X sigue una forma distribucional específica. La prueba 2 sirve
para determinar si existe alguna diferencia significativa entre las frecuencias esperadas (las
basadas en la distribución teórica) y las frecuencias actuales (las representadas por los datos).

La prueba es válida para tamaños de muestra grandes, para consideraciones de ambos tipos de
distribuciones discretas y continuas, cuando los parámetros son estimados por máxima
verisimilitud.

Los pasos seguidos para probar el proceso son:

1. Establezca la prueba de hipótesis, H0 , en la que los n datos observados son sacados


de la población que es descrita por una distribución teórica conocida.
2. Establezca la hipótesis alternativa, H 1, en la que los n datos observados no son
sacados de la población del paso 1.
3. Identificar el nivel de significacia,  en el cual la prueba será efectuada [ (1-  )
nivel de significancia de la prueba estadística].
4. Usando la siguiente relación matemática

( f0  fe )2
2 
fe

donde 2 cal = valor calculado de x


fo = frecuencias observadas
fe = frecuencias teóricas esperadas
Calcules fei como npi , donde pi es la probabilidad teórica hipotetizada asociada con el ivo intervalo.
pruébese la 2 cal con 2 tabla

si 2 cal > 2 Tabla entonces rechace Ho y acepte H1

si 2 cal < 2 Tabla entonces rechace H1 y acepte Ho

El valor de 2 en la tabla es encontrado en la tabla de ji-cuadrada y es definido por el numero de


grados de libertad (g.l.). Y estos se definen para la mayoría de las pruebas de bondad como ;
g.l.=k-s-1
donde;
k= No. de categorías(intervalos de clases)
s= No. de parámetros del la distribución de probabilidad hipotetizada.
Ejemplo:Ajustando una Distribución Exponencial Usando la Prueba de Ajuste de Bondad
Chi-Cuadrada (  2 )

Realice una prueba de ajuste de bondad de los datos siguientes para una distribución Exponencial.
Los 60 datos siguientes representan el tiempo en segundos del tiempo entre arribos de los carros en una
cierta intersección.

12 7 26 6 18 15 44 28 9 44 16 19 37 29 8
10 9 18 35 17 20 31 8 24 15 18 30 11 28 68
7 19 4 26 25 37 46 9 18 14 7 34 26 9 49
9 16 32 7 4 6 23 8 36 19 5 21 9 3 22

La media es de 20.1 segundos.


La función de densidad de probabilidad de la distribución exponencial está dada por:
x
1  20.1
f ( x)  e , para x > 0
20.1

y su respectiva función acumulada de probabilidad por:


x

F ( x)  1  e 20.1
> 0

Se realizan los cálculos para obtener la frecuencia esperada de los diferentes intervalos de clase:

Celda Frecuencia 
0

Observada F (0)  1  e 20.1


 1 1  0
Foi 
10

0-10 19 F (10)  1  e 20.1


 1  .60804  0.391958
10-20 16 
20

20-30 12 F (20)  1  e 20.1


 1  0.369714  0.630285724
30-40 8 
30
40-50 4 F (30)  1  e 20.1
 1  0.224801  0.77519839
50-60 0 
40
60-∞ 1 F (40)  1  e 20.1
 1  0.136695  0.863304574
Totales n = 60
50

F (50)  1  e 20.1
 1  0.08311  0.916887652
60

F (60)  1  e 20.1
 1  0.050535733  0.949464266
70

F (70)  1  e 20.1
 1  0.0307278  0.969272184

p1= [F(10) - F(0)]*60 = 0.391958*60 = 23.51748


p2=[ [F(20)-F(10)]*60 = 0.238327724*60 =14.29966
p3=[ [F(30)-F(20)]*60 = 0.1449698*60 =8.698188
p4=[ [F(40)-F(30)]*60 = 0.088106184*60 =5.286371
p5=[ [F(50)-F(40)]*60 = 0.053583078*60 =3.21498468
p6=[ [F(60)-F(50)]*60 = 0.032576614*60 =1.95459684
p7=[ [F(70)-F(60)]*60 = 0.019807918*60 =1.188475

Ahora se elabora la tabla para el cálculo de la χ 2 calculada


Celda Frecuencia Frecuencia ( Foi  Fei ) 2
Observada Esperada
Foi Fei = npi Fei
0-10 19 23.51748 0.8677641
10-20 16 14.29966 0.20218355
20-30 12 8.698188 1.25336601
30-40 8 5.286371 1.39297494
40-50 4 3.21498468
50-60 0 1.95459684
60-∞ 1 1.188475
Totales n = 60 60

Cuando Fei = npi es menor que 5 se debe combinar con la celda inmediata superior. Lo cual sucede para las
últimas 3 filas, resultando la tabla siguiente:

Celda Frecuencia Frecuencia ( Foi  Fei ) 2


Observada Esperada
Foi Fei = npi Fei
0-10 19 23.51748 0.8677641
10-20 16 14.29966 0.20218355
20-30 12 8.698188 1.25336601
30-40 8 5.286371 1.39297494
40-∞ 5 8.198301 1.24771331
50-60
60-
Totales n = 60 60.0 4.964001911

Así la χ2 calculada =4.964. Ahora se obtiene la χ2 de la tabla, con grados de libertad igual a 5-1=4, y con un nivel
de significancia =0.05  χ2Tabla,4,0.05 =9.49
Como la χ2 calculada =4.964 es menor que χ2Tabla= 9.49, se puede decir que los tiempos entre arribos de los
carros siguen comportamiento que se apega a una distribución exponencial.

Ejemplo:Ajustando una Distribución Uniforme Usando la Prueba de Ajuste de Bondad Chi-


Cuadrada (  2 )
Distribución Uniforme a=0, b=13

1 1 1
F ( x) i  ( LS i  a ) F ( x)i  ( LSi  0) F ( x) i  LS i
ba 13  0 13

Intervalo FO PEA FEA FE ( Foi  Fei )2 χ2 calculada

Fei
0- 1 6 0.0769 3.076 3.076 2.779
1–3 6 0.2307 9.228 6.154 0.0038
3–5 5 0.3846 15.384 6.154 0.2164
5–7 6 0.5384 21.536 6.154 0.0038
7–9 6 0.6923 27.692 6.154 0.0038
9 – 11 6 0.8461 33.846 6.154 0.0038
11 - 13 5 1.0000 40.0 6.154 0.2164 3.2112

Así la χ2 calculada =3.2112. Ahora se obtiene la χ2 de la tabla, con grados de libertad igual a 7-1=6, y con un nivel
de significancia =0.05
χ2Tabla,6,0.05 =12.6
Como la χ2 calculada =3.2112 es menor que χ2Tabla= 12.6, se puede decir que los tiempos entre arribos de los
carros siguen comportamiento que se apega a una distribución UNIFORME.

Ejemplo:Ajustando una Distribución Normal Usando la Prueba de Ajuste de Bondad Chi-


Cuadrada (  2 )  =8,  =2
xi   LS i   LS i  8
Zi  Zi  Zi 
  2

Intervalo FO Z PEA FEA FE ( Foi  Fei )2


Fei
0-1 0 -3.5 0.00023 0.012 0.012 0.012
2– 3 1 -2.5 0.0061 0.335 0.323 1.419
4–5 8 -1.5 0.06681 3.674 3.351 6.449
6–7 12 -0.5 0.3054 16.797 13.123 0.096
8–9 20 0.5 0.69146 38.030 21.233 0.072
10 – 11 10 1.5 0.933319 51.332 13.302 0.819
12 - 13 3 2.5 0.99379 54.658 3.326 0.032
14 – ∞ 1 3.5 1.0000 55 0.342 1.265
∑ 55 10.164

Así la χ2 calculada =10.164. Ahora se obtiene la χ2 de la tabla, con grados de libertad igual a 8 -1=7, y con un
nivel de significancia =0.05
χ2Tabla,7,0.05 =14.1
Como la χ2 calculada =10.164 es menor que χ2Tabla= 14.1, se puede decir que los tiempos entre arribos de los
carros siguen comportamiento que se apega a una distribución normal.

Ejemplo:Ajustando una Distribución Poisson Usando la Prueba de Ajuste de Bondad Chi-


Cuadrada (  2 )

No. de Arribos/Hora FO FEA Frecuencia (fo-fe)2


(x) Esperada fe
(fe)
0 70 75.05 75.05 3.3398
1 84 150.144 75.05 1.0673
2 34 187.68 37.52 0.3302
3 12 200.124 12.51 0.0208
4 o Más 4 204 3.87 0.0043

204 2 cal = 4.7624

*Calculando si 2 cal , se asume que cada clase de datos tiene una fe de al menos 5, debido a que
cada valor esperado para x>4 es 3.87 observaciones, se agrupan la l°, 3° y 4° clase.

usando  =1 la función de densidad Poisson, se pueden calcular la probabilidad de los varios


números de clientes que entran al banco. Estos se expresan como sigue ;
e   x
f  x  k  k  0,1,2...
x!

(1)e 1
P ( x  0)   .36788 x 204  75.0475
0!

(1)e 1
P ( x  1)   .36788x 204  75.04752
1!

(1)e 1
P ( x  2)   .18394x 204  37.52376
2!

(1)e 1
P( x  3)   .06131x 204  12.50724
3!
3
P ( x  4)  1   P( x  4)  .01899 x 204  3.87396
i 0

Así la χ2 calculada =4.7624. Ahora se obtiene la χ2 de la tabla, con grados de libertad igual a 5-1= 4, y con un
nivel de significancia =0.05
χ2Tabla,4,0.05 =9.49
Como la χ2 calculada =4.7624 es menor que χ2Tabla= 9.49, se puede decir que los arribos de los carros siguen
comportamiento que se apega a una distribución POISSON.

La recomendación para el numero de intervalos de clase para datos continuos se resume en la


tabla siguiente;

Tamaño de la muestra Numero de intervalos de clase


n k
20 No use la prueba Chi-cuadrada
50 De 5 a 10
100 De 10 a 20
>100 n
De n hasta
5

You might also like