You are on page 1of 31

MÉTODO DE LOS MÍNIMOS CUADRADOS

1. MARCO TEORICO

Es una técnica en la que, dados un conjunto de pares ordenados, se intenta encontrar


la función continua (ecuación de la recta) que mejor se aproxime a los datos (un "mejor
ajuste").
FIGURA 1

(Fuente, http://fisicamatematic.wordpress.com)

FIGURA 2

(Fuente, https://sites.google.com/site/metalmetnumericos/home/unidad-3/3-9-metodo-de-
minimos-cuadrados)
La ecuación de la recta de la figura anterior es:

𝑌̂𝑖 = 𝑎𝑋𝑖 + 𝑏
Donde:

 𝑌̂𝑖 es el valor estimado para cada 𝑋𝑖 .


 n es el número de pares ordenados; 𝑖 varía desde 1 hasta n.

La distancia vertical entre el 𝑌𝑖 , que es el valor observado o real de las ordenadas de los
datos, e "𝑒𝑖 " se le denomina error y está representado por:

𝑒𝑖 = 𝑌𝑖 − 𝑌̂𝑖

También se puede trabajar elevando la ecuación anterior al cuadrado, obteniendo:

2
𝑒𝑖2 = (𝑌𝑖 − 𝑌̂𝑖 )

Lo que resulta el “error cuadrático”; si se hace la sumatoria de todos los errores


cuadráticos desde “i” hasta “n” se obtiene:

𝑛 𝑛
2
∑ 𝑒𝑖2 = ∑(𝑌𝑖 − 𝑌̂𝑖 )
𝑖 𝑖

¿Por qué?
- Lo que se busca es minimizar el valor de la sumatoria del error cuadrático, si
esto se aproxima más a cero significa que se ha encontrado la recta que mejor
se ajuste a los datos.

Reemplazando en la ecuación anterior, la sumatoria del error cuadrático, el valor de


𝑌̂𝑖 = 𝑎𝑋𝑖 + 𝑏 se obtiene:
𝑛 𝑛

∑ 𝑒𝑖2 = ∑(𝑌𝑖 − 𝒂 ∗ 𝑿𝒊 − 𝒃)2


𝑖 𝑖

El valor de ∑𝑛 2
𝑖 𝑒𝑖 va a depender de los valores de “a” y “b” para que sea mínimo por lo
que se puede representar la ecuación anterior como una función que depende de los
valores de “a” y “b”.
𝑛 𝑛

𝐹(𝑎, 𝑏) = ∑ 𝑒𝑖2 = ∑(𝑌𝑖 − 𝑎 ∗ 𝑋𝑖 − 𝑏)2


𝑖 𝑖

Para encontrar los valores de “a” y “b” los cuales hagan que el valor de F(a,b) sea
mínimo se tiene que desarrollar las derivadas parciales de la función respecto a “a” y “b”
e igualar a cero.
𝜕𝐹(𝑎, 𝑏)
=0
𝜕𝑎
𝜕𝐹(𝑎, 𝑏)
=0
𝜕𝑏
 Desarrollando la derivada parcial de F(a,b) respecto a “b” se obtiene:
𝑛
𝜕𝐹(𝑎, 𝑏)
= ∑ −2 ∗ (𝑌𝑖 − 𝑎 ∗ 𝑋𝑖 − 𝑏) = 0
𝜕𝑏
𝑖
𝑛 𝑛 𝑛

∑ 𝑌𝑖 − ∑ 𝑎 ∗ 𝑋𝑖 − ∑ 𝑏 = 0
𝑖 𝑖 𝑖

Sí “a” y “b” son constantes, se obtiene:


𝑛 𝑛 𝑛

∑ 𝑌𝑖 − 𝑎 ∗ ∑ 𝑋𝑖 − 𝑏 ∗ ∑ 1 = 0
𝑖 𝑖 𝑖

Si se resuelve ∑𝑛𝑖 1 , resulta que ∑𝑛𝑖 1 = 𝑛.


𝑛 𝑛

∑ 𝑌𝑖 − 𝑎 ∗ ∑ 𝑋𝑖 − 𝑏 ∗ 𝑛 = 0
𝑖 𝑖

La ecuación anterior es igual a:


𝑛 𝑛

∑ 𝑌𝑖 = 𝑎 ∗ ∑ 𝑋𝑖 + 𝑏 ∗ 𝑛 … … . . (1)
𝑖 𝑖

 Desarrollando la derivada parcial de F(a,b) respecto a “a” se obtiene:

𝑛
𝜕𝐹(𝑎, 𝑏)
= ∑ −2 ∗ (𝑌𝑖 − 𝑎 ∗ 𝑋𝑖 − 𝑏) ∗ 𝑋𝑖 = 0
𝜕𝑎
𝑖
𝑛 𝑛 𝑛

∑(𝑌𝑖 ∗ 𝑋𝑖 ) − ∑ 𝑎 ∗ 𝑋𝑖2 − ∑ 𝑏 ∗ 𝑋𝑖 = 0
𝑖 𝑖 𝑖
Extrayendo “a” y “b” de la sumatorias:
𝑛 𝑛 𝑛

∑(𝑌𝑖 ∗ 𝑋𝑖 ) − 𝑎 ∗ ∑ 𝑋𝑖2 − 𝑏 ∗ ∑ 𝑋𝑖 = 0
𝑖 𝑖 𝑖

La ecuación anterior es igual a:

𝑛 𝑛 𝑛

∑(𝑌𝑖 ∗ 𝑋𝑖 ) = 𝑎 ∗ ∑ 𝑋𝑖2 + 𝑏 ∗ ∑ 𝑋𝑖 … … (2)


𝑖 𝑖 𝑖

Para poder resolver las ecuaciones (1) y (2) y encontrar los valores de “a” y “b” se
resuelve por medio de matrices.

𝑛 𝑛 𝑛

∑ 𝑋𝑖2 ∑ 𝑋𝑖 ∑(𝑌𝑖 ∗ 𝑋𝑖 )
𝑖 𝑖 𝑎 𝑖
𝑛 ∗[ ]= 𝑛
𝑏
∑ 𝑋𝑖 𝑛 ∑ 𝑌𝑖
[ 𝑖 ] [ 𝑖 ]

El sistema de ecuaciones anterior puede ser resuelto por la regla de Cramer, mediante
el uso de determinantes.

𝑛 𝑛

∑ 𝑋𝑖2 ∑ 𝑋𝑖 𝑛 𝑛 2
𝑖 𝑖
𝑛 = 𝑛 ∗ ∑ 𝑋𝑖2 − (∑ 𝑋𝑖 ) … … … … … . (3)
𝑖 𝑖
∑ 𝑋𝑖 𝑛
[ 𝑖 ]

𝑛 𝑛

∑(𝑌𝑖 ∗ 𝑋𝑖 ) ∑ 𝑋𝑖 𝑛 𝑛 𝑛
𝑖 𝑖
𝑛 = 𝑛 ∗ ∑(𝑌𝑖 ∗ 𝑋𝑖 ) − ∑ 𝑋𝑖 ∗ ∑ 𝑌𝑖 … … … … … . (4)
𝑖 𝑖 𝑖
∑ 𝑌𝑖 𝑛
[ 𝑖 ]
𝑛 𝑛

∑ 𝑋𝑖2 ∑(𝑌𝑖 ∗ 𝑋𝑖 ) 𝑛 𝑛 𝑛 𝑛
𝑖 𝑖
𝑛 𝑛 = ∑ 𝑌𝑖 ∗ ∑ 𝑋𝑖2 − ∑ 𝑋𝑖 ∗ ∑(𝑌𝑖 ∗ 𝑋𝑖 ) … … . (5)
𝑖 𝑖 𝑖 𝑖
∑ 𝑋𝑖 ∑ 𝑌𝑖
[ 𝑖 𝑖 ]

Dividiendo las determinantes se obtiene:

𝑒𝑐𝑢𝑎𝑐𝑖𝑜𝑛(4) 𝑛 ∗ ∑𝑛𝑖(𝑌𝑖 ∗ 𝑋𝑖 ) − ∑𝑛𝑖 𝑋𝑖 ∗ ∑𝑛𝑖 𝑌𝑖


𝑎= =
𝑒𝑐𝑢𝑎𝑐𝑖𝑜𝑛(3) 𝑛 ∗ ∑𝑛𝑖 𝑋𝑖2 − (∑𝑛𝑖 𝑋𝑖 )2

𝑒𝑐𝑢𝑎𝑐𝑖𝑜𝑛(5) ∑𝑛𝑖 𝑌𝑖 ∗ ∑𝑛𝑖 𝑋𝑖2 − ∑𝑛𝑖 𝑋𝑖 ∗ ∑𝑛𝑖(𝑌𝑖 ∗ 𝑋𝑖 )


𝑏= =
𝑒𝑐𝑢𝑎𝑐𝑖𝑜𝑛(3) 𝑛 ∗ ∑𝑛𝑖 𝑋𝑖2 − (∑𝑛𝑖 𝑋𝑖 )2
2. COEFICIENTE DE DETERMINACION Y CORRELACION

Una vez ajustada la recta de regresión, es importante disponer de una medida que mida
la bondad del ajuste realizado y que permita decidir si el ajuste lineal es correcto. Como
medida de bondad del ajuste se utiliza el coeficiente de determinación, definido por:

2
2∑𝑛𝑖(𝑌̂𝑖 − 𝑌̅)
R = 𝑛
∑𝑖 (𝑌𝑖 − 𝑌̅)2

𝑟 = √𝑅 2

 Donde R2 es el coeficiente de determinación y mide la cantidad de datos


que se encuentran sobre la recta linealizada.
 “r” es el coeficiente de correlación y mide cuan relacionados están las
variable Y y X.

3. APLICANDO A LA DISTRIBUCIÓN DE WEIBULL


La función acumulativa de distribución de fallos F(t) está dada por:

𝑡−𝛾 𝛽
−( )
𝐹(𝑡) = 1 − 𝑒 𝜂
𝑡−𝛾 𝛽
−( )
1 − 𝐹(𝑡) = 𝑒 𝜂
1 𝑡−𝛾 𝛽
( )
=𝑒 𝜂
1 − 𝐹(𝑡)

Para determinar los parámetros de la distribución de Weibull es necesario linealizar la


ecuación de la infiabilidad para que este se asemeje a la ecuación de una recta. Esto
se logra aplicando doble logaritmo neperiano a la ecuación anterior.

1
ln (ln ( )) = 𝛽 ∗ ln(𝑡 − 𝛾) − 𝛽 ∗ ln(𝜂)
1 − 𝐹(𝑡)
Si igualamos a la ecuación de la recta:
1
𝑌 = ln (ln ( ))
1 − 𝐹(𝑡)
𝑋 = ln(𝑡 − 𝛾)
𝑎=𝛽
𝑏 = −𝛽 ∗ ln(𝜂)
Para resolver estas ecuaciones se recurrirá a la fórmula de Bernard y que es igual a:
𝑖 − 0.3
𝐹(𝑖) =
𝑛 + 0.4

fallas Horas (t) Fi=(i-0.3)/(n+0.4)


1 520 0.012
2 575 0.028
3 1039 0.045
4 1052 0.061
5 1283 0.078
6 1880 0.094
7 2224 0.111
8 2409 0.127
9 2517 0.144
10 2715 0.161
11 2945 0.177
12 3000 0.194
13 3154 0.210
14 3179 0.227
15 3201 0.243
16 3256 0.260
17 3341 0.276
18 3353 0.293
19 3353 0.310
20 3422 0.326
21 3450 0.343
22 3542 0.359
23 3582 0.376
24 3592 0.392
25 3611 0.409
26 3613 0.425
27 3695 0.442
28 3812 0.459
29 3824 0.475
30 3865 0.492
31 3870 0.508
32 3918 0.525
33 3918 0.541
34 3955 0.558
35 3976 0.575
36 4150 0.591
37 4230 0.608
38 4232 0.624
39 4251 0.641
40 4299 0.657
41 4325 0.674
42 4343 0.690
43 4367 0.707
44 4413 0.724
45 4467 0.740
46 4508 0.757
47 4545 0.773
48 4735 0.790
49 4765 0.806
50 4803 0.823
51 4885 0.839
52 4985 0.856
53 5126 0.873
54 5149 0.889
55 5348 0.906
56 6005 0.922
57 6129 0.939
58 6350 0.955
59 6850 0.972
60 7683 0.988

 Con estos datos se procede a calcular los parámetros de la distribución Weibull


con mínimos cuadrados con un Y=0:
Horas
fallas (t) Fi=(i-0.3)/(n+0.4) Yi=ln(ln(1/1-Fi)) Xi=ln(t-γ) Xi^2 Xi*Yi
1 520 0.012 -4.452 6.254 39.110 -27.841
2 575 0.028 -3.556 6.354 40.378 -22.597
3 1039 0.045 -3.085 6.946 48.247 -21.428
4 1052 0.061 -2.761 6.958 48.420 -19.214
5 1283 0.078 -2.513 7.157 51.222 -17.987
6 1880 0.094 -2.311 7.539 56.837 -17.425
7 2224 0.111 -2.141 7.707 59.399 -16.498
8 2409 0.127 -1.992 7.787 60.637 -15.514
9 2517 0.144 -1.861 7.831 61.322 -14.572
10 2715 0.161 -1.743 7.907 62.513 -13.778
11 2945 0.177 -1.635 7.988 63.806 -13.059
12 3000 0.194 -1.536 8.006 64.102 -12.295
13 3154 0.210 -1.444 8.056 64.906 -11.631
14 3179 0.227 -1.358 8.064 65.033 -10.949
15 3201 0.243 -1.277 8.071 65.145 -10.306
16 3256 0.260 -1.201 8.088 65.420 -9.711
17 3341 0.276 -1.128 8.114 65.837 -9.154
18 3353 0.293 -1.059 8.118 65.896 -8.597
19 3353 0.310 -0.993 8.118 65.896 -8.060
20 3422 0.326 -0.929 8.138 66.227 -7.564
21 3450 0.343 -0.868 8.146 66.359 -7.074
22 3542 0.359 -0.809 8.172 66.789 -6.614
23 3582 0.376 -0.752 8.184 66.973 -6.156
24 3592 0.392 -0.697 8.186 67.018 -5.704
25 3611 0.409 -0.643 8.192 67.105 -5.265
26 3613 0.425 -0.590 8.192 67.114 -4.835
27 3695 0.442 -0.539 8.215 67.482 -4.425
28 3812 0.459 -0.488 8.246 67.995 -4.027
29 3824 0.475 -0.439 8.249 68.047 -3.621
30 3865 0.492 -0.390 8.260 68.223 -3.225
31 3870 0.508 -0.343 8.261 68.244 -2.831
32 3918 0.525 -0.296 8.273 68.448 -2.446
33 3918 0.541 -0.249 8.273 68.448 -2.060
34 3955 0.558 -0.203 8.283 68.604 -1.681
35 3976 0.575 -0.157 8.288 68.691 -1.303
36 4150 0.591 -0.112 8.331 69.403 -0.932
37 4230 0.608 -0.067 8.350 69.722 -0.557
38 4232 0.624 -0.022 8.350 69.730 -0.180
39 4251 0.641 0.023 8.355 69.805 0.196
40 4299 0.657 0.068 8.366 69.992 0.573
41 4325 0.674 0.114 8.372 70.093 0.952
42 4343 0.690 0.159 8.376 70.163 1.333
43 4367 0.707 0.205 8.382 70.255 1.718
44 4413 0.724 0.251 8.392 70.431 2.108
45 4467 0.740 0.298 8.404 70.635 2.506
46 4508 0.757 0.346 8.414 70.789 2.910
47 4545 0.773 0.394 8.422 70.926 3.322
48 4735 0.790 0.444 8.463 71.618 3.760
49 4765 0.806 0.496 8.469 71.725 4.197
50 4803 0.823 0.549 8.477 71.859 4.650
51 4885 0.839 0.604 8.494 72.147 5.128
52 4985 0.856 0.661 8.514 72.491 5.632
53 5126 0.873 0.723 8.542 72.967 6.172
54 5149 0.889 0.788 8.547 73.044 6.734
55 5348 0.906 0.859 8.584 73.693 7.373
56 6005 0.922 0.937 8.700 75.696 8.156
57 6129 0.939 1.027 8.721 76.052 8.956
58 6350 0.955 1.134 8.756 76.671 9.929
59 6850 0.972 1.273 8.832 78.004 11.240
60 7683 0.988 1.495 8.947 80.045 13.372
∑Y=-33.790 ∑X=489.183 ∑X^2=4003.849 ∑X*Y=-240.203

Entonces reemplazando en las ecuaciones siguientes, resulta:


𝑛 ∗ ∑𝑛𝑖(𝑌𝑖 ∗ 𝑋𝑖 ) − ∑𝑛𝑖 𝑋𝑖 ∗ ∑𝑛𝑖 𝑌𝑖 60 ∗ (−240.203) − (489.183) ∗ (−33.79)
𝑎= 2 =
𝑛 ∗ ∑𝑛𝑖 𝑋𝑖2 − (∑𝑛𝑖 𝑋𝑖 ) 60 ∗ (4003.849) − (489.183)^2

∑𝑛𝑖 𝑌𝑖 ∗ ∑𝑛𝑖 𝑋𝑖2 − ∑𝑛𝑖 𝑋𝑖 ∗ ∑𝑛𝑖(𝑌𝑖 ∗ 𝑋𝑖 ) (−33.79) ∗ (4003.849) − (489.183) ∗ (−240.203)


𝑏= =
𝑛 ∗ ∑𝑛𝑖 𝑋𝑖2 − (∑𝑛𝑖 𝑋𝑖 )2 60 ∗ (4003.849) − (489.183)^2

a= 2.28
b= -19.11

Y los parámetros 𝛽 & 𝜂 son:

 𝛽 = 𝑎 = 2.28

 𝑏 = −𝛽 ∗ ln(𝜂)
𝑏 −19.11
𝜂 = 𝑒 −𝑎 = 𝑒 −( 2.28
)
= 4449.64

BETA (𝛽) 2.28


ETA (𝜂) 4449.64

 Reemplazando los parámetros “eta” y “beta” en la ecuación de infiabilidad se obtiene:

𝑡−𝛾 𝛽
−( )
𝐹(𝑡) = 1 − 𝑒 𝜂

𝑡−𝛾 𝛽
−( )
fallas Horas (t) 𝐹(𝑡) = 1 − 𝑒 𝜂

1 520 0.0075
2 575 0.0095
3 1039 0.0359
4 1052 0.0369
5 1283 0.0573
6 1880 0.1314
7 2224 0.1865
8 2409 0.2193
9 2517 0.2393
10 2715 0.2774
11 2945 0.3236
12 3000 0.3349
13 3154 0.3668
14 3179 0.3721
15 3201 0.3767
16 3256 0.3882
17 3341 0.4061
18 3353 0.4086
19 3353 0.4086
20 3422 0.4232
21 3450 0.4291
22 3542 0.4485
23 3582 0.4569
24 3592 0.4590
25 3611 0.4630
26 3613 0.4634
27 3695 0.4807
28 3812 0.5051
29 3824 0.5076
30 3865 0.5161
31 3870 0.5171
32 3918 0.5270
33 3918 0.5270
34 3955 0.5346
35 3976 0.5389
36 4150 0.5740
37 4230 0.5898
38 4232 0.5902
39 4251 0.5940
40 4299 0.6033
41 4325 0.6084
42 4343 0.6118
43 4367 0.6164
44 4413 0.6252
45 4467 0.6354
46 4508 0.6430
47 4545 0.6499
48 4735 0.6840
49 4765 0.6892
50 4803 0.6957
51 4885 0.7096
52 4985 0.7261
53 5126 0.7484
54 5149 0.7519
55 5348 0.7812
56 6005 0.8616
57 6129 0.8741
58 6350 0.8942
59 6850 0.9307
60 7683 0.9687

 Con estos datos se calcula los coeficientes de determinación y correlación

Horas 𝑡−𝛾 𝛽
−( )
fallas (t) 𝐹(𝑡) = 1 − 𝑒 𝜂 Ŷi=ln(ln(1/1- 𝐹(𝑡)))
1 520 0.0075 -4.8843
2 575 0.0095 -4.6556
3 1039 0.0359 -3.3094
4 1052 0.0369 -3.2812
5 1283 0.0573 -2.8295
6 1880 0.1314 -1.9602
7 2224 0.1865 -1.5779
8 2409 0.2193 -1.3961
9 2517 0.2393 -1.2963
10 2715 0.2774 -1.1240
11 2945 0.3236 -0.9390
12 3000 0.3349 -0.8969
13 3154 0.3668 -0.7830
14 3179 0.3721 -0.7651
15 3201 0.3767 -0.7494
16 3256 0.3882 -0.7106
17 3341 0.4061 -0.6520
18 3353 0.4086 -0.6438
19 3353 0.4086 -0.6438
20 3422 0.4232 -0.5975
21 3450 0.4291 -0.5789
22 3542 0.4485 -0.5190
23 3582 0.4569 -0.4935
24 3592 0.4590 -0.4872
25 3611 0.4630 -0.4752
26 3613 0.4634 -0.4739
27 3695 0.4807 -0.4228
28 3812 0.5051 -0.3519
29 3824 0.5076 -0.3448
30 3865 0.5161 -0.3205
31 3870 0.5171 -0.3175
32 3918 0.5270 -0.2895
33 3918 0.5270 -0.2895
34 3955 0.5346 -0.2681
35 3976 0.5389 -0.2561
36 4150 0.5740 -0.1586
37 4230 0.5898 -0.1152
38 4232 0.5902 -0.1141
39 4251 0.5940 -0.1039
40 4299 0.6033 -0.0784
41 4325 0.6084 -0.0646
42 4343 0.6118 -0.0552
43 4367 0.6164 -0.0427
44 4413 0.6252 -0.0188
45 4467 0.6354 0.0089
46 4508 0.6430 0.0296
47 4545 0.6499 0.0482
48 4735 0.6840 0.1414
49 4765 0.6892 0.1558
50 4803 0.6957 0.1739
51 4885 0.7096 0.2124
52 4985 0.7261 0.2585
53 5126 0.7484 0.3219
54 5149 0.7519 0.3321
55 5348 0.7812 0.4184
56 6005 0.8616 0.6820
57 6129 0.8741 0.7285
58 6350 0.8942 0.8091
59 6850 0.9307 0.9816
60 7683 0.9687 1.2427

Del cuadro anterior obtenemos 𝑌̅, que es igual al promedio de la columna Ŷi:

𝑌̅ = −0.563

Para reemplazar en la fórmula del coeficiente de determinación se necesita el 𝑌̅ :


2
∑𝑛𝑖(𝑌̂𝑖 − 𝑌̅)
R2 =
∑𝑛𝑖(𝑌𝑖 − 𝑌̅)2

Yi=ln(ln(1/1- Ŷi=ln(ln(1/1-
Fi)) 𝐹(𝑡))) (Ŷi- Ῡ)^2 (Yi-Ῡ)^2
-4.452 -4.8843 18.672 15.122
-3.556 -4.6556 16.748 8.958
-3.085 -3.3094 7.542 6.359
-2.761 -3.2812 7.387 4.831
-2.513 -2.8295 5.136 3.803
-2.311 -1.9602 1.952 3.056
-2.141 -1.5779 1.030 2.489
-1.992 -1.3961 0.694 2.043
-1.861 -1.2963 0.538 1.684
-1.743 -1.1240 0.315 1.391
-1.635 -0.9390 0.141 1.148
-1.536 -0.8969 0.111 0.946
-1.444 -0.7830 0.048 0.775
-1.358 -0.7651 0.041 0.631
-1.277 -0.7494 0.035 0.509
-1.201 -0.7106 0.022 0.406
-1.128 -0.6520 0.008 0.319
-1.059 -0.6438 0.007 0.246
-0.993 -0.6438 0.007 0.185
-0.929 -0.5975 0.001 0.134
-0.868 -0.5789 0.000 0.093
-0.809 -0.5190 0.002 0.061
-0.752 -0.4935 0.005 0.036
-0.697 -0.4872 0.006 0.018
-0.643 -0.4752 0.008 0.006
-0.590 -0.4739 0.008 0.001
-0.539 -0.4228 0.020 0.001
-0.488 -0.3519 0.045 0.006
-0.439 -0.3448 0.048 0.015
-0.390 -0.3205 0.059 0.030
-0.343 -0.3175 0.060 0.049
-0.296 -0.2895 0.075 0.072
-0.249 -0.2895 0.075 0.099
-0.203 -0.2681 0.087 0.130
-0.157 -0.2561 0.094 0.165
-0.112 -0.1586 0.164 0.204
-0.067 -0.1152 0.201 0.247
-0.022 -0.1141 0.202 0.293
0.023 -0.1039 0.211 0.344
0.068 -0.0784 0.235 0.399
0.114 -0.0646 0.249 0.458
0.159 -0.0552 0.258 0.522
0.205 -0.0427 0.271 0.590
0.251 -0.0188 0.296 0.663
0.298 0.0089 0.327 0.742
0.346 0.0296 0.351 0.826
0.394 0.0482 0.374 0.917
0.444 0.1414 0.496 1.015
0.496 0.1558 0.517 1.121
0.549 0.1739 0.543 1.236
0.604 0.2124 0.601 1.362
0.661 0.2585 0.675 1.500
0.723 0.3219 0.783 1.653
0.788 0.3321 0.802 1.826
0.859 0.4184 0.964 2.022
0.937 0.6820 1.551 2.252
1.027 0.7285 1.669 2.529
1.134 0.8091 1.883 2.880
1.273 0.9816 2.386 3.370
1.495 1.2427 3.261 4.235
𝑛 𝑛
2
∑(𝑌̂𝑖 − 𝑌̅) = 80.294 ∑(𝑌𝑖 − 𝑌̅)2 = 89.019
𝑖 𝑖

Reemplazando:
2
2∑𝑛𝑖(𝑌̂𝑖 − 𝑌̅) 80.294
R = 𝑛 = = 0.902
∑𝑖 (𝑌𝑖 − 𝑌̅) 2 89.019

 El coeficiente de determinación: R^2=0.902 ó 90.2%


 El coeficiente de correlación de Pearson: r= 0.95

¿Cómo se interpretan estos resultados?

 El coeficiente de correlación de Pearson indica que el 95% de nuestros datos


(pares ordenados) están relacionados, es decir hay una correlacionan entre X y
Y.
 Mientras el coeficiente de determinación nos indica que el 90.2% de nuestros
datos están sobre la recta.

4. PRUEBAS DE BONDAD DE AJUSTE


a. PRUEBA DEL CHI CUADRADO

Compara las frecuencias que entregan los datos de la muestra (frecuencias


observadas) con las frecuencias esperadas, y tiene la siguiente fórmula cálculo:

Donde “Oi” representa a cada frecuencia observada y “ei” representa a cada


frecuencia esperada.

Grados de libertad: 𝒓 = 𝑵 − 𝟏 − 𝒑

Donde p es el número de variables estimadas, siendo para el caso de la


distribución weibull p=3.

𝑡−𝛾 𝛽
−( )
Fi=(i-0.3)/(n+0.4) F̂ i = 1 − 𝑒 𝜂 (Fi-F̂i)^2/(F̂i)
0.012 0.0075 0.0022
0.028 0.0095 0.0369
0.045 0.0359 0.0022
0.061 0.0369 0.0161
0.078 0.0573 0.0073
0.094 0.1314 0.0104
0.111 0.1865 0.0306
0.127 0.2193 0.0384
0.144 0.2393 0.0379
0.161 0.2774 0.0492
0.177 0.3236 0.0663
0.194 0.3349 0.0595
0.210 0.3668 0.0668
0.227 0.3721 0.0567
0.243 0.3767 0.0472
0.260 0.3882 0.0424
0.276 0.4061 0.0414
0.293 0.4086 0.0327
0.310 0.4086 0.0240
0.326 0.4232 0.0222
0.343 0.4291 0.0174
0.359 0.4485 0.0177
0.376 0.4569 0.0144
0.392 0.4590 0.0097
0.409 0.4630 0.0063
0.425 0.4634 0.0031
0.442 0.4807 0.0031
0.459 0.5051 0.0043
0.475 0.5076 0.0021
0.492 0.5161 0.0011
0.508 0.5171 0.0002
0.525 0.5270 0.0000
0.541 0.5270 0.0004
0.558 0.5346 0.0010
0.575 0.5389 0.0024
0.591 0.5740 0.0005
0.608 0.5898 0.0005
0.624 0.5902 0.0020
0.641 0.5940 0.0037
0.657 0.6033 0.0048
0.674 0.6084 0.0070
0.690 0.6118 0.0101
0.707 0.6164 0.0133
0.724 0.6252 0.0155
0.740 0.6354 0.0172
0.757 0.6430 0.0201
0.773 0.6499 0.0234
0.790 0.6840 0.0164
0.806 0.6892 0.0199
0.823 0.6957 0.0232
0.839 0.7096 0.0237
0.856 0.7261 0.0232
0.873 0.7484 0.0206
0.889 0.7519 0.0250
0.906 0.7812 0.0198
0.922 0.8616 0.0043
0.939 0.8741 0.0048
0.955 0.8942 0.0042
0.972 0.9307 0.0018
0.988 0.9687 0.0004
∑(Fi-
F̂i)^2/(F̂i)=1.0790

Como el valor de X^2 es , tenemos:

X^2= 1.0790

El GRADO DE LIBERTAD es: 60-1-3=56


GRADO DE CONFIANZA DE 95%

GRADO DE LIBERTAD DE 56

(Fuente: ttp://www.davidgiuliodori.com.ar/IUA_Estadistica_Superior.html)

Comparando con la tabla anterior para un nivel de significación de 0.05 o un grado


de confianza de 95%, el valor de chi cuadrado es menor para un grado de libertad
entre 40 y 60.

X^2(calculado) < X^2(tabla)


1.079 < 1.6745

Por lo que sí se puede usar la distribución de Weibull para los datos analizados.
b. PRUEBA DE KOLMOGOROV-SMIRNOV

En estadística, la prueba de Kolmogórov-Smirnov (también prueba K-S) es una


prueba no paramétrica que se utiliza para determinar la bondad de ajuste de dos
distribuciones de probabilidad entre sí.

𝐷 + 𝑛=max(Fn(x)−F(x))
𝐷 − 𝑛 =max(F(x)−Fn(x))

D=max[𝐷 + 𝑛, 𝐷 − 𝑛]
Donde:
 Fn(x) es la frecuencia observada
 Fn es la frecuencia esperada

𝑡−𝛾 𝛽
−( )
Fi=(i-0.3)/(n+0.4) 𝑒 𝜂
F̂ i = 1 − Fi-F̂i F̂i-Fi
0.012 0.0075 0.00405 -0.0041
0.028 0.0095 0.01868 -0.0187
0.045 0.0359 0.00882 -0.0088
0.061 0.0369 0.02437 -0.0244
0.078 0.0573 0.02048 -0.0205
0.094 0.1314 -0.03699 0.0370
0.111 0.1865 -0.07557 0.0756
0.127 0.2193 -0.09181 0.0918
0.144 0.2393 -0.09528 0.0953
0.161 0.2774 -0.11685 0.1169
0.177 0.3236 -0.14648 0.1465
0.194 0.3349 -0.14120 0.1412
0.210 0.3668 -0.15657 0.1566
0.227 0.3721 -0.14524 0.1452
0.243 0.3767 -0.13328 0.1333
0.260 0.3882 -0.12826 0.1283
0.276 0.4061 -0.12959 0.1296
0.293 0.4086 -0.11557 0.1156
0.310 0.4086 -0.09901 0.0990
0.326 0.4232 -0.09701 0.0970
0.343 0.4291 -0.08636 0.0864
0.359 0.4485 -0.08921 0.0892
0.376 0.4569 -0.08109 0.0811
0.392 0.4590 -0.06663 0.0666
0.409 0.4630 -0.05408 0.0541
0.425 0.4634 -0.03794 0.0379
0.442 0.4807 -0.03860 0.0386
0.459 0.5051 -0.04646 0.0465
0.475 0.5076 -0.03240 0.0324
0.492 0.5161 -0.02434 0.0243
0.508 0.5171 -0.00881 0.0088
0.525 0.5270 -0.00215 0.0022
0.541 0.5270 0.01440 -0.0144
0.558 0.5346 0.02337 -0.0234
0.575 0.5389 0.03563 -0.0356
0.591 0.5740 0.01706 -0.0171
0.608 0.5898 0.01777 -0.0178
0.624 0.5902 0.03394 -0.0339
0.641 0.5940 0.04677 -0.0468
0.657 0.6033 0.05396 -0.0540
0.674 0.6084 0.06548 -0.0655
0.690 0.6118 0.07857 -0.0786
0.707 0.6164 0.09052 -0.0905
0.724 0.6252 0.09831 -0.0983
0.740 0.6354 0.10469 -0.1047
0.757 0.6430 0.11360 -0.1136
0.773 0.6499 0.12332 -0.1233
0.790 0.6840 0.10577 -0.1058
0.806 0.6892 0.11710 -0.1171
0.823 0.6957 0.12710 -0.1271
0.839 0.7096 0.12977 -0.1298
0.856 0.7261 0.12987 -0.1299
0.873 0.7484 0.12414 -0.1241
0.889 0.7519 0.13717 -0.1372
0.906 0.7812 0.12444 -0.1244
0.922 0.8616 0.06054 -0.0605
0.939 0.8741 0.06467 -0.0647
0.955 0.8942 0.06112 -0.0611
0.972 0.9307 0.04120 -0.0412
0.988 0.9687 0.01969 -0.0197

D+max 0.137
D-max 0.157

D 0.157
GRADO DE CONFIANZA DE 95%

60 0.138 0.147 0.158 0.176 0.210

Para un nivel de significancia igual a 0.05 el Dcritico es 0.176

Por lo que:
D<Dcritico
0.157<0.176
Entonces, se demuestra que se puede usar la distribución weibull para los datos
analizados.
c. PRUEBA DE ANDERSON-DARLING

En estadística, la prueba de Anderson-Darling es una prueba no paramétrica sobre


si los datos de una muestra provienen de una distribución específica.

Se calcula el estadístico “A^2”de la siguiente manera:

En que “N” es el número total de muestras, F es la distribución de probabilidad e “Y”


es la variable aleatoria que el problema analizado es igual al tiempo “Y=t”.

F(Yk)=F̂i Ln(F̂i) F(YN+1-k)=FN+1-i ln(1-FN+1-i) S


0.0075 -4.88809425 0.9687 -3.46492494 -0.13921699
0.0095 -4.66031224 0.9307 -2.6686806 -0.36644964
0.0359 -3.32765805 0.8942 -2.24596895 -0.46446892
0.0369 -3.2998881 0.8741 -2.07205666 -0.62672689
0.0573 -2.85888228 0.8616 -1.97790508 -0.7255181
0.1314 -2.02980207 0.7812 -1.51954314 -0.65071329
0.1865 -1.67932708 0.7519 -1.39393868 -0.66587425
0.2193 -1.51732612 0.7484 -1.37981224 -0.72428459
0.2393 -1.42996926 0.7261 -1.29496889 -0.77206581
0.2774 -1.2821152 0.7096 -1.23661953 -0.79759933
0.3236 -1.1281583 0.6957 -1.18989537 -0.81131879
0.3349 -1.09390723 0.6892 -1.16858421 -0.86728839
0.3668 -1.00284353 0.6840 -1.15191194 -0.89781478
0.3721 -0.98870496 0.6499 -1.04942672 -0.91715926
0.3767 -0.97640663 0.6430 -1.03008996 -0.96980668
0.3882 -0.94623856 0.6354 -1.00889788 -1.01015383
0.4061 -0.9011939 0.6252 -0.98136254 -1.03540604
0.4086 -0.89498512 0.6164 -0.95824284 -1.08104964
0.4086 -0.89498512 0.6118 -0.9463029 -1.13546094
0.4232 -0.8599872 0.6084 -0.93740298 -1.16830361
0.4291 -0.84612048 0.6033 -0.92463069 -1.21001329
0.4485 -0.8018801 0.5940 -0.90130875 -1.22061867
0.4569 -0.78326125 0.5902 -0.89216932 -1.25657292
0.4590 -0.77866357 0.5898 -0.89121031 -1.30806787
0.4630 -0.76999016 0.5740 -0.85332313 -1.32570585
0.4634 -0.76908189 0.5389 -0.77408853 -1.31169485
0.4807 -0.73260389 0.5346 -0.76481764 -1.32272235
0.5051 -0.68305128 0.5270 -0.74863538 -1.31237944
0.5076 -0.67812962 0.5270 -0.74863538 -1.35542675
0.5161 -0.66153376 0.5171 -0.72793075 -1.36630677
0.5171 -0.65953295 0.5161 -0.72579272 -1.40841443
0.5270 -0.64057673 0.5076 -0.70839371 -1.41641897
0.5270 -0.64057673 0.5051 -0.70334605 -1.45591634
0.5346 -0.62627164 0.4807 -0.65518838 -1.43096369
0.5389 -0.61826959 0.4634 -0.62257383 -1.42696994
0.5740 -0.55512054 0.4630 -0.62179 -1.39267748
0.5898 -0.52790233 0.4590 -0.61437121 -1.38976614
0.5902 -0.527236 0.4569 -0.61048662 -1.42215327
0.5940 -0.52093978 0.4485 -0.5950862 -1.43223334
0.6033 -0.50530405 0.4291 -0.56049974 -1.40330831
0.6084 -0.49699442 0.4232 -0.55020335 -1.41371699
0.6118 -0.49130652 0.4086 -0.5252858 -1.40628604
0.6164 -0.48380448 0.4086 -0.5252858 -1.42954456
0.6252 -0.46968379 0.4061 -0.5210183 -1.43651804
0.6354 -0.453533 0.3882 -0.49134734 -1.4015725
0.6430 -0.44157143 0.3767 -0.47266662 -1.38659439
0.6499 -0.43099589 0.3721 -0.46530781 -1.38927073
0.6840 -0.37984408 0.3668 -0.45702399 -1.32504112
0.6892 -0.37223345 0.3349 -0.40782596 -1.26109605
0.6957 -0.36276933 0.3236 -0.39101314 -1.24374108
0.7096 -0.3430033 0.2774 -0.3249684 -1.12441903
0.7261 -0.32007633 0.2393 -0.27353762 -1.01903727
0.7484 -0.28985215 0.2193 -0.2475611 -0.94047318
0.7519 -0.2851469 0.1865 -0.20640866 -0.8766074
0.7812 -0.24693922 0.1314 -0.14082826 -0.70444425
0.8616 -0.14891632 0.0573 -0.05904198 -0.38472285
0.8741 -0.13459084 0.0369 -0.03758484 -0.3242642
0.8942 -0.11185372 0.0359 -0.03653643 -0.28441445
0.9307 -0.0718652 0.0095 -0.00950857 -0.15867885
0.9687 -0.03177487 0.0075 -0.00756431 -0.0780227
∑ -62.5834762

S= -62.5834762

A^2= 2.58347616

Con el valor de A2 calculado se procede a calcular el valor del A2 ajustado con la


siguiente tabla:
𝟎.𝟐
A2ajustado=(𝟏 + ) ∗ 𝟐. 𝟓𝟖𝟑 = 𝟐. 𝟔𝟓
√𝟔𝟎

2.65 < 0.757 ¡NO CUMPLE!

Comparando el valor anterior con los datos que aparecen en la tabla para una
distribución weibull, es mayor por lo que se descarta con esta prueba de ajuste el uso
de la distribución weibull para los datos analizados.
d. PRUEBA DE BONDAD DE AJUSTE DE SHAPIRO-WILKS

Dada una muestra aleatoria simple de tamaño n,


(x1, x2, ..., xn),
Se quiere saber si procede de una población con distribución normal. Este problema es
muy frecuente, ya que no son pocas las pruebas de inferencia estadística que exigen
como condición imprescindible para su aplicabilidad que la población de procedencia de
la muestra sea normal.
El contraste que se desarrolla en esta sección recibe el nombre de Shapiro-Wilks y el
método consiste en seguir los siguientes pasos:

1. Se ordena la muestra de menor a mayor, obteniendo el nuevo vector muestral


(x(1), x(2), ..., x(n)), Siendo x(i) el i-ésimo valor muestral tas la ordenación.

2. Se calcula el estadístico de contraste

,
Siendo s2 la varianza muestral,

y las ai n suelen aparecer tabuladas en los manuales, además

3. La distribución del estadístico W se encuentra también tabulada para cada nivel


de significación.
El contraste de normalidad se plantea en los siguientes términos:

H0: Si W>W tabla "la muestra procede de una población normal"

Frente a la alternativa:
H1: Si W > W tabla "la muestra no procede de una población normal".
Instrucciones

 Resuelve el valor W. La prueba Shapiro Wilks es interpretada basada en este


valor. Por lo tanto, debes calcularlo.
 Identifica el nivel alfa. Este nivel se usa cuando comparas el valor W. El nivel alfa
se ofrece con frecuencia en problemas o puede localizarse en la gráfica alfa.
 Compara el nivel alfa con el valor W. Rechaza la hipótesis nula de que el valor W
es menor que el nivel alfa. Si éste es mayor que el nivel alfa, no rechaces la
hipótesis nula.

horas menor horas mayor a coeficiente para D=a*(X(n-


fallas
a mayor menor contraste “a” i+1)-Xi)

1 520 7683 0.3751 2687

2 575 6850 0.2574 1615

3 1039 6350 0.226 1200

4 1052 6129 0.2032 1032

5 1283 6005 0.1847 872

6 1880 5348 0.1691 586

7 2224 5149 0.1554 455

8 2409 5126 0.143 389

9 2517 4985 0.1317 325

10 2715 4885 0.1212 263

11 2945 4803 0.1113 207

12 3000 4765 0.102 180

13 3154 4735 0.0932 147

14 3179 4545 0.0846 116

15 3201 4508 0.0764 100

16 3256 4467 0.0685 83

17 3341 4413 0.0608 65

18 3353 4367 0.0532 54

19 3353 4343 0.0459 45

20 3422 4325 0.0386 35

21 3450 4299 0.0314 27

22 3542 4251 0.0244 17

23 3582 4232 0.0174 11


24 3592 4230 0.0104 7

25 3611 4150 0.0035 2

26 3613 3976 ∑D 10519

27 3695 3955

28 3812 3918 S^2= 403427

29 3824 3918

30 3865 3870

31 3870 3865

32 3918 3824

33 3918 3812

34 3955 3695

35 3976 3613

36 4150 3611

37 4230 3592

38 4232 3582

39 4251 3542

40 4299 3450

41 4325 3422

42 4343 3353

43 4367 3353

44 4413 3341

45 4467 3256

46 4508 3201

47 4545 3179

48 4735 3154

49 4765 3000

50 4803 2945

51 4885 2715

52 4985 2517

53 5126 2409

54 5149 2224

55 5348 1880

56 6005 1283

57 6129 1052

58 6350 1039
59 6850 575

60 7683 520

Analizamos el estadístico:

W>W tabla
4.57>0.974

CONCLUSIÓN
La muestra proviene de una distribución normal, por lo tanto podemos usar la
distribución de weibull.
COEFICIENTES a PARA LA PRUEBA DE NORMALIDAD DE SHAPIROWILK.

You might also like