You are on page 1of 7

Modelos de regresin para observaciones censuradas

FIABILIDAD (VII): MODELOS DE REGRESIN


PARA OBSERVACIONES CENSURADAS
Autores: ngel A. Juan Prez (ajuanp@uoc.edu), Rafael Garca Martn (rgarciamart@uoc.edu).

RELACIN CON OTROS MATH-BLOCS__________________________________


Este math-block forma parte de una serie de 8 documentos relacionados todos ellos con la Fiabilidad
de componentes desde un punto de vista estadstico:

Conceptos Bsicos (I).


Identificacin y descripcin grfica de los datos (II).
Anlisis paramtrico de los tiempos de fallo (III).
Anlisis no paramtrico de los tiempos de fallo (IV).
Comparacin no paramtrica de muestras (V).
Tests de vida acelerada (VI).
Modelos de regresin para observaciones censuradas (VII).
Anlisis Probit (xito / fracaso) (VIII).

ESQUEMA DE CONTENIDOS___________________________________________

Regresin mltiple
con obs. censuradas

Fiabilidad (VII): Modelos


de regresin para obs.
censuradas

Ejemplo reg. mltiple con


obs. cens. (Minitab)

Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

Modelos de regresin para observaciones censuradas

INTRODUCCIN_____________________________________________________
En cualquier investigacin sobre anlisis de fiabilidad puede resultar de sumo inters identificar
aquellas variables que estn correlacionadas con los tiempos de fallo. Bsicamente, hay dos razones
por las cuales este proceso de identificacin no se puede realizar utilizando las tcnicas comunes de
regresin mltiple:
1) La variable dependiente (tiempos de fallo) no suele distribuirse de forma normal
(condicin necesaria para aplicar regresin por mnimos cuadrados).
2) La existencia de observaciones censuradas

El objetivo de la regresin con observaciones censuradas ser encontrar una expresin matemtica
que nos describa el tiempo de fallo de una determinada proporcin de unidades (percentil de T Tp)
en funcin de una o varias v.a. independientes (temperatura, horas de trabajo al da, grupo a que
pertenecen los datos, etc.).
Para llevar a cabo de forma efectiva estos tests de vida acelerada, ser conveniente recurrir a
software especializado. En este captulo se har uso del programa MINITAB a fin de ejemplificar con
casos prcticos los conceptos involucrados en este tipo de estudios.

REGRESIN MLTIPLE CON OBS. CENSURADAS_________________________


Por defecto, MINITAB usar un modelo de regresin lineal a la hora de explicar la relacin existente
entre las variables independientes X1, X2, ..., Xn y la variable dependiente Tp (percentil de orden p de
T). Sin embargo, es posible construir modelos no lineales sin ms que transformar las variables
explicativas del modelo.
Adems, segn la distribucin que sigan los tiempos de fallo T (exponencial, Weibull, etc.), puede
resultar conveniente (ver tabla) realizar alguna de las siguientes transformaciones del percentil Tp:
Yp = Tp

( )

Yp = Ln Tp

( )

Yp = Log10 Tp

El modelo de regresin lineal mltiple tendr pues la forma:


Yp = b 0 + b1 X1 + ... + bn X n + p

donde:

b0, b1, ..., bn son el trmino independiente y los coeficientes de regresin

= parmetro de escala (escala = 1 / forma)

p = percentil de orden p de la distribucin de los residuos (), la cual vendr


determinada por la distribucin de T (ver tabla).

En la tabla siguiente se relaciona la distribucin de los tiempos de fallo T con:


1) Las transformaciones idneas para Tp , y
2) Las distribuciones que siguen los residuos

Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

Modelos de regresin para observaciones censuradas


Yp
Ln Tp
Log10 Tp
Tp

Distrib. de tiempos de fallo (T)


Weibull
exponencial
log-normal base e
log-logstica
log-normal base 10
normal
valores extremos
logstica

Distrib. de
valores extremos (0,1)
normal (0,1)
logstica (0,1)
normal (0,1)
valores extremos (0,1)
logstica (0,1)

EJEMPLO REGRESIN MLTIPLE CON OBS. CENSURADAS________________


Continuando con el ejemplo de las capas aislantes para motores (ver el math-block Fiabilidad VI),
supngase ahora que se desean estimar los tiempos en que una determinada proporcin de
protecciones aislantes fallan, en funcin no slo de las temperaturas, sino tambin de la planta donde
fueron construidas (planta 1 o planta 2), i.e., se buscar una expresin de la forma:
Yp = a + bX1 + cX 2 + p

Entrada de datos (input): se debe indicar la variable donde se han registrado los tiempos de fallo T,
la distribucin que siguen dichas observaciones, y las variables independientes del modelo (en este
caso ArrTemp X1 y Planta X2). Indicaremos tambin la columna de censura y aquellas columnas
donde se guardan los valores de las variables independientes para los cuales se desean hacer
predicciones (ArrNuevaT y NuevaPlant).

Finalmente, se pedir un grfico de probabilidad para los residuos, a fin de estimar si la distribucin
escogida es o no adecuada:

Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

Modelos de regresin para observaciones censuradas

Salida de datos (output):

Regression with Life Data: T versus ArrTemp; Planta


Response Variable: T
Censoring Information
Uncensored value
Right censored value
Censoring value: Censura = C

Informacin sobre la
distribucin elegida

Count
66
14

Estimation Method: Maximum Likelihood


Distribution: Weibull

Valores estimados de a, b1, b2, y


1/ (shape=1/scale), as como los
p-valores asociados al test con H0:
el coeficiente es 0 (i.e., no tiene
razn de existir en el modelo)

Regression Table
Predictor
Intercept
ArrTemp
Planta
Shape

Coef
-15,1603
0,83925
-0,18077
2,9431

Standard
Error
0,9468
0,03397
0,08457
0,2707

Z
P
-16,01 0,000
24,71 0,000
-2,14 0,033

95,0% Normal CI
Lower
Upper
-17,0160
-13,3047
0,77267
0,90584
-0,34652
-0,01501
2,4577
3,5244

Log-Likelihood = -562,525

Predicciones (basadas en el modelo


creado) para los tiempos de fallo del
Anderson-Darling (adjusted) Goodness-of-Fit 50% de dispositivos bajo los valores de
Standardized Residuals = 0,5078
temperatura y planta indicados: (80,1),
(80,2),(100,1),y (100,2)

Table of Percentiles
Percent
50
50
50
50

Predictor
Row Number Percentile
1
182093,6
2
151980,8
3
41530,38
4
34662,51

Standard
Error
Lower
32466,16
128389,8
25286,65
109689,6
5163,756
32548,44
3913,866
27781,00

Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

95,0% Normal CI
Upper
258260,9
210577,6
52990,94
43248,61

Modelos de regresin para observaciones censuradas

La tabla de regresin proporciona los coeficientes del modelo. En este caso, dado que se ha usado
una Weibull, la ecuacin del modelo sera:
Ln Tp = 15,1603 + 0,83925 ArrTemp 0,18077 Planta +

1
p
2,9431

donde la variable Planta puede tomar los valores 1 2, y sigue una distrib. de valores extremos
(0,1).
A partir de los p-valores asociados a cada coeficiente (0,000 para ArrTemp, y 0,033 para Planta), los
cuales son significativos para = 0,05, se puede afirmar que: (1) la temperatura influye de forma
decisiva sobre los tiempos de fallo (ms altas temperaturas significan menor tiempo hasta el fallo), y
(2) la calidad de la capa aislante depender de la planta de produccin en la que fue construida (las
capas aislantes fabricadas en la planta 1 duran ms).
La tabla de percentiles muestra el percentil de orden 50 asociado a cada combinacin de
temperatura y planta de produccin. Dado que este percentil es una buena aproximacin a la
esperanza de vida de una unidad, es posible pronosticar lo siguiente: a 80 C, las protecciones
fabricadas en la planta 1 durarn unas 182.093,6 horas (o 20,77 aos), mientras que la duracin
esperada de las de la planta 2 ser de tan slo 151.980,8 horas (17,34 aos). Anlogas conclusiones
se pueden extraer para una temperatura de 100 C.
Aunque MINITAB hace todos los clculos de forma automtica, resulta interesante entender cmo el
programa obtiene sus predicciones a partir del modelo. Por ejemplo, para una proteccin fabricada en
la planta 1 (Planta = 1), y sometida una temperatura de 80 C (ArrTemp = 32,85998), el modelo
anterior sera:
Ln Tp = 15,1603 + 0,83925 32,85998 0,18077 1 + 0,33978 p

Se sabe que los residuos siguen en este caso una distribucin de valores extremos (0,1), cuya f.d.
viene dada por:

{ }

F(x) = P(X x) = 1 exp e x


Por tanto, el percentil de orden 50 de esta distribucin ser:

0,50 = P(X <= 50) = 1-exp{-exp{50}} 50 = -0,36651


Finalmente, sustituyendo en la expresin del modelo y tomando exponenciales, se obtiene el valor
para T50 de 182.093,6 horas que aparece en la tabla de percentiles.

Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

Modelos de regresin para observaciones censuradas


Por lo que respecta a la bondad del ajuste, en el grfico siguiente se aprecia que las observaciones
estn suficientemente cerca de la recta de probabilidad, por lo que se puede dar por bueno el ajuste
mediante la Weibull:

Probability Plot for SResids of T


Extreme value Distribution - ML Estimates - 95,0% CI
Censoring Column in Censura
99,9
99
95
90
80
70
60
50
40
30

Failure
Censor
AD*

66
14
0,5078

Percent

20
10
5
3
2
1

0,1
-8

-4

Standardized Residuals

BIBLIOGRAFA______________________________________________________
[1].
[2].
[3].
[4].
[5].
[6].
[7].
[8].
[9].
[10].
[11].
[12].

Hager, H. W., and L. J. Bain. 1970. Inferential procedures for thegeneralized gamma distribution J.
Am. Stat. Assoc. 65: 1601-1609.
Harter, H. L. 1967. Maximum-likelihood estimation of the parametersof a four-parameter generalized
gamma population for complete and censored samples. Technometrics 9: 159-165.
Kaplan, E. L., and P. Meier. 1958. Nonparametric estimation from incomplete observations. J. Am.
Stat. Assoc. 53: 457-481.
Nelson, W. 1990. Accelerated Testing: Statistical Models, Test Plansand Data Analyses. John Wiley.
pp: 75-85.
Nelson, W. B., and G. J. Hahn. 1972. Linear estimation of regression relationships from censored
data, Part I-Simple methods and their application (with discussion). Technometrics 14: 247-276.
Stacy, E.W., and G. A. Mihram. 1965. Parameter estimation for a Generalized Gamma distribution.
Technometrics 7: 349-358.
Stacy, E. W. 1962. A generalization of the Gamma distribution. Ann.Math. Stat. 33: 1187-1192.
Parr, V. H., and J. T. Webster. 1965. A method for discriminating between failure density functions
used in reliability predictions.Technometrics 7: 1-10.
Prentice, R. L. 1974. A Log Gamma Model and its maximum likelihood estimation. Biometrika 61:
539-544.
Farewell, V. T., and R. L. Prentice 1977. A study of distributional shape in life testing. Technometrics
19: 69-75.
Galambos, J. 1978. The Asymtotic Theory of Extreme Order Statistics.Wiley-Interscience. New York.
pp: 189-191.
Lawless, J. F. 1982. Statistical Models and Methods for Lifetime Data.John Wiley. pp: 298-321.

Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

Modelos de regresin para observaciones censuradas

ENLACES___________________________________________________________
Los siguientes artculos son un excelente material para quien desee profundizar ms sobre este tema:
[W1]

http://www.colpos.mx/agrocien/Bimestral/2000/jul-ago/art-9.pdf

[W2]

http://bear.fhcrc.org/~clk/papers/weipan.pdf

Proyecto e-Math
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

You might also like