You are on page 1of 7

Una Introducción al Análisis de Fallas

Las personas con las que hemos trabajado comenzaron a realizar análisis de fallas en equipos industriales a mediados de la década
de 1960. Sus esfuerzos se vincularon principalmente con un interés en mejorar la confiabilidad de los equipos y la capacidad de
producción en plantas químicas. Antes de ese momento, la mayoría de los análisis de fallas industriales simplemente involucraban
tratar de entender las raíces físicas del problema. Desde su punto de vista de trabajo y fabricación y procesamiento, no fue hasta
principios de la década de 1970 que se comenzó a desarrollar que las verdaderas fuentes de nuestros problemas eran mucho más
complejas.

¿Qué es el análisis de fallas? Probablemente hay tantas definiciones como personas a las que se les pregunta, pero preferimos
pensar en ello como "el proceso de interpretación de las características de un sistema o componente deteriorado para determinar
por qué ya no realiza la función deseada". El análisis de fallas primero implica utilizar la lógica deductiva para encontrar las causas
mecánicas y humanas de la falla, y luego utilizar la lógica inductiva para encontrar las causas latentes. Además, también debería
conducir a los cambios necesarios para evitar la repetición de fallos.

Muchas personas en la industria prefieren no usar el término análisis de fallas, y hemos escuchado la afirmación más de una vez
de que "No queremos que nuestro programa de mejora de mantenimiento (o algún programa similar) se centre en las fallas". Es
fácil de entender sus palabras pero imposible entender su lógica. ¿Qué mejor y más eficiente manera de mejorar que mirar
inteligentemente nuestras debilidades y errores, aprender de ellos e intentar hacer un mejor trabajo la próxima vez?

Este libro es mi intento de un manual que explica cómo y por qué falla la maquinaria mecánica. Para hacer eso, he tratado de
explicar cómo se producen los mecanismos básicos de falla, las cosas que todos hacemos para causar problemas de maquinaria,
cómo reconocer esas cosas y qué hacer para prevenir fallas en el futuro.

LAS CAUSAS DE LAS FALLAS

¿Por qué hay fallas prematuras del equipo? Cuando a las personas involucradas se les hace esta pregunta, la respuesta casi
siempre es "él tuvo la culpa". Si alguien le preguntara a un ingeniero mecánico o un mecánico de mantenimiento, la respuesta más
probable a esa pregunta sería "error del operador". Pero si se hizo la misma pregunta a un operador que trabajaba en la planta con
ese ingeniero; su respuesta podría ser "no se reparó adecuadamente". En ocasiones, ambas respuestas tienen cierta validez, pero la
respuesta honesta y completa es Mucho más complejo.

Sería bueno y limpio si hubiera una sola causa por falla, porque corregir el problema sería fácil. Sin embargo, en realidad,
existen múltiples causas para la falla de cada equipo. Desafortunadamente, hay muchas personas que creen que solo hay una causa
para un fracaso. Sin embargo, observe cualquier desastre mayor bien estudiado y pregunte si hubo una sola causa. ¿Hubo una sola
causa para Three Mile Island? ¿El problema de Exxon Valdez? Bhopal Chernobyl? ¿Un accidente aéreo importante? Al observar
estas y otras fallas bien reconocidas y ampliamente estudiadas, los informes muestran que todas tienen múltiples causas. Entonces,
¿por qué una persona inteligente cree que una falla típica de una bomba o ventilador sería diferente? (En el caso de Three Mile
Island, hubo tres estudios grandes, cada uno encargado por uno de los grupos responsables. Los tres estudios dijeron que había
muchas causas, pero que era "principalmente la culpa de las otras organizaciones").

En una conferencia internacional sobre análisis de fallas, se realizó una presentación sobre las causas de las fallas en los equipos
de las aeronaves. Los datos de la presentación se muestran a continuación:

 30% — Errores de Fabricación


 26% — Errores de Diseño
 23% — Errores de Mantenimiento
 18% — Selección de Material
 3% — Operación

Durante la sesión de preguntas y respuestas después de la presentación, un miembro de la audiencia le preguntó al orador por
qué habían enumerado solo una causa por cada falla, cuando por lo general había múltiples causas. El orador estuvo de acuerdo
con el interrogador y luego dijo: "... solo había un espacio en blanco en el formulario". Esta respuesta es una cita y un testimonio
interesante de la falta de percepción del público. Piensan en casos que han sido cuidadosamente estudiados, como los que se
mencionaron anteriormente, y están de acuerdo en que obviamente hay múltiples causas para cada uno. Sin embargo, cuando están
directamente involucrados con un problema, muchas personas aún ignoran la realidad y presentan datos como los que se muestran
en el estudio anterior. Luego toman estos datos, dibujan un diagrama circular (pastel) o un gráfico de barras, y señalan una buena
causa única para cada falla, cuando la lógica simple y honesta indica claramente que eso no es cierto.

Dos comentarios:

Un momento después de la sesión, otro grupo analizó el mismo conjunto de datos básicos y llegó a conclusiones muy
diferentes. ¡Ellos también clasificaron los datos con la idea de una causa única para cada falla!
Una de las preguntas que me parece interesante es: "¿Por qué no reconocen que muchas fallas tienen más de una causa física
y todas las fallas tienen más de una causa humana?" Sospecho que existe un deseo humano innato de categorizar cuidadosamente
los problemas y responde, pero la respuesta a esto está en las personas que son más hábiles que yo.
Trevor Kletz ha escrito una fascinante serie de libros que detallan los eventos que llevaron a muchos de los principales desastres
industriales del mundo. En su enfoque de las fallas, utiliza un sistema de tres niveles para clasificar las causas; usaremos un método
similar. En este enfoque, hay tres clases generales de causas o raíces de falla, y hasta que el investigador no entienda cada una de
estas clases y su interacción inevitable, no comprenden realmente cómo y por qué ocurrió la falla y no tienen la capacidad de
prevenir otra.

Las divisiones que hemos utilizado para estas raíces y algunos ejemplos son:

Raíces físicas — Este es el mecanismo físico que causó la falla, es decir, el eje falló en la rotación de la fatiga por flexión
complicada por la corrosión y una concentración de tensión significativa.

Raíces Humanas — Así es como la “intervención humana inapropiada” resultó en las raíces físicas. Continuando con el ejemplo
anterior:

Cuando se diseñó el eje, el ingeniero no esperaba las condiciones corrosivas y usó una aleación que era relativamente sensible
a la corrosión.

El maquinista que hizo el eje cortó una esquina afilada donde debería haber habido un radio suave.

El molinero que instaló la máquina la desalinizó significativamente, causando vibración y una carga de flexión imprevista en el
eje.

Raíces latentes (debilidades del sistema) — Estas son las políticas o acciones corporativas que son causa de “acción humana
inapropiada”. De nuevo persiguiendo el ejemplo anterior:

El ingeniero fue presionado por la supervisión para completar rápidamente esta tarea y no analizó cuidadosamente la gama
completa de condiciones que la máquina iba a experimentar. Además, solo tenía dos años fuera de la universidad como ingeniero
mecánico, no le fue bien en sus clases de materiales o realmente no entendía el uso de diferentes aleaciones, y su supervisor no
tenía idea de estas debilidades.

Después de que el maquinista hizo el eje, fue enviado a la planta para su instalación. Desafortunadamente, no se recibió ninguna
inspección para los materiales utilizados en el mantenimiento de la planta y el eje fue aceptado con el error.

La gerencia de mantenimiento había declarado que los molineros debían usar equipos de alineación láser, pero la política no se
aplicaba, y este mecánico no había estado en la clase de alineación. (Fue un "trabajo intenso" y tuvo que volver a funcionar lo antes
posible, para que no pudieran perder tiempo en la alineación).

Un dilema realmente importante de la industria es que los problemas que no son el resultado de fallas catastróficas a menudo
no son reconocidos en absoluto. A menudo, los problemas de corrosión y desgaste normales, en los cuales el desperdicio lento
destruye un componente o un equipo, no se reconocen como oportunidades de mejora y se ignoran. Una fuga inesperada en una
tubería o embarcación puede reconocerse como una falla, pero el deterioro a largo plazo de un tanque o el reemplazo de rutina
de un conjunto de correas trapezoidales se considera “solo una parte del costo de hacer negocios”.
Gran parte del mantenimiento de rutina que realiza una planta o instalación cae en esta categoría de "falla ignorada". Durante
una reciente asignación en una planta que generalmente fue aceptada en su industria por tener un excelente programa de
mantenimiento, uno de sus técnicos en instrumentos descubrió que gastaba más de $300 por día en reemplazo de los filtros del
sistema de gas que deberían haber costado menos de una décima parte. En una planta similar, las entrevistas extensas con el
personal de mantenimiento encontraron que casi el 20% del presupuesto de mantenimiento de rutina fue el resultado de
elementos recurrentes que nunca deberían haber ocurrido en primer lugar. En ambas situaciones, los problemas habían existido
durante años, pero nunca habían sido reconocidos.

RAÍZ CAUSA ANÁLISIS (RCA) Y ENTENDER LAS RAÍCES

El concepto de RCA tiene muchas interpretaciones. Lo usamos para llegar a las verdaderas causas de una falla, pero a muchas
personas les gusta detenerse en las causas físicas. Si solo resuelve las causas físicas de la falla, todo lo que ha hecho es determinar
por qué ocurrió ese incidente. Profundizar y encontrar las raíces humanas permite cambiar el comportamiento humano y eliminar
un grupo de fracasos. Pero al profundizar y corregir las debilidades latentes se eliminan clases enteras de fallos. Como ejemplo de
esto, observe el cambio en la confiabilidad de los automóviles después de la introducción de las importaciones japonesas en la
década de 1970.

Raíces Físicas

La raíz física es el mecanismo que causó la ruptura de la pieza. Puede ser fatiga, sobrecarga, desgaste, corrosión o cualquier
combinación de estos. La importancia de entender la raíz física o las raíces no puede ser exagerada. El análisis de fallas debe
comenzar con la determinación precisa de las raíces físicas, ya que sin ese conocimiento, las raíces humanas y latentes no se pueden
detectar ni corregir.

La mayor parte de este libro trata sobre las raíces físicas de las fallas y hay momentos en que la causa es una raíz física única.
Sin embargo, nuestros datos de años de análisis muestran que con frecuencia hay más de una raíz.

Raíces Humanas
Las raíces humanas son aquellos errores humanos que resultan en los mecanismos que causaron las fallas físicas. Un buen
ejemplo no industrial de una raíz humana de un problema sería el uso de un teléfono celular por parte de un conductor de automóvil
y el efecto de esto en las tasas de accidentes. Dos estudios sobre el uso del teléfono celular muestran:

Los automovilistas tienen cuatro veces más probabilidades de bloquearse cuando usan teléfonos celulares (New England
Journal of Medicine, 1997).

El uso del teléfono móvil mientras se conduce aumenta enormemente la posibilidad de un accidente. Los aumentos, que van
del 34% a más del 300%, se han citado en diferentes estudios.*

Otros estudios han reportado datos similares. Parece bastante obvio que estos conductores no tienen colisiones intencionalmente
y que es el uso del teléfono celular y la distracción resultante lo que resulta tanto en un aumento en la tasa de errores humanos
como en el aumento en las tasas de accidentes. Las buenas estadísticas sobre la frecuencia del error humano en la industria son
generalmente difíciles de encontrar. Sin embargo, un artículo en la revista Chemical Engineering declaró los siguientes incidentes
para una variedad de errores humanos en la industria.

Actividades Industriales

 Tarea de rutina crítica — 1/1000


 Tarea de rutina no crítica — 3/1000
 Tasa de error general para actividades rápidas de alto estrés: 1/4
 Operaciones no rutinarias (arranque, mantenimiento, etc.) — 1/100
 Lista de inspección de inspección — 1/10

Error Humano General

 Por observación — 1/50


 Por omisión — 1/100

Hay textos sobre errores humanos y los datos que se muestran a continuación son de Swain y Guttman y proporcionan una
estimación de la frecuencia de los errores humanos tanto en la planta como en las situaciones cotidianas. (Los valores parentéticos
indican los porcentuales 5° y 95°).

1. Seleccione el control incorrecto en un grupo de controles idénticos etiquetados: 0.003 (0.001 a 0.01)
2. Gire el control en la dirección equivocada en una situación de alta tensión donde el diseño es inconsistente: 0.5 (0.1 a
0.9)
3. Operar las válvulas en secuencia incorrecta [menos de 10 secuencias]: 0.01 (0.001 a 0.05)
4. No se reconoce un estado incorrecto al verificar un elemento justo delante de usted: 0.01 (0.005 a 0.05)

El número de errores citados en el texto anterior parece desalentador. Sin embargo, Charles Latino, presidente del Centro de
Confiabilidad, Inc., Hopewell, VA, un destacado experto en confiabilidad humana, ha declarado que "los expertos en errores
humanos dicen que la persona promedio comete aproximadamente seis errores significativos por semana". Definido como un error
que podría resultar en pérdidas económicas significativas o lesiones personales. Se han realizado estudios de errores humanos,
algunos de los cuales sugieren que las cifras del Sr. Latino pueden ser incluso conservadoras.

Tratar de comprender las razones de estos errores es una tarea casi infinita. Un punto importante es que nosotros, como seres
humanos, tenemos una opinión poco realista de nuestras habilidades y, en general, las exageramos. En el trabajo de Tom Peters,
En Busca de la Excelencia, describe encuestas en las que se les pide a los estudiantes que evalúen sus habilidades. Las
autoevaluaciones sobre "la capacidad de llevarse bien con los demás" y la "capacidad de liderazgo" parecen muy sobreestimadas,
pero no tenemos una manera de evaluar estas habilidades de manera comparativa. Sin embargo, cuando el 94% de estos estudiantes
se califican a sí mismos como que tienen una capacidad atlética por encima del promedio y el 60% califican su capacidad atlética
como el 25% superior, sabemos que ellos (y, desafortunadamente, el resto de nosotros) no tienen una perspectiva realista evaluada
de sus habilidades.

En un esfuerzo por comprender más sobre esta tendencia persistente de sobreestimar nuestras capacidades, realizamos una serie
de encuestas a trabajadores industriales y comerciales con los siguientes resultados:

1. En un grupo ocupacional particularmente peligroso, en el que el 10% de los empleados tuvieron tiempo perdido por
daños o lesiones cada año, el trabajador promedio calificó su conciencia de seguridad como en el 83 porcentual.
2. En un grupo similar, el trabajador promedio sintió que cometió un error significativo aproximadamente una vez cada 8
meses, es decir, menos del 1% con la frecuencia que indican los expertos en errores humanos.
3. En un tercer conjunto de estudios de varios miles de trabajadores e ingenieros en los procesos industriales, el trabajador
promedio indicó que sus habilidades estaban en el nivel del 68° porcentual en comparación con sus compañeros, que
cometieron un error significativo aproximadamente una vez cada 5 meses, y que los compañeros cometieron el doble de
errores que ellos.

De acuerdo con estos estudios, una de las cosas que hemos encontrado al realizar análisis de fallas es que la reacción típica (y
frecuentemente no declarada) a una falla es que "debe ser la culpa del otro". La gente de mantenimiento realmente cree que el
problema es un error del operador. Los operadores realmente creen que el personal de mantenimiento no arregla las máquinas
adecuadamente, y no es raro que los ingenieros y supervisores crean que todos los demás tienen la culpa. En un esfuerzo por
comprender mejor las causas de las fallas en los equipos, revisamos 131 análisis detallados de fallas que nuestra compañía realizó
durante un período de 3 años a fines de la década de 1990.

De los 131 análisis, los principales mecanismos de falla física fueron (los porcentajes no totalizan el 100% debido al redondeo):

Tipos de Falla Física Número de Análisis Porcentaje del Total

Corrosión 23 18
Fatiga 57 44
Vestimenta 15 11
Fatiga por Corrosión 17 13
Sobrecarga 19 15

Dos puntos importantes deben tomarse en cuenta:

1. Al definir estas cinco categorías, existe la posibilidad de confusión entre la fatiga por corrosión y la fatiga. Nuestra
práctica fue asignar la fatiga como el mecanismo principal para aquellos casos en los que el componente finalmente
hubiera fallado y la corrosión no era necesaria para afectar la falla. En aquellas situaciones en las que el componente no
habría fallado sin la acción de la corrosión, es decir, hubo una carga cíclica, pero no fue lo suficientemente grave como
para causar grietas sin corrosión, la causa fue catalogada como fatiga por corrosión.
2. La lista muestra solo los principales mecanismos de falla, y muchos de ellos en realidad tenían múltiples raíces físicas.

EL ESTUDIO DEL ERROR HUMANO

Estas fallas analizan todas las visitas al sitio de las plantas involucradas y las entrevistas con el personal de muchas plantas. En
el estudio, nos dimos cuenta de que, debido a las diversas directivas de nuestros clientes, no podíamos garantizar que todas las
raíces humanas hubieran surgido, pero estamos razonablemente seguros de que se encontró una buena representación. El estudio
dividió los principales errores humanos en seis categorías de la siguiente manera:

1. Diseño — hay dos tipos de errores de diseño, los de omisión y los de comisión.
a. Un error por omisión es aquel en el que el ingeniero / diseñador no nota una falla de diseño que resulta en una falla
prematura, como una concentración de tensión o una selección de material inadecuada.
b. Un error por comisión es uno en el que se toma la decisión de usar un diseño aceptable en condiciones que llevan
al fracaso. Un ejemplo de esto podría ser una situación en la que la producción de una máquina que funciona bien a
500 unidades por día aumenta a una tasa de operación de 550 unidades por día sin un estudio serio y, como resultado
del aumento, se producen fallas.
2. Manufactura — Se produce un error de fabricación cuando una máquina que está correctamente especificada y diseñada
se fabrica incorrectamente.
3. Mantenimiento — Los errores por mantenimiento se producen cuando una máquina bien diseñada y fabricada se repara
incorrectamente o la unidad reparada se reinstala incorrectamente. Un ejemplo de esto es cuando un molinero decide un
ajuste deslizante, en lugar de un ajuste por contracción, un acoplamiento que luego permite que las fuerzas de fatiga
torsional rompan el eje.
4. Instalación — Los errores por instalación ocurren cuando una máquina bien diseñada y fabricada se instala
incorrectamente.
5. Errores de funcionamiento — Los errores de funcionamiento se producen cuando una máquina se ejecuta en condiciones
fuera de los rangos normalmente aceptados.
6. Situación por ceguera — el término adecuado para esto es "nesciencia", pero esta categoría también podría denominarse
"no se puede ver la madera para los árboles". Se refiere a los errores que se producen cuando se ignora una situación de
un problema evidente durante un período prolongado de tiempo.

Al desarrollar estas categorías, las cinco primeras fueron relativamente sencillas. Sin embargo, después de una revisión de lo
que realmente sucedió, sentimos que se justificaba una categoría adicional. Usamos el término "situación por ceguera" para
describir aquellas fallas en las cuales el grupo descuidó un problema bien reconocido pero relativamente menor y le permitió
convertirse en una falla costosa y catastrófica. Un ejemplo desafortunado de esto fue el fallo de un reductor de 2600 hp en una gran
fábrica de papel. Fue en una planta en la que los procedimientos indicaron que cada operador era responsable de verificar el nivel
de lubricante en cada máquina en su área en cada turno. El reductor estaba ubicado en un pedestal que estaba alejado de la sala de
control del operador y era difícil llegar, bajar un tramo de escaleras, cruzar el piso de operaciones y subir una escalera. Había estado
goteando mucho durante más de 12 meses y tanto el área alrededor del reductor como los lados del pedestal estaban saturados de
petróleo. Ciertamente, las causas directas fueron el sello con fugas y la falta de atención por parte del operador (falta de reposición
del aceite), pero consideramos que también debía reconocerse la falta general de información por parte del personal operativo y de
supervisión de la planta. Cuando un proceso crítico depende de la confiabilidad humana, habrá fallas.

Otro ejemplo involucra el fallo repetido de una trituradora de 400 kw (300 hp). Cuando nos llamaron para hacer el análisis de
fallas, hubo muchas quejas sobre el diseño deficiente y la falta de soporte por parte del proveedor. Sin embargo, después de un par
de días de análisis detallados y largas llamadas de conferencia con el fabricante y la planta, descubrimos que la planta había
ignorado el bajo rendimiento de una instalación anterior, tenía una tienda local reparaba rápidamente la maquinaria y la manera en
la que lo hacía no le agradaba al proveedor, había instalado la maquinaria incorrectamente, había intentado de usar la maquinaria
para una aplicación y ésta no fue diseñada para esa tarea, y el proveedor recomendó una maquinaria mucho más grande para su
aplicación.

El estudio encontró un total de 276 errores humanos importantes y cientos de causas contributivas menores. Los valores a
continuación indican la cantidad de veces que ocurrió un tipo específico de causa de falla mayor. Tenga en cuenta que casi siempre
hay más de una causa contributiva. Un ejemplo típico de esto fue una falla de la cubierta del calcinador que fue causada por
corrosión por picadura. Los agujeros resultaron de los efectos combinados de un error de soldadura durante la fabricación y un
error de operación.

El número total en cada categoría muestra:

Grandes Errores Humanos Número de Errores

Errores de Mantenimiento 93
Errores de Diseño 90
Errores Operacionales 34
Errores de Manufacturación 28
Errores por Instalaciones Originales 20
Errores de Situaciones por Ceguera 11

Al reconocer que la distribución de estos grandes contribuidores no fue uniforme, luego examinamos el número real de fallas
afectadas por cada categoría, es decir, los ordenamos para ver cuántos errores de diseño involucrados, errores de mantenimiento,
etc. Al evaluar las principales causas de fallas, los siguientes totales indican el porcentaje que los grupos específicos de errores
efectuaron.

Grupo de Errores Porcentaje

Errores de Diseño 59
Errores de Mantenimiento 38
Errores Operacionales 24
Errores por Instalaciones Originales 16
Errores de Manufacturación 12
Errores de Situaciones por Ceguera 9

Comenzamos el proyecto con algunas conjeturas sobre lo que encontraríamos, pero los resultados del análisis de los datos no
fueron los esperados. Para garantizar errores mínimos, los análisis y los resúmenes de datos se revisaron varias veces. Al observar
los resúmenes de un año a otro, hubo variaciones, pero todas estaban dentro del mismo rango general y también encontramos otros
con resultados similares.

Durante este mismo período, también estuvimos profundamente involucrados con varios RCAs verdaderos. Estos indican que
cuando se toma una falla industrial importante hasta el punto donde se examinan todas las causas posibles, por lo general hay entre
8 y 12 raíces significativas. La distribución de las raíces físicas y humanas tiende a caer en la misma línea que lo que vimos en las
investigaciones de causa raíz (RCIs), con la excepción de que generalmente se descubren raíces menores adicionales. La gran
diferencia está en el descubrimiento de las múltiples raíces latentes.

RAICES LATENTES

Estos son los sistemas o las prácticas que permiten que existan las raíces humanas y físicas. Por ejemplo, la mayoría de las
empresas hacen grandes esfuerzos para garantizar la buena calidad del producto. Los estándares son muy estrictos y, con frecuencia,
incluso un error en un millón de unidades de producción no es aceptable. Sin embargo, muchas de estas mismas empresas no han
recibido programas de inspección en sus suministros de mantenimiento, y sabemos por estudios que generalmente el 4% de lo que
se recibe en el muelle de mantenimiento no es lo que estaba en la orden de compra.

Comprender las raíces latentes puede ser difícil, especialmente si se encuentra en medio de ellas, por lo que un ejemplo médico
puede brindar un mejor punto de vista de cómo estas raíces latentes afectan las fallas. Si tuviera un problema cardíaco, ¿qué tipo
de médico consultaría? ¿Por qué no irías a un dermatólogo? El dermatólogo tiene la misma educación prematura que el cardiólogo,
y luego pasan los mismos 4 años de la escuela de medicina. Pero, hay alguna diferencia entre la residencia y la especialización, y
usted quiere asegurarse de que el médico esté en lo correcto en lo que respecta a su salud. Sin embargo, en muchas plantas, vemos
una filosofía de administración en la que se ha optado por reducir los costos aparentes, lo que efectivamente establece que “los
ingenieros son ingenieros” y no reconoce las diferencias entre los ingenieros químicos, ingenieros mecánicos, ingenieros de minas,
etc. Ciertamente, un ingeniero químico puede sacar un manual y diseñar un mecanismo mecánico, pero ¿cuál sería su reacción si
su médico practicara un manual? Este tipo de pensamiento gerencial niega el valor de la experiencia y es la consecuencia de tener
sistemas que no determinan con precisión el costo de estas fallas. Como resultado, tienen más errores de diseño y problemas de
confiabilidad tanto en sus operaciones de producción como en sus productos.
Algunos ejemplos simples de la falta de conocimiento de la administración, cada uno de los cuales cuesta más de $ 150,000 (en
2004), en relación con los ingenieros, son:

1. El ingeniero químico que modificó el diseño de una transmisión del transportador y no se dio cuenta de que la posición
del piñón de transmisión tuvo un efecto en las fuerzas sobre el eje del transportador.
2. El ingeniero de minas que sufrió repetidas fallas en los sujetadores sin comprender cómo la carga de fatiga afecta a los
pernos.
3. El ingeniero mecánico de una instalación de tratamiento químico que no entendía la corrosión intergranular.
4. El ingeniero de diseño que especificó un lubricante reductor que era incompatible con la grasa que venía en los
rodamientos de bolas provistos.

Estos errores latentes están en todas partes y la vida sería mucho menos desafiante sin ellos. Sin embargo, a veces eso sería un
cambio agradable.

CÓMO ACTÚAN LAS RAICES MÚLTIPLES

Al observar los fracasos, hay una tendencia general a ignorar las raíces latentes y culpar al individuo. El resultado de hacer esto
es que no resuelve el problema y no evita que vuelva a suceder. Hay datos sólidos que muestran que la falla típica de una planta
tiene entre cuatro y siete raíces físicas y humanas. Si una falla tiene seis raíces y se toman medidas para corregir solo una de ellas,
es decir, censurar o penalizar a la persona involucrada, ¿qué sucede con las fuentes de las otras cinco raíces? Vuelven para perseguir
y crear otro fracaso.

Por qué las raíces múltiples son perdidas frecuentemente

Al principio de mi carrera como ingeniero de confiabilidad, me dijeron: “Uno de los problemas reales con la confiabilidad de la
maquinaria es que ella no es lo que nosotros sabemos que no sabemos que nos puede lastimar. Lo que es realmente doloroso y
costoso son aquellas cosas que creemos que sabemos que realmente no entendemos".

FIGURA 1.1 El fenómeno de cambio de error con la primera cadena muestra la secuencia de falla completa. En la segunda
secuencia, se reconoce la cadena de error, y una intervención apropiada ha roto la cadena.

Al observar el hecho de que existen múltiples causas para todas las fallas, Charles Latino ha hablado a menudo de lo que él
llama el "fenómeno de cambio de error". Una falla típica de una planta resulta como la culminación de una secuencia de eventos.
Si una persona reconoce que esta secuencia tiene la posibilidad de causar una falla y realiza un cambio que rompe la secuencia, esa
falla no ocurrirá. Sin embargo, cuando la cadena se rompe por un incidente aleatorio, entonces la probabilidad de que el fallo se
repita es significativa. En la Figura 1.1, mostramos el fenómeno de cambio de error con la primera cadena que muestra la secuencia
de falla completa. En la segunda secuencia, se reconoce la cadena de error, y una intervención apropiada ha roto la cadena.
En un ejemplo, una tubería de proceso en una enorme planta química canadiense se rompió, lo que provocó un derrame en una
corriente adyacente que causó una costosa muerte de peces. En el análisis de la falla, se descubrió que habían tenido dos fallas
similares en los últimos 10 años. Después de cada una de las fallas anteriores, el equipo había sido reparado, pero la falla se repitió.
Como en la mayoría de las plantas, la práctica habitual era que las personas de la planta observaran el fallo, lo repararan lo más
rápido posible y volvieran a la producción. Una investigación detallada del incidente utilizando un árbol lógico encontró que había
nueve raíces físicas y humanas principales. Solo después del análisis, el personal de la planta reconoció que algunas de las causas
habían existido durante años, mientras que otras eran relativamente recientes. Tuvieron una cadena de nueve eventos que causaron
la falla, y cada vez que ocurrieron los nueve en la secuencia correcta, la falla regresó. Sólo eliminando varias de las raíces se podría
eliminar el problema permanentemente.

El incidente involucró la falla de la tubería debajo del tanque de almacenamiento. En el último caso, la tubería se agrietó entre
el tanque y la válvula de control de descarga, y el flujo de agua amoniada no pudo cerrarse. Entre las principales raíces humanas
que el análisis encontró estaban: las bombas funcionaron hasta que cavitaron y algunas veces se les permitió cavitar por largos
períodos de tiempo (del orden de horas); el sistema de tuberías tenía una resonancia que fue excitada por la vibración de la bomba;
los procedimientos de reparación de tuberías resultaron en tuberías que eran inherentemente mucho más débiles que el diseño
original; las bombas estaban siendo reparadas incorrectamente; Las bases estaban corroídas y muy debilitadas; y así. Si cualquiera
de estos se corrigiera, el sistema volvería a funcionar, y esperaría hasta la próxima vez para fallar.

Uno observa este fallo y dice: “¿Cómo pueden los operadores de la planta permitir que las bombas con cavitación severa
funcionen durante horas? ¿No entienden el daño que se está haciendo?”. Sin embargo, menos de 2 meses después, estábamos a
1500 millas de distancia, investigando una falla similar en el sureste de los E.E.U.U. Nuevamente, los operadores permitieron que
las bombas cavitaran durante horas y las bombas fueron destruidas. En ambos sitios, las personas eran bastante inteligentes, pero
nunca se les había enseñado que la inanición severa puede destruir un conjunto de cojinetes de bomba en menos de un día. Estos
son dos ejemplos excelentes de botas de raíces latentes y el valor de la educación.

LOS BENEFICIOS Y AHORROS

Los ahorros de costos que resultan del análisis de fallas pueden compararse favorablemente con los beneficios de cualquier otro
análisis de sistema efectivo. Esencialmente, estamos viendo un problema, entendiendo en detalle cómo y por qué ocurrió, y luego
intentamos evitar que vuelva a ocurrir. Los resultados deben ser mayor disponibilidad de activos, mayor rendimiento y costos
reducidos. La magnitud del beneficio es proporcional a la cantidad de soporte del sitio. Nos han asociado con varios programas de
análisis de fallas / confiabilidad que fueron respaldados solo por la organización de mantenimiento y donde los rendimientos anuales
cuidadosamente documentados estuvieron en el rango de seis a diez veces el costo del programa. Sin embargo, cuando son
compatibles con toda la organización, otros programas han mostrado resultados de producción que han aumentado constantemente
a lo largo de los años sin inversión de capital y menores costos de mantenimiento y operación. En un programa de análisis de fallas
activo y respaldado confiablemente, no es sorprendente ver rendimientos anuales de más de cincuenta veces el costo.

La planta donde aprendí sobre The Reliability Approach ™ tenía más de 90 años, con un proceso de madurez que no se había
cambiado durante años. El volumen de ventas anual de la planta fue de alrededor de 500 millones de dólares, e históricamente
había perdido alrededor del 17% de la capacidad de producción al tiempo de inactividad. Durante los primeros seis años de este
programa de confiabilidad, a pesar de un gasto mínimo en equipos de capital y una reducción tanto en la dotación de personal de
mantenimiento como en el presupuesto de mantenimiento, pudimos aumentar el tiempo efectivo de producción en
aproximadamente un 1% por año, y la producción real aumentó en más que eso. (El beneficio neto fue aproximadamente una
reducción de 1/3 en el tiempo de inactividad para un proceso que no había cambiado sustancialmente en 40 años). El siguiente
gráfico muestra los resultados reales del programa (Figura 1.2).

You might also like