mean time between failures nota explicativa
TRANSCRIPT
5/14/2018 Mean Time Between Failures Nota Explicativa - slidepdf.com
http://slidepdf.com/reader/full/mean-time-between-failures-nota-explicativa 1/5
Universidad San Francisco de Quito Procesos Estocásticos
Mean Time Between Failures (MTBF) – Nota Explicativa preparadapor René Játiva Espinoza
Definiciones:
Es importante notar que la definición del Tiempo medio entre fallas (MTBF del inglésMean Time Between Failures) se torna en muchos casos ambiguo si no se ha definido
previamente la noción de falla. A continuación citamos dos definiciones de falla:
1) La terminación de la habilidad de un producto entendido como un todo, paradesarrollar la función que se le requiere.
2) La terminación de la habilidad de cualquier componente individual para desarrollar sufunción pero no la terminación de la habilidad de operación del producto entendido como
un todo.
Se entiende entonces que el MTBF impacta tanto a la confiabilidad como a la
disponibilidad, así que citamos las definiciones de estos términos:
La Confiabilidad es la habilidad de un sistema o componente para desarrollar sus
funciones bajo condiciones pre-establecidas durante un período de tiempo especificado
[IEEE 90].
En otras palabras, es la probabilidad de que los sistemas o componentes tengan éxito
durante el tiempo de la misión identificada, sin fallas. Una misión aérea es el perfecto
ejemplo para ilustrar este concepto. Cuando una aeronave despega para su misión, hayun objetivo en mente: completar el vuelo, como se ha programado, con seguridad (sin
fallas catastróficas).
La Disponibilidad, por otro lado, es el grado al cual un sistema o componente es
operacional y accesible cuando se requiere su uso [IEEE 90].
La disponibilidad puede verse como la probabilidad de que el sistema o componente se
encuentre en estado de desarrollar su función requerida bajo ciertas condiciones en un
instante dado. La disponibilidad se determina por la confiabilidad del sistema, así como
también por el tiempo de recuperación cuando una falla se produce. Cuando los sistemas
tienen tiempos de operación continua muy largo, las fallas son inevitables y entonces loimportante es recuperar la operación del sistema lo más pronto posible.
El valor del MTBF es una medida básica de la confiabilidad del sistema. Se la representa
típicamente en horas. Mientras más alto es el valor del MTBF, mayor es la confiabilidad
del producto. La siguiente expresión ilustra esta relación:tiempo
MTBF Confiabilidad e−
= (1.1)
5/14/2018 Mean Time Between Failures Nota Explicativa - slidepdf.com
http://slidepdf.com/reader/full/mean-time-between-failures-nota-explicativa 2/5
Universidad San Francisco de Quito Procesos Estocásticos
Un malentendido común respecto del MTBF es que es equivalente al número esperado de
horas de operación antes de que el sistema falle, es decir a la “vida de servicio”.
Pongamos el siguiente ejemplo:
En la muestra de nuestra población disponemos de 500.000 personas de 25 años de edad.
En el trascurso de un año, se recoge información sobre fallas (muertes) de los miembros
de esta población. La vida operacional de la población es de 500.00 x 1 año= 500.000años. Puesto que en el año 625 personas fallaron (murieron), la tasa de fallas es de
625/500.000 años= 0,125%/año. El MTBF es el inverso de la tasa de fallas, es decir
1/0,00125=800 años. Esto significa que aunque las personas de 25 años tienen valoresaltos de MTBF, su expectativa de vida (vida de servicio) es mucho más baja y no se
correlacionan. Si lo que pretendemos es que el MTBF y la vida de servicio se relacionen,deberíamos esperar a que toda la población falle (muera) y entonces tendríamos un valor
de MTBF de entre 75 y 80 años. Ambos valores son correctos, pero difieren en lasasunciones realizadas. Lo cierto es que en general, se pretende disponer de un valor quesirva hoy, y no uno que se obtenga cuando el producto en cuestión haya sido ya superado
tecnológicamente por otro.
Por otra parte el Tiempo Medio de Recuperación o MTTR (siglas en inglés de MeanTime to Recover), es el tiempo esperado para recuperar un sistema de una falla y se
representa también en horas. Como lo muestra la siguiente ecuación, MTTR impacta
sobre la disponibilidad y no sobre la confiabilidad. Así también el MTBF afecta tambiéna la disponibilidad. Mientras mayor es el MTBF mejor es la disponibilidad, y mientras
mayor es el MTTR, peor es la disponibilidad del sistema.
MTBF Disponibilidad MTBF MTTR
=
+
(1.2)
Las expresiones anteriores son válidas bajo el supuesto que el sistema exhibe una tasa de
fallas constante. Esto es cierto en componentes electrónicos únicamente en lo que se
conoce como el “período de operación normal” o el “período de vida útil” del sistema encuestión, como se observa de la figura 1.
5/14/2018 Mean Time Between Failures Nota Explicativa - slidepdf.com
http://slidepdf.com/reader/full/mean-time-between-failures-nota-explicativa 3/5
Universidad San Francisco de Quito Procesos Estocásticos
Métodos para predecir y estimar el MTBF
En ocasiones los términos predicción y estimación aparecen como sinónimos, pero enrealidad tienen significados diversos. Los métodos que predicen el MTBF calculan un
valor en base al diseño del sistema, usualmente realizado en una etapa temprana dentro
del ciclo de vida del producto. Los métodos de estimación por otro lado se consiguen demediciones de fallas, y se calculan de la observación de muestras de sistemas similares,
usualmente después de que una gran población ha sido implementada en el campo. Su
uso por tanto es el más recomendado y el más difundido en la industria.
Métodos de Predicción de la Confiabilidad:
• MIL-HDBK 217.- Bajo este estándar, hay dos formas de predecir la
confiabilidad: Predicción por cuenta de Partes y Predicción por Análisis de Esfuerzos en Partes.
La Predicción por cuenta de Partes implica que la tasa de fallas se calculaliteralmente contando los componentes similares de un producto y agruparlos en
varios tipos de componentes. El número de componentes en cada grupo se multiplica
entonces por una tasa de fallas genérica, encontrándose así el factor de calidad.Finalmente, las tasas de falla de todos los diferentes grupos de partes se suman para
conseguir la tasa de fallas final.
La Predicción por Análisis de Esfuerzos en Partes se utiliza mucho más tarde en el
ciclo de desarrollo del producto, cuando el diseño de los circuitos actuales y elhardware están cerca de la producción. La tasa de falla para cada componente se
calcula individualmente en base a los niveles de esfuerzo específicos a los cuales sesujeta al componente (por ejemplo humedad, temperatura, vibración, voltaje). Esta
metodología generalmente conduce a una tasa de fallas menor que la anterior, y
debido al nivel de análisis requerido, este método consume mucho más tiempo encomparación con otros.
• Telcordia.- Este método originalmente basado en MIL 217, añadió
posteriormente información de campo para posibilitar la estimación de laconfiabilidad de equipos de telecomunicaciones. Ha sufrido varias
actualizaciones. Su última revisión corresponde a SR-332 Publicación 1, lanzadaen mayo de 2001. Esta metodología continúa aplicándose comu una herramientade diseño de producto dentro de esta industria.
• HRD5 (Handbook for Reliability Data for Electronic Components).-Desarrollada por British Telecom y usada exclusivamente en el Reino Unido, essimilar a 217.
5/14/2018 Mean Time Between Failures Nota Explicativa - slidepdf.com
http://slidepdf.com/reader/full/mean-time-between-failures-nota-explicativa 4/5
Universidad San Francisco de Quito Procesos Estocásticos
• RBD (Reliability Block Diagram).- Es un dibujo representativo y unaherramienta de cálculo que se usa para modelar la disponibilidad y confiabilidad
de un sistema. La estructura del diagrama de bloques define la interacción lógicade las fallas dentro de un sistema y no necesariamente sus conexiones lógicas ofísicas en conjunto. Puede modelar un sistema, un subsistema o un componente.
Muestra el funcionamiento de un sistema y como la falla en un componente puede
afectar la operación de un sistema visto como un todo.
• Modelos de Markov.- Proveen la habilidad para analizar los sistemas complejostales como arquitecturas eléctricas. Se conocen también como diagramas de
espacio de estados o grafos de estado. El espacio de estados se define como unconjunto de todos los estados en los cuales el sistema puede estar. A diferencia de
los diagramas de bloques, los grafos de estado proveen una representación más
exacta de un sistema. El uso de grafos de estado el útil para mostrar dependenciasde fallas a componentes, y varios estados que el diagrama de bloques no puederepresentar. Además del MTBF, los modelos de Markov proveen varias medidas
de un sistema que incluyen la disponibilidad, el MTTR, la probabilidad de estar
en un estado dado en un tiempo especificado, etc.
• FMEA/FMECA.- El FMEA (Failure Mode and Effect Analysis) es un procesousado en el análisis de los modos de falla de un producto. El análisis puede ir un
paso hacia delante asignando un nivel de severidad a cada un de los modos defalla, en cuyo caso toma el nombre de FMECA (Failure Mode, Effects and
Criticality Analysis). FMEA usa una aproximación de abajo hacia arriba, es decir
desde los componentes hasta el sistema completo. Además de usarse como unaherramienta de diseño de producto, puede usarse para calcular la confiabilidad del
sistema completo. Requiere de información de probabilidad que puede ser difícil
de obtener para ciertas partes del equipamiento.
• Árbol de Fallas.- Es una técnica que puede ayudar a detallar el trayecto de los
eventos, tanto relacionados al funcionamiento normal como a eventos de falla, loscuales conducen hacia las fallas a nivel de componentes o hacia los eventosindeseados que se investigan (aproximación de arriba hacia abajo). La
confiabilidad se calcula convirtiendo un árbol de fallas completo en un sistema de
ecuaciones equivalente, usando el álgebra de Boole. La información de
probabilidad requerida por esta metodología puede ser difícil de obtener.
• HALT (Highly Accelerated Life Testing).- Se usa para establecer cuánto tiempolleva alcanzar el punto de ruptura de un producto, sujetándolo a esfuerzos
cuidadosamente medidos y controlados, tales como temperatura y vibración.
Utiliza un modelo matemático para estimar el tiempo que habría tomado para queel producto fallara en el campo. Aunque HALT puede estimar el MTBF, su
función principal es mejorar la confiabilidad del diseño del producto.
5/14/2018 Mean Time Between Failures Nota Explicativa - slidepdf.com
http://slidepdf.com/reader/full/mean-time-between-failures-nota-explicativa 5/5
Universidad San Francisco de Quito Procesos Estocásticos
Métodos de Predicción de la Confiabilidad:
• Método de Predicción de Artículos Similares.- Se basa en estimar laconfiabilidad a partir de registros históricos de artículos similares. Su efectividad
depende de cuán similar es el nuevo equipamiento con respecto al existente y
cuya información se encuentra disponible. La similitud debe entenderse en
términos de procesos de manufactura, funciones del producto y diseños. Lasdiferencias deben estudiarse cuidadosamente para la predicción final.
• Método de Medición de Información en Campo.- Es posiblemente el método másutilizado por los fabricantes, y consiste en hacer seguimiento de una muestra de la
población de nuevos productos. Una vez que se recoge la información, se
calculan la tasa de fallas y el MTBF. La tasa de fallas es el porcentaje de lapoblación de unidades que se espera que “fallen” en un año calendario.Adicionalmente al uso de esta información para el control de calidad, se provee
también a los clientes y socios con información al respecto de la confiabilidad de
sus productos y procesos de calidad. Dado que este método es tan ampliamenteutilizado por los fabricantes, provee una referencia común para comparar valores
del MTBF. Esta información puede ser utilizada por los usuarios para valorar
diferencias de calidad en el equipamiento ofrecido por los diversos fabricantes ytomar decisiones en consecuencia. Para efectuar dichas comparaciones, las
variables críticas consideradas deben ser las mismas para asegurar que el proceso
de decisión sea el correcto.
Conclusiones:
La palabra MTBF se utiliza comúnmente en la industria como una “alarma”. Los
números se lanzan sin un entendimiento de lo que verdaderamente representan. Mientras
el MTBF es una indicación de la confiabilidad, no representa la vida media de servicio
del producto. En último término, un valor de MTBF no tiene significado si la falla esindefinida y las asunciones son confusas o no son realistas.
Referencias:
Las ideas de este artículo se han extraído de:
“Mean Time Between Failure: Explanation and Standards”; Wendy Torrel, Victor
Abelar; White Paper #78; American Power Conversio, 2004; www.apc.com.