mean time between failures nota explicativa

5/14/2018 Mean Time Between Failures Nota Explicativa - slidepdf.com

http://slidepdf.com/reader/full/mean-time-between-failures-nota-explicativa 1/5

Universidad San Francisco de Quito Procesos Estocásticos

Mean Time Between Failures (MTBF) – Nota Explicativa preparadapor René Játiva Espinoza

Definiciones:

Es importante notar que la definición del Tiempo medio entre fallas (MTBF del inglésMean Time Between Failures) se torna en muchos casos ambiguo si no se ha definido

previamente la noción de falla. A continuación citamos dos definiciones de falla:

1) La terminación de la habilidad de un producto entendido como un todo, paradesarrollar la función que se le requiere.

2) La terminación de la habilidad de cualquier componente individual para desarrollar sufunción pero no la terminación de la habilidad de operación del producto entendido como

un todo.

Se entiende entonces que el MTBF impacta tanto a la confiabilidad como a la

disponibilidad, así que citamos las definiciones de estos términos:

La Confiabilidad es la habilidad de un sistema o componente para desarrollar sus

funciones bajo condiciones pre-establecidas durante un período de tiempo especificado

[IEEE 90].

En otras palabras, es la probabilidad de que los sistemas o componentes tengan éxito

durante el tiempo de la misión identificada, sin fallas. Una misión aérea es el perfecto

ejemplo para ilustrar este concepto. Cuando una aeronave despega para su misión, hayun objetivo en mente: completar el vuelo, como se ha programado, con seguridad (sin

fallas catastróficas).

La Disponibilidad, por otro lado, es el grado al cual un sistema o componente es

operacional y accesible cuando se requiere su uso [IEEE 90].

La disponibilidad puede verse como la probabilidad de que el sistema o componente se

encuentre en estado de desarrollar su función requerida bajo ciertas condiciones en un

instante dado. La disponibilidad se determina por la confiabilidad del sistema, así como

también por el tiempo de recuperación cuando una falla se produce. Cuando los sistemas

tienen tiempos de operación continua muy largo, las fallas son inevitables y entonces loimportante es recuperar la operación del sistema lo más pronto posible.

El valor del MTBF es una medida básica de la confiabilidad del sistema. Se la representa

típicamente en horas. Mientras más alto es el valor del MTBF, mayor es la confiabilidad

del producto. La siguiente expresión ilustra esta relación:tiempo

MTBF Confiabilidad e−

= (1.1)




Un malentendido común respecto del MTBF es que es equivalente al número esperado de

horas de operación antes de que el sistema falle, es decir a la “vida de servicio”.

Pongamos el siguiente ejemplo:

En la muestra de nuestra población disponemos de 500.000 personas de 25 años de edad.

En el trascurso de un año, se recoge información sobre fallas (muertes) de los miembros

de esta población. La vida operacional de la población es de 500.00 x 1 año= 500.000años. Puesto que en el año 625 personas fallaron (murieron), la tasa de fallas es de

625/500.000 años= 0,125%/año. El MTBF es el inverso de la tasa de fallas, es decir

1/0,00125=800 años. Esto significa que aunque las personas de 25 años tienen valoresaltos de MTBF, su expectativa de vida (vida de servicio) es mucho más baja y no se

correlacionan. Si lo que pretendemos es que el MTBF y la vida de servicio se relacionen,deberíamos esperar a que toda la población falle (muera) y entonces tendríamos un valor

de MTBF de entre 75 y 80 años. Ambos valores son correctos, pero difieren en lasasunciones realizadas. Lo cierto es que en general, se pretende disponer de un valor quesirva hoy, y no uno que se obtenga cuando el producto en cuestión haya sido ya superado

tecnológicamente por otro.

Por otra parte el Tiempo Medio de Recuperación o MTTR (siglas en inglés de MeanTime to Recover), es el tiempo esperado para recuperar un sistema de una falla y se

representa también en horas. Como lo muestra la siguiente ecuación, MTTR impacta

sobre la disponibilidad y no sobre la confiabilidad. Así también el MTBF afecta tambiéna la disponibilidad. Mientras mayor es el MTBF mejor es la disponibilidad, y mientras

mayor es el MTTR, peor es la disponibilidad del sistema.

MTBF Disponibilidad MTBF MTTR

=

+

(1.2)

Las expresiones anteriores son válidas bajo el supuesto que el sistema exhibe una tasa de

fallas constante. Esto es cierto en componentes electrónicos únicamente en lo que se

conoce como el “período de operación normal” o el “período de vida útil” del sistema encuestión, como se observa de la figura 1.




Métodos para predecir y estimar el MTBF

En ocasiones los términos predicción y estimación aparecen como sinónimos, pero enrealidad tienen significados diversos. Los métodos que predicen el MTBF calculan un

valor en base al diseño del sistema, usualmente realizado en una etapa temprana dentro

del ciclo de vida del producto. Los métodos de estimación por otro lado se consiguen demediciones de fallas, y se calculan de la observación de muestras de sistemas similares,

usualmente después de que una gran población ha sido implementada en el campo. Su

uso por tanto es el más recomendado y el más difundido en la industria.

Métodos de Predicción de la Confiabilidad:

• MIL-HDBK 217.- Bajo este estándar, hay dos formas de predecir la

confiabilidad: Predicción por cuenta de Partes y Predicción por Análisis de Esfuerzos en Partes.

La Predicción por cuenta de Partes implica que la tasa de fallas se calculaliteralmente contando los componentes similares de un producto y agruparlos en

varios tipos de componentes. El número de componentes en cada grupo se multiplica

entonces por una tasa de fallas genérica, encontrándose así el factor de calidad.Finalmente, las tasas de falla de todos los diferentes grupos de partes se suman para

conseguir la tasa de fallas final.

La Predicción por Análisis de Esfuerzos en Partes se utiliza mucho más tarde en el

ciclo de desarrollo del producto, cuando el diseño de los circuitos actuales y elhardware están cerca de la producción. La tasa de falla para cada componente se

calcula individualmente en base a los niveles de esfuerzo específicos a los cuales sesujeta al componente (por ejemplo humedad, temperatura, vibración, voltaje). Esta

metodología generalmente conduce a una tasa de fallas menor que la anterior, y

debido al nivel de análisis requerido, este método consume mucho más tiempo encomparación con otros.

• Telcordia.- Este método originalmente basado en MIL 217, añadió

posteriormente información de campo para posibilitar la estimación de laconfiabilidad de equipos de telecomunicaciones. Ha sufrido varias

actualizaciones. Su última revisión corresponde a SR-332 Publicación 1, lanzadaen mayo de 2001. Esta metodología continúa aplicándose comu una herramientade diseño de producto dentro de esta industria.

• HRD5 (Handbook for Reliability Data for Electronic Components).-Desarrollada por British Telecom y usada exclusivamente en el Reino Unido, essimilar a 217.




• RBD (Reliability Block Diagram).- Es un dibujo representativo y unaherramienta de cálculo que se usa para modelar la disponibilidad y confiabilidad

de un sistema. La estructura del diagrama de bloques define la interacción lógicade las fallas dentro de un sistema y no necesariamente sus conexiones lógicas ofísicas en conjunto. Puede modelar un sistema, un subsistema o un componente.

Muestra el funcionamiento de un sistema y como la falla en un componente puede

afectar la operación de un sistema visto como un todo.

• Modelos de Markov.- Proveen la habilidad para analizar los sistemas complejostales como arquitecturas eléctricas. Se conocen también como diagramas de

espacio de estados o grafos de estado. El espacio de estados se define como unconjunto de todos los estados en los cuales el sistema puede estar. A diferencia de

los diagramas de bloques, los grafos de estado proveen una representación más

exacta de un sistema. El uso de grafos de estado el útil para mostrar dependenciasde fallas a componentes, y varios estados que el diagrama de bloques no puederepresentar. Además del MTBF, los modelos de Markov proveen varias medidas

de un sistema que incluyen la disponibilidad, el MTTR, la probabilidad de estar

en un estado dado en un tiempo especificado, etc.

• FMEA/FMECA.- El FMEA (Failure Mode and Effect Analysis) es un procesousado en el análisis de los modos de falla de un producto. El análisis puede ir un

paso hacia delante asignando un nivel de severidad a cada un de los modos defalla, en cuyo caso toma el nombre de FMECA (Failure Mode, Effects and

Criticality Analysis). FMEA usa una aproximación de abajo hacia arriba, es decir

desde los componentes hasta el sistema completo. Además de usarse como unaherramienta de diseño de producto, puede usarse para calcular la confiabilidad del

sistema completo. Requiere de información de probabilidad que puede ser difícil

de obtener para ciertas partes del equipamiento.

• Árbol de Fallas.- Es una técnica que puede ayudar a detallar el trayecto de los

eventos, tanto relacionados al funcionamiento normal como a eventos de falla, loscuales conducen hacia las fallas a nivel de componentes o hacia los eventosindeseados que se investigan (aproximación de arriba hacia abajo). La

confiabilidad se calcula convirtiendo un árbol de fallas completo en un sistema de

ecuaciones equivalente, usando el álgebra de Boole. La información de

probabilidad requerida por esta metodología puede ser difícil de obtener.

• HALT (Highly Accelerated Life Testing).- Se usa para establecer cuánto tiempolleva alcanzar el punto de ruptura de un producto, sujetándolo a esfuerzos

cuidadosamente medidos y controlados, tales como temperatura y vibración.

Utiliza un modelo matemático para estimar el tiempo que habría tomado para queel producto fallara en el campo. Aunque HALT puede estimar el MTBF, su

función principal es mejorar la confiabilidad del diseño del producto.




Métodos de Predicción de la Confiabilidad:

• Método de Predicción de Artículos Similares.- Se basa en estimar laconfiabilidad a partir de registros históricos de artículos similares. Su efectividad

depende de cuán similar es el nuevo equipamiento con respecto al existente y

cuya información se encuentra disponible. La similitud debe entenderse en

términos de procesos de manufactura, funciones del producto y diseños. Lasdiferencias deben estudiarse cuidadosamente para la predicción final.

• Método de Medición de Información en Campo.- Es posiblemente el método másutilizado por los fabricantes, y consiste en hacer seguimiento de una muestra de la

población de nuevos productos. Una vez que se recoge la información, se

calculan la tasa de fallas y el MTBF. La tasa de fallas es el porcentaje de lapoblación de unidades que se espera que “fallen” en un año calendario.Adicionalmente al uso de esta información para el control de calidad, se provee

también a los clientes y socios con información al respecto de la confiabilidad de

sus productos y procesos de calidad. Dado que este método es tan ampliamenteutilizado por los fabricantes, provee una referencia común para comparar valores

del MTBF. Esta información puede ser utilizada por los usuarios para valorar

diferencias de calidad en el equipamiento ofrecido por los diversos fabricantes ytomar decisiones en consecuencia. Para efectuar dichas comparaciones, las

variables críticas consideradas deben ser las mismas para asegurar que el proceso

de decisión sea el correcto.

Conclusiones:

La palabra MTBF se utiliza comúnmente en la industria como una “alarma”. Los

números se lanzan sin un entendimiento de lo que verdaderamente representan. Mientras

el MTBF es una indicación de la confiabilidad, no representa la vida media de servicio

del producto. En último término, un valor de MTBF no tiene significado si la falla esindefinida y las asunciones son confusas o no son realistas.

Referencias:

Las ideas de este artículo se han extraído de:

“Mean Time Between Failure: Explanation and Standards”; Wendy Torrel, Victor

Abelar; White Paper #78; American Power Conversio, 2004; www.apc.com.

http://www.apc.com/

http://www.apc.com/

mean time between failures nota explicativa

Documents