常见的设备可靠性指标: MTBF/MTTF/MTTR/MTBR

在重资产行业,故障(失效,Failure)是不可避免的。设备总会出现偏差、卡死、断裂。但是,通过将故障转化为可量化的、具有行动意义指标,你可以更好地将控制故障范围,减少故障的频率,并且更容易管理。

在研究如何衡量并将其转换为指标之前,我们需要确保我们真正理解故障是什么。故障的定义与解读有时会很微妙。

部分故障与完全故障

一般来说,故障可以分为两种类型,局部和完全故障。局部的指设备可能还能用,但不会很好用。比如说,有一台压铸成型设备,它们产出的形状不是100%精确。或者,它们可能会以正确的尺寸和形状出来,但生产速度却不对。然而,在完全故障的情况下,设备完全停止工作。压铸机就会停止压制。

部分与完全故障的示例

以一辆自行车为例。我们可以说完全故障是指自行车的链条滑档。不管你怎么用力,怎么踩,怎么快,你都走不动。但如果只是保护链条的挡板脱落呢?在这种情况下,自行车还能用,你可能都意识不到出了问题。还有一些局部故障是明显的,但仍然是局部的。比如有人去偷了自行车的座椅。如果有一点决心和平衡,你仍然可以通过站在踏板上骑。这并不是完全的故障,还只是局部的故障。

部分故障的统计是具有难度的,因此一般软件在处理核心KPI的计算时,以完全故障为准。

设备停工(DOWN)

实际上大多数主流CMMS/EAM软件在统计KPI时,是以DOWNTIME为基准的。也就是跟踪这些可靠性KPI的根本目的还是保障生产运营。

DOWN并不是指不能开机,准确的说是指无法满足生产而离线。包括

  1. 无法开机,无法使用。
  2. 可以运行但不能达到生产运营或质量要求,不得不停用设备。

什么是MTTR?

平均修复时间(MTTR – Mean Time To Recover; MTT Recovery=MTT Diagnosis+ MTT Repair)指设备从故障恢复到正常运营状态下的平均时间。是衡量维护部门效率的指标,也是反映故障影响程度(耽误生产运营)的指标。

如何计算平均恢复时间(MTTR)

首先,你需要知道的是,在设定的时间内,维修一项资产花费了多少时间。假设你有一台印刷机电机总是有故障。在一个星期内,你总共花了4个小时在它身上。第一次你花了1.5小时。然后第二次你用了2.5小时。

如果每次时间长相差很大,也是正常的。但是,做维修的人在能力和准备方面需要大致相同。你想知道的是,一个经过适当培训的专业人员,使用一套清晰的说明书,需要多长时间来完成维修。如果你收集的一些数据是来自于一个新雇员在没有运维手册的情况下在资产上工作的数据,那结果的意义就有限了。

接下来,用总时间(1.5+2.5=4)除以你在资产上工作的次数(2次)。你的MTTR=(1.5+2.5)/2=2 小时。

平均恢复时间 MTTR=总维修时间/维修次数

关于维修时间怎么统计?

MTTR的概念比较容易理解,但在实际统计时,如何获取Time-to-Repair其实有不同的理解和解读。比如是算从报修到完工?算从实际维修到完工(排除诊断\计划等时间)?

常见的设备可靠性指标: MTBF/MTTF/MTTR/MTBR 1

[智维修]平台会自动与目前最主流的CMMS/EAM软件(如SAP、Maximo)中逻辑一致,在MTTR计算时,实际是以UNPLANED_DOWNTIME(故障停机的“净时间”)做为统计依据的。只考虑记录下的从停机开始到结束的时间。与报修、工单下达、人员到场这些时间点都无关。

利用MTTR

一般来说,你希望这个数字越小越好,所以一旦你有了这个数字,你就可以开始寻找具体的步骤来缩小它。

例如,可以有以下用途:

  • 分析人员因素:你可以开始考虑人员配置问题。如果你加不了人。那可能就得对现有员工进行额外培训。
  • 分配备件因素:MTTR也经常被用来评估哪些备件需要保留在现场或库存,并设定标准水平。如果维修时间过长,很有可能是因为缺件耗时。
  • 在决定修理或更换资产时,MTTR也是有用的。在资产的使用寿命内,MTTR将呈上升趋势,停机影响超来超大。老旧资产需要更多的时间来维修,因为其故障往往更严重。通过观察其MTTR随时间的变化,前台可以更好地决定何时需要更换资产,或者继续要求维护部门维修是否更有意义。
  • 前期决策时还可以利用MTTR来更好地决定购买哪些新资产。想象一下,你必须修复一块旧手表中的一个小弹簧。想一想,你需要多么小心翼翼地拆开手表,更换那一个破损的部件,然后把所有东西重新组装起来。这简直是一场噩梦。但是,如果同样的手表有一个更模块化的设计,当你打开它时,只有三个 “部件”你可以直接替换。因此购买更容易维修的模块化资产,这对维修部门有直接的好处。

什么是MTBF:平均故障间隔时间?

平均故障间隔时间(MTBF – Mean Time Between Failure)这个指标是用来确定可靠性的。基本上,设备平均多久坏一次。

如何计算平均故障间隔时间(MTBF)

你需要三样东西:资产运行的总小时数,故障次数,以及每次故障后修复所需的时间。你把运行的总小时数除以故障的总次数。

资产因为预防性质的维护而有计划的关停/离线的时间不用考虑为停机,这里只统计意外关停。

让我们来看一个简单的例子。假设你有一台印刷机,运行了24小时。在此期间,它发生了两次故障。结论是平均每12个小时就会出现一次故障。这可不是什么好事。

平均故障间隔 MTBF = 运行总时间/故障次数

同样在主流 CMMS/EAM软件中,这里的故障时间,以DOWNTIME计次来计算。

MTBF的价值

先别把那性能糟糕台压机处置了。一般来说,当您的MTBF较低时,可以追溯到操作者的错误或资产维修方式的问题。您可以通过额外的培训和更密切的监督来提高MTBF。

MTBF不仅能暴露过去使用和维修的问题,而且还能帮助您制定未来的预防性维护计划。如果您知道某项资产平均每100小时就会出现一次故障,您可以将预防性维护/检查设置为每90小时一次。这样,您就能获得最大的预防性收益。

如何计算平均无故障时间(MTTF)

MTBF是针对于资产整体的,有时我们需要针对不同部件(不可修复的部件)进行跟踪。举个例子,灯泡,我们可能有四个烧坏的灯泡,它们分别运行了20、22、26和18小时。我们把这些数字加起来,得到86。当我们把这个数字除以灯泡的数量,也就是四个,我们得到的平均故障时间是21.5小时。

MTTF的价值

从我们对灯泡的KPI来看,我们可以马上看出你需要更换品牌,当你的MTTF很低时,就只能如此。你只能通过购买质量更好的产品来提高MTTF。平均故障时间是 “你得到你所付出的 “的指标。

MTTF还可以帮助你更好地管理库存。如果你决定继续使用这些糟糕的灯泡,至少你会知道在现场库存中保留大量的灯泡。之后,如果你决定换一个更好的灯泡,你就会知道你可以通过减少它们的数量来降低库存成本。

但MTTF的真正威力在于它能告诉你更大、更复杂的资产的可靠性。事实上,大型资产中一个小部件的平均故障时间对该资产的可靠性有很大影响。想想你的汽车。如果车内的一个灯烧坏了,会发生什么?除了一些小的不便,没有什么。但风扇皮带呢?和灯一样,它也属于MTTF指标,因为它无法修复,只能更换。但由于汽车没有风扇皮带就无法运行,所以在判断汽车的整体可靠性时,风扇皮带的MTTF可能比汽车的MTBF更重要。

关于修理平均间隔时间(MTBR)

MTBR从统计上来看与MTTF是完全一致的。它们都是反映一个无故障的设备到出现故障可持续的时间。有时也以MTTF(平均无故障时间代替MTBF)

MTTF = MTBR = MTBF - MTTR

接下来的步骤

只有当你有一个稳定的数据收集系统时,你才能真正开始使用故障指标。幸运的是,最简单的方法是使用设备维护软件或工单软件。如果你还没有CMMS/EAM,现在正是考虑购买一个。今天一个好的CMMS/EAM软件很容易学习和使用,提供了一个简洁,直观的界面和任何地方的访问。特别是基于云的系统,会非常容易实施部署,帮助你快速统计这些关键性指标。