周五上午九点,设备连续运行第二十四小时。
小陈揉着胀的太阳穴站在控制台前,屏幕上的数据流让他既兴奋又焦虑。兴奋的是,自适应算法已经开始工作,虽然还在初级学习阶段,但已经能看出效果,那条缓慢下滑的精度曲线,下滑度明显减慢了。
焦虑的是,设备状态正在逼近临界点。
振动频谱图上,那些中高频尖峰的能量在持续增长。虽然增长很缓慢,但趋势明确。王海拿着听诊器一样的机械听诊器,贴在设备的关键部位听音,眉头越皱越紧。
声音不对。他直起身,轴承有杂音,很轻微,但确实有。
韩博调出轴承的监测数据:温度正常,振动加度值在允许范围内。但,你看这个。
他指着频谱图上oo赫兹附近的一个微小突起:这个频率是轴承外圈故障的特征频率之一。虽然现在能量还很小,但说明轴承已经开始出现早期磨损。
小陈心里一沉。高精度设备最怕的就是轴承问题。轴承一旦开始磨损,游隙变大,整个传动链的精度都会受到影响。而且这种磨损是不可逆的,只能更换。
问题是,这台设备用的是进口高精密轴承,单个价格就要三千多。整台设备用了十二个这样的轴承,全换就是将近四万。
更重要的是时间——订货周期至少两周。
咱们库存有备件吗?小陈问。
王海摇头:这种高精度轴承咱们平时用不到,没备库存。就算现在下单,最快也要下下周才能到。
下下周,那就是十三天以后。
设备还能坚持多久?韩博问。
王海又听了一遍轴承的声音,经验判断:如果不降负载,一直高运行,可能……还能撑三天。三天后杂音会明显增大,精度会急剧下降。
三天。小陈脑子飞快计算。三天时间,他的自适应算法能学到什么程度?设备在这三天里能采集到足够的数据吗?三天后轴承真坏了,停机更换要多久?更换后重新标定要多久?
一连串问题,每一个都紧迫。
林凡走进车间时,看到的就是这样一副景象,所有人围在设备旁,表情凝重得像在参加葬礼。
听完汇报,林凡沉默了几秒:轴承必须换,但现在不能停。三天,我们还有三天时间。这三天,设备继续运行,采集所有能采集的数据。三天后,停机换轴承,同时小陈的算法应该也学得差不多了,正好用新轴承做验证。
王海担忧:可是厂长,万一轴承在运行中突然失效,可能会损坏其他部件。
那就加强监测。林凡说,每半小时检查一次轴承状态,一有恶化迹象立刻停机。另外,准备一套应急预案,万一真坏了,怎么以最快度更换,把停机时间压缩到最短。
他看向小陈:三天,你的算法能做到什么程度?
小陈深吸一口气:如果数据质量好,三天应该能完成核心学习阶段。但离完全成熟还有距离。
够用了。林凡说,先解决有无问题,再解决好坏问题。
命令下达,车间再次调整节奏。
监测频次加密,每半小时一次全面检查。应急预案制定出来,更换轴承需要的工具、材料、人员分工都明确到人。小陈的算法进入加学习模式,设备运行的所有数据都被标记、分类、输入模型。
时间在紧绷的状态下缓慢流逝。
周六下午,设备运行第四十八小时。
轴承的杂音开始变得明显,不用听诊器也能隐约听到。精度曲线下滑度再次加快,自适应算法的学习度似乎赶不上硬件退化度。
小陈盯着屏幕上两条曲线,一条是实测精度,一条是算法预测精度。两条线原本在缓慢靠近,但现在又开始拉开距离。
算法学得不够快。他喃喃自语。
韩博走过来:是不是模型太复杂了?学习参数太多,需要的数据量太大?
有可能。小陈调出模型结构,这是一个有三百多个可调参数的深度神经网络。理论上,这种模型能拟合非常复杂的非线性关系,但也需要海量数据来训练。
三天时间,对三百个参数来说,太短了。
简化模型。小陈做出决定,抓住主要矛盾,先解决o的问题。
他开始删减网络层数,减少参数数量。从三百个参数压缩到一百五十个,再从一百五十个压缩到八十个。每删减一层,模型复杂度就降低一档,但拟合能力也下降一档。
就像做选择题,要精度,还是要度?要完美的理论模型,还是要能在有限时间内见效的实用方案?
小陈选择了后者。
新模型编译完成,重新部署。学习度明显加快,精度曲线的下滑趋势再次被抑制。
但代价是,模型对一些极端工况的适应性变差了。设备运行到某些特殊位置时,补偿效果会打折扣。