當(dāng)前位置:全球制造網(wǎng) > 技術(shù)中心 > 所有分類
不涉及組網(wǎng) 版本R0809P27
堆疊部署,每臺(tái)成員設(shè)備安裝雙300W交流電源供電,成員設(shè)備的兩個(gè)電源分別由兩路PDU供電,通過(guò)交叉涉及實(shí)現(xiàn)供電冗余。
故障發(fā)生當(dāng)天由于機(jī)房動(dòng)環(huán)因素影響導(dǎo)致一路PDU故障無(wú)法正常供電,隨后設(shè)備在同一天發(fā)生整機(jī)重啟,影響業(yè)務(wù)。
兩臺(tái)成員設(shè)備重啟原因都為L(zhǎng)ast reboot reason : Power overload
設(shè)備雙電源冗余在實(shí)際故障發(fā)生時(shí)未生效,理論單電源功能是300W,但參考《MSR 5600路由器 硬件描述》中單板功耗表計(jì)算現(xiàn)場(chǎng)板卡的所需功耗累加值并不到300W。
因此需要確認(rèn)觸發(fā)重啟的機(jī)制。
在設(shè)備重啟并且故障PDU搶修恢復(fù)正常后,查看設(shè)備供電情況發(fā)現(xiàn)在雙電源供電450W的情況下,預(yù)留HMIM卡功耗僅有124W(Remaining power for HMIM: 124W),這說(shuō)明系統(tǒng)內(nèi)部計(jì)算功耗時(shí)并沒(méi)有按給出的板卡功耗累加而是計(jì)算預(yù)留了更多的功耗預(yù)算,達(dá)到了326W。
即此情況下減少到單電源供電,系統(tǒng)確實(shí)可判斷為供電不足。
現(xiàn)場(chǎng)兩臺(tái)MSR56設(shè)備均為單主控、單SPE板卡運(yùn)行,因此按照單板功耗表計(jì)算總功耗時(shí)僅各計(jì)算了一份功耗。
但系統(tǒng)內(nèi)部計(jì)算是需要為雙主控和雙SPE板卡預(yù)留功耗的,因?yàn)檫@兩類板卡對(duì)于MSR56設(shè)備來(lái)說(shuō)都是高優(yōu)供電硬件。
這種計(jì)算是為了防止單電源情況下新插一塊SPE板卡導(dǎo)致整機(jī)供電不足下電而設(shè)計(jì)的提前告警。
雙倍計(jì)算SPE板卡功耗后,現(xiàn)場(chǎng)每個(gè)成員設(shè)備整機(jī)功耗都達(dá)到300W以上。
在現(xiàn)場(chǎng)版本,當(dāng)設(shè)備2小時(shí)內(nèi)發(fā)現(xiàn)一直處于功耗預(yù)留不足的情況下,就會(huì)觸發(fā)整機(jī)重啟,即如下提示打?。?/p>
%Jun 26 19:15:46:203 2022 XXX POWER/3/PowerDriverLog: Power overload. Please add a power supply or uninstall an HMIM. Otherwise the device will reboot in 116 minutes.
由于重啟會(huì)觸發(fā)網(wǎng)絡(luò)中斷,后續(xù)版本(如2021年度版本R0821P18)對(duì)該機(jī)制做了優(yōu)化:
1.預(yù)留功耗計(jì)算方式保持不變;
2.發(fā)現(xiàn)功耗預(yù)留不足時(shí)僅打印告警日志,但不會(huì)觸發(fā)倒計(jì)時(shí)2小時(shí)后重啟