華為MA5600故障處理常用方法
華為MA5600處理故障時(shí)可以采用多種故障定位方法。在實(shí)際的故障定位過(guò)程中,各種定位方法往往可交叉使用,互為補(bǔ)充。
為提高效率,實(shí)際操作過(guò)程中,華為MA5600故障處理遵循由外到內(nèi)、由大到小的原則,即先查看外部線纜連接是否牢靠、各指示燈狀態(tài)是否正常,然后通過(guò)控制臺(tái)查看系統(tǒng)的整體運(yùn)行狀態(tài),最后再查看各個(gè)模塊的運(yùn)行狀態(tài)。
故障定位的各個(gè)過(guò)程及其常用的方法如表1所示
表1 故障處理流程圖 | ||
故障定位過(guò)程 | 常用方法 | 其它方法 |
排除外部設(shè)備故障 | · 對(duì)比分析 · 互換分析 · 儀表測(cè)試 · 協(xié)議分析 | · 告警分析 · 性能分析 |
故障定位到具體設(shè)備 | · 分段處理 · 配置數(shù)據(jù)分析 | · 告警分析 · 性能分析 |
故障定位到單板 | · 分段處理 · 替換分析 · 儀表測(cè)試 | 協(xié)議分析 |
配置數(shù)據(jù)分析
重配置不當(dāng)、擴(kuò)容配置不當(dāng)、過(guò)往配置遺留的問(wèn)題隱患等都是導(dǎo)致MA5600故障的原因之一,因此定位和排除故障時(shí)有必要對(duì)配置數(shù)據(jù)進(jìn)行檢查分析。維護(hù)工程師必須掌握不同業(yè)務(wù)功能的配置方法、實(shí)現(xiàn)原理,從而掌握不同故障現(xiàn)象需要重點(diǎn)檢查哪些配置數(shù)據(jù),防止盲目定位,降低故障處理效率。
告警分析
通過(guò)分析告警信息,能找到部分故障的原因,或配合其他方法共同定位故障原因。
告警是故障或者事件發(fā)生的重要提示信息,告警信息包含故障或異?,F(xiàn)象的具體描述、可能的原因、修復(fù)建議等,涉及硬件、鏈路、業(yè)務(wù)、CPU占用率等各個(gè)方面,信息豐富、全面,是進(jìn)行故障分析和定位的重要依據(jù)之一。
當(dāng)華為MA5600系統(tǒng)出現(xiàn)故障時(shí),請(qǐng)查看系統(tǒng)是否有告警上報(bào)。如果系統(tǒng)有告警上報(bào),則分析出同本故障相關(guān)的告警,然后根據(jù)告警參數(shù)的指導(dǎo)清除這些告警,進(jìn)而清除故障。
對(duì)比分析
對(duì)比分析是指將故障的部件或現(xiàn)象與正常的部件或現(xiàn)象進(jìn)行比較分析,找出不同點(diǎn),從而判斷問(wèn)題的所在。如:業(yè)務(wù)故障時(shí)的線路參數(shù)與業(yè)務(wù)正常時(shí)進(jìn)行對(duì)比、同等地位的設(shè)備間進(jìn)行對(duì)比。對(duì)比分析適用于故障單一的場(chǎng)合。
互換分析
在更換備件后仍不能定位故障時(shí),可以使用互換分析法定位和排除故障。
互換是指將處于正常狀態(tài)的部件(如單板、線纜等)與可能故障的部件對(duì)調(diào),通過(guò)比較對(duì)調(diào)后二者運(yùn)行狀況的變化,確定故障的范圍或故障點(diǎn)。此方法適用于:
· 在更換部件后,仍然不能確定故障范圍或故障點(diǎn)的場(chǎng)合。
· 故障復(fù)雜的場(chǎng)合。
注意:互換操作具有一定的風(fēng)險(xiǎn)。例如:將短路的單板換到正常的機(jī)框中有可能造成正常機(jī)框損壞。因此,使用互換方法必須謹(jǐn)慎,確保不會(huì)導(dǎo)致新故障。
分段處理
在故障可能原因復(fù)雜,涉及到多個(gè)環(huán)節(jié)時(shí),使用分段處理的方法逐個(gè)排除可能產(chǎn)生故障的環(huán)節(jié),最終定位故障點(diǎn)。
進(jìn)行分段處理的前提是確定可能產(chǎn)生故障的環(huán)節(jié),然后運(yùn)用合適的定位手段(如:各種環(huán)回操作、配置數(shù)據(jù)分析等)進(jìn)行逐個(gè)排查。因此,本操作對(duì)維護(hù)工程師技能有一定要求:
· 對(duì)華為MA5600/MA5603的系統(tǒng)結(jié)構(gòu)和功能特性原理有深入的了解。
· 對(duì)可能導(dǎo)致業(yè)務(wù)故障的各個(gè)環(huán)節(jié)全面了解。
· 熟練掌握環(huán)回、配置數(shù)據(jù)分析等故障診斷操作。
· 熟練使用測(cè)試儀器。
說(shuō)明:分段處理往往涉及整個(gè)組網(wǎng)的各個(gè)環(huán)節(jié),建議按照先遠(yuǎn)程處理后近端處理、由最可能原因到次要原因、由簡(jiǎn)單到復(fù)雜的順序進(jìn)行不同環(huán)節(jié)的排查,以降低故障處理成本,提高故障處理效率。
協(xié)議分析
協(xié)議分析主要用于當(dāng)MA5600/MA5603與上層設(shè)備的對(duì)接出現(xiàn)問(wèn)題時(shí)定位和排除故障,是定位故障的重要手段。
協(xié)議分析是指通過(guò)信令跟蹤、捕獲數(shù)據(jù)包(即通常所說(shuō)的“抓包”)等手段對(duì)故障進(jìn)行分析的方法。協(xié)議分析要求維護(hù)工程師對(duì)協(xié)議有深入的了解,掌握各種協(xié)議報(bào)文的交互流程,從而能夠從捕獲的報(bào)文中找出故障的真正原因。
例如:某用戶不能點(diǎn)播組播節(jié)目,通過(guò)抓包分析發(fā)現(xiàn),BRAS丟棄了該用戶發(fā)出的IGMP報(bào)文。
儀表測(cè)試
儀表測(cè)試法是指使用各種儀器、儀表取得實(shí)際的各種性能參數(shù),對(duì)照正常的參數(shù)值來(lái)定位和排除故障。儀器、儀表以直觀、量化的數(shù)據(jù)直接反映設(shè)備運(yùn)行狀態(tài),在故障處理過(guò)程中有著不可替代的作用。
在故障處理中常用的儀器、儀表包括:
· 萬(wàn)用表
· 線路測(cè)試儀
· 光功率計(jì)
· 光衰減器
性能分析
性能分析是指通過(guò)MA5600/MA5603提供的性能統(tǒng)計(jì)手段,對(duì)發(fā)生故障的業(yè)務(wù)進(jìn)行性能指標(biāo)的分析,從而定位故障原因。
針對(duì)不同的故障類(lèi)別,需要查看不同的統(tǒng)計(jì)信息,這要求維護(hù)工程師:
· 熟悉系統(tǒng)的結(jié)構(gòu)和運(yùn)行機(jī)制。
· 了解系統(tǒng)能夠提供哪些統(tǒng)計(jì)信息。
· 了解如何查看、分析統(tǒng)計(jì)信息。
例如:在以太網(wǎng)端口模式下,使用display port statistics命令查詢以太網(wǎng)端口的統(tǒng)計(jì)信息,根據(jù)以太網(wǎng)端口的統(tǒng)計(jì)信息判斷設(shè)備運(yùn)行是否正常:
· 如果發(fā)現(xiàn)CRC錯(cuò)誤幀增長(zhǎng)很快,說(shuō)明設(shè)備之間可能存在鏈路異常、端口協(xié)商不正確或端口物理故障。
· 如果發(fā)現(xiàn)存在大量的丟棄幀,說(shuō)明對(duì)接設(shè)備發(fā)送的流量超過(guò)了端口的接收能力。