在組網(wǎng)規(guī)模相對大一些的局域網(wǎng)環(huán)境中,交換機的使用數(shù)量往往比較多,這些交換機在進行相互連接時,很容易被人為地連接錯誤,從而引發(fā)網(wǎng)絡環(huán)路故障,要是對應交換機沒有正常啟用STP功能時,網(wǎng)絡環(huán)路故障就會造成通信數(shù)據(jù)包在網(wǎng)絡傳輸通道中反復不停地進行轉發(fā),最終形成廣播風暴,那樣一來整個局域網(wǎng)都有可能發(fā)生癱瘓故障。筆者在管理、維護局域網(wǎng)的過程中也曾多次遭遇到這種網(wǎng)絡故障,其中一次故障的排除經歷令筆者記憶猶新,筆者巧妙地利用了新交換機的網(wǎng)絡環(huán)回監(jiān)測受控功能,迅速地找到了發(fā)生網(wǎng)絡環(huán)路的節(jié)點,現(xiàn)在本文就將該故障的排除過程還原出來,供各位朋友參考交流!
案發(fā)現(xiàn)場
筆者所管理的局域網(wǎng)規(guī)模比較大,大約有300臺左右的計算機分布在10層大樓上,每一臺計算機都通過100M雙絞線連接到各個樓層的二層交換機上,每一樓層的交換機又會通過寬帶光纖線纜直接與單位局域網(wǎng)的核心交換機相連,最后局域網(wǎng)通過硬件防火墻連上了Internet網(wǎng)絡。 為了便于高效管理和維護網(wǎng)絡,筆者根據(jù)每個樓層的實際情況,在每一臺二層交換機上都劃分了多個虛擬工作子網(wǎng),這樣一來每個虛擬工作子網(wǎng)的上網(wǎng)狀態(tài)是相互獨立的,即使某個虛擬工作子網(wǎng)中不幸遭遇了網(wǎng)絡病毒的襲擊,也不會對整個局域網(wǎng)網(wǎng)絡的穩(wěn)定運行造成影響;同時,日后遇到網(wǎng)絡故障時,筆者也能將故障范圍縮小到某個虛擬工作子網(wǎng)中進行解決,而不需要在整個局域網(wǎng)中進行大范圍排查。
平時,局域網(wǎng)中的所有計算機都能正常上網(wǎng)?墒牵罱骋惶,筆者突然接到電話,說八樓某房間不能正常上網(wǎng),懇請能夠到現(xiàn)場幫忙解決一下;筆者剛剛放下電話,準備遠程登錄進對應房間所連的二層交換機上,看看其交換端口是否處于激活、啟用狀態(tài)時,接二連三的電話不停地打到筆者的辦公室,一打聽這些故障電話都來自八樓,并且都報告說計算機突然不能正常上網(wǎng)。
謎霧重重
這么多來自八樓的故障電話,告訴筆者整個八樓看來都不能上網(wǎng)了,難道是對應樓層的交換機發(fā)生了死機或其他意想不到的故障了?以前筆者也多次遇到過某個樓層都不能上網(wǎng)的故障,每次只要重新啟動一下對應樓層的二層交換機,往往就能恢復整個樓層的上網(wǎng)狀態(tài)了。為了驗證自己的猜測,筆者立即嘗試以telnet連接來遠程登錄位于八樓的二層交換機系統(tǒng),可是等了好長時間,也無法遠程登錄成功,顯然該樓層的二層交換機工作狀態(tài)不正常。筆者不放心,又以系統(tǒng)管理員身份登錄進入了局域網(wǎng)的核心交換機,利用該交換機后臺管理系統(tǒng)提供的“display cpu”命令,查看了核心交換機上各個插槽板卡的CPU消耗情況,結果發(fā)現(xiàn)2號板卡的CPU使用率已經超過了50%,而根據(jù)以往經驗筆者得知,核心交換機每塊插卡正常工作時CPU使用率不會超過50%的,正常處于20%-30%之間波動(如圖1所示);繼續(xù)檢查時,筆者發(fā)現(xiàn)2號板卡中的某個交換端口恰好就是連接八樓二層交換機的那個端口,使用“display interface”命令查看該端口的工作狀態(tài)時,該端口已經處于“down”狀態(tài)了,同時筆者看到該端口的輸入、輸出數(shù)據(jù)流量特別大,達到了驚人的每秒萬兆級別了,這與平時的每秒幾百兆級別相差也太大了,看來位于八樓的二層交換機系統(tǒng)的確存在問題。
由于無法遠程登錄八樓的二層交換機系統(tǒng),筆者只好趕赴該交換機的現(xiàn)場,通過觀察交換機控制面板上的信號燈狀態(tài),并不能找出明顯的故障痕跡;不得已,筆者只好先嘗試著重新啟動一下該樓層交換機系統(tǒng),重啟成功沒有多久,八樓中的計算機又能正常上網(wǎng)了,原以為這種故障現(xiàn)象已經被成功解決了,可是沒有多長時間,八樓的二層交換機系統(tǒng)工作狀態(tài)又不正常了,并且該交換機與核心交換機相連的級聯(lián)端口輸入、輸出數(shù)據(jù)流量還是特別大。后來,筆者在核心交換機后臺系統(tǒng)不停地執(zhí)行“display interface”命令,查看八樓的二層交換機級聯(lián)端口工作狀態(tài),發(fā)現(xiàn)該端口的輸出廣播包不停地增大,很明顯上述故障問題不在八樓的二層交換機系統(tǒng)上,很可能是連接到該交換機下面的虛擬工作子網(wǎng)中出現(xiàn)了廣播風暴現(xiàn)象。
峰回路轉
一般來說,引起廣播風暴現(xiàn)象的因素有很多,比方說虛擬工作子網(wǎng)中存在網(wǎng)絡病毒或硬件設備損壞現(xiàn)象,或者是某個交換端口出現(xiàn)了瓶頸現(xiàn)象,也有可能是虛擬工作子網(wǎng)中出現(xiàn)了網(wǎng)絡環(huán)路現(xiàn)象。由于八樓的二層交換機上同時劃分有幾個虛擬工作子網(wǎng),每個虛擬工作子網(wǎng)中又包含了多臺計算機,如果單純依靠手工方法去尋找網(wǎng)絡硬件設備的損壞或網(wǎng)絡病毒,工作量將十分巨大?紤]到虛擬工作子網(wǎng)中發(fā)生網(wǎng)絡硬件損壞的現(xiàn)象屬于極個別現(xiàn)象,這種極個別的硬件損壞一般不會造成這么大輸出、輸入數(shù)據(jù)流量,為此筆者打算先從網(wǎng)絡環(huán)路因素著手,來排除整個八樓不能上網(wǎng)的故障現(xiàn)象。
北京 | 天津 | 上海 | 江蘇 | 山東 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內蒙古 |