故障現(xiàn)象
1、內(nèi)部關(guān)鍵業(yè)務(wù)響應(yīng)很慢,信息處理不流暢;
2、服務(wù)器和交換機(jī)的CPU和內(nèi)存利用率低;
3、無(wú)法定位查找到網(wǎng)絡(luò)響應(yīng)慢的原因;
網(wǎng)絡(luò)環(huán)境
1、一臺(tái)cisco3560交換機(jī);
2、局域網(wǎng)內(nèi)有8臺(tái)服務(wù)器,其中4臺(tái)是UNIX系統(tǒng),另外4臺(tái)是Windows 2003系統(tǒng);
現(xiàn)場(chǎng)診斷
首先做Ping 測(cè)試。UNIX系統(tǒng)主機(jī)互ping的比較穩(wěn)定,Ping值均小于1MS。而UNIX系統(tǒng)主機(jī)去Ping Windows系統(tǒng)主機(jī)的Ping值經(jīng)常會(huì)出現(xiàn)9-15MS的延時(shí)。Windows系統(tǒng)主機(jī)之間互Ping值很不穩(wěn)定,在1MS到15MS之間跳躍性出現(xiàn)。
現(xiàn)象分析
該網(wǎng)絡(luò)結(jié)構(gòu)簡(jiǎn)單清晰,服務(wù)器和交換機(jī)的性能良好。網(wǎng)絡(luò)內(nèi)經(jīng)常出現(xiàn)大于1MS的延時(shí)將會(huì)影響到整個(gè)網(wǎng)絡(luò)正常運(yùn)行,對(duì)關(guān)鍵業(yè)務(wù)的運(yùn)行造成影響,要解決該問(wèn)題首先要找出延時(shí)發(fā)生的原因。
眾所周知,一次網(wǎng)絡(luò)交易處理過(guò)程:由客戶(hù)端發(fā)起連接,通過(guò)網(wǎng)絡(luò)轉(zhuǎn)發(fā)到服務(wù)端,服務(wù)端處理后再返回客戶(hù)端的。因此,在整個(gè)交易過(guò)程中的時(shí)延可以由三個(gè)時(shí)間來(lái)決定,客戶(hù)端響應(yīng)時(shí)間(t1)網(wǎng)絡(luò)傳輸所用時(shí)間(t2)服務(wù)端響應(yīng)時(shí)間(t3)。
現(xiàn)場(chǎng)測(cè)試發(fā)現(xiàn)UNIX系統(tǒng)主機(jī)之間ping值穩(wěn)定的小于1MS,而Windows系統(tǒng)主機(jī)之間、或與UNIX系統(tǒng)主機(jī)Ping時(shí)出現(xiàn)較大延時(shí)。這就表明UNIX系統(tǒng)主機(jī)之間通信是良好的,但是與Windows系統(tǒng)主機(jī)通信、或Windows系統(tǒng)主機(jī)之間互相通訊過(guò)程中才會(huì)有延時(shí)的出現(xiàn)。因此,我們推斷是Windows系統(tǒng)主機(jī)響應(yīng)較慢。為了驗(yàn)證以上推斷,我們用科來(lái)網(wǎng)絡(luò)通訊分析系統(tǒng)2009進(jìn)行診斷。
利用科來(lái)網(wǎng)絡(luò)通訊分析系統(tǒng)進(jìn)行網(wǎng)絡(luò)診斷
首先,打開(kāi)科來(lái)網(wǎng)絡(luò)通訊分析系統(tǒng)2009,配置上IP為 190.15.xxx.200,此主機(jī)做為ping發(fā)起者,向一臺(tái)IP地址為190.15.xxx.218的Windows系統(tǒng)主機(jī)進(jìn)行Ping測(cè)試。將該Windows系統(tǒng)主機(jī)的交換機(jī)端口做一個(gè)鏡像,鏡像收發(fā)的流量。然后,用190.15.xxx.200主機(jī)去Ping 190.15.xxx.218,用科來(lái)網(wǎng)絡(luò)通訊分析系統(tǒng)2009進(jìn)行13分鐘的抓包。
抓包過(guò)程中我們發(fā)現(xiàn),190.15.xxx.200主機(jī)在Ping 190.15.xxx.218主機(jī)的時(shí)候會(huì)產(chǎn)生9MS的延時(shí),而且頻率較頻繁。而190.15.xxx.200主機(jī)Ping UNIX系統(tǒng)主機(jī)則都是小于1MS的延時(shí)。另外,在鏡像口收到的icmp response 不很穩(wěn)定,而且是1MS與9MS交替出現(xiàn),表明網(wǎng)絡(luò)是不停在抖動(dòng)。
鏡像的位置是Windows系統(tǒng)主機(jī)的SW端口,因此在echo response出現(xiàn)的延時(shí)可以看做是服務(wù)端響應(yīng)延時(shí),而這個(gè)響應(yīng)經(jīng)常會(huì)出現(xiàn)9MS的時(shí)延。由此驗(yàn)證:該網(wǎng)絡(luò)時(shí)延由win主機(jī)的響應(yīng)慢造成。
然后,登錄到190.15.xxx.218主機(jī),發(fā)現(xiàn)該主機(jī)運(yùn)行了較多的程序,內(nèi)存和CPU利用較高。我們對(duì)該主機(jī)進(jìn)行減壓,在關(guān)閉一款殺毒軟件的進(jìn)程后發(fā)現(xiàn)網(wǎng)絡(luò)延時(shí)不見(jiàn)了,而完全卸載該殺毒軟件后,網(wǎng)絡(luò)ping值全部穩(wěn)定在小于1MS下。
診斷結(jié)果
通過(guò)科來(lái)網(wǎng)絡(luò)通訊分析系統(tǒng)2009的抓包診斷,困擾一個(gè)月的網(wǎng)絡(luò)延時(shí)問(wèn)題終于有了結(jié)果。原來(lái)該局域網(wǎng)此前一直受蠕蟲(chóng)病毒困擾,為了進(jìn)行網(wǎng)絡(luò)安全防御,給每個(gè)Windows系統(tǒng)主機(jī)裝了一款殺毒軟件,并且該殺毒軟件默認(rèn)開(kāi)啟了入侵檢測(cè)功能。該功能會(huì)對(duì)每個(gè)到達(dá)服務(wù)器的數(shù)據(jù)包進(jìn)行檢測(cè)后再交給相應(yīng)程序處理,而這個(gè)檢查過(guò)程是很消耗時(shí)間的,所以產(chǎn)生了9MS的延時(shí)。
專(zhuān)業(yè)網(wǎng)絡(luò)故障診斷服務(wù)簡(jiǎn)介
網(wǎng)絡(luò)故障診斷服務(wù)是由科來(lái)軟件專(zhuān)業(yè)網(wǎng)絡(luò)分析技術(shù)人員提供,利用專(zhuān)業(yè)的網(wǎng)絡(luò)分析儀器部署在用戶(hù)指定網(wǎng)段,通過(guò)網(wǎng)絡(luò)數(shù)據(jù)包級(jí)的分析,快速定位分析引起網(wǎng)絡(luò)故障的原因,并提供相關(guān)解決問(wèn)題建議,從而幫助用戶(hù)快速解決問(wèn)題。
網(wǎng)絡(luò)故障診斷服務(wù)旨在為客戶(hù)提供更加人性化的服務(wù),幫助網(wǎng)絡(luò)負(fù)責(zé)人解決切實(shí)的網(wǎng)絡(luò)問(wèn)題,優(yōu)化管理網(wǎng)絡(luò),打造健康安全穩(wěn)定的網(wǎng)絡(luò)服務(wù)。
北京 | 天津 | 上海 | 江蘇 | 山東 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內(nèi)蒙古 |