當(dāng)網(wǎng)站訪問(wèn)很慢或無(wú)法訪問(wèn)時(shí),若排除其它顯著問(wèn)題,而檢測(cè)到 ping 有明顯丟包時(shí),建議您作鏈路測(cè)試。Linux 環(huán)境下,您可以通過(guò) mtr 命令行工具(優(yōu)先使用) 或 traceroute 命令行工具進(jìn)行鏈路測(cè)試來(lái)判斷問(wèn)題來(lái)源。
通常情況下,請(qǐng)依照下述步驟進(jìn)行處理:
利用鏈路測(cè)試工具探測(cè)網(wǎng)絡(luò)狀況和服務(wù)器狀態(tài)。
根據(jù)鏈路測(cè)試結(jié)果分析處理。
mtr命令行工具(優(yōu)先使用)
mtr (My traceroute)幾乎是所有 Linux 發(fā)行版本預(yù)裝的網(wǎng)絡(luò)測(cè)試工具,集成了 tracert 與 ping 這兩個(gè)命令的圖形界面,功能十分強(qiáng)大。
ping 與 tracert 通常被用來(lái)檢測(cè)網(wǎng)絡(luò)狀況和服務(wù)器狀態(tài),具體說(shuō)明如下:
命令名稱(chēng) |
具體說(shuō)明 |
ping |
送出封包到指定的服務(wù)器。如果服務(wù)器有回應(yīng)就會(huì)傳送回封包,并附帶返回封包來(lái)回的時(shí)間。 |
tracret |
返回從用戶(hù)的電腦到指定的服務(wù)器中間經(jīng)過(guò)的所有節(jié)點(diǎn)(路由)以及每個(gè)節(jié)點(diǎn)的回應(yīng)速度。 |
mtr 默認(rèn)發(fā)送 ICMP 數(shù)據(jù)包進(jìn)行鏈路探測(cè),通過(guò) -u 參數(shù)來(lái)指定 UDP 數(shù)據(jù)包用于探測(cè)。相對(duì)于 traceroute 只作一次鏈路跟蹤測(cè)試,mtr 會(huì)對(duì)鏈路上的相關(guān)節(jié)點(diǎn)做持續(xù)探測(cè)并給出相應(yīng)的統(tǒng)計(jì)信息。mtr 能避免節(jié)點(diǎn)波動(dòng)對(duì)測(cè)試結(jié)果的影響,所以其測(cè)試結(jié)果更正確,建議優(yōu)先使用。
用法說(shuō)明
1. mtr [-hvrctglspni46] [--help] [--version] [--report]
2. [--report-cycles=COUNT] [--curses] [--gtk]
3. [--raw] [--split] [--no-dns] [--address interface]
4. [--psize=bytes/-s bytes]
5. [--interval=SECONDS] HOSTNAME [PACKETSIZE]
常見(jiàn)可選參數(shù)說(shuō)明
-r 或 —report:以報(bào)告模式顯示輸出。
-p 或 —split:將每次追蹤的結(jié)果分別列出來(lái),而非如 —report 統(tǒng)計(jì)整個(gè)結(jié)果。
-s 或 —psize:指定 ping 數(shù)據(jù)包的大小。
-n 或 —no-dns:不對(duì) IP 地址做域名反解析。
-a 或 —address:設(shè)置發(fā)送數(shù)據(jù)包的 IP 地址。用于主機(jī)有多個(gè) IP 時(shí)。
-4:只使用 IPv4 協(xié)議。
-6:只使用 IPv6 協(xié)議。
在mtr運(yùn)行過(guò)程中,您也可以輸入相應(yīng)字母來(lái)快速切換模式,各字母的含義如下:
? 或 h:顯示幫助菜單。
d:切換顯示模式。
n:切換啟用或禁用 DNS 域名解析。
u:切換使用 ICMP 或 UDP 數(shù)據(jù)包進(jìn)行探測(cè)。
返回結(jié)果說(shuō)明
默認(rèn)配置下,返回結(jié)果中各數(shù)據(jù)列的說(shuō)明如下:
第一列(Host):節(jié)點(diǎn) IP 地址和域名。如前面所示,按 n 鍵可以切換顯示。
第二列(Loss%):節(jié)點(diǎn)丟包率。
第三列(Snt):每秒發(fā)送數(shù)據(jù)包數(shù)。默認(rèn)值是 10,可以通過(guò)參數(shù) -c 指定。
第四列(Last):最近一次的探測(cè)延遲值。
第五、六、七列(Avg、Best、Wrst):分別是探測(cè)延遲的平均值、最小值和最大值。
第八列(StDev):標(biāo)準(zhǔn)偏差。越大說(shuō)明相應(yīng)節(jié)點(diǎn)越不穩(wěn)定。
traceroute命令行工具
traceroute 是幾乎所有 Linux 發(fā)行版本預(yù)裝的網(wǎng)絡(luò)測(cè)試工具,用于跟蹤 Internet 協(xié)議(IP)數(shù)據(jù)包傳送到目標(biāo)地址時(shí)經(jīng)過(guò)的路徑。
traceroute 先發(fā)送具有小的最大存活時(shí)間值(Max_TTL)的 UDP 探測(cè)數(shù)據(jù)包,然后偵聽(tīng)從網(wǎng)關(guān)開(kāi)始的整個(gè)鏈路上的 ICMP TIME_EXCEEDED 響應(yīng)。探測(cè)從 TTL=1 開(kāi)始,TTL值逐步增加,直至接收到 ICMP PORT_UNREACHABLE 消息。ICMP PORT_UNREACHABLE 消息用于標(biāo)識(shí)目標(biāo)主機(jī)已經(jīng)被定位,或命令已經(jīng)達(dá)到允許跟蹤的最大TTL值。
traceroute 默認(rèn)發(fā)送 UDP 數(shù)據(jù)包進(jìn)行鏈路探測(cè)??梢酝ㄟ^(guò) -I 參數(shù)來(lái)指定發(fā)送 ICMP 數(shù)據(jù)包用于探測(cè)。
用法說(shuō)明
traceroute [-I] [ -m Max_ttl ] [ -n ] [ -p Port ] [ -q Nqueries ] [ -r ] [ -s SRC_Addr ] [ -t TypeOfService ] [ -f flow ] [ -v ] [ -w WaitTime ] Host [ PacketSize ]
常見(jiàn)可選參數(shù)說(shuō)明
-d 使用 Socket 層級(jí)的排錯(cuò)功能。
-f 設(shè)置第一個(gè)檢測(cè)數(shù)據(jù)包的存活數(shù)值 TTL 的大小。
-F 設(shè)置不要分段標(biāo)識(shí)。
-g 設(shè)置來(lái)源路由網(wǎng)關(guān),最多可設(shè)置 8 個(gè)。
-i 使用指定的網(wǎng)卡送出數(shù)據(jù)包。用于主機(jī)有多個(gè)網(wǎng)卡時(shí)。
-I 使用 ICMP 數(shù)據(jù)包替代 UDP 數(shù)據(jù)包進(jìn)行探測(cè)。
-m 設(shè)置檢測(cè)數(shù)據(jù)包的最大存活數(shù)值 TTL 的大小。
-n 直接使用 IP 地址而非主機(jī)名稱(chēng)(禁用 DNS 反查)。
-p 設(shè)置 UDP 傳輸協(xié)議的通信端口。
-r 忽略普通的 Routing Table,直接將數(shù)據(jù)包送到遠(yuǎn)端主機(jī)上。
-s 設(shè)置本地主機(jī)送出數(shù)據(jù)包的 IP 地址。
-t 設(shè)置檢測(cè)數(shù)據(jù)包的 TOS 數(shù)值。
-v 詳細(xì)顯示指令的執(zhí)行過(guò)程。
-w 設(shè)置等待遠(yuǎn)端主機(jī)回包時(shí)間。
-x 開(kāi)啟或關(guān)閉數(shù)據(jù)包的正確性檢驗(yàn)。
分析鏈路測(cè)試結(jié)果
以如下鏈路測(cè)試結(jié)果示例圖為基礎(chǔ)進(jìn)行闡述:
操作步驟
1.判斷各區(qū)域是否存在異常,并根據(jù)各區(qū)域的情況分別處理。
區(qū)域 A:客戶(hù)端本地網(wǎng)絡(luò),即本地局域網(wǎng)和本地網(wǎng)絡(luò)提供商網(wǎng)絡(luò)。針對(duì)該區(qū)域異常,客戶(hù)端本地網(wǎng)絡(luò)相關(guān)節(jié)點(diǎn)問(wèn)題,請(qǐng)對(duì)本地網(wǎng)絡(luò)進(jìn)行排查分析;本地網(wǎng)絡(luò)提供商網(wǎng)絡(luò)相關(guān)節(jié)點(diǎn)問(wèn)題,請(qǐng)向當(dāng)?shù)剡\(yùn)營(yíng)商反饋。
區(qū)域 B:運(yùn)營(yíng)商骨干網(wǎng)絡(luò)。針對(duì)該區(qū)域異常,可根據(jù)異常節(jié)點(diǎn) IP 查詢(xún)歸屬運(yùn)營(yíng)商,然后直接或通過(guò)售后技術(shù)支持,向相應(yīng)運(yùn)營(yíng)商反饋問(wèn)題。
區(qū)域 C:目標(biāo)服務(wù)器本地網(wǎng)絡(luò),即目標(biāo)主機(jī)歸屬網(wǎng)絡(luò)提供商網(wǎng)絡(luò)。針對(duì)該區(qū)域異常,需要向目標(biāo)主機(jī)歸屬網(wǎng)絡(luò)提供商反饋問(wèn)題。
2.結(jié)合 Avg(平均值)和 StDev(標(biāo)準(zhǔn)偏差),判斷各節(jié)點(diǎn)是否存在異常。
若 StDev 很高,則同步觀察相應(yīng)節(jié)點(diǎn)的 Best 和 Wrst,來(lái)判斷相應(yīng)節(jié)點(diǎn)是否存在異常。
若 StDev 不高,則通過(guò) Avg 來(lái)判斷相應(yīng)節(jié)點(diǎn)是否存在異常。
注意:上述 StDev 高 或者 不高,并沒(méi)有具體的時(shí)間范圍標(biāo)準(zhǔn)。而需要根據(jù)同一節(jié)點(diǎn)其它列的延遲值大小來(lái)進(jìn)行相對(duì)評(píng)估。比如,如果 Avg 為 30 ms,那么,當(dāng) StDev 為 25 ms,則認(rèn)為是很高的偏差。而如果 Avg 為 325 ms,則同樣的 StDev(25 ms),反而認(rèn)為是不高的偏差。
3.查看節(jié)點(diǎn)丟包率,若 Loss% 不為零,則說(shuō)明這一跳網(wǎng)絡(luò)可能存在問(wèn)題。
導(dǎo)致節(jié)點(diǎn)丟包的原因通常有兩種:
Ø 人為限制了節(jié)點(diǎn)的 ICMP 發(fā)送速率,導(dǎo)致丟包。
Ø 節(jié)點(diǎn)確實(shí)存在異常,導(dǎo)致丟包。
4.確定當(dāng)前異常節(jié)點(diǎn)的丟包原因。
Ø 若隨后節(jié)點(diǎn)均沒(méi)有丟包,說(shuō)明當(dāng)前節(jié)點(diǎn)丟包是由于運(yùn)營(yíng)商策略限制所致,可以忽略。如前文鏈路測(cè)試結(jié)果示例圖中的第 2 跳所示。
Ø 若隨后節(jié)點(diǎn)也出現(xiàn)丟包,說(shuō)明當(dāng)前節(jié)點(diǎn)存在網(wǎng)絡(luò)異常,導(dǎo)致丟包。如前文鏈路測(cè)試結(jié)果示例圖中的第 5 跳所示。
說(shuō)明:前述兩種情況可能同時(shí)發(fā)生,即相應(yīng)節(jié)點(diǎn)既存在策略限速,又存在網(wǎng)絡(luò)異常。對(duì)于這種情況,若當(dāng)前節(jié)點(diǎn)及其后續(xù)節(jié)點(diǎn)連續(xù)出現(xiàn)丟包,而且各節(jié)點(diǎn)的丟包率不同,則通常以最后幾跳的丟包率為準(zhǔn)。如前文鏈路測(cè)試結(jié)果示例圖所示,在第 5、6、7跳均出現(xiàn)了丟包。所以,最終丟包情況,以第 7 跳的 40% 作為參考。
5.通過(guò)查看是否有明顯的延遲,來(lái)確認(rèn)節(jié)點(diǎn)是否存在異常。通過(guò)如下兩個(gè)方面進(jìn)行分析:
Ø 若某一跳之后延遲明顯陡增,則通常判斷該節(jié)點(diǎn)存在網(wǎng)絡(luò)異常。如前文鏈路測(cè)試結(jié)果示例圖所示,從第 5 跳之后的后續(xù)節(jié)點(diǎn)延遲明顯陡增,則推斷是第 5 跳節(jié)點(diǎn)出現(xiàn)了網(wǎng)絡(luò)異常。
注意:高延遲并不一定完全意味著相應(yīng)節(jié)點(diǎn)存在異常,延遲大也有可能是在數(shù)據(jù)回包鏈路中引發(fā)的,建議結(jié)合 反向鏈路測(cè)試一并分析。
Ø ICMP 策略限速也可能會(huì)導(dǎo)致相應(yīng)節(jié)點(diǎn)的延遲陡增,但后續(xù)節(jié)點(diǎn)通常會(huì)恢復(fù)正常。如前文鏈路測(cè)試結(jié)果示例圖所示,第 3 跳有 100% 的丟包率,同時(shí)延遲也明顯陡增。但隨后節(jié)點(diǎn)的延遲馬上恢復(fù)了正常。所以判斷該節(jié)點(diǎn)的延遲陡增及丟包是由于策略限速所致。