1,問題描述

如上圖拓撲:

某局點本端兩臺AR3260路由器做主備,與IDC機房2臺其他廠商路由器通過傳輸專線做對接。對接方式爲靜態路由。客戶希望正常情況下業務走主路由器,主路由器鏈路故障時,備路由器接管業務。目前已經在主路由器和備路由器做好不同優先級的靜態路由配置。對端廠商設備也做好了相應的配置。因過傳輸設備,中間有若干節點,中間節點故障或對端路由器故障不會使我方路由器的互聯接口狀態轉爲DOWN,故現做NQA與靜態路由聯動,檢測對端互聯IP的可達性。若互聯IP不可達,則聯動的靜態路由被失效,備路由器的次優路由生效,業務切至備路由器。

客戶做完配置後實測,正常情況下,測試業務PC端tracert 業務正常通過主路由器互聯IP通信;

在主路由器上對互聯接口shutdown,模擬鏈路故障,查看路由表,靜態路由失效,備路由器的路由生效,終端PC 進行tracert發現業務已切換至備路由器互聯IP通信,測試正常。

在對端路由器上對互聯接口shutdown,模擬鏈路故障,查看路由表,靜態路由未失效,終端PC進行tracert,業務依然走至主路由器後無法繼續通信。NQA未按正常預計失效掉靜態路由。測試失敗。

2,告警信息

業務未正常切換,靜態路由器未失效,依然在主路由器

3,處理過程

第一步:故障出現時,查看路由表,靜態路由依然生效。

第二步:對互聯IP進行ping測試,發現對端互聯IP已經ping不通。

第三步:查看NQA配置:

nqa test-instance IDC ZHU

test-type icmp

destination-address ipv4 10.XXX.1.249

frequency 15

interval seconds 3

timeout 1

start now

配置正常,已經start now啓動

第四步:檢查NQA測試結果,使用命令display nqa results test-instance IDC ZHU,查看對應NQA測試例的檢測信息,有以下回顯:

NQA entry(IDC, ZHU) :testflag is active ,testtype is icmp

1 . Test 96902 result The test is finished

Send operation times: 3 Receive response times: 0

Completion:failed RTD OverThresholds number: 0

Attempts number:1 Drop operation number:0

Disconnect operation number:0 Operation timeout number:3

System busy operation number:0 Connection fail number:0

Operation sequence errors number:0 RTT Status errors number:0

Destination ip address:10.XXX.1.249

Min/Max/Average Completion Time: 0/0/0

Sum/Square-Sum Completion Time: 0/0

Last Good Probe Time: 0000-00-00 00:00:00.0

Lost packet ratio: 100 %

2 . Test 96903 result The test is finished

Send operation times: 3 Receive response times: 0

Completion:failed RTD OverThresholds number: 0

Attempts number:1 Drop operation number:0

Disconnect operation number:0 Operation timeout number:3

System busy operation number:0 Connection fail number:0

Operation sequence errors number:0 RTT Status errors number:0

Destination ip address:10.XXX.1.249

Min/Max/Average Completion Time: 0/0/0

Sum/Square-Sum Completion Time: 0/0

Last Good Probe Time: 0000-00-00 00:00:00.0

Lost packet ratio: 100 %

此命令會顯示最近5次的 NQA檢測結果,根據回顯,NQA已經檢測到測試IP不可達。

第五步:檢查靜態路由聯動配置:

ip route-static 10.xx3.1.0 255.255.255.0 10.xxx.1.249 description TO-IDC track nqa IDC ZHU

檢查發現靜態路由聯動配置錯誤。上述回顯,description後是描述信息。經確定,是客戶在原靜態路由基礎上,直接複製全部配置在其後增加 track nqa IDC ZHU 配置,然後刷配置進設備。實際上此次配置只是修改了靜態路由的描述信息,因描述信息可以增加空格,客戶勿以爲已經做好NQA聯動。正確靜態路由配置如下:

ip route-static 10.xx3.1.0 255.255.255.0 10.xxx.1.249 track nqa IDC ZHU description TO-IDC

修改靜態路由器聯動配置後,查看路由表,對應靜態路由已經正常失效,備路由器次優路由生效,業務正常切換。重新恢復鏈路後進行主備切換測試,均正常切換。

恢復鏈路後NQA檢查結果如下:

NQA entry(IDC, ZHU) :testflag is active ,testtype is icmp

1 . Test 1 result The test is finished

Send operation times: 3 Receive response times: 3

Completion:success RTD OverThresholds number: 0

Attempts number:1 Drop operation number:0

Disconnect operation number:0 Operation timeout number:0

System busy operation number:0 Connection fail number:0

Operation sequence errors number:0 RTT Status errors number:0

Destination ip address:10.xxx.1.249

Min/Max/Average Completion Time: 10/360/133

Sum/Square-Sum Completion Time: 400/130600

Last Good Probe Time: 2018-04-13 14:50:34.4

Lost packet ratio: 0 %

可看到Completion:字段結果爲success

查看路由表:

dis ip routing-table

Route Flags: R - relay, D - download to fib

------------------------------------------------------------------------------

Routing Tables: Public

Destinations : 8 Routes : 8

Destination/Mask Proto Pre Cost Flags NextHop Interface

10.xx3.1.0/24 Static 60 0 RD 10.xxx.1.249 GigabitEthernet0/0/3

靜態路由正常生效。

斷開接口口查看NQA狀態:

NQA entry(IDC, ZHU) :testflag is active ,testtype is icmp

1 . Test 52 result The test is finished

Send operation times: 3 Receive response times: 0

Completion:failed RTD OverThresholds number: 0

Attempts number:1 Drop operation number:2

Disconnect operation number:0 Operation timeout number:1

System busy operation number:0 Connection fail number:0

Operation sequence errors number:0 RTT Status errors number:0

Destination ip address:10.xxx.1.249

Min/Max/Average Completion Time: 0/0/0

Sum/Square-Sum Completion Time: 0/0

Last Good Probe Time: 0000-00-00 00:00:00.0

Lost packet ratio: 100 %

NQA按預期轉爲failed

查看路由表:

Routing Tables: Public

Destinations : 8 Routes : 8

Destination/Mask Proto Pre Cost Flags NextHop Interface

10.XX3.1.0/24 O_ASE 150 1 D 10.XX5.2.22 XGigabitEthernet0/0/0.1

可看到靜態路由已經失效,業務路由已經從鄰居學到,業務已經轉至備路由器。

經測試,NQA正常工作,故障解決。

4,根因

主要原因有以下幾點:

第一:本地靜態路由是否生效,依賴於對應的下一跳互聯接口直連路由是否存在,以及對應的聯動策略是否生效。客戶在本端路由器做接口故障模擬時,因接口被shutdown,直連路由失效,所以對應的靜態路由同時失效,並不是因NQA聯動原因失效。

第二:靜態路由描述信息可增加空格,做配置模板時未實際配置命令做測試,導致勿以爲聯動配置已經做上。實際上重複制命令後只是修改了靜態路由的描述信息。正確的聯動配置要在下一跳IP之後開始配置,描述信息會被顯示在所有命令之後。

5,解決方案

修改靜態路由聯動NQA的正常配置後解決

6,建議與總結

直連路由會影響靜態路由是否生效,需要注意。

描述信息會顯示在配置最後面,做配置模板要做配置實際驗證,新配置要在描述信息之前。

查看原文 >>
相關文章