rssLink RSS dla wszystkich kategorii
 
icon_green
icon_red
icon_red
icon_blue
icon_green
icon_green
icon_green
icon_red
icon_green
icon_green
icon_blue
icon_green
icon_blue
icon_green
icon_green
icon_green
icon_red
icon_green
icon_orange
icon_red
icon_green
icon_green
icon_green
icon_green
icon_green
icon_green
icon_green
 

FS#11343 — ams-1-6k karta 3

Przydzielony do projektu— Sieć Internet i szafy
Nagła usterka
cała sieć
ZAMKNIĘTE
100%
Około godziny 14 wystąpił problem z jednym z łącz 10G jednego z naszych dostawców tranzytu (TATA). Sesja BGP się urywa, następnie znów jest UP. Przeciąża to wiele routerów ams-1-6k.

Odłączyliśmy jedną z dwóch sesji z TATA w Amsterdamie. Z drugim łączem 10G z TATA nie ma problemów.
Data:  niedziela, 23 sierpień 2009, 15:15
Powód zamknięcia:  Done
Komentarz od OVH - sobota, 22 sierpień 2009, 21:36

ams-1-6k-gsw#ping 94.23.122.81

Type escape sequence to abort.
Sending 5, 100-byte ICMP Echos to 94.23.122.81, timeout is 2 seconds:
.....
ams-1-6k-gsw(config-router)#neighbor 94.23.122.81 shutdown

Router TATA nie odpowiada. Kontaktujemy ich, aby dowiedzieć się, co się dzieje.


Komentarz od OVH - sobota, 22 sierpień 2009, 21:42

Pozostałe łącze 10G TATA jest przeciążone. Odwrócimy routing między GBLX/TATA i Londyn/Amsterdam.


Komentarz od OVH - sobota, 22 sierpień 2009, 22:08

Routing został zmieniony.
Korzystamy z 2x10G z TATA do Londynu zamiast Amsterdamu i 2x10G z GBLX do Amsterdamu zamiast 3x10G do Londynu.


Komentarz od OVH - sobota, 22 sierpień 2009, 22:38

Problem został rozwiązany. Sprawdzimy z TATA łącze 10G do Amsterdamu.


Komentarz od OVH - sobota, 22 sierpień 2009, 23:04

Problem nie został rozwiązany. Ruch do var-1-6k jest związany z jednym z 2 łącz 10G. Łącze to jest na tej samej karcie co TATA. Restartujemy kartę 3.


Komentarz od OVH - niedziela, 23 sierpień 2009, 08:57

22.08.2009 23:36
Po restarcie karty 3 problem został rozwiązany.

W logach karty 3 nie było informacji o problemach. Mimo to zaczęła ona nieprawidłowo routować pakiety około godziny 14:00 przez około godzinę, następnie działała prawidłowo przez 30 minut, później znowu wystąpił problem przez około godzinę. Router powinien sam zrestartować kartę.

Ten rodzaj problemu nie jest łatwy do odnalezienia i naprawienia. Na http://smokeping.ovh.net nie widać żadnych problemów z usługami.

Musimy zastanowić się, w jaki sposób rozpoznawać wewnętrzne problemy z routingiem, gdy tylko 4x10G jednego routera nie działa prawidłowo.

Przepraszamy za problem.


Komentarz od OVH - niedziela, 23 sierpień 2009, 08:58

4x10G, których dotyczył problem:

ams-1-6k-gsw#sh inter statu | i Te3/
Te3/1 var-1-6k:Te1/4 connected routed full 10G 10Gbase-LR
Te3/2 vss-1-6k:t1/2/2 connected routed full 10G 10Gbase-LR
Te3/3 teleglobe_1 connected routed full 10G 10Gbase-ER
Te3/4 amsix1 connected routed full 10G 10Gbase-LR