rssLink RSS dla wszystkich kategorii
 
icon_orange
icon_red
icon_red
icon_blue
icon_blue
icon_blue
icon_green
icon_red
icon_blue
icon_blue
icon_blue
icon_blue
icon_blue
icon_blue
icon_blue
icon_blue
icon_red
icon_blue
icon_orange
icon_red
icon_blue
icon_blue
icon_blue
icon_blue
icon_green
icon_blue
icon_blue
 

FS#15846 — Zamówienie VPS2013

Przydzielony do projektu— VPS
Konserwacja
Backend / Core
ZAMKNIĘTE
100%
29.04.2013 21:09

Witam,

Od kilku dni mamy problemy ze stabilnością serwerów VPS 2013, które były dostarczane nowym klientom. Serwery VPS 2013 zainstalowane kilka tygodni temu działają prawidłowo. Problem pojawił się 10 dni temu. Rozwiązujemy problemy związane z vCloud 5.1 i 1000v, ktore pojawiły się na kilku tysiącach działających serwerów VPS.

Podjęliśmy więc decyzję o wstrzymaniu sprzedaży nowych serwerów VPS do czasu rozwiązania tego problemu. Powinno nam to zająć 7-8 dni. W przyszłym tygodniu (we wtorek lun w środę) wznowimy sprzedaż.

Przez te 7-8 dni podzielimy infrastrukturę VPS na kilka mniejszych części. Spowoduje to przerwę w dostępie do usługi trwającą 60-180 sekund. W przypadku nowych zamówień będziemy korzystać z nowego maksymalnego rozmiaru infrastruktury. Następnie zmienimy konfigurację robotów i API, aby korzystać bezpośrednio z vSphere zamiast z vClouda. Prace te będzie wykonywać 9 osób i będą one trwać 2-3 dni. Następnie przez 2-3 dni będziemy testować panel manager/api i bieżące operacje (reinstalacje, snapshoty). W przyszłą środę problemy na serwerach VPS nie powinny już występować.

W trakcie tych prac mogą pojawić się problemy z panalem manager i z api. Będzie to związane ze zmianą ich konfiguracji. Nie mamy w zwyczaju podejmowania tak radykalnych decyzji jak zawieszenie zamówienia, ale musimy rozwiązać ten problem. Zarządzanie tak dużą liczbą nowych zamówień nie pozwoliłoby nam na sprawdzenie całej infrastruktury.

Przepraszamy za te awarie.

Pozdrawiam
Octave
Data:  wtorek, 24 grudzień 2013, 11:42
Powód zamknięcia:  Done
Komentarz od OVH - wtorek, 30 kwiecień 2013, 09:36

30.04.2013, 03:07

Roboty VPS2013 zostały odłączone. Wszystkie nowe operacje zostaną wykonane w późniejszym czasie. Trwa uruchamianie nowej infrastruktury. Roboty został przekodowane tak, aby łączyły się poprzez vsphere. Wykonujemy teraz testy działania całości i baz danych.


Komentarz od OVH - wtorek, 30 kwiecień 2013, 09:36

30.04.2013, 07:39

Rozpoczynamy migrację.


Komentarz od OVH - wtorek, 30 kwiecień 2013, 10:03

Cały czas trwa przenoszenie na nową infrastrukturę. Prace przebiegają prawidłowo. Migracja została wykonana dla 10% infrastruktury.


Komentarz od OVH - wtorek, 30 kwiecień 2013, 12:29

Migracja została wykonana dla 40% infrastruktury.

Prace przebiegają prawidłowo. Kontynuujemy.


Komentarz od OVH - wtorek, 30 kwiecień 2013, 13:36

Migracja została wykonana dla 60% infrastruktury.

Prace przebiegają prawidłowo. Kontynuujemy.


Komentarz od OVH - wtorek, 30 kwiecień 2013, 16:05

Pozostało około 250 serwerów VPS do przeniesienia.


Komentarz od OVH - czwartek, 02 maj 2013, 08:47

01.05.2013, 00:53

Wszystkie serwery VPS Cloud zostały przeniesione. Kończymy prace polegające na ponownym uruchamianiu niektórych VM, które nie odpowiadają.

Wśród serwerów vps, które nie odpowiadają są serwery windows, które z natury nie pingują.

Zajmujemy się pozostałymi serwerami, które nie odpowiadają. W tym przypadku wykonujemy "vmotion" hosta na inny host i usługa zaczyna odpowiadać.

Pozostało kilka serwerów VPS, które nie zostały skonfigurowane do końca lub ponowna konfiguracja nie powiodła się (uruchomienie ACL, MAC, VLAN, port na 1000v, IP/MAC na routerze, itp). Wznawiamy skrypt dla serwerów VPS, które się nie uruchomiły.


Komentarz od OVH - czwartek, 02 maj 2013, 08:47

01.05.2013, 05:44

Wszystkie VM działają poprawnie.


Komentarz od OVH - czwartek, 02 maj 2013, 08:48

01.05.2013, 05:44

Jeśli pojawi się problem, prosimy o kontakt na adres oles@ovh.net lub na twitterze (@olesovhcom) opisując problem i podając nazwę serwera.


Komentarz od OVH - czwartek, 02 maj 2013, 08:50

01.05.2013, 13:25

Sprawdzając pozostałe serwery VPS, zauważyliśmy problem z outputem VM na 1000v w przypadku, gdy VPS jest zainstalowany na hoście XL.

Wykonujemy migrację wszystkich VM na hosty L2+.


Komentarz od OVH - poniedziałek, 06 maj 2013, 11:57

05.05.2013, 23:15

Witam,

Oto kilka informacji na temat usługi VPS 2013.

Odnaleziono przyczynę problemów ze stabilnością na nowej platformie VPS 2013. Problem był związany z brakiem kompatybilności między fizycznymi serwerami korzystającymi z interfejsu sieciowego 10G i wirtualnym switchem Cisco 1000v. W powodu, którego jeszcze nie znamy, serwery VPS czasami przestawały pingować. Po przeniesieniu serwera na inny host usługa zaczynała działać, następnie znowu się zatrzymywała. Usunęliśmy usługę vCloud, aby mieć pewność, że nie jest ona przyczyną problemu. W sobotę o 4:00 rano przenieśliśmy ostatni serwer VPS z hosta 10G i od tego czasu nie zarejestrowaliśmy niestabilnego działania.

vCloud został zastąpiony przez vSphere. Na poziomie kodowania działa już 80%. Prace nad pozostałą częścią API zostaną zakończone za 48 godzin.

Postaramy się dodać 1 miesiąc do każdego serwera VPS. W ciągu ostatniego miesiąca miało miejsce zbyt dużo awarii, abyśmy mogli pobrać opłatę za taki miesiąc.


Infrastruktury VPS 2013 są chronione przez Arbor. System ten pozwala na filtrowanie prostych ataków i lepsze chronienie infrastruktury przed brakiem stabilności. Czekamy na dodanie nowych funkcji w zależności od rodzaju wykrytego ataku.

Przykro nam z powodu tych awarii.

Pozdrawiam,
Octave