Рейтинг
0.00

Дата-центры OVH

34 читателя, 1208 топиков

stockage SQL

status.ovh.net/?do=details&id=14809
travaux.ovh.net/?do=details&id=25709

Для того, чтобы вместить 3 миллиона в общем хостинге сайтов мы используем 2 центров обработки данных: исторический DC в Париж (P19) и новый DC в Гравелине (GRA1). На P19, мы используем
различные технологии для хранения данных для сайтов веб и базы данных. В большинстве случаев мы использовать нашу технологию SIN или SIN-HA на основе ZFS.

Кроме того, на Р19 в некоторых случаях мы используем хранение EMC VNX 5400 с записью
SSD-накопители. Это решение, которое, мы осуществили в 2012 году, чтобы преодолеть проблемы с производительностью хранения что у нас было в 2012 году на базах данных. от мы устанавливаем производительность на нашем NAS-HA и GRA мы больше не используем наши внутренние решения.

Четверг, 29 Июня в 18:30, у нас был инцидент на один массив хранения данных EMC VNX 5400 мы используем хранить часть хостинг баз данных общий с P19. Это представляет собой сборку из 96
SSD-накопители, настроенные в активный / активный на нескольких физические окна. Набор не хочет, чтобы перезапустить. нам связались с производителем и мы пытаемся найти решение для восстановления данных, размещенных на этом залив.

Массив хранения данных используется для размещения баз из общего хостинга данных. Кроме того, все базы данных BACKUPE данные каждые 24 часа на других системах существующие хранилища в другом RBX1 DC Рубе.

У нас есть 2 текущие действия:

1) Мы находимся в контакте с EMC, с которым мы пытался перезапустить систему. команда RBX приняла массив хранения данных EMC VNX 5400 мы имели в запасные Рубе для транспортировки Р19. Бухта прибытие на P19 в 3 часа ночи и мы стараемся перезагрузить диски в новом массиве хранения. Мы попросили электромагнитные помехи на сайте для поможет нам перезапустить быстро. Мы знаем, не сколько времени это займет, чтобы перезапустить, и если нам удастся восстановить данные. У нас нет ETA. Техника EMC должен быть на сайте до 10:00. Мы будем иметь больше информации это время.

2) поэтому мы начали восстановление баз данных данные из резервной копии. Это восстановление началось полночь утром. Сегодня утром в 9 часов утра, около 15% база
Данные были включены снова в «только для чтения» то, что веб-сайты могут читать данные в базах данных, но не все же может изменить. Мы продолжаем восстановление, что будет принимать до около 20ч той ночи. Весь процесс теперь автоматизированы и мы имеем достаточно для хранения
развертывание этих баз данных Р19.

Следующий шаг. Есть 2 варианта. Вариант А и вариант B.

А) если мы можем восстановить данные из отсека мы сразу же перезапустить все основания данные. нет потери данных.

б) если мы не в состоянии перезапустить залив. в этом случае мы будем активировать режим «чтение и писание «в базах данных, которые были восстановить из резервной копии, которая будет задержкой 22H минимальное и максимальное 1H баз на версии. Данные на момент выхода из строя.

Для отслеживания задач для работы по восстановлению
База данных:
travaux.ovh.net/?do=details&id=25697

113 VM с базой данных были затронуты.

Мы приносим извинения за эту неудачу.
последний крах такого масштаба 2006 года и время мы расспросили все технологии хранения мы используем в OVH. Эта неудача еще один урок, и мы будем сообщаться изменения, которые делают кости закончить этот случай, чтобы избежать повторения следующего провала этой величины в будущее 10 лет.

Network Maintenance, 22nd June

We are writing to inform you of some network maintenance which needs to be carried out this Thursday the 22nd of June, at 5 am. Please find all the details of the intervention below:

Background
To improve our services, since the 6th of June 2017, we have been gradually switching some networks to new routers, especially those using our BHS-3A and BHS-3B routers.

Current situation
Due to a software malfunction on one of the network cards, which was beyond our control, the previous settings have not changed. We therefore need to force the routing to the new equipment, by entering configuration commands.

We also need to update the BHS-3B chassis to make sure that these instructions are registered correctly.

Intervention
To ensure minimal impact, the intervention is scheduled to take place during a period of low traffic: Thursday the 22nd of June at 5 am.

The upgrade is due to take approximately one hour. All the servers will then be routed via BHS-3A, with a possible slight reduction in speed.

Rest assured that we have put all the necessary measures in place to limit any impact on your services.

Please do not hesitate to contact us for any further information.
The OVH team