stockage SQL

status.ovh.net/?do=details&id=14809
travaux.ovh.net/?do=details&id=25709

Для того, чтобы вместить 3 миллиона в общем хостинге сайтов мы используем 2 центров обработки данных: исторический DC в Париж (P19) и новый DC в Гравелине (GRA1). На P19, мы используем
различные технологии для хранения данных для сайтов веб и базы данных. В большинстве случаев мы использовать нашу технологию SIN или SIN-HA на основе ZFS.

Кроме того, на Р19 в некоторых случаях мы используем хранение EMC VNX 5400 с записью
SSD-накопители. Это решение, которое, мы осуществили в 2012 году, чтобы преодолеть проблемы с производительностью хранения что у нас было в 2012 году на базах данных. от мы устанавливаем производительность на нашем NAS-HA и GRA мы больше не используем наши внутренние решения.

Четверг, 29 Июня в 18:30, у нас был инцидент на один массив хранения данных EMC VNX 5400 мы используем хранить часть хостинг баз данных общий с P19. Это представляет собой сборку из 96
SSD-накопители, настроенные в активный / активный на нескольких физические окна. Набор не хочет, чтобы перезапустить. нам связались с производителем и мы пытаемся найти решение для восстановления данных, размещенных на этом залив.

Массив хранения данных используется для размещения баз из общего хостинга данных. Кроме того, все базы данных BACKUPE данные каждые 24 часа на других системах существующие хранилища в другом RBX1 DC Рубе.

У нас есть 2 текущие действия:

1) Мы находимся в контакте с EMC, с которым мы пытался перезапустить систему. команда RBX приняла массив хранения данных EMC VNX 5400 мы имели в запасные Рубе для транспортировки Р19. Бухта прибытие на P19 в 3 часа ночи и мы стараемся перезагрузить диски в новом массиве хранения. Мы попросили электромагнитные помехи на сайте для поможет нам перезапустить быстро. Мы знаем, не сколько времени это займет, чтобы перезапустить, и если нам удастся восстановить данные. У нас нет ETA. Техника EMC должен быть на сайте до 10:00. Мы будем иметь больше информации это время.

2) поэтому мы начали восстановление баз данных данные из резервной копии. Это восстановление началось полночь утром. Сегодня утром в 9 часов утра, около 15% база
Данные были включены снова в «только для чтения» то, что веб-сайты могут читать данные в базах данных, но не все же может изменить. Мы продолжаем восстановление, что будет принимать до около 20ч той ночи. Весь процесс теперь автоматизированы и мы имеем достаточно для хранения
развертывание этих баз данных Р19.

Следующий шаг. Есть 2 варианта. Вариант А и вариант B.

А) если мы можем восстановить данные из отсека мы сразу же перезапустить все основания данные. нет потери данных.

б) если мы не в состоянии перезапустить залив. в этом случае мы будем активировать режим «чтение и писание «в базах данных, которые были восстановить из резервной копии, которая будет задержкой 22H минимальное и максимальное 1H баз на версии. Данные на момент выхода из строя.

Для отслеживания задач для работы по восстановлению
База данных:
travaux.ovh.net/?do=details&id=25697

113 VM с базой данных были затронуты.

Мы приносим извинения за эту неудачу.
последний крах такого масштаба 2006 года и время мы расспросили все технологии хранения мы используем в OVH. Эта неудача еще один урок, и мы будем сообщаться изменения, которые делают кости закончить этот случай, чтобы избежать повторения следующего провала этой величины в будущее 10 лет.
Выделенные серверы OVH
Выделенные серверы Hetzner

0 комментариев

Оставить комментарий