Рейтинг
0.00

Дата-центры OVH

34 читателя, 1208 топиков

Теперь вот длинный ответ

travaux.ovh.net/?do=details&id=28247

Сегодня утром в 7:23 утра у нас был большой перерыв на нашем сайте в Страсбурге (SBG): перерыв в электроснабжении, который оставил три датацентра без электроэнергии в течение 3,5 часов. SBG1, SBG2 и SBG4. Вероятно, это самый худший сценарий, который мог произойти с нами.

Участок SBG питается от линии электропередачи 20 кВА, состоящей из 2 кабелей, каждая из которых обеспечивает 10MVA. 2 кабеля работают вместе и подключены к одному и тому же источнику и к тому же автоматическому выключателю в ELD (Strasbourg Electricity Networks). Сегодня утром один из двух кабелей был поврежден, и автоматический выключатель отключил питание от центра обработки данных.

Сайт SBG предназначен для работы без ограничений по времени на генераторах. Для SBG1 и SBG4 мы создали первую резервную систему из 2 генераторов по 2MVA каждый, сконфигурированных в N + 1 и 20kv. Для SBG2 мы создали 3 группы в конфигурации N + 1 1,4 МВА каждый. В случае сбоя внешнего источника питания высоковольтные ячейки автоматически перенастраиваются с помощью моторной отказоустойчивой системы. Менее чем за 30 секунд дата-центры SBG1, SBG2 и SBG4 могут восстановить мощность с 20 кВА. Чтобы сделать это переключение без отключения питания серверов, у нас есть источники бесперебойного питания (ИБП), которые могут поддерживать питание до 8 минут.

Сегодня утром моторная отказоустойчивая система работала не так, как ожидалось. Команда запуска генераторов резервного копирования не была предоставлена ​​NSM. Это NSM (двигатель с нормальной аварийной ситуацией), предоставляемый поставщиком высоковольтных ячеек 20 кВ. Мы контактируем с производителем / супером, чтобы понять происхождение этой проблемы. Тем не менее, это дефект, который должен был быть обнаружен во время периодических испытаний на неисправность внешнего источника. Последний тест SBG для восстановления резервных копий был в конце мая 2017 года. Во время этого последнего теста мы приводили SBG только из генераторов в течение 8 часов без каких-либо проблем, и каждый месяц мы тестируем генераторы резервных копий бесплатно. И, несмотря на все это, этой системы было недостаточно, чтобы избежать сегодняшнего юрта.

Примерно в 10 часов нам удалось переключить ячейки вручную и снова начать работу центра обработки данных с генераторами. Мы попросили ELD отсоединить неисправный кабель от высоковольтных ячеек и снова включить автоматический выключатель только с одним из двух кабелей и, следовательно, были ограничены 10MVA. Это действие было выполнено ELD, и мощность была восстановлена ​​примерно в 10:30. Маршрутизаторы SBG были подключены к сети с 10:58 утра.

С тех пор мы работаем над перезагрузкой сервисов. Включение источника энергии с помощью энергии позволяет перезапускать серверы, но службы, запущенные на серверах, все равно необходимо перезапустить. Вот почему каждый сервис постепенно возвращается с 10:30. Наша система мониторинга позволяет нам узнать список успешно запущенных серверов и те, которые все еще имеют проблему. Мы вмешиваемся на каждом из этих серверов, чтобы выявить и решить проблему, которая препятствует ее перезапуску.

В 7:50 мы создали кризисную единицу в RBX, где мы централизовали информацию и действия всех вовлеченных команд. Грузовик из RBX был загружен запасными частями для SBG. Он прибыл в пункт назначения около 17:30. Чтобы помочь нашим местным командам, мы отправили команды из центра данных LIM, расположенного в Германии, и персонала из центра обработки данных RBX, все из которых были мобилизованы на месте с 16:00. В настоящее время более 50 техников работают в SBG, чтобы вернуть все услуги в Интернете. Мы готовим работу ночью и, если необходимо, завтра утром.

Во избежание катастрофических сценариев, таких как этот, за последние 18 лет OVH разработала электрические архитектуры, которые могут выдерживать всевозможные отключения электроэнергии. Каждый тест, каждый недостаток, каждая новая идея обогатили наш опыт, позволяющий нам сегодня создавать надежные центры обработки данных.

Так почему же этот провал? Почему SBG не выдержала простой сбой питания? Почему весь интеллект, который мы развили в OVH, не смог предотвратить эту катастрофу?

Быстрый ответ: энергосистема SBG унаследовала все недостатки дизайна, которые были результатом небольших амбиций, которые первоначально ожидались для этого местоположения.

Теперь вот длинный ответ:
Еще в 2011 году мы планировали развертывание новых центров обработки данных в Европе. Чтобы проверить аппетит для каждого рынка, с новыми городами и новыми странами, мы изобрели новую технологию развертывания центров обработки данных. С помощью этой внутренней технологии мы надеялись получить гибкость при развертывании центра обработки данных без ограничений времени, связанных с разрешениями на строительство. Первоначально мы хотели получить возможность подтвердить наши гипотезы, прежде чем делать значительные инвестиции в определенном месте.

Таким образом, в начале 2012 года мы запустили дата-центр SBG1 из морских контейнеров. Мы развернули 8 грузовых контейнеров, и SBG1 работает менее чем за 2 месяца. Благодаря этому сверхбыстрому развертыванию, которое заняло менее 6 месяцев, мы смогли подтвердить, что SBG действительно является стратегическим местом для OVH. К концу 2012 года мы решили построить SBG2, а в 2016 году мы начали строительство SBG3. Эти 2 датацентра не были построены из контейнеров, но были основаны на нашей технологии «Башня». Строительство SBG2 заняло 9 месяцев, и SBG3 будет запущен в производство в течение месяца. Чтобы решить проблему пространства, в начале 2013 года мы быстро построили SBG4, основываясь на разговорах о транспортировочных контейнерах.

Проблема заключалась в том, что, развертывая SBG1 с технологией, основанной на транспортных контейнерах, мы не смогли подготовить сайт для крупномасштабного проекта.

Мы допустили две ошибки:
  1. Мы не сделали сайт SBG совместимым с внутренними стандартами, для которых требуется 2 отдельных электропитания 20 кВ, как и все наши места постоянного тока, которые оснащены двумя электрическими каналами. Это крупные инвестиции в размере от 2 до 3 миллионов евро за электрическую подачу, но мы считаем, что это часть нашего внутреннего стандарта.
  2. Мы построили энергосистему SBG2, поместив ее в энергосистему SBG1 вместо того, чтобы сделать их независимыми друг от друга, как и во всех наших центрах обработки данных. В OVH каждый номер центра данных указывает, что силовая сеть не зависит от других датацентров. Где угодно, кроме сайта SBG.

Технология, основанная на транспортных контейнерах, использовалась только для сборки SBG1 и SBG4. На самом деле мы поняли, что контейнерный центр обработки данных не соответствует требованиям нашей торговли. На основе темпов роста SBG минимальный размер сайта должен быть равен нескольким центрам обработки данных и, следовательно, иметь общую емкость 200 000 серверов. Вот почему сегодня для развертывания нового датацентра мы используем только два типа конструкций, которые были широко протестированы и спланированы для крупномасштабных проектов и надежности:
  1. строительство 5-6-этажных башен (RBX4, SBG2-3, BHS1-2) для 40 000 серверов.
  2. приобретение зданий (RBX1-3,5-7, P19, GRA1-2, LIM1, ERI1, WAW1, BHS3-7, VIH1, HIL1) для 40 000 или 80 000 серверов.

Даже если этот утренний инцидент был вызван сторонним автоматом, мы не можем отрицать свою ответственность за провал. У нас есть кое-что, что нужно сделать для SBG, чтобы достичь того же уровня стандартов, что и другие OVH-сайты.

В течение дня мы приняли следующий план действий:
  • установка второго, полностью отдельного электрического питания 20MVA;
  • разделение силовой сети SBG2 от SBG1 / SBG4, а также отделение будущего SBG3 от SBG2 и SBG1 / SBG4;
  • миграция клиентов SBG1 / SBG4 в SBG3;
  • закрытие SBG1 / SBG4 и удаление транспортных контейнеров.

Это инвестиционный план в размере 4-5 миллионов евро, который мы запускаем завтра, и надеемся, что мы сможем восстановить доверие наших клиентов к SBG и OVH.

Наши команды по-прежнему трудно на работе, чтобы восстановить услуги последний из затронутых клиентов. Как только инцидент будет полностью разрешен, мы применим SLA по нашим контрактам.

Мы очень сожалеем об этом инциденте, и мы благодарим доверие, которое вы оказываете нам.

Update of OVH & SYS LT contracts



Здесь вы можете найти ответы на вопросы о поправках, внесенных в контракты с OVH / SYS LT, которые вступят в силу 21 октября 2020 года после перехода на OVHcloud Europe.
Эта документация применима только к клиентам, подключенным к OVH / SYS LT.

Какие основные изменения?
Какие продукты затронуты?
С 21 октября 2020 года будут затронуты все продукты, заказанные на веб-сайте OVH / SYS LT.

Изменится ли процесс заказа этих продуктов?
С 21 октября 2020 года вы больше не сможете заказывать новые продукты на веб-сайте OVH / SYS LT. Новые заказы необходимо будет размещать на веб-сайтах OVHcloud Europe / SYS Europe.

Могу ли я продлить свои продукты?
Вы сможете продлить свои продукты на веб-сайте OVH / SYS LT на максимальный период 3 месяца, до 1 февраля 2021 года на OVH LT. По истечении этого периода вы больше не сможете продлевать свои продукты на OVH / SYS LT. Затем вам нужно будет заказать новые продукты на OVHcloud Europe / SYS Europe.

Продукты с доменными именами являются исключением, так как они могут быть продлены максимум на 12 месяцев.

Я хочу обновить существующие продукты после 1 февраля 2021 года и / или разместить заказ на новый продукт — как мне это сделать?
Для этого перейдите в панель управления OVH, примите новые контракты и выполните для них процесс подтверждения.

После того, как вы подтвердите все эти контракты, вы получите доступ ко всему каталогу OVHcloud на веб-сайте OVHcloud Europe.

Что будет с продуктами, которые у меня уже есть?
После обновления OVHcloud ваши продукты будут оставаться активными до истечения срока их действия. В результате, при миграции вы сохраните все свои активные службы.

Изменится ли панель управления OVHcloud?
Доступ к панели управления OVHcloud / SYS не изменится, и вы по-прежнему сможете входить в систему через тот же дескриптор сетевой карты (учетную запись клиента).

Важно отметить, что панель управления OVHcloud, / SYS полностью перейдет на английский язык с 1 февраля 2021 года.

Я разместил заказ, но еще не оплатил его — что будет?
Любые неоплаченные заказы, за исключением продления, которые еще не выполняются, будут отменены 21 октября 2020 года. Вы можете снова разместить заказ прямо на веб-сайте OVHcloud Europe / SYS Europe после завершения миграции.

Однако, если мы получаем оплату за отмененный заказ, мы возвращаем оплату покупателю.

Подробно о том, как это будет работать
Я хочу подтвердить новые контракты в панели управления OVHcloud, но кнопка серая. Что я должен делать?

Чтобы подтвердить новые контракты, вам необходимо выполнить 3 условия:
  1. Если у вас есть незавершенные платежи на вашем счете, вам нужно будет оплатить их в этом разделе OVH / SYS.
  2. Если в настоящее время у вас есть заказ, который выполняется, но не завершен, вам нужно подождать, пока он не будет завершен, или отменить его. Вы можете отслеживать статусы ваших заказов OVH здесь / SYS.
  3. Если в одном из ваших продуктов постоянно выполняется операция смены контактов, вам нужно будет завершить или отменить эту операцию. Вы можете отслеживать текущие операции OVH здесь / SYS.


В настоящее время у меня есть баллы лояльности и / или кредиты на моем счете OVH, потеряю ли я их?
Нет — баллы лояльности и / или кредиты на вашем счете OVH / SYS будут сохранены.
Нужно ли мне создавать резервную копию моих данных и повторно импортировать их в свои службы?
Нет — ваши данные не будут изменены. Эта операция связана с ранее подтвержденными общими условиями продажи, и никакие изменения не вносятся в конфигурацию вашего продукта.

Будут ли мне предлагаться новые продукты?
OVHcloud Europe предлагает гораздо более широкий ассортимент продуктов.
Это означает, что у вас будет больший выбор продуктов, отвечающих вашим потребностям.
Изменится ли контактный номер службы поддержки?
Номер OVH +420 246 030 899 по-прежнему будет работать.

Способы оплаты
Что будет с моими сохраненными способами оплаты?
После подтверждения новых условий продажи ваши способы оплаты OVH / SYS LT будут автоматически перенесены в OVHcloud Europe.

Какие способы оплаты принимаются в OVHcloud Europe / SYS Europe?
Допустимые способы оплаты включают:
— банковские карты (например, Visa или Mastercard)
— PayPal
— прямой дебет (если счет находится в зоне SEPA, то есть в 33 странах Европы)
Свяжитесь с нашей службой поддержки, которая может помочь вам в этом.

Какая валюта принимается в OVHcloud Europe / SYS Europe?
Валюта, используемая в OVHcloud Europe / SYS Europe, — евро.

Автоматическое продление
Что будет с моими услугами при автоматическом продлении?
Автоматическое продление будет работать до 1 февраля 2021 года на OVH / SYS LT.

Опция автоматического продления будет отключена 1 февраля 2021 года для OVH / SYS LT.

Я подтвердил условия продажи OVHcloud Europe / SYS Europe. Могу ли я использовать автоматическое продление?
Да. Если вы подтвердите общие условия продажи до 1 февраля 2021 года, ваши услуги все равно будут продлеваться автоматически.

Если вы подтвердите общие условия продажи OVHcloud Europe после 1 февраля 2021 года, вам нужно будет повторно включить автоматическое продление для ваших продуктов.

Я хочу включить автоматическое продление для своих продуктов с 21 октября 2020 года по 1 февраля 2021 года в OVH LT. Смогу ли я это сделать?
Вы не сможете включить автоматическое продление на OVH LT с 21 октября 2020 года.

Подтвердите новые общие условия продажи в панели управления OVHcloud, чтобы использовать опцию автоматического продления.

Datacenter SBG

В настоящее время в нашем центре обработки данных в Страсбурге произошел серьезный инцидент, связанный с пожаром в здании SBG2.
Пожарные немедленно прибыли на место происшествия, но не смогли справиться с возгоранием в SBG2.
Весь сайт был изолирован, что влияет на все наши услуги на SBG1, SBG2, SBG3 и SBG4.
Если ваше производство находится в Страсбурге, мы рекомендуем активировать план аварийного восстановления.
Все наши бригады полностью мобилизованы вместе с пожарными.
Мы будем держать вас в курсе по мере поступления дополнительной информации.

Wednesday, 10 March 2021, 13:31PM
Пожар на нашем сайте в Страсбурге

В 00:47 в среду, 10 марта 2021 года, возник пожар в комнате одного из наших 4 центров обработки данных в Страсбурге, SBG2. Обратите внимание, что этот сайт не относится к категории «Севезо».
Пожарные немедленно вмешались, чтобы защитить наши команды и предотвратить распространение огня. В 2:54 они изолировали площадку и перекрыли ее периметр.
К 4:09 пожар уничтожил SBG2 и продолжал представлять опасность для близлежащих центров обработки данных, пока пожарная команда не взяла под контроль пожар.
С 5:30 утра сайт был недоступен для наших групп по очевидным причинам безопасности под руководством префектуры. Огонь теперь локализован.

Мы рады, что никто не пострадал ни среди наших бригад, ни среди пожарных, ни среди служб префектуры, которых мы благодарим за их образцовую мобилизацию на нашей стороне.

Имея 15 центров обработки данных в Европе, наши технические и коммерческие группы полностью сосредоточены на поддержке наших клиентов, внедрении решений и смягчении последствий недоступности нашего сайта в Страсбурге. Наша миссия — предоставлять нашим клиентам услуги высочайшего качества для поддержки их онлайн-активности, и мы знаем, насколько это важно для них. Мы искренне приносим свои извинения за трудности и проблемы, вызванные этим пожаром. Мы обязуемся и дальше сообщать с максимальной прозрачностью о причинах пожара и его последствиях.
В настоящее время мы оцениваем влияние этого инцидента и будем максимально прозрачно сообщать о ходе нашего анализа и реализации решений.

Статус Страсбургского центра обработки данных
  • SBG1: Сетевая комната в порядке — 4 комнаты разрушены — 8 комнат в порядке
  • SBG2: Уничтожен
  • SBG3: UPS Down — проверка сервера еще продолжается
  • SBG4: Нет физического воздействия
Сегодня нет перезапуска для SBG1, SBG3 и SBG4

План на следующие 2 недели:
  • 1) Реконструкция 20кВ для SBG3
  • 2) Восстановление 240 В в SBG1 / SBG4
  • 3) Проверка DWDM / маршрутизаторов / коммутаторов в сетевой комнате A (SBG1).
  • Проверка волокон Париж / Франкфурт
  • 4) Реконструкция сетевого помещения B (SBG5) для проверки волокна Париж / Франкфурт

Мы будем держать вас в курсе по мере развития ситуации.





travaux.ovh.net/?do=details&id=49484

Wednesday, 10 March 2021, 17:26PM
Технические группы OVH готовят и отправляют оборудование, необходимое для создания временной сетевой комнаты. Это оборудование будет отправлено в центр обработки данных в Страсбурге в одночасье.
Поступление волокна на объект контролировалось и не пострадало от пожара.
Восстановление электроснабжения площадок SBG1 и SBG4 намечено на понедельник, 15 марта. Восстановление после SBG3 ожидается к пятнице 19 марта.

НОВИНКА: вы можете просмотреть историю записей DNS



Правильная работа ваших адресов электронной почты, веб-сайтов и вызовов API зависит от правильных DNS-серверов. Поэтому любые изменения в полях являются рискованными, поскольку могут привести к простою службы.

Хорошие новости! Благодаря истории зоны DNS управлять DNS стало проще.

Теперь доступны следующие функции:
  • просматривать полную историю ваших DNS-зон;
  • загрузить конфигурацию зоны DNS, чтобы реплицировать ее на новое доменное имя (полезно, если вы переносите доменные имена в другую учетную запись);
  • восстановить зону DNS;
  • сравните две предыдущие версии зоны DNS.
Больше не нужно ничего делать вручную или беспокоиться о простое DNS! Используйте эти настройки по максимуму, без стресса!

Хотите узнать больше? Посмотрите наше руководство
help.ovhcloud.com/csm/en-ie-dns-zone-history

Миграция SBG-1 (61E / 62E) -> SBG-3



После завершения работы SBG-1 мы переводим некоторые серверы SBG-1 в центр обработки данных SBG-3.
Серверы SBG-1, расположенные в стойках 61E* и 62E*, будут перемещены в SBG-3 в стойках S350A* и S351A*.



Необходимо перенести 1066 серверов.

Обновление 15 апреля, 9:00:
  • Перенесено серверов: 253 (24%)

SBG1/AD => SBG4



После завершения работы SBG-1 мы переносим серверы SBG-1 в центр обработки данных SBG-4.
Серверы SBG-1, расположенные в RACK 61A *, 61D * и 62A *, будут перемещены в SBG-4 в стойках 90A * / B * / C * / D *.
В 37 стойках необходимо перенести 758 серверов.

Обновление 1 апреля, 19:30:
Завершение серверов: 75 (10%)

Обновление 1 апреля, 23:00:
Завершение серверов: 116 (15%)

Обновление 2 апреля, 12:30:
Завершение серверов: 140 (18%)

Обновление 2 апреля, 15:30:
Завершение серверов: 209 (27%)

Обновление 2 апреля, 21:30:
Завершение серверов: 237 (31%)