Отчет по глобальным сетевым неполадкам, 21 октября 2020



Уважаемый клиент, предоставляем отчет о произошедшем 21 октября 2020 года инциденте, в результате которого наблюдалась частичная или полная недоступность серверов по публичной сети в наших локациях.

Основной причиной инцидента послужил сбой у магистрального провайдера Lumen (в прошлом Level 3).

Общее время неполадок составило 2 часа 12 минут.

Хронология событий:
17:10 МСК — наша система мониторинга начала регистрировать неполадки в работе публичной сети, и мы сразу приступили к диагностике;
17:21 МСК — мы обнаружили, что сбой связан с автономной системой AS203 магистрального провайдера Lumen, который начал анонсировать часть наших сетей от своего имени (неумышленный BGP hijacking);
17:24 МСК — мы начали убирать анонсы наших сетей у провайдера Lumen во всех локациях;
17:30 МСК — инцидент эскалирован в техническую поддержку провайдера Lumen;
17:45 МСК — отключение анонсов сетей через провайдера Lumen не принесло желаемых результатов. Более ста наших сетей продолжали анонсироваться автономной системой AS203. Для снижения влияния сбоя мы начали разделять затрагиваемые сети на меньшие блоки и анонсировать маршруты с большей маской через других операторов связи, где это было возможно;
18:35 МСК — специалисты поддержки Lumen подтвердили наличие сбоя;
19:17 МСК — специалисты поддержки Lumen сообщили, что обнаружили причину сбоя и занимаются её устранением;
19:22 МСК — специалисты поддержки Lumen восстановили корректную работу сети со своей стороны. Работоспособность сети полностью восстановлена;
19:30 МСК — наши сетевые инженеры начали возвращать анонсирование сетей в провайдер связи Lumen;
20:00 МСК — мы восстановили все анонсы наших сетей в оператор связи Lumen.

Причины неполадок и принятые меры
Причиной сетевых неполадок послужило то, что магистральный провайдер Lumen в результате ошибки конфигурации при включении нового сервиса начал анонсировать от своей автономной системы множество наших сетей. Весь входящий трафик, который проходил через Lumen, не доходил до нашего оборудования и блокировался в AS203.

Lumen являются сетевым провайдером уровня Tier 1, то есть они владеют сетевыми каналами, через которые проходит трафик от других Tier 1 провайдеров. Во многих случаях трафик проходит безальтернативно через каналы Lumen. Таким образом могла наблюдаться недоступность серверов даже в тех локациях, где мы не используем Lumen для анонсирования наших сетей.

Приносим извинения за неудобства, доставленные этим сбоем.

С уважением, команда поддержки Servers.ru

Перезагрузка облачных серверов для работы с IPv6 и GPN

Уважаемый клиент, после выполнения планового обновления облачной платформы некоторые облачные серверы продолжают работать со старой версией эмулятора.

Просим перезапустить облачные серверы из списка ниже в удобное для вас время, чтобы завершить обновление и повысить стабильность работы услуг. Без перезапуска корректная работа сетевых сервисов облачных серверов может быть ограничена.

Требуемые действия:
  • 1. Корректно завершить в ОС облачного сервера все необходимые сервисы
  • 2. Перейти в portal.servers.ru → выбрать «Облачный сервер» -> «Управление питанием» → «Перезагрузить»

Обратите внимание, что команды «reboot» из ОС облачного сервера недостаточно для применения обновлений. Необходим перезапуск именно средствами Portal или Compute API.

После перезапуска облачного сервера версия эмулятора должна измениться на 17.х.х. Проверить версию можно при помощи команды Linux:
dmidecode -t1 | grep -i version

В Windows должен измениться параметр реестра
HKEY_LOCAL_MACHINE\HARDWARE\DESCRIPTION\System\BIOS -> SystemVersion


Если у вас появятся какие-либо вопросы, пожалуйста, обращайтесь.

Как сообщает Reuters



Как сообщает Reuters, российский Яндекс будет предоставлять услуги облачных вычислений южнокорейским разработчикам игр через южнокорейскую компанию по управлению ИТ-инфраструктурой — Naver Business Platform (NBP). NBP является дочерней компанией Naver — южнокорейской интернет-компании.
www.servers.ru

Microsoft отказывается от производителей твердотельных накопителей

Windows больше не будет доверять дискам, которые говорят, что они могут шифровать себя, вместо этого BitLocker по умолчанию использует шифрование AES с ускорением процессора. Это после разоблачения широких проблем с микропрограммным шифрованием.
support.microsoft.com/en-us/help/4516071/windows-10-update-kb4516071

Bloomberg предоставляет 14 000 приложений только на одном терминале



Bloomberg предоставляет 14 000 приложений только на одном терминале, предоставляя информацию по всему миру с высокой надежностью и низкой задержкой. В 2016 году Bloomberg принял альфа-версию Kubernetes и с тех пор добился замечательных результатов. Смотрите тематическое исследование:

Если вы работаете в сфере финансовых услуг, терминал Bloomberg, вероятно, ваш лучший друг. За кулисами Bloomberg каждый день имеет дело с сотнями миллиардов данных, поступающих с финансовых рынков, и миллионами новостей из сотен тысяч источников. Только на Терминале есть 14 000 различных приложений. В таких масштабах доставка информации по всему миру с высокой надежностью и низкой задержкой является большой проблемой для более чем 5500 человек сильного инженерного отдела компании.

В последние годы команда разработчиков инфраструктуры работала над предоставлением инфраструктуры как службы, одновременно раскручивая множество виртуальных машин и масштабируя их по мере необходимости. «Но это не дало командам разработчиков достаточно гибкости для разработки приложений, особенно когда им нужно было масштабироваться быстрее, чем поступающие запросы», — говорит Андрей Рыбка, руководитель группы вычислительной архитектуры в офисе Bloomberg в CTO. «Нам нужно было равномерно распределить объекты по всей сети, и мы хотели, чтобы наше частное облако было таким же простым в использовании, как и общедоступное облако».

В 2016 году Bloomberg принял Kubernetes, когда он еще находился в альфа-версии, и с тех пор добился замечательных результатов, используя исходный код проекта. «С Kubernetes мы можем очень эффективно использовать наше оборудование до такой степени, что мы можем приблизиться к коэффициенту использования от 90 до 95%», — говорит Рыбка. Автоматическое масштабирование в Kubernetes позволяет системе гораздо быстрее удовлетворять потребности. Кроме того, Kubernetes «предложил нам возможность стандартизировать наш подход к созданию и управлению сервисами, что означает, что мы можем уделять больше времени работе над инструментами с открытым исходным кодом, которые мы поддерживаем», — говорит Стивен Бауэр, Инфраструктура данных и аналитики Вести. «Если мы хотим установить новый кластер в другом месте в мире, это действительно очень просто сделать. Все это всего лишь код. Конфигурация — это код».

www.cncf.io/case-study/bloomberg/
www.servers.ru/