Selectel запустил катастрофоустойчивый регион в собственной облачной платформе

Провайдер Selectel сообщил о запуске геораспре-деленного (Multi-AZ) региона. Новый регион будет работать на базе трех независимых зон доступности, расположенных в Москве на расстоянии до 15 км между ЦОДами. Связность площадок обеспечивается единой высокоскоростной сетью с низким временем отклика (менее 1 мс). Архитектура нового региона гарантирует работоспособность клиентских приложений в случае выхода из строя целой зоны доступности.
С запуском геораспределенного региона ru-6 катастрофоустойчивость сетевых и PaaS-сервисов доступна «из коробки», в то время как раньше распределение нагрузки между зонами доступности требовало ручного конфигурирования.
В новых типах геораспределенных кластеров мастер-ноды Managed Kubernetes и ноды облачных баз данных автоматически размещаются в разных зонах доступности. Аналогично устроено и распределенное резервное копирование.
Такая архитектура нового региона гарантирует работоспособность клиентских приложений в случае выхода из строя целой зоны доступности. При возникновении инцидента восстановление сервисов произойдет с минимальной задержкой (от нескольких минут) на базе другого исправного ЦОД в этом регионе. Новое решение дает возможность клиентам получить доступ к «катастрофоустойчивости как сервису», то есть нивелировать риски, связанные с функционированием ЦОД, без необходимости самостоятельно настраивать DR-сервисы (сервисы аварийного восстановления). Такой подход по крайней мере в 2 раза дешевле классического сценария настройки аварийного восстановления. При этом сохраняется возможность выбора, где именно разместить критичные сетевые компоненты с учетом требований к RTO (целевое время восстановления) и RPO (целевая точка восстановления).
Регион построен на современном оборудовании (в том числе на базе собственной серверной платформы Selectel) с процессорами AMD EPYC 9754 и Intel Xeon 6747P, сверхбыстрыми сетевыми дисками с производительностью 75 000 IOPS (скорость чтения или записи) без привязки к размеру диска, а также новейших GPU для запуска и работы с AI-проектами — H200, RTX PRO 6000 Blackwell Server Edition.
В будущем решение будет дополнено геораспределенным хранилищем S3 с высокоскоростным подключением к кластерам облачных серверов для комфортной работы с AI-проектами. Также появится ускоренное файловое хранилище для повышения скорости работы с нагруженными AI-вычислениями. С точки зрения дополнительных возможностей повышения катастрофоустойчивости будет добавлена функциональность резервирования выделенных хостов виртуализации для конфиденциальных вычислений и экспорт бэкапов в другие географические регионы для реализации еще более масштабных настроек отказоустойчивости.
https://selectel.ru
0 комментариев
Вставка изображения
Оставить комментарий