Рейтинг
0.00

Nubes Хостинг

1 читатель, 12 топиков

Всего 3 стойкоместа могут принять нагрузку в 50 кВт




Вот несколько инсайтов от нашего генерального директора Василия Степаненко:
  • Всего 3 стойкоместа могут принять нагрузку в 50 кВт. Можно обойтись без межрядных кондиционеров.
  • В одну такую стойку вмещается 26 серверов. Каждый можно оснастить 4 картами NVIDIA Tesla H100.
  • Практически бесшумная работа (можно размещать хоть в офисном здании!).
  • Чтобы установить такую систему охлаждения, придется попрощаться с гарантией производителя, т. к. в процессе установки сервер разбирают, убирают кулеры и меняют термопасту.
  • Водяное охлаждение не требует масштабного техобслуживания — только базовый уход.

Для колокейшена такое решение, правда, не подойдет, но для облачного провайдера, специализирующегося на GPU-сервисах (а Nubes именно такой) — это многообещающая технология.

nubes.ru

Теперь в Nubes можно взять в аренду сервер

Да, коммерческий дата-центр — место практически неприступное. И с физической точки зрения, и с информационной. А еще в нем есть резервирование энергоснабжения, современная система охлаждения, надежная телеком-инфраструктура и специалисты, которые помогают ЦОДу работать без сбоев.

Чтобы все это организовать собственными силами, нужно здорово вложиться. И деньгами, и человеческими ресурсами. Для стартапов (да и не только для них) такие затраты — роскошь на грани разорения. Иногда даже в буквальном смысле.

Мы это понимаем, принимаем и в список услуг добавили одну, которая порадует тех, кто не готов в моменте закупать оборудование, нанимать дополнительных людей в ИТ-команду и планирует быстро масштабироваться.

Теперь в Nubes можно взять в аренду сервер. И не просто взять, а взять на выгодных условиях — 90 000 руб/мес.

Конфигурация сервера:
  • Серверная платформа 270W (8 U.2-NVMe/SATA+4 NVMe+2 M.2 x 3 PCIe4.0x16+1 PCIe4.0x8 + mezz PCIe4.0x16) — 1
  • Intel Xeon Gold 6354 (18 cores, 3.0/3.6 Ghz, 39 MB Cache, 205W TDP) — 2
  • 64GB 3200MHz DDR4 RDIMM ECC — 16
  • SSD NVMe M.2.2280 PCIe 3,0x4 500 Gb — 1
  • SSD U.2 2.5" NVMe 3.84TB PCIe Gen4x4 (7mm) — 8
  • Карта 25 Gbps PCIe gen3/gen4 2 порта SFP28 — 2
  • Оптический трансивер 25GE-SFP28 Optical Transceiver SR — 4

Что по плюсам?
  • Совместим со многими программными продуктами. В том числе с OpenStack (РОСА, RED OS, Astra Linux, ALT Linux, ОСОН Основа и ОСОН Стрелец, Microsoft, RedHat, VMware и др.).
  • Универсальный ЗИП, который позволяет быстро устранять проблемы с компонентами, если они вдруг возникнут.
  • Обслуживанием и мониторингом оборудования занимаются наши специалисты, и нагрузки на ИТ-команду нет.
  • Арендованное оборудование изолируется от всего остального в ЦОДе. Так еще больше повышается уровень безопасности данных.

nubes.ru

Миссия выполнима, или как мы проходили сертификацию Tier III Facility в работающем ЦОДе [Часть 2]

Для получения сертификата ЦОДы проверяют не только на устойчивость системы охлаждения, но и на устойчивость энергетической системы.

Как мы справились с этой частью, рассказал наш главный энергетик Олег Царев.

Первый и, наверное, самый важный шаг при прохождении подобных проверок — разработка плана действий каждого сотрудника. А сотрудников, которых мы привлекли к подготовке, было одиннадцать. И это только те, которые трудятся в штате.

Специалисты, которые участвовали в подготовке к сертификации, и их задачи
  • Технический директор осуществлял общую координацию.
  • Директор по эксплуатации координировал действия дежурной смены.
  • Директор по строительству контролировал работу оборудования в ГРЩ.
  • Главный энергетик выполнял переключения.
  • Старший инженер холодоснабжения следил за работой кондиционеров.
  • Специалист по мониторингу следил за его работой.
  • Двое дежурных эксплуатации контролировали работу оборудования в машзалах.
  • Двое дежурных инженеров и дежурный администратор следили за работой оборудования по мониторингу.

Для удобства мы сконфигурировали отдельный дашборд с отображением всех необходимых при прохождении сертификации параметров:
  • Позальная и полная IT-мощность.
  • Мощность каждого ГРЩ и полная мощность работающих кондиционеров.
  • Мощность работающих ДГУ.
  • Температура охлаждающей жидкости в ДГУ.
  • Уровень топлива в ДГУ.
  • Уровень масла в ДГУ.
  • Мощность потребления каждого ЩИБП, ЩР, ЩК.
  • Статус ИБП (процент заряда батарей, оставшееся время работы на батареях, потребляемая мощность ИБП, общая и по каждой фазе).



Кроме наших сотрудников, к подготовке мы привлекли по два человека от каждой подрядной организации, обслуживающей оборудование. Они делали необходимые переключения и находились на «боевом» дежурстве на случай возникновения аварийной ситуации.

Специалисты подрядных организаций
  • Электрики, обслуживающие РУ 10кВ, отключали и включали по команде силовые трансформаторы, имитируя пропажу городского питания или вывод трансформаторов в ремонт.
  • Электрики, обслуживающие низкую сторону, помогали с подключением тепловых пушек.
  • Дизелисты контролировали работу ДГУ и выводили их в ремонт.
  • Специалисты по ИБП следили за работой ИБП и аккумуляторов, осуществляли разборку ИБП.
  • Специалисты по пожарной сигнализации осуществляли вывод системы в ремонт и производили контроль ее работы.
  • Инженеры холодильного оборудования следили за кондиционерами.

Основной сложностью при прохождении сертификации было наличие действующих клиентов. Любая ошибка или авария — и работа клиентских сервисов могла бы встать. Права на ошибку не было.

Tier III подразумевает вывод любой единицы оборудования в ремонт без воздействия на критическую инфраструктуру при номинальной нагрузке. Например, одного из трех ГРЩ, одного из трех ДГУ, какого-нибудь ИБП или щитка, питающего АБК. А так как мы относительно молодой ЦОД, нагрузка еще не успела вырасти до номинальной, и пришлось добирать ее тепловыми пушками. Поэтому, чтобы тест прошел успешно, важно было сделать две вещи:
  • Рассчитать недостающую нагрузку, чтобы компенсировать ее с помощью пушек.
  • Доработать электрические щиты, чтобы была возможность подключить пушки большей мощности.

Вроде все достаточно просто, но и тут есть нюансы.

Во-первых, во время проведения сертификации прерывание мониторинга недопустимо. Поэтому к щитам мониторинга пришлось подводить второе питание.

Во-вторых, найти в необходимом количестве подходящие пушки, которые будут соответствовать проектной мощности стойки, сложно. Поэтому нам пришлось импровизировать и использовать пушки разной мощности. Частью из них, с нами поделились коллеги из Selectel, за что мы им сильно благодарны.

Наши сотрудники устанавливали маломощные пушки прямо в пустые стойки клиентов, предварительно получив их согласие. В большинстве случаев клиенты понимали важность сертификации и шли навстречу, но были и исключения. Тогда нам приходилось размещать пушки в других местах.

В-третьих, для подключения пушек нужны удлинители, с которыми тоже были сложности. Нам не хватило длины проводов, поэтому пришлось экстренно искать кабели, груши и людей, которые все это соберут воедино.


В-четвертых, постоянно менялась схема расстановки пушек, нужно было быстро реагировать и перемещать их.

В-пятых, у тепловых пушек есть своего рода «климат-контроль», который отключал их, когда температура вокруг становилась достаточно высокой. Из-за этого нам пришлось ставить дополнительные пушки, чтобы компенсировать мощность отключившихся.

Переключать питание пушек во время тестов по отключению одного из лучей — отдельный аттракцион, на который ушло много ресурсов. Все потому, что необходимо было сохранить номинальную нагрузку, а мест для подключения становилось меньше.

Очень опасным в плане надежности электроснабжения был тест с поочередным выведением в ремонт ДГУ. У проводящего сертификацию специалиста были считанные минуты на проверку выполнения теста, пока электроснабжение осуществлялось от аккумуляторных батарей.

Кстати, про ДГУ! Во время тестов именно они должны питать ЦОД, а не городская сеть. Поэтому крайне важно было следить за уровнем топлива постоянно. Здесь все достаточно просто: договорился с поставщиком, согласовал график подвоза топлива, заправил. Мы это делали каждую ночь в моменты перерывов между тестами. Так день начинался с полностью заправленными машинами, и можно было не переживать, что во время теста топливо закончится, и питание отключится.


Да, мероприятия подобного рода — серьезная вещь, но место забавным ситуациям все-таки нашлось.
  • Мы разработали план действий на случай аварийного отключения питания. Этот план должен был снизить перегрев оборудования. Суть его была в том, что, услышав команду «Восстанавливаемся» по рации или в чате, сотрудники должны отключить тепловые пушки.
  • Исполнитель отключил ИБП, замерил показатели и доложил о готовности к включению. В ответ получил: «Восстановление подтверждаю».
  • Из-за схожести команд «Восстанавливаемся» и «Восстановление подтверждаю» случилась путаница. Сотрудники начали отключать пушки. Это показали датчики мониторинга — нагрузка в залах упала.
  • Демонстрацию пришлось переделывать, и мы поняли: команды должны звучать максимально по-разному. Поэтому в следующий раз использовали кодовое слово «банан».

На этом история про аудит заканчивается, но работа над улучшениями продолжается. Ведь следующий шаг — получение сертификата Tier III Operations.

Миссия выполнима, или как мы проходили сертификацию Tier III Facility в работающем ЦОДе

Представьте себе квест, где вам нужно превратить обычный дата-центр в настоящую холодильную камеру, при этом не заморозив клиентское оборудование и не устроив тропический рай там, где должен быть технологический холод. Или, например, нагрузить ЦОД по максимуму, а потом отключать источники питания, да так, чтобы все продолжало работать. И всё это под пристальным взглядом аудиторов, готовых придраться к каждому градусу!

В сентябре ЦОД Nubes прошел этот квест, чтобы заслужить сертификат Tier III Facility от UpTime Institute. И двое наших ребят поведали, как войти в ~5% дата-центров в мире, которые прошли проверку с находящимися в нем клиентами.

В этой статье Алексей Сидоров, старший инженер холодоснабжения, поделился своей историей и рассказал, как выжить в условиях, когда тепловые пушки и серверные стойки играют в свою версию «кошки-мышки», а система мониторинга решила устроить День независимости. Запасайтесь попкорном (только не кладите его близко к серверам) — будет жарко! Точнее, холодно. В общем, читайте сами!

Кто сильнее: тепловые пушки или кондиционеры?

Генеральный директор и директор по эксплуатации ЦОД поставили команде задачу — пройти аудит и получить сертификат Tier III Facility. Это важный для компании документ, который открывает двери для сотрудничества с самыми требовательными клиентами. Так как мы молодой провайдер, получить этот сертификат крайне необходимо.

У меня и моей команды подобного опыта раньше не было, и, если честно, я нервничал. Нервничал и активно готовился к проверке.

Глобально задача у старшего инженера холодоснабжения одна — привести все системы кондиционирования в «боевую» готовность, выйти на максимальную тепловую нагрузку и «простоять» на ней всю неделю, отключая резервные узлы согласно схеме резервирования. Плюсом надо было довести до идеала систему мониторинга и оповещения.



Кажется, что не так уж все и сложно. Пушки по всему ЦОДу врубил, кондиционеры активировал и ждешь себе спокойно семь дней. И так бы, может, оно и было, только первая и самая большая сложность в том, что дата-центр уже функционирует и в нем стоят десятки клиентов. Одна ошибка – и последствия будут печальными для всех.

А давайте-ка включим все на полную мощь и посмотрим, как все будет работать

Подготовка к аудиту — чудесная возможность увидеть недочеты и исправить их. В процессе тестирования мы столкнулись с неочевидными проблемами, которые в штатном режиме вряд ли бы заметили. Вот на что стоит обращать внимание:

1. При запуске всех прецизионных кондиционеров на полную обнаружились недостатки, которые мы не увидели в процессе комплексных испытаний. Например, время выхода компрессора на полную мощность после имитации пропажи питания достигало порядка 10 минут и температура поднималась до пиковых значений по условиям SLA. Нам пришлось долго изучать параметры и экспериментировать с конфигурациями, чтобы найти оптимальные настройки. После внесения корректировок время выхода кондиционера в нужный режим сократилось с 10 до 3 минут.

2. На дашборде мониторинга не отображались некоторые незначительные алармы кондиционеров, местами не соответствовала цветовая индикация, а расположения двух датчиков не соответствовали мнемосхеме. Разумеется, это все мы поправили.



3. На момент аудита в залах уже были клиентские стойки, что очень сильно ограничивало нас в плане размещения пушек. Их необходимо много, и размещать пушки важно так, чтобы поток горячего воздуха не перегревал клиентские стойки. Для этого мы решили изготовить «холодные» коридоры. Но так как количество времени было ограничено, мы могли использовать только те материалы, которые можно достать сверхбыстро. Армированная пленка, профиль и скотч — идеальные варианты!


Минусы, конечно, тоже были. Структура стоек оказалась слишком фактурной, скотч держался плохо, и приходилось постоянно подклеивать образовавшиеся отверстия. В целом такое решение себя полностью оправдало. Прибегнул бы я к нему в схожей ситуации? Однозначно да!


4. Когда кондиционеры начали работать на полную мощность, обнаружилась проблема с LAC-клапанами. После долгого простоя, рабочий шток внутри клапана закисал, оставляя клапан в открытом положении. Кондиционеры с избыточным количеством хладагента вставали по высокому давлению. А так как времени у нас было немного, приходилось буквально «перекусывать» трубки клапана, чтобы принудительно его закрывать. Клапаны, естественно, поменяли на новые.

Хорош не тот, кто не делает ошибок, а тот, кто делает выводы!

В конечном итоге, как вы уже поняли, все у нас получилось, но определенные выводы мы сделали. И если вы, как и я, отвечаете за холод в дата-центрах, то дочитайте до конца.

  • Вывод №1. Проходить сертификацию Tier III Facility лучше до того, как в ЦОД заедут клиенты, чтобы не возникало опасности перегрева клиентского оборудования.
  • Вывод №2. Подготовку к аудиту нужно начинать за 3-4 месяца.
  • Вывод №3. Тестирование с последовательным отключением по уровню N+1 могло бы помочь выявить проблему со скоростью выхода компрессора на полную мощность раньше. Но из-за недостаточной нагрузки в дата-центре такой тест проводился в ограниченном режиме.
  • Вывод №4. Важно фиксировать все изменения конфигураций, следить за количеством заправленного фреона, мониторить систему на предмет утечек и требовать от подрядчика официально оформленных объяснений, в случае если есть вопросы и сомнения.
  • Вывод №5. При приемке оборудования необходимо сымитировать как можно больше ошибок в работе систем холодоснабжения, чтобы проверить их идентичность с системой мониторинга. Да и вообще, все оборудование нужно принимать строго по чек-листу.
  • Вывод №6. Во время пусконаладочных работ клапан необходимо тщательно осматривать. Например, скрип при его работе — явный признак некачественного монтажа, что в дальнейшем приведет к его поломке.

Строится Nubes Strato











nubes.ru/dc/colocation

Облачный провайдер Nubes (НУБЕС) планирует запустить новый ЦОД Nubes Strato в сентябре 2024 года. Дополнительные вычислительные мощности будут использоваться для развития облака NGcloud и облачных сервисов компании. Кроме того, клиенты смогут арендовать часть стоек для гибридных решений.

Дата-центр на 198 стоек строится на огороженной территории на юге Москвы (м. Царицыно). Новый объект находится рядом с Nubes Alto — первым ЦОД компании, который был запущен в 2022 году.

Запуск нового дата-центра планируется в сентябре 2024 года. На текущий момент в помещениях проходит монтаж инженерной инфраструктуры. В ближайшее время на площадке будут установлены источники бесперебойного и гарантированного электроснабжения (ДГУ). Параллельно провайдер занимается закупкой вычислительного и сетевого оборудования.

Мы строим второй дата-центр для расширения наших возможностей по предоставлению клиентам гибридных решений. Также на базе Nubes Strato продолжит развиваться наше облако нового поколения NGcloud со встроенными средствами защиты, а клиенты смогут размещать собственное оборудование в стойках и интегрировать его с облаком
рассказывает генеральный директор компании Nubes (НУБЕС) Василий Степаненко

Пока защищенное облако NGcloud функционирует на базе ЦОД Nubes Alto уровня Tier III. Здесь же развернуты все облачные ИБ-сервисы компании, а также решения для удаленной работы, хранения данных и других задач. Кроме того, в дата-центре Nubes Alto клиенты размещают собственное серверное и телеком-оборудование (colocation).

ЦОД Nubes Alto получил заключение о соответствии ФЗ-152



В январе 2023 года завершился аудит системы защиты персональных данных в дата-центре Nubes Alto. Аудитор — лицензированная ФСТЭК компания ООО «Кард Сек» — подтвердил, что услуги colocation в ЦОД соответствуют требованиям к организационным и техническим мерам, обеспечивающим выполнение как ФЗ-152, так и его подзаконных актов. По итогам аудита системе защиты ПДн Nubes Alto присвоен первый уровень защищенности. Он свидетельствует о том, что уровень информационной безопасности позволяет клиентам безопасно хранить и обрабатывать в ЦОД любые категории персональных данных, включая специальные и биометрические.

Запущенный в ноябре машинный зал Nubes Alto уже заполнен, услугой колокейшн пользуются несколько крупных клиентов. Они разворачивают локальные IT-системы и частные облачные сервисы, в том числе для хранения и обработки персональных данных, требующих УЗ-1. Именно в силу ответственности, которую накладывает на провайдера хранение и обработка данных такого уровня, Nubes и обратился к Card Security для оценки соответствия.

В рамках аудита ЦОД представители Card Security обследовали физическую IT-инфраструктуру дата-центра, а также изучили процессы управления средствами аутентификации, идентификации, регистрации событий безопасности и т.д. Специалисты оценили уровень защищенности машинных носителей персональных данных, технических средств, процессы выявления инцидентов и реагирования на них. По итогам обследования в заключение о соответствии уровня защищенности был включен сервис colocation.

ООО «Кард Сек» — лицензированный ФСТЭК аудитор в области информационной безопасности. Компания действует на основании лицензии Федеральной службы по техническому и экспортному контролю №3099 от 22 ноября 2016 г. За более чем 15 лет на рынке ООО «Кард Сек» наработал сильную экспертизу на стыке управления ИБ-рисками, IT и стал одним из лидеров в сегменте аудиторских и консалтинговых услуг в области ИБ. Полученное от Card Security заключение подтверждает уровень информационной безопасности, необходимый для хранения и обработки в Nubes Alto всех категорий персональных данных.
12