Nebius AI Cloud 3.1 предоставляет вычислительные мощности нового поколения NVIDIA Blackwell Ultra с прозрачным управлением мощностью для масштабируемого ИИ

Амстердам, 17 декабря 2025 г. Компания Nebius сегодня анонсировала Nebius AI Cloud 3.1, предоставляющую вычислительные мощности нового поколения NVIDIA Blackwell Ultra и расширенные операционные возможности для последней версии своей полнофункциональной облачной платформы для ИИ. Версия 3.1 основана на концепции Nebius AI Cloud «Aether», добавляя прозрачное управление мощностью и расширенную инфраструктуру для обеспечения оперативной прозрачности и возможностей планирования ресурсов, необходимых клиентам при масштабировании ИИ в производственной среде.
По мере того, как клиенты переходят от экспериментов к масштабному внедрению, они определяют четкие операционные приоритеты, включая видимость возможностей графических процессоров в режиме реального времени в разных регионах, прозрачное распределение ресурсов для многокомандных сред и доступ к вычислительным ресурсам следующего поколения по мере усложнения моделей. Nebius AI Cloud 3.1 решает эти задачи по трем направлениям.
Компания Nebius развертывает инфраструктуру NVIDIA Blackwell Ultra по всему миру, при этом системы NVIDIA GB300 NVL72 и NVIDIA HGX B300 уже используются клиентами. Nebius стала первой облачной платформой в Европе, которая использует обе платформы в производственной среде. Nebius AI Cloud также является первым в мире провайдером, который запускает системы GB300NVL72 в производственной среде на основе межсоединения NVIDIA Quantum-X800 InfiniBand со скоростью 800 Гбит/с, что удваивает пропускную способность для распределенных рабочих нагрузок. Это, наряду с аппаратным ускорением сети и улучшенным кэшированием хранилища, устраняющим узкие места инфраструктуры, еще больше дополняет лидирующие результаты в тестах MLPerf Training v5.1.
Для удовлетворения потребностей предприятий в операционной прозрачности в версии 3.1 представлены блоки емкости и панель мониторинга емкости в реальном времени, которые предоставляют клиентам полную информацию о зарезервированной емкости графических процессоров и их доступности во всех регионах центров обработки данных. Квоты на уровне проекта и новые правила хранения объектов на протяжении всего жизненного цикла расширяют возможности детального контроля над распределением ресурсов и затратами.
Экосистема платформы Nebius AI Cloud также продолжает расширяться. Помимо новой нативной интеграции с Dstack, версия 3.1 упрощает развертывание и использование микросервисов NVIDIA BioNeMo NIM, включая Boltz2, Evo-2, GenMol и MolMIM, без необходимости использования ключей NGC или лицензий NVIDIA AI Enterprise. Дополнительные функции, ориентированные на удобство использования разработчиками, включают улучшенную оркестрацию на основе Slurm с помощью Manager Operator, экспорт данных о выставлении счетов, совместимый с FOCUS, и различные улучшения пользовательского интерфейса консоли.
В последней версии также расширена готовая к использованию в корпоративной среде база безопасности Aether, включающая журналы аудита плоскости данных объектного хранилища для соответствия требованиям HIPAA, контроль доступа для каждого объекта и группы безопасности VPC. Расширенные возможности управления идентификацией и доступом (IAM) с интеграцией Microsoft Entra ID и детализированными ролями сервисов обеспечивают более надежное управление при упрощенном администрировании, расширяя возможности соответствия требованиям, что позволяет клиентам в высокорегулируемых секторах и государственном секторе развертывать рабочие нагрузки ИИ в производственной среде.
Компания Nebius проведет технический вебинар по Nebius AI Cloud 3.1, включающий сессию вопросов и ответов в прямом эфире, 29 января в 18:00 CET / 12:00 EST / 9:00 PST. Для получения дополнительной информации зарегистрируйтесь здесь.
Nebius AI Cloud 3.1 — краткий обзор
Вычислительные ресурсы следующего поколения
- Системы NVIDIA HGX B300 и GB300 NVL72 с поддержкой NVIDIA Quantum-X800 InfiniBand со скоростью 800 Гбит/с.
- Аппаратное ускорение сети, кэширование с обратной записью в хранилище и расширенное масштабирование производительности файловой системы.
- Высочайшие результаты в тестах MLPerf Training v5.1.
Оперативная прозрачность и эффективность
- Блоки ресурсов для планирования и отслеживания зарезервированных графических процессоров.
- Панель мониторинга производительности с отображением доступности графических процессоров в режиме реального времени во всех регионах.
- Квоты на уровне проекта для детального контроля ресурсов.
- Новые правила хранения объектов на протяжении всего жизненного цикла для оптимизации затрат.
производительность разработчиков
- Микросервисы NVIDIA BioNemo NIM для рабочих процессов в здравоохранении и медико-биологических науках.
- Масштабирование на основе Slurm и встроенная поддержка Dstack, экспорт данных о выставлении счетов, совместимый с FOCUS, для интеграции с FinOps.
- Журналы аудита с событиями плоскости данных объектного хранилища для конфигураций, соответствующих требованиям HIPAA, и контроля доступа к каждому объекту.
- Группы безопасности VPC для защиты на сетевом уровне
- Расширенные возможности управления идентификацией и доступом (IAM) с использованием входа через Microsoft Entra ID, визуального управления единым входом (SSO) и детализированных ролей служб.
0 комментариев
Вставка изображения
Оставить комментарий