Рейтинг
0.00

Nebius Cloud

1 читатель, 18 топиков

Марк Бородицкий присоединяется к Nebius в качестве директора по доходам



Амстердам, 28 мая 2025 г. – Nebius (NASDAQ: NBIS), ведущая компания в области инфраструктуры искусственного интеллекта, сегодня объявила о назначении Марка Бородицкого на должность директора по доходам, поскольку компания продолжает наращивать свою глобальную команду продаж.

Опытный старший технический руководитель, Марк имеет большой опыт выхода на глобальный рынок и достижения высокого роста — за пять лет в Twilio он увеличил количество платящих клиентов в шесть раз, а доход — более чем в 10 раз до $4 млрд. Ранее он основал несколько успешных компаний и занимал должность старшего руководителя в Oracle и совсем недавно в Cloudflare.

Аркадий Волож, основатель и генеральный директор Nebius, приветствовал Марка в компании:
Мы создаем глобальную компанию и планируем многократно вырасти в ближайшие годы. Марк — идеальный кандидат, который поможет Nebius масштабироваться до нескольких миллиардов долларов дохода, открывая продажи по всем регионам, секторам и корпоративным клиентам

Марк Бородицкий, новый директор по доходам компании Nebius, сказал:
Я поражен тем, как много команда Nebius построила за столь короткое время. Эта компания — один из самых тщательно охраняемых секретов в области ИИ, и это скоро изменится. У Nebius есть все ключевые ингредиенты, чтобы возглавить рынок инфраструктуры ИИ — передовые технологии, выдающаяся команда и свободный доступ к капиталу для роста. Я рад присоединиться к Аркадию и команде и с нетерпением жду возможности построить высокопроизводительную организацию, готовую к выходу на рынок, в качестве директора по доходам

Контакты
Для журналистов: media@nebius.com
Для инвесторов: askIR@nebius.com

Nebius — технологическая компания, которая создает полнофункциональную инфраструктуру для обслуживания взрывного роста глобальной индустрии ИИ, включая крупномасштабные кластеры GPU, облачную платформу ИИ, а также инструменты и услуги для разработчиков. Компания со штаб-квартирой в Амстердаме и котирующаяся на Nasdaq, имеет глобальное присутствие с научно-исследовательскими центрами в Европе, Северной Америке и Израиле.

AI Cloud от Nebius был создан с нуля для интенсивных рабочих нагрузок ИИ. Благодаря фирменному программному обеспечению и оборудованию, разработанному внутри компании, Nebius предоставляет разработчикам ИИ вычислительные ресурсы, хранилище, управляемые сервисы и инструменты, необходимые для создания, настройки и запуска своих моделей.

Nebius — одна из немногих компаний в мире, имеющих статус партнера NVIDIA Cloud по референсной платформе, что подчеркивает ее опыт в проектировании и развертывании полного спектра аппаратной и программной инфраструктуры для референсной архитектуры NVIDIA.

‍Чтобы узнать больше, посетите www.nebius.com

Nebius Group объявляет финансовые результаты за первый квартал 2025 года



Для полного раскрытия информации, включая основные финансовые показатели, нажмите здесь (PDF).



Амстердам, 20 мая 2025 г. – Nebius Group NV («Nebius Group», «Группа» или «Компания»; NASDAQ: NBIS), (1) ведущая компания в сфере инфраструктуры искусственного интеллекта, сегодня объявила свои неаудированные финансовые результаты за первый квартал, закончившийся 31 марта 2025 г.

В первом квартале 2025 года выручка Группы в размере $55,3 млн увеличилась на 385% в годовом исчислении, в основном за счет основного бизнеса инфраструктуры ИИ. Скорректированный убыток EBITDA в первом квартале 2025 года составил $62,6 млн, а чистый убыток от продолжающейся деятельности — $113,6 млн.

Компания также сегодня опубликовала инаугурационное квартальное письмо акционерам от основателя и генерального директора Аркадия Воложа и сопроводительную презентацию с ключевыми деловыми и финансовыми обновлениями. Эти материалы можно найти на сайте компании по связям с инвесторами по адресу group.nebius.com/investor-hub

Информация о веб-трансляции
Руководство Nebius Group проведет веб-трансляцию, посвященную доходам компании, 20 мая 2025 года в 8:00 (EDT) / 5:00 (PDT) / 14:00 (CET).

Чтобы получить доступ к веб-трансляции, перейдите по ссылке: goldmansachs.zoom.us/webinar/register/WN_yvxosJvoTKihOOMdEJKFkw

Nebius приветствует Bezos Expeditions в качестве ведущего инвестора в бизнес по обработке данных ИИ Toloka





  • Позволяет значительно и быстро масштабировать бизнес Толоки, чтобы извлечь выгоду из существенных рыночных возможностей в области данных ИИ
  • Позиционирует «Толоку» среди ведущих мировых компаний в сфере данных ИИ, получая поддержку от стратегических инвесторов мирового уровня
  • Обеспечивает долгосрочный потенциальный рост для акционеров Nebius за счет роста бизнеса Toloka
  • Дает Толоке большую гибкость и независимость в управлении

Амстердам, 7 мая 2025 г. – Сегодня Nebius Group («Nebius» или «Компания»; NASDAQ: NBIS) объявила о стратегических инвестициях в Toloka, свой бизнес решений в области данных ИИ, возглавляемый Bezos Expeditions (инвестиционное подразделение Джеффа Безоса) при участии Михаила Парахина, технического директора Shopify.

Инвестиции знаменуют собой важный шаг в развитии Toloka и позволят компании быстро масштабироваться и усилить свою стратегическую направленность на фоне растущего мирового спроса на надежные и высококачественные решения для обработки данных на основе искусственного интеллекта.

Михаил Парахин займет должность исполнительного председателя нового Совета директоров «Толоки» после завершения инвестиций. Исполнительную управленческую команду компании продолжит возглавлять основатель и генеральный директор Ольга Мегорская, которая также войдет в новый Совет директоров.

Привлечение стратегических инвесторов мирового уровня, таких как Джефф и Михаил, является весомым подтверждением качества бизнеса и лидерства Toloka. Как энтузиасты Ольги и выдающейся команды Toloka с самого начала, мы считаем, что это лучший способ для Toloka ускорить свой рост и извлечь выгоду из огромных возможностей революции ИИ. Nebius по-прежнему привержен долгосрочному успеху Toloka, и мы рады быть частью того, что будет дальше.
Для нас это партнерство также является еще одной наглядной демонстрацией того, что Nebius — это место, где могут рождаться и масштабироваться смелые идеи и исключительные компании. От нашего ClickHouse, который мы вынашивали и выводили на новый уровень с поддержкой венчурного капитала высшего уровня, до нашей беспилотной компании Avride, Nebius создает среду для долгосрочных инноваций и создания ценности
Аркадий Волож, основатель и генеральный директор Nebius Group

Эти инвестиции знаменуют собой поворотный момент для Toloka, поскольку мы вступаем в новую фазу роста. Благодаря мощной финансовой поддержке стратегических инвесторов, которые глубоко понимают ландшафт ИИ, мы теперь готовы значительно масштабировать наши технологические инновации на критическом стыке человеческого опыта и возможностей ИИ.
Уникальный подход Toloka к сотрудничеству человека и ИИ позволяет нам решать самые насущные проблемы в разработке ИИ сегодня, гарантируя, что системы будут не только мощными, но и надежными, безопасными и соответствующими человеческим ценностям. Поскольку ИИ все больше интегрируется в глобальные рабочие процессы, Toloka готова стать основой следующего поколения решений, которые разумно объединяют человеческое суждение с эффективностью ИИ, устанавливая новые стандарты того, что возможно в этой быстро развивающейся экосистеме
Ольга Мегорская, основатель и генеральный директор Толоки

Спрос на экспертизу данных ИИ мирового класса актуален как никогда. Toloka имеет уникальные возможности для удовлетворения этой потребности, отличаясь превосходными инжиниринговыми решениями, прочной репутацией в области исследований и доказанной способностью сочетать экспертизу МО с управлением людьми в больших масштабах и с научной строгостью. Я рад присоединиться к Toloka, чтобы помочь компании воспользоваться возможностью и сформировать следующую главу нашей отрасли
Михаил Парахин, новый председатель правления «Толоки»

Nebius по-прежнему привержен поддержке стратегического направления и долгосрочного создания стоимости Toloka и сохранит значительную контрольную долю в экономике, обеспечивая акционерам значительный долгосрочный рост. Аркадий Волож и Чарльз Райан, независимый неисполнительный директор Nebius, также станут неисполнительными директорами Toloka.

В то же время в результате сделки Nebius откажется от контрольного пакета акций Toloka, что позволит Toloka стать более независимой и гибкой в ​​управлении, а также позволит управленческой команде Nebius сосредоточиться на основном бизнесе инфраструктуры ИИ.

Toloka может похвастаться глубокими знаниями и компетенциями мирового класса на протяжении всего жизненного цикла разработки ИИ, включая такие критически важные области, как оценка безопасности агентов и red teaming. Начиная с крупномасштабной краудсорсинговой маркировки данных, Toloka претерпела значительную трансформацию и сегодня является надежным партнером ведущих передовых лабораторий ИИ, разработчиков моделей и корпоративных клиентов, включая Amazon, Anthropic, Microsoft, poolside, Recraft и Shopify. Работа компании играет важную роль в обеспечении того, чтобы передовые системы ИИ были не только точными и масштабируемыми, но и безопасными, соответствовали человеческим ценностям и были готовы к ответственному развертыванию.

Чтобы узнать больше об уникальных возможностях «Толоки», клиентах и ​​будущих планах, а также получить дополнительные комментарии по поводу сегодняшнего объявления, прочитайте запись в блоге генерального директора «Толоки» Ольги Мегорской здесь: toloka.ai/blog/toloka-strategic-investment-led-by-bezos-expeditions/

В результате того, что Nebius перестала иметь контрольный пакет акций в Toloka, она больше не будет включать результаты Toloka в консолидированную финансовую отчетность Nebius и вместо этого будет сообщать о своей доле в инвестициях в акционерный капитал Nebius с даты закрытия. Nebius предоставит более подробную информацию на предстоящем объявлении о доходах 20 мая 2025 года.

О Небиусе
Nebius (NASDAQ:NBIS) — технологическая компания, создающая полнофункциональную инфраструктуру для обслуживания взрывного роста глобальной индустрии ИИ, включая крупномасштабные кластеры GPU, облачные платформы, а также инструменты и сервисы для разработчиков. Компания со штаб-квартирой в Амстердаме и котирующаяся на Nasdaq, имеет глобальное присутствие с научно-исследовательскими центрами в Европе, Северной Америке и Израиле.

Основной бизнес Nebius — это облачная платформа, ориентированная на ИИ, созданная для интенсивных рабочих нагрузок ИИ. Благодаря собственной архитектуре облачного ПО и оборудованию, разработанному внутри компании (включая серверы, стойки и проектирование центров обработки данных), Nebius предоставляет разработчикам ИИ вычислительные ресурсы, хранилища, управляемые сервисы и инструменты, необходимые для создания, настройки и запуска своих моделей.

Более подробную информацию о Nebius можно найти на сайте group.nebius.com

Nebius предложит сверхмощные экземпляры NVIDIA Blackwell



Амстердам, 18 марта 2025 г. – Nebius (NASDAQ:NBIS), ведущая компания в области инфраструктуры искусственного интеллекта, станет одним из первых поставщиков облачных решений для искусственного интеллекта, предложивших новую платформу NVIDIA Blackwell Ultra AI Factory, которая откроет доступ к самым передовым в мире вычислительным мощностям по запросу для разработчиков искусственного интеллекта и предприятий по всему миру для создания следующего поколения агентного, рассуждающего и физического искусственного интеллекта.

В поддержку запуска NVIDIA Blackwell Ultra сегодня на GTC 2025 компания Nebius предоставит своим клиентам доступ к инстансам на базе NVIDIA GB300 NVL72, ускоренным 72 графическими процессорами NVIDIA Blackwell Ultra, к концу 2025 года.

Доступ к инфраструктуре ИИ мирового класса — ключ к полной реализации потенциала ИИ. Благодаря выделенным мощностям NVIDIABlackwell, доступным со следующего квартала, Nebius предоставляет новаторам ИИ и предприятиям по всему миру доступ к самым мощным в мире вычислениям ИИ через наше многопользовательское облако на основе ИИ. Это будущее ИИ, и мы строим его сегодня
Аркадий Волож, основатель и генеральный директор Nebius

Платформа NVIDIA Blackwell была создана, чтобы предоставить возможности ИИ предприятиям и новаторам по всему миру. Будучи одним из первых поставщиков облачных вычислений на базе GPU, предлагающих экземпляры NVIDIA Blackwell и Blackwell Ultra-powered, Nebius позволит своим клиентам ускорить модели рассуждений следующего поколения, ИИ-агенты и физические ИИ-приложения.
сказал Дэйв Сальватор, директор по ускоренным вычислительным продуктам в NVIDIA

Сегодня Nebius также был подтвержден в качестве партнера по экосистеме для NVIDIA Dynamo, открытой платформы вывода, обслуживающей развертывание генеративного ИИ в крупномасштабных распределенных средах. NVIDIA Dynamo обеспечивает наиболее эффективное решение для масштабирования вычислений во время тестирования. Dynamo на NVIDIA Blackwell ускоряет работу DeepSeek-R1 в 30 раз.

Сегодня компания Nebius подтвердила, что ее недавно анонсированный центр обработки данных в Нью-Джерси будет предназначен исключительно для графических процессоров с архитектурой NVIDIA Blackwell. Ожидается, что развертывание NVIDIA HGXB200 в центре обработки данных компании в Канзас-Сити также станет доступным для клиентов во втором квартале 2025 года.

Предварительные заказы на экземпляры NVIDIA GB200 NVL72 и NVIDIA HGX B200 можно оформить уже сейчас на сайте Nebius.

В настоящее время компания Nebius принимает участие в выставке GTC 2025, демонстрируя возможности своего AI Cloud и AI Studio для разработчиков ИИ, новаторов и предприятий на стенде 809.

Nebius — технологическая компания, которая создает полноценную облачную инфраструктуру для обслуживания взрывного роста глобальной индустрии ИИ, включая крупномасштабные кластеры GPU, облачные платформы, а также инструменты и сервисы для разработчиков. Nebius со штаб-квартирой в Амстердаме и котирующаяся на Nasdaq, имеет глобальное присутствие с научно-исследовательскими центрами в Европе, Северной Америке и Израиле. В команду входят около 400 высококвалифицированных инженеров по оборудованию и программному обеспечению, а также внутренняя команда по научно-исследовательской работе в области ИИ.

Основной бизнес Nebius — это облачная платформа на основе искусственного интеллекта, которая обеспечивает настоящий гипермасштабный облачный опыт, адаптированный для новаторов искусственного интеллекта. Благодаря собственной архитектуре облачного программного обеспечения и оборудованию, разработанному внутри компании (включая серверы, стойки и проектирование центров обработки данных), Nebius предоставляет разработчикам искусственного интеллекта вычислительные, хранилищные, управляемые сервисы и инструменты, необходимые для создания, настройки и запуска моделей и приложений в одном месте.

Являясь партнером NVIDIA Cloud по эталонной платформе, компания Nebius создает свое AI Cloud на основе эталонной архитектуры NVIDIA, проверенной путем принятия, строгого соблюдения и валидации эталонной архитектуры NVIDIA Cloud Partner по всему технологическому стеку аппаратных и программных компонентов.

Компания Nebius имеет статус партнера NVIDIA Cloud по референтной платформе и является одним из немногих поставщиков облачных решений для ИИ, соответствующих этим требованиям во всем мире, что подчеркивает опыт Nebius в проектировании и развертывании полного спектра аппаратной и программной инфраструктуры, соответствующей стандартам NVIDIA для рабочих нагрузок ИИ и МО.

nebius.com
studio.nebius.ai
console.eu.nebius.com

Мы представляем регион Нью-Джерси мощностью 300 МВт и расширяемся на Исландию



Мы рады объявить о крупном обновлении наших вычислительных мощностей в США. Чтобы воплотить его в жизнь, мы объединили усилия с DataOne, компанией по хостингу ИИ-инфраструктуры, чтобы обеспечить запуск первой фазы объекта в Нью-Джерси этим летом. Мы также запускаем объект колокейшн в Исландии с Verne, поставщиком центров обработки данных с устойчивым питанием в странах Северной Европы, и ожидаем, что он будет запущен в эксплуатацию в этом месяце.

Центр обработки данных, построенный по индивидуальному заказу в Нью-Джерси
Сотрудничество Nebius и DataOne использует особый подход к строительству ЦОД и энергоэффективности. Объект будет построен с использованием собственного проекта Nebius, в то время как партнерство использует опыт DataOne для достижения амбициозной цели: построить современный центр обработки данных всего за 20 недель.

В основе объекта лежит инновационный подход к производству электроэнергии. Мы будем использовать электричество за счетчиком и передовые энергетические технологии, чтобы максимизировать устойчивость, одновременно усиливая эксплуатационную надежность — именно то, что нужно новаторам ИИ для их рабочих нагрузок.

Площадка в Нью-Джерси — наш первый крупный центр обработки данных в США — будет вводиться в эксплуатацию поэтапно и может быть расширена до общей мощности 300 МВт. Ранее мы обязались достичь 100 МВт установленной мощности к концу 2025 года, и мы готовы ускориться сверх этого, если это потребуется для удовлетворения спроса.

Размещение колокейшн в Исландии
Встречайте наше новое размещение в прекрасном исландском городе Кефлавик, где мы развернем вычислительный кластер мощностью 10 МВт. Благодаря усилиям нашего партнера Верна, сайт полностью работает на 100% возобновляемых гидроэлектрических и геотермальных энергетических ресурсах Исландии.


В настоящее время ведутся работы по физическому развертыванию и установке программного обеспечения. Ожидается, что новые мощности будут полностью готовы к эксплуатации и станут доступны к концу марта.

Дополнительная емкость и общая картина
В дополнение к новому зеленому объекту в Нью-Джерси и размещению в Исландии, мы также договорились о втором этапе развертывания в ранее объявленном центре обработки данных в Канзас-Сити. Мы рассчитываем запустить эту дополнительную мощность к концу второго квартала 2025 года. Между тем, поставка первой фазы остается на графике в этом месяце.

Наш собственный центр обработки данных в Финляндии, колокейшн во Франции и Исландии, расширенное развертывание в Канзас-Сити и огромный центр обработки данных в Нью-Джерси мощностью 300 МВт — вот как скоро будет выглядеть карта зон доступности Nebius, выделенных для ИИ.

Он будет продолжать развиваться в течение года по мере нашего роста. Быстрое расширение нашего центра обработки данных — единственный способ удовлетворить растущие потребности новаторов ИИ в США и Европе — и продолжать предоставлять им наши масштабируемые, гибкие и мощные вычисления.



nebius.com
studio.nebius.ai
console.eu.nebius.com

Nebius расширяет немедленный доступ к графическим процессорам NVIDIA Hopper



Расширение границ для энтузиастов ИИ
Мы собрали и проанализировали запросы пользователей за последние девять месяцев с момента запуска доступа к самообслуживанию в апреле. Мы заметили, что большинство пользователей потребляют больше вычислений на GPU, чем мы предоставляем мгновенно по умолчанию. С точки зрения пользователя, расширение квот вычислений несложно, но это создает дополнительные трения и ослабляет потенциал масштабируемости. Более того, процесс утверждения занимает время, что имеет решающее значение в мире конкурентоспособных компаний ИИ и ценных вычислений на GPU.

Мы подсчитали, что увеличение квот ускоряет доступ к ресурсам примерно для 80% наших пользователей самообслуживания. Это также открывает возможности и дает больше свободы тем, кому нужен быстрый доступ к сторонней учебной среде или дополнительное пространство для экспериментов с МО. Что бы это ни было, мы вас обеспечим.

Что нового
Это обновление вводит мгновенный доступ к графическим процессорам NVIDIA L40S и NVIDIA H200, делая их доступными через консоль для всех. Еще одним важным изменением является доступность до 16 графических процессоров NVIDIA H100 (2 узла, соединенных с NVIDIA Quantum InfiniBand). Это значительно увеличивает диапазон рабочих нагрузок, которые могут быть запущены немедленно.

Мы также увеличили квоты на оперативную память, процессор и хранилище, чтобы лучше соответствовать введенной конфигурации графического процессора.


Квота по умолчанию не применяется к сетевым жестким дискам и распространяется только на SSD-накопители.

Обратите внимание, что квоты по умолчанию могут меняться и корректироваться в зависимости от доступности вычислительных ресурсов в каждом конкретном регионе.

Начиная
Эти увеличенные квоты уже действуют для всех. Зарегистрируйтесь в консоли и введите свои платежные данные, чтобы начать. Если вашему проекту требуется значительный объем вычислений на GPU с самого начала, свяжитесь с нами через форму запроса для получения специального предложения.

Если вам нужны какие-либо рекомендации по квотам или у вас возникли технические проблемы, обращайтесь в нашу службу поддержки клиентов.

studio.nebius.ai
console.eu.nebius.com

DeepSeek R1 и V3: китайский Новый год ИИ начался рано



Если вы думаете, что празднование Нового года началось 1 января, то это зависит от того, как на это посмотреть — ведь в мире ИИ настоящий фейерверк прогремел в декабре с выпуском DeepSeek V3. Теперь DeepSeek R1 освещает небо сиянием с открытым исходным кодом, которое заставляет даже самых закоренелых гигантов Кремниевой долины почувствовать жар.

Рост DeepSeek
DeepSeek последовательно работает на моделях Mixture-of-Experts (MoE), которые эффективны и открыты. DeepSeek V2 был выпущен в мае 2024 года и представил интересную альтернативу Llama 3 70B. Его производительность на английском языке была немного ниже, чем у Llama, но V2 превзошел модель Meta на стандартных китайских тестах.

DeepSeek V3 сделал еще один шаг вперед, не только улучшив производительность, но и похваставшись в три раза более быстрым временем вывода. Он появился в декабре 2024 года и с тех пор вызвал резонанс в сообществе ИИ. Созданный на архитектуре MoE с колоссальным количеством параметров в 671 миллиард, V3 активирует всего 37 миллиардов параметров на токен, сохраняя как вычислительную нагрузку, так и потребление энергии на низком уровне по сравнению с другими альтернативами. Обученный на 14,8 триллионах высококачественных токенов с функцией Multi-Token Prediction для более высокой скорости вывода, DeepSeek V3 обрабатывает 60 токенов в секунду — в три раза быстрее своего предшественника. Он показывает тактовую частоту 88,5 на бенчмарке MMLU — немного меньше ведущего Llama 3.1, но превосходит таких известных конкурентов, как Qwen 2.5 и Claude 3.5 Sonnet. На бенчмарке DROP он достигает 91,6, демонстрируя внушительную способность к рассуждению (ты не должен обсуждать свои проблемы с рассуждениями LLM в этом посте; ты должен подождать отдельного). Если вы программист, обратите внимание: DeepSeek V3 превосходит Claude 3.5 Sonnet на Codeforces. Я знаю — я тоже любил свой Sonnet.


Доступность и открытость
Возможно, самой большой сенсацией является разрешительная лицензия DeepSeek V3 с открытым исходным кодом, позволяющая разработчикам свободно загружать, настраивать и развертывать модель — даже для коммерческих проектов. Эта открытая философия не только идеологическая; она также экономична. Обучение DeepSeek V3 обошлось примерно в 5,58 миллионов долларов за два месяца — это лишь малая часть того, что тратят некоторые крупные технологические компании. Внезапно у тяжеловесов с закрытым исходным кодом появился реальный конкурент, который может масштабироваться, не опустошая банковские счета. DeepSeek R1 добавляет оскорбления к ране, обойдя GPT-o1 по нескольким показателям (источник):


Количество данных преобладает над качеством данных
Тенденция, начатая Фи в Учебники — это все, что вам нужно наконец-то привело к широкому признанию: теперь, когда мы научились собирать огромные объемы данных, контроль качества данных стал настоящим секретом разработки современных моделей.

Это также одна из краеугольных идей проекта Pleias, соучредителем которого я являюсь. В 2024 году Pleias опубликовал Общий корпус — крупнейший открытый и разрешенный набор текстовых данных, включающий более 2 триллионов токенов. Однако именно обширная предварительная обработка, адаптированная для RAG, позволила Плея 1.0 семейство моделей, которые превзойдут свой вес на бенчмарках RAG. Надеюсь, позже я напишу несколько постов о предварительной обработке данных для «обмотки модели».

Бережливость — это новый тренд
Сообщество открытого исходного кода известно тем, что оно «бедно вычисляет», то есть ресурсы часто минимальны по сравнению с лабораториями с глубокими карманами. Но эта вынужденная бережливость может быть суперсилой: она стимулирует более эффективные алгоритмы, более простую архитектуру и экологичные оптимизации.

Интересное замечание: даже при постоянном повышении эффективности обучение гигантских моделей по-прежнему требует значительных затрат энергии. Это делает расположение и проектирование кластеров критически важными. Например, первый собственный центр обработки данных Nebius находится в Финляндии, где используется естественное воздушное охлаждение для сокращения расходов на электроэнергию и уменьшения выбросов углекислого газа — концепция, которую мы часто называем свободным охлаждением. Эта тенденция только усилится в 2025 году, поскольку все больше разработчиков и пользователей ИИ научатся делать больше с меньшими затратами.

По-настоящему открытый ИИ догоняет
Модели искусственного интеллекта закрытого типа в Кремниевой долине, эти «мамонты», оглядываются по сторонам. Появление DeepSeek V3 знаменует собой последний шаг в критическом сдвиге: ИИ с открытым исходным кодом больше не играет в догонялки; он медленно продвигается вперед по ключевым показателям и применимости в реальном мире.

Представляю вам Доказательство А: твиты Сэма Альтмана, намекающие на усиление конкуренции.


OpenAI, несомненно, изменил общественный консенсус относительно того, что возможно, но конкуренция усиливается, и слово «открытый» в его названии больше не является достаточным. Недавнее объявление Stargate контрастирует с бережливым подходом DeepSeek, который предоставляет полностью открытые модели за малую часть стоимости.

Если вы хотите разместить DeepSeek V3 в ЕС экономически эффективно, вы скоро сможете попробовать его в Небиус AI Студия и решите сами, как это сравнить с закрытыми альтернативами, используя игровую площадку студии. На этой неделе мы добавим и R1, и V3.

Дорога впереди
Можно с уверенностью сказать, что «китайский Новый год ИИ» начался с грохотом на целый месяц раньше в этом году. В конце концов, год Деревянной Змеи знаменует собой «время трансформации, роста и самоанализа». Это касается как начинающих стартапов, так и устоявшихся участников в области genAI. Вопрос уже не в том, догонит ли ИИ с открытым исходным кодом, а в том, как быстро он охватит поле — и кто сможет использовать его для наибольшего воздействия.

Анализ данных о происшествии: Частичная недоступность 26 ноября 2024



Обзор инцидента
Неисправный релиз в последовательности восстановления VM запустил операцию восстановления, в результате чего 282 виртуальные машины (VM) в eu-north1регионе были перезапущены. 164 из этих VM столкнулись с длительным простоем, требующим ручного вмешательства для восстановления работы. Это вызвало перерывы в рабочих нагрузках клиентов.

Мы искренне приносим извинения всем клиентам, пострадавшим от этого инцидента. Мы намерены извлечь из этого урок и предпринимаем конкретные шаги, чтобы гарантировать, что это не повторится.

Влияние
Перезапущено 282 виртуальные машины. 196 из них не смогли успешно перезапуститься и зависли.
32 виртуальные машины были перезапущены или удалены пользователями.
164 виртуальные машины не смогли запуститься и оставались в автономном режиме примерно 2–3 часа.

Хронология
  • 13:48 Развертывание нового релиза в eu-north1. Цепочка событий, приведших к инциденту, началась
  • 13:48 Массовый перезапуск ВМ: затронуто 282 ВМ.
  • 13:50 86 виртуальных машин успешно перезапущены автоматически.
  • 14:03 Были запущены оповещения о большом количестве застрявших виртуальных машин, и проблема была сообщена внутри компании. Первый отчет клиента получен через Slack; проблема была классифицирована как инцидент.
  • 14:21 Команда начала анализировать причины происходящего и способы смягчения последствий, не усугубляя ситуацию.
  • 15:00 Выявлена ​​основная причина и определена стратегия смягчения последствий.
  • 15:00 — 15:37 Исследовали способы смягчения последствий инцидента без возникновения дальнейших проблем и создали план смягчения, одновременно тестируя решение на отдельных виртуальных машинах. К этому времени 32 виртуальных машины были либо восстановлены пользователями, либо удалены.
  • 15:37 — 16:39 163 ВМ восстановлены партиями.
  • 17:40 Подтвержден успешный запуск всех затронутых ВМ. Инцидент решен

Первопричина
Чтобы обеспечить четкое понимание событий, которые привели к этому инциденту, мы опишем некоторые внутренние процессы, способствовавшие возникновению проблемы.

Служба Compute API столкнулась с проблемой, когда она неправильно предполагала, что некоторые виртуальные машины неработоспособны. Это было вызвано ошибочным предположением о порядке обработки событий в системе, отвечающей за отслеживание обновлений ресурсов. В результате Compute API ошибочно определил некоторые виртуальные машины как отсутствующие и инициировал ненужные операции восстановления.

Другим фактором, способствовавшим возникновению проблемы, стало то, что на момент инцидента системы не были оптимизированы для такого количества операций восстановления, из-за которых виртуальные машины зависали.

Действия по смягчению последствий
Мы начали с определения первопричины инцидента и остановки всех операций автоматического восстановления, чтобы предотвратить дальнейшее воздействие.

Затем мы разделили затронутые ВМ на две группы: те, которые успешно перезапустились, и те, которые застряли и требовали ручного вмешательства.
Чтобы решить проблему, мы разработали и тщательно протестировали процедуры смягчения. Они включали остановку затронутых ВМ для прерывания всех застрявших процессов и их последующий перезапуск контролируемыми партиями для обеспечения успешного перезапуска.

Наконец, эти процедуры смягчения последствий были успешно применены ко всем виртуальным машинам, требующим ручного восстановления, что завершило процесс.

Результаты реагирования на инциденты
Наши внутренние системы мониторинга обнаружили проблему, когда некоторые виртуальные машины зависли. Это вызвало немедленные телефонные звонки дежурным инженерам, и в течение 15 минут мы оценили воздействие, официально объявили об инциденте, собрали группу реагирования и начали работу по смягчению последствий. Благодаря быстрым действиям группы мы определили первопричину в течение 35 минут.

Процесс восстановления следовал поэтапному подходу, который оказался эффективным, но потребовал ручного вмешательства и тщательного мониторинга для обеспечения надежного восстановления. Этот инцидент показал, что нам нужна лучшая автоматизация процедур восстановления, которая могла бы значительно сократить время реагирования в подобных ситуациях.

План действий после инцидента
Наш план действий после инцидента направлен на улучшение трех ключевых областей: проверка перед развертыванием, эксплуатация и связь.

Для проверки перед развертыванием мы введем дополнительное тестирование сценариев восстановления и усилим проверку изменений состояния виртуальной машины.

В операционной деятельности мы планируем добавить ограничение скорости для процессов восстановления, улучшить мониторинг и обнаружение аномалий в деятельности виртуальных машин, а также усилить процедуры развертывания с помощью дополнительных проверок безопасности.

В сфере коммуникаций мы стремимся обеспечить более быструю эскалацию масштабных событий, связанных с виртуальными машинами, улучшить уведомления и взаимодействие с клиентами, а также усовершенствовать внутренние протоколы коммуникации для оптимизации наших усилий по реагированию на инциденты.

Знаменательный год: основные моменты путешествия Nebius в 2024 году



Хотя праздничный сезон, возможно, не всегда связан с числами — а скорее с тем, чтобы не думать о них некоторое время — они все еще всплывают здесь и там. Будь то мощность GPU, которую вы планируете на следующий год, или сколько миллиардов параметров вы будете использовать в своей следующей модели, числа ведут нас в 2025 год. Вот некоторые цифры, над которыми мы размышляем в эти дни — сохраняя при этом чувство веселья.

Наш недавний инвестиционный раунд указывает путь к светлому будущему, и мы рады приветствовать в составе нашей компании в качестве новых акционеров нескольких престижных инвесторов.



Эти 700 миллионов долларов пополнят наши собственные сбережения и дадут нам больше возможностей для инвестиций в создание инфраструктуры ИИ по всему миру…



…при этом никогда не забывая о своих корнях. Первый центр обработки данных Nebius в Финляндии, наша домашняя база, был полностью построен нами самостоятельно, с тщательным вниманием к конструкции здания, адаптацией его к нашим внутренним серверам и конструкциям стоек. И мы структурировали его не только для экономической эффективности, но и в очень финском стиле — с сауной на месте.



Это может показаться довольно горячим — надо признать, что большинство сотрудников предпочитают температуру ближе к 80–100 °C.

Говоря о тепле, мы используем избыточное тепло от наших серверов с пользой, перенаправляя его в близлежащий город Мянтсяля.



Трубы, по которым поступает тепло, конечно, не единственная часть коммуникаций центра обработки данных. Для поддержки многохостового обучения для наших клиентов мы полагаемся на InfiniBand. Фактически, общая длина оптических кабелей, установленных в наших центрах обработки данных, охватывает все расстояние от нашей штаб-квартиры в Амстердаме до Рима.



Конечно, мы посетили Рим в 2024 году, чтобы продвигать Nebius – вместе с 26 другими городами в Соединенных Штатах, Европе, Азиатско-Тихоокеанском регионе и за его пределами. Вы найдете нас на конференциях по ИИ по всему миру, готовых поддержать участников, где бы они ни находились.



Поддержка означает не только предоставление инфраструктуры GPU, но и заботу о людях в теплой и вдумчивой манере. Если количество ваших носков нечетное, ну… это, конечно, то, чего никогда не случалось с нами.



Посещение конференций по всему миру не означает, что у нас нет ключевых достопримечательностей. Наши рекламные щиты в районе залива привлекли много внимания — именно то, чего мы хотели.



Если мы так смелы в маркетинге, насколько сильны наши технологические основы? Один из способов измерить это — через портфель патентов. Эти цифры показывают, что мы не просто строим инфраструктуру ИИ, как другие, кто был до нас. Вместо этого мы продвигаем технологии, чтобы продвигать отрасль вперед.



Nebius привносит дополнительную технологическую ценность в эту область. Как еще можно описать платформу облачных вычислений, переписанную с нуля менее чем за год? Мы владеем каждой частью технологического стека Nebius, и каждая строка кода — наша собственная. Мы считаем, что это делает Nebius по-настоящему уникальным в мире облаков.



Помимо облака мы также запустили Nebius AI Studio, которая предоставляет разработчикам приложений GenAI конечные точки для десятков самых популярных моделей с открытым исходным кодом, а также некоторые более специализированные предложения. Они не ограничиваются LLM, но также включают модели машинного зрения. AI Studio уже производит фурор на рынке вывода.



Расширение нашего портфолио такими технологическими продуктами требует тесного сотрудничества между командами, особенно при росте в нескольких странах. Чтобы оставаться на связи, мы полагаемся на Zoom для трансграничной командной работы.



После продуктивных мозговых штурмов, как онлайн, так и офлайн, о том, как сделать жизнь разработчиков ИИ еще проще, мы прилагаем все усилия, чтобы восстановить связь с нашими семьями. Экологичный способ добираться на работу — велосипед — очень амстердамское занятие.



Вот и все наши цифры на 2024 год! Теперь пора подумать о том, как достичь еще более впечатляющих показателей в 2025 году. Если покорение мира ИИ также входит в ваши планы на следующий год, вы знаете, где найти инфраструктуру. И носки.

nebius.com
studio.nebius.ai/playground
console.eu.nebius.com

Реализовано в четвертом квартале: обновления нашего облака GPU



После завершения полной переписывания нашего облака с нуля в октябре мы начали улучшать фундамент, который мы вывели на рынок. Функции и инструменты, которые мы представили с тех пор, охватывают весь наш спектр облачных сервисов, от Compute Cloud до управляемых решений MLOps.

Вычислительное облако
  • Добавлена ​​конфигурация платформы AMD (cpu-d3).
  • В консоль добавлены новые панели мониторинга: ЦП, ГП, ОЗУ, метрики NVLink, метрики InfiniBand, метрики Ethernet.
  • Выбор типа публичного IP-адреса (статический или динамический) теперь доступен при создании виртуальной машины в GUI, CLI или Terraform.

Кластерное управление
Оператор

  • Включено sshdна рабочих узлах для прямого, безопасного доступа и упрощенного устранения неполадок.
  • Реализована поддержка enroot без необходимости наличия прав root, что обеспечивает более гибкие и безопасные контейнеризированные рабочие процессы.
  • Добавлена dockerd​​поддержка управления средой выполнения контейнера.
  • Интегрировано apparmorдля улучшения профилей безопасности и изоляции рабочей нагрузки.
  • Внедрены разделы Slurm для логического разделения ресурсов и повышения эффективности планирования.
  • Запущен API Slurm REST, позволяющий осуществлять программное управление кластерами, отправку заданий и запрашивать состояния кластеров.
  • Поддерживаются типы кластеров, состоящие только из ЦП и только из ГП, что позволяет пользователям точно адаптировать свою инфраструктуру к требованиям рабочей нагрузки.

Управляемый сервис для Kubernetes
  • Добавлена ​​поддержка балансировщика нагрузки для предоставления сервисам доступа в Интернет и внутренние сети.
  • В консоль добавлены новые панели мониторинга: ЦП, ГП, ОЗУ, метрики NVLink, метрики InfiniBand, метрики Ethernet.
  • Запущен автомасштабатор узлов для динамического добавления или удаления узлов в зависимости от потребностей в ресурсах.
  • Внедрена интеграция с нашей службой реестра контейнеров для бесперебойного управления образами.
  • Включена высокая доступность для кластеров по умолчанию, что обеспечивает избыточную плоскость управления без дополнительных затрат.
  • Добавлена ​​поддержка блочных томов ReadWriteOnce с CSI через блочное хранилище в режиме предварительного просмотра. Обратитесь в службу поддержки или к своему архитектору облачных решений, чтобы начать их использовать.
  • Добавлена ​​поддержка настройки кластеров в пользовательских подсетях, что позволяет кластерам Kubernetes подключаться к частному адресному пространству клиента через VPN.

Реестр контейнеров

Хранилище данных
Общая файловая система

  • Запущена функция изменения размера файловой системы. Производительность файловой системы будет увеличиваться на каждые 4 ТБ размера.
  • Добавлена ​​поддержка получения доступных платформ и предустановок через API и CLI.
  • Добавлена ​​возможность изменения размера файловых систем и дисков без необходимости их переустановки.

Хранение объектов
  • В консоль добавлены показатели производительности и потребления.

Управляемый сервис для PostgreSQL
  • Добавлены показатели производительности в консоль.
  • Добавлена ​​поддержка Run:ai.
  • Запущены частные конечные точки кластера (доступны только из VPC пользователя).
  • Добавлена ​​возможность включать и отключать конечные точки публичного кластера.
  • Добавлены настройки размера пула и некоторые второстепенные настройки, связанные с параметрами кластера PostgreSQL.
  • Добавлена ​​возможность обновления созданного кластера путем изменения параметров кластера (количество хостов, количество ЦП, объем памяти), параметров PostgreSQL (пароль, настройки автоочистки и т. д.) или настроек пулера.

Услуги и приложения MLOps
Управляемая услуга для MLflow

  • Теперь поддерживаются частные и публичные конечные точки.
  • Добавлены журналы MLflow в веб-консоль.
  • В веб-консоль добавлены показатели производительности MLflow.

Возможности облачной платформы
Сеть

  • Добавлено «количество доступных публичных IP-адресов» в качестве публичной квоты в консоли.
  • Теперь доступна возможность изменения диапазона IP-адресов для частной сети.
  • Решение Wireguard VPN было добавлено для безопасного удаленного доступа.
  • Управление идентификацией и доступом
  • Добавлена ​​аутентификация GitHub в консоль.
  • Теперь у клиентов есть возможность настраивать собственные федерации с помощью протокола SAML2 через API.

API
  • Выпустили API-репозиторий github.com/nebius/api
  • Go SDK и Python SDK выпущены в режиме предварительного просмотра. Пожалуйста, свяжитесь со службой поддержки или архитектором облачных решений, чтобы начать их использовать.
Страница статуса
  • Теперь вы можете подписаться на инциденты на страница статуса status.nebius.com

Небиус AI Студия
  • В настоящее время в нашем портфолио LLM более 30 моделей.
  • Теперь платформа поддерживает увеличенные лимиты скорости — более 100 млн токенов в минуту и ​​более.
  • Добавлена ​​новейшая модель Llama-3.3-70B-Instruct.
  • Добавлены модели стражи.
  • Добавлены специализированные модели Med42 и Llama3-OpenBioLLM-8B.
  • Теперь также доступны модели Vision.
  • LoRA доступен в режиме предварительного просмотра.

nebius.com
studio.nebius.ai/playground
console.eu.nebius.com