Рейтинг
0.00

Дата-центры OVH

33 читателя, 1307 топиков

Высокоскоростной вывод ИИ: OVHcloud выбирает SambaNova



OVHcloud заключил неисключительное соглашение с SambaNova. Этот стартап из Кремниевой долины разрабатывает перепрограммируемые чипы для быстрого вывода языковых моделей, при этом потребляя меньше энергии, чем видеокарты Nvidia.

По словам Октава Клабы, соучредителя и генерального директора группы, это подразумевает, помимо прочего, развитие возможностей вывода. Под выводом, напомним, понимается реализация моделей машинного обучения и искусственного интеллекта в процессе производства. Когда ChatGPT отвечает на вопрос пользователя, это пример вывода.

Три режима вывода ИИ
Октав Клаба, со своей стороны, выделяет три типа вывода, которые он планирует предложить в OVHcloud. Во-первых, это базовый вывод, который уже доступен широкой публике.

Скоро будут доступны еще два режима.

С 31 декабря пакетный вывод позволит асинхронно обрабатывать большие объёмы данных. И наконец, то, что интересует эту статью: сверхбыстрый вывод, которого ожидают пользователи большинства ИИ-помощников. С таким инструментом, как ChatGPT, вы видите, как буквы формируются прямо на ваших глазах; это просто потрясающе
говорит Октав Клаба.

Для пакетного и базового режимов OVHcloud может использовать существующие экземпляры Nvidia: H100, V100S, A10, L4, L40S и RTX 5000. С 30 ноября компания будет предоставлять H200 через свои инструменты искусственного интеллекта. Также планируется запуск RTX 6000 Pro, B200 и B300, но дата выхода пока не объявлена.

Но для высокоскоростного вывода провайдер намерен предложить доступ к стойкам SambaNova.

SambaNova — обещание быстрого вывода с низким углеродным следом
SambaNova, гораздо менее известная, чем Nvidia, — американский разработчик перепрограммируемого чипа, предназначенного для выполнения задач искусственного интеллекта (обучения или вывода). Эти чипы называются RDU (Reconfigurable Dataflow Units).

ASICS можно перенастраивать в соответствии с рабочими нагрузками и моделями. Это делает его гораздо более устойчивым
заявил Октав Клаба на пресс-конференции перед саммитом OVHCloud.

Компания SambaNova, с которой LeMagIT познакомился во время пресс-тура в 2022 году, была основана бывшими сотрудниками Sun Microsystems/Oracle и учёными, окончившими Стэнфорд. В то время компания-единорог уже заявляла, что её технология способна выполнять модели типа GPT с высокой скоростью.

Стойка SambaNovaСтойка SambaNova, сфотографированная в 2022 году


Мы протестировали Cerebras, Groq и SambaNova. Мы пришли к выводу, что SambaNova обеспечивает наилучшее соотношение производительности, цены и занимаемой площади в центрах обработки данных
говорит Октав Клаба

SambaNova удалось разместить 16 чипов SN40L, четвёртого поколения своих 5-нм чипов (производства TSMC), в одной стойке (по 2 RDU на лезвие, 8 лезвий). Для обеспечения эквивалентной вычислительной мощности Groq потребовалось бы 9 стоек, а Cerebras — четыре. «SambaRack» может обрабатывать передовые модели с более чем 400 миллиардами параметров, включая Llama 4 Maverick и DeepSeek R1 (671 миллиард параметров). По расчётам SambaNova, одна стойка может вместить до 5 триллионов параметров.

Ещё одной отличительной особенностью чипа SN40L является наличие 520 МБ кэш-памяти SRAM и 64 ГБ памяти HBM. К нему можно подключить 768 ГБ оперативной памяти DDR4. В общей сложности стойка SN40L-16 имеет 8 ГБ SRAM, 1 ТБ HBM и 12 ТБ оперативной памяти DDR4. По словам Октава Клаба, эта стойка потребляет в среднем 10 кВт (пиковая мощность — 14,5 кВт) и может вместить «десятки» моделей, которые можно сменить «менее чем за 2 миллисекунды». «В то время как с графическими процессорами Nvidia это занимает от 30 секунд до 3 минут». Для сравнения, очень мощная стойка GB300NVL72 (с общим объёмом 40 ТБ HBM3e) потребляет от 130 до 140 кВт, по данным Supermicro.

Агенты с открытым исходным кодом и ИИ для различных профессий
Но, как отмечает глава французского поставщика, самое интересное — это скорость ответов.

SambaNova заявляет, что с Llama 4 Maverick она может получать более 100 токенов в секунду. С более мелкими моделями, такими как Llama 3.1 8B, эта скорость достигает более 1000 токенов в секунду по сравнению с 1837 токенами в секунду у Cerebras.

Напоминаем, что функция Lightning Speed ​​в приложении Le Chat от Mistral AI реализована на базе чипов Cerebras, установленных в дата-центре в Лас-Вегасе.

Сейчас мы развёртываем первое шасси SambaNova в нашем центре обработки данных Gravelines. Если рынок отреагирует положительно, мы планируем добавить стойки в каждый из наших центров обработки данных
говорит Октав Клаба

Речь идёт не о предоставлении прямого доступа к экземплярам GPU/RPU Nvidia и фреймворкам SambaNova. Вместо этого OVHcloud предоставляет эти вычислительные возможности через свой сервис AI Endpoint. Через API он предоставляет доступ примерно к сорока моделям генеративного ИИ и обработки естественного языка. Эти модели в основном имеют открытый вес.

Наша стратегия в области графических процессоров ориентирована на логический вывод, особенно на модели с открытым исходным кодом
говорит генеральный директор OVHcloud.

Параллельно французский провайдер разрабатывает OmisimO, ИИ-помощника на базе SHAI, программного агента с открытым исходным кодом для ИИ (Apache 2.0). Идея заключается в том, чтобы способствовать появлению реальных сценариев использования, полезных для бизнеса, таких как ИИ-агенты, подключенные к CRM-системам компаний.

Модель ценообразования для API конечных точек ИИ во многом зависит от скорости отклика. Базовый API, как правило, основан на тарификации на основе токенов. Цена зависит от выбранного уровня LLM (локальное управление жизненным циклом). Для объёмов токенов, обрабатываемых через пакетный API, OVHcloud обещает скидку и возможность планировать запросы вне периодов пикового потребления. Для быстрого API потребуется минимальный ежемесячный взнос, но поставщик гарантирует «сверхвысокую пропускную способность, сверхбыструю доставку и повышенную конфиденциальность». Выпуск этого API запланирован на 2026 год.

Объявление о партнерстве было сделано на следующий день после того, как Nvidia опубликовала результаты за третий финансовый квартал 2026 года.
Продажи Blackwell необычайно высоки, и графические процессоры для облака распроданы
заявил в пресс-релизе Дженсен Хуанг, основатель и генеральный директор Nvidia.

Графические процессоры: «проблема бизнес-модели»
Октав Клаба, отвечая на вопрос о гонке вооружений среди облачных провайдеров, осторожен.
Когда я инвестирую, меня интересует прибыльный рост. Я отказываюсь играть в лотерею. Мы делаем это, исходя из потребностей клиентов. Мы хотим знать, кто и за что будет платить

Руководитель утверждает, что придерживается «защитной» инвестиционной стратегии.

Правда о графических процессорах H100, купленных три года назад, заключается в том, что они практически бесполезны. Люди постепенно поймут, что инвестиционные циклы для графических процессоров гораздо короче, чем для центральных процессоров. Через 18 или 24 месяца у вас уже есть серьёзные вопросы, которые нужно задать себе. А через 36 месяцев вы теряете почти 80% стоимости

Это объясняет, почему OVH не вкладывает значительные средства в обучение суперкомпьютеров.
Провайдеры программ LLM переходят на кодирование с точностью FP4 во время обучения. Графические процессоры H100 не поддерживают FP4. Графические процессоры H200 уже широко распространены; снизите ли вы цену на H100 или потеряете клиентов из-за того, что они будут использовать более дешёвые H200? Проблема в бизнес-модели
объясняет Октав Клаба

Создание новых центров обработки данных: на саммите Choose France OVHcloud объявляет об инвестициях в размере 160 миллионов евро

OVHcloud, европейский лидер в области облачных вычислений, базируется в Страсбурге с 2012 года. (Архивное фото Лорана Реа)


Среди инвестиций, «сделанных или утвержденных в 2025 году», о которых было объявлено в понедельник в ходе первого саммита «Выбирайте Францию ​​— французское издание», в официальном пресс-ките, опубликованном в полдень, упоминаются «160–180 миллионов евро», запланированные OVHcloud «на новый центр обработки данных в Страсбурге, который займет часть зданий, оставленных пустующими ArcelorMittal в автономном порту».

В ответ на запрос отдел коммуникаций «европейского лидера в области облачных вычислений» поначалу выразил удивление. «Наше заявление на Choose France касается разработки и расширения нашего предложения в области квантовых вычислений», — ответила компания, которая только что объявила о запуске своей квантовой платформы, предназначенной для обеспечения «доступа как минимум к восьми самым мощным квантовым компьютерам».

Из Страсбурга, где OVHcloud базируется с 2012 года (в марте 2021 года пожар повредил один из четырёх её локальных дата-центров, вызвав хаос в интернете), в понедельник явно никто не планировал выступать. То есть, до раннего вечера, когда в сообщении на X президент-основатель Октав Клаба «подтвердил инвестиции в размере 160–180 миллионов евро» в дата-центры SBG6, SBG7 и SBG8, «которые в настоящее время находятся в стадии строительства и потребуют этих сумм после завершения строительства и установки серверов».

В пресс-релизе Choose France упоминаются еще две инвестиции в Эльзасе: «более 2 миллиардов евро» в проект Lithium de France к северу от Агно и «50 миллионов евро» на модернизацию заводов Alsapan в Эрштайне (компания объявила о вложении 35 миллионов евро к 2027 году).

Публичное облако SNC / +40 продуктов



Публичное облако SNC / +40 продуктов
OPCP / Edge SNC

Проведение аудита по стандарту ANSSI, как я уже говорил, в рамках публичного облака SNC, продуктов, соответствующих сертификации SNC и LPM (OIV). IAM, KMS, Obs, Secret, Firewall, VPN, VPC, VM, Bare Metal, Object Storage, Block Storage, File Storage, Managed K8S, DBaaS, End-Point AI (LLM) и т. д.

Все эти продукты доступны в течение 6 месяцев на базе OPCP (локальной облачной платформы), сертифицированной платформой SNC и LPM и способны работать в AirGap, в центрах обработки данных наших клиентов и на Edge (в пользователях, магазинах, магазинах и т.д.) для распространения инноваций, искусственного интеллекта и оборудования. местный.

Клиенты Les premières BETA démarrent… :)

Браво DreamTeam! Спасибо вашим клиентам!




Ваше приглашение на саммит OVHcloud 2025




20 ноября я провел встречу в Maison de la Mutualité, в Париже, для саммита OVHcloud 2025.
OVHcloud — это игра, играющая роль специалиста по инновациям и включающая в себя IA. И в этот год мы делаем все возможное, чтобы объявить о нашей ярмарке.

L'IA переопределил дежавю манеру творить, действовать каждый день.
Она трансформирует нашу профессию, ускоряет производительность и открывает путь к новому поколению предприятий.

Авек Янив Фдида (технический директор), Кэролайн Комет-Френьо (CRO), Матье Делобель (директор по информационным технологиям), Аксель Мак Намара (CCO) и Анн Дюбоск (директор по бренду и коммуникациям), наши партнеры не являются передовыми, мы убеждены и не знаем видения европейского облака в сфере полезных и безопасных инноваций.

Если вы являетесь разработчиком, стартапом, глобальным действующим лицом или историческим партнером, саммит — это настоящий момент встречи и обмена с сообществом OVHcloud, для разработки, тестирования и построения ансамбля будущего облака.

Квант как услуга

VHcloud Quantum: ваш привилегированный доступ к квантовым вычислениям
Квантовые вычисления меняют наш подход к решению сложных задач, особенно в областях оптимизации и моделирования. Квантовая платформа OVHcloud обеспечивает надёжную и доступную отправную точку для освоения этой новой эры вычислений.

www.ovhcloud.com/fr/public-cloud/quantum-computing/
www.ovhcloud.com/fr/public-cloud/prices/#quantum-computing

Повышение устойчивости сети на серверах OVHcloud Bare Metal

В рамках постоянного совершенствования нашей инфраструктуры Bare Metal компания OVHcloud представляет новую архитектуру агрегации сетей, призванную повысить устойчивость публичных и частных интерфейсов ваших серверов.

Что меняется?
До сих пор агрегация каналов (LACP) для сетевых интерфейсов осуществлялась с использованием портов, принадлежащих одной сетевой карте (NIC). Хотя это и обеспечивало резервирование на случай отказа коммутатора ToR (Top-of-Rack), это не исключало риск отказа сетевой карты.

Мы обновим эту функциональность с 25 ноября 2025 года.
Вы обеспокоены, если
  • Вы настроили агрегацию LACP ваших публичных или частных каналов (исключая OLA).
  • Вы настроили OLA на своем сервере и хотите вернуться к общедоступной/частной конфигурации по умолчанию.
После этого обновления
  • Существующие агрегации не будут изменены автоматически.
  • Переключение в режим OLA, а затем возврат в режим по умолчанию вызовет перенастройку и, следовательно, применение нового правила агрегации.
  • Изменение конфигурации агрегаций логически перераспределит их по двум отдельным сетевым картам (без изменения физической кабельной разводки).
  • После применения нового правила вернуться к старому режиму будет невозможно.
  • Для серверов, поставленных после этого обновления, будет применяться только новое правило агрегации.



Панель управления OVHcloud отображает схему агрегации, которую можно настроить на вашем сервере. Эта же информация доступна через API OVHcloud
/dedicated/server/{serviceName}/virtualNetworkInterface) /dedicated/server/{serviceName}/virtualNetworkInterface/{uuid}


Если вы не используете агрегацию каналов LACP на своем сервере, никаких действий не требуется, и никакие изменения для ваших служб не будут видны

Важное примечание, если вы настроили LACP на уровне ОС
Если вы планируете перейти на это новое правило агрегации, вам потребуется обновить MAC-адреса, назначенные каждой связи в вашей операционной системе.

Преимущества этого изменения
При правильной настройке ОС новое правило обеспечивает:
  • Более высокая доступность: повышенная отказоустойчивость к сбоям оборудования (сетевых карт, коммутаторов и кабелей).
  • Непрерывное подключение: ваши услуги остаются доступными даже при выходе из строя одной сетевой карты.
  • Плавная эволюция: это улучшение реализуется без влияния на вашу текущую конфигурацию.

Хронология и документация
Развертывание начнется 25 ноября 2025 года.
Более подробную информацию см. в документации, касающейся этого изменения.
OVHcloud по-прежнему стремится предоставлять еще более надежную, высокопроизводительную и безопасную инфраструктуру.
help.ovhcloud.com/csm/en-dedicated-servers-improve-network-resilience

Спасибо за ваше доверие
OVHcloud

Публичное облако / Средства реализации / Менеджер секретов (BETA)



Представляем OVHcloud Secret Manager — полностью управляемый сервис, который защищает ваши конфиденциальные данные (учётные данные, ключи API и т. д.) и гарантирует их защиту от кражи, подмены или потери. С Secret Manager вы можете безопасно хранить, управлять и использовать свои секреты в своих приложениях и/или сервисах OVHcloud.

Основные преимущества
  • Защитите ваши конфиденциальные данные от несанкционированного доступа
  • Безопасно используйте свои секреты в собственных приложениях и/или сервисах OVHcloud.
  • Контролируйте, автоматизируйте и регистрируйте весь доступ к вашим секретам
  • Обеспечить соответствие нормативным требованиям
  • Повышение безопасности и снижение риска

Ключевые особенности
  • Безопасное хранение секретов (учетных данных, ключей API и т. д.)
  • Сертификации: FIPS 140-3, ISO 27001 (позже PCI-DSS, HDS и CSPN)
  • Поддержка API: REST API и API, совместимый с Hashicorp Vault, для гибкой интеграции с различными приложениями и сервисами.
  • Полностью управляемый интерфейс для безопасного управления секретами
  • Контроль, автоматизация и протоколирование всех доступов к секретам
  • Встроенная интеграция OVHcloud IAM для детального контроля
  • Журналы аудита в реальном времени и исторические журналы доступны через платформу данных журналов OVHcloud
Распространенные случаи использования
  • Безопасное хранение и управление ключами API, учетными данными и другими конфиденциальными данными
  • Интеграция с конвейерами CI/CD и инструментами DevOps
  • Соблюдение требований к хранению и управлению конфиденциальными данными
  • Уведомление об истечении срока действия секрета

Цены (после бета-фазы)
OVHcloud Secret Manager предлагает предсказуемую и прозрачную модель ценообразования, независимо от того, какой объем секретов вы используете.
  • Цена за секрет: € 0,03 / секрет / месяц
  • Цена за запрос: добросовестное использование (порог будет подтвержден после бета-тестирования)

Следующие несколько месяцев будут богаты на анонсы



Вчера, 20 октября 2025 года, совет директоров OVHcloud принял решение объединить должности председателя и генерального директора и доверить мне общее управление OVHcloud для реализации следующего стратегического плана на 2026–2030 годы. Идея заключается в объединении видения, стратегии и исполнения, чтобы быстрее извлекать выгоду из 10 лет крупных инвестиций в центры обработки данных (250 МВт) и программное обеспечение (40 продуктов публичного облака). Я благодарю Бенджамина Ревколевски за его приверженность и действия, предпринятые в этом году.

Что такое OVHcloud в 2025 году?
Мы преуспели в завоевании места среди корпоративных клиентов, крупных клиентов, государств, банков, больниц и промышленности, достигнув выручки > 200 млн. В то же время мы достигли выручки > 100 млн. в публичном облаке, и это только начало. В общей сложности у нас более 1200 клиентов, которые достигают > 100 тыс. годовых доходов. Наконец, мы вышли на рынок США, где в 2025 финансовом году выручка превысила 100 млн долларов.

Помимо поддержки корпоративных клиентов и клиентов, занимающихся цифровым масштабированием, я возвращаюсь к нашим давним клиентам, занимающим лидирующие позиции в категории «Digital Starters» (малые клиенты), как их называют, чтобы предложить им инновации, ИИ, соотношение цены и производительности, улучшенную поддержку и упрощенную систему оплаты… Следующие несколько месяцев будут богаты на анонсы…

Я создал OVHcloud 26 лет назад, и каждое утро у меня по-прежнему много идей. Сегодня у меня отличная команда, OVHcloud растёт на рынке уже несколько десятилетий, и у нас есть уникальная возможность, как единственного европейского игрока в сфере облачных технологий, достичь годовой выручки более 1 млрд долларов.

Я очень рад снова полностью посвятить себя нашим клиентам, нашим командам и нашим финансовым партнёрам. Я свяжусь с вами в ближайшее время с подробностями Стратегического плана на 2026–2030 годы, чтобы получить ваши отзывы и совместно разработать наши дорожные карты, чтобы всегда быть на шаг впереди.

Octave