Nebius запускает Nebius Token Factory для масштабной реализации вывода ИИ в производственных масштабах

Амстердам, 5 ноября 2025 г. — Сегодня компания Nebius представила Nebius Token Factory — платформу производственного вывода, которая позволяет компаниям, работающим в сфере ИИ, и цифровым предприятиям развертывать и оптимизировать модели с открытым исходным кодом и пользовательские модели в больших масштабах с надежностью и контролем корпоративного уровня.
Nebius Token Factory, построенная на комплексной ИИ-инфраструктуре Nebius, объединяет высокопроизводительный инференс, пост-обучение и детальное управление доступом в единую управляемую платформу. Она поддерживает все основные открытые модели, включая DeepSeek, GPT-OSS от OpenAI, Llama, NVIDIA Nemotron и Qwen, а также предоставляет клиентам возможность размещать собственные модели.
По мере того, как ИИ переходит от экспериментального этапа к производству, использование закрытых моделей может создавать узкие места при масштабировании. Модели с открытым исходным кодом и пользовательские модели могут устранить эти препятствия, открывая путь к инновациям и улучшая экономические показатели, но управление ими и их обеспечение безопасности в производстве остаются сложными и ресурсоёмкими для большинства команд.
Nebius Token Factory позволяет командам реализовать эти преимущества, сочетая гибкость открытых моделей с управляемостью, производительностью и экономичностью, необходимыми для масштабного запуска ИИ. Платформа оптимизирована для повышения эффективности, обеспечивая задержку менее секунды, автоматическое масштабирование пропускной способности и 99,9% времени безотказной работы, даже при рабочих нагрузках, превышающих сотни миллионов запросов в минуту.
У каждой команды свои уникальные требования, и им нужна скорость, надёжность и экономичность без лишних усилий. Мы создали Nebius Token Factory не только для обслуживания моделей, но и для того, чтобы помочь клиентам решать реальные задачи и масштабировать разработку, оптимизируя конвейеры вывода и превращая открытые модели в готовые к использованию системысказал Роман Чернин, соучредитель и директор по развитию бизнеса Nebius
Как клиенты и сообщество используют Nebius Token Factory
Первые пользователи Nebius Token Factory используют платформу для поддержки широкого спектра решений на основе ИИ: от интеллектуальных чат-ботов и помощников-кодировщиков до высокопроизводительного поиска, генерации дополнения (RAG), анализа документов и автоматизированной поддержки клиентов.
Компания Prosus, стоящая за некоторыми из ведущих мировых брендов в сфере образа жизни и электронной коммерции, добилась сокращения расходов в 26 раз по сравнению с фирменными моделями.
Мы быстро работаем, быстро тестируем и итерируем, а гибкость, продукты и оперативная реакция Nebius Token Factory позволили нам поддерживать этот темп на протяжении всего производственного процесса. Используя выделенные конечные точки Nebius Token Factory, Prosus смогла обеспечить гарантированную производительность и изоляцию. Внедрение функции автоматического масштабирования стало переломным моментом, позволив нам обрабатывать огромные рабочие нагрузки — до 200 миллиардов токенов в день — без ручного вмешательствасказал Зюлькюф Генч, директор по ИИ в Prosus
Ведущая ИИ-видеоплатформа Higgsfield AI использует Nebius для вывода по запросу и автоматического масштабирования.
Масштабный вывод с хорошей экономической эффективностью требует эффективных возможностей масштабирования по запросу и автоматического масштабирования. Nebius был единственным поставщиком, который удовлетворил нашим требованиям, сократив накладные расходы, упростив управление и позволив нам быстрее и экономичнее внедрять ИИ в производствосказал Алекс Машрабов, основатель и генеральный директор Higgsfield AI.
Лидеры в области открытого исходного кода, такие как Hugging Face, также сотрудничают с Nebius с целью улучшения доступа и масштабируемости для разработчиков.
Hugging Face и Nebius разделяют общую миссию: сделать открытый ИИ доступным и масштабируемым. Благодаря сотрудничеству с Nebius Token Factory мы смогли обеспечить более быстрый и надёжный вывод для разработчиков, работающих с крупными моделями с открытым исходным кодомзаявил Жюльен Шомон, технический директор Hugging Face.
Полнофункциональная инфраструктура ИИ как основа
Nebius Token Factory построен на базе Nebius AI Cloud 3.0 «Aether». Это обеспечивает безопасность корпоративного уровня, проактивный мониторинг и стабильную производительность, подтвержденную бенчмарками, включая MLPerf Inference. Объединяя полнофункциональную инфраструктуру Nebius с оптимизированным для вывода технологическим стеком, Nebius Token Factory помогает клиентам быстрее масштабировать свои ИИ-приложения и решения.
В SemiAnalysis мы отслеживаем совокупную стоимость владения для каждого игрока GPU Cloud. Nebius — единственный NeoCloud, использующий шасси ODM, что обеспечивает значительное снижение совокупной стоимости владения. Мы рады видеть, что их новая платформа Inference разработана с учётом компромиссного решения: стоимость, скорость вывода на пользователя и качество моделисказал Дилан Патель, главный аналитик SemiAnalysis
Проекты ИИ часто масштабируются быстрее, чем команды, которые их создают. Nebius Token Factory оптимизирует жизненный цикл после обучения, превращая весовые коэффициенты моделей с открытым исходным кодом в оптимизированные, готовые к использованию системы с гарантированной производительностью и прозрачной стоимостью за токен. Интегрированные конвейеры тонкой настройки и дистилляции позволяют командам адаптировать большие открытые модели к собственным данным, одновременно сокращая затраты на вывод и задержки до 70%.
Оптимизированные модели можно мгновенно развернуть на конечных точках производства, без ручной настройки инфраструктуры. Такой подход позволяет разработчикам ИИ и предприятиям быстрее выполнять итерации, предсказуемо управлять затратами и поддерживать полную прозрачность каждого обслуживаемого токена.
Token Factory представляет Teams и Access Management, систему единого входа (SSO), разделение проектов и корпоративное выставление счетов для упрощения совместной работы и обеспечения соответствия требованиям. Администраторы могут настраивать детализированные роли, применять минимальные привилегии доступа и вести чёткий аудит всех развёртываний, от ранних экспериментов до критически важных рабочих нагрузок.
Фабрика токенов Nebius — ключевые особенности
- Выделенные конечные точки с гарантированной производительностью и изоляцией, с SLA 99,9%, предсказуемой задержкой и автоматическим масштабированием пропускной способности
- Вывод с нулевым сохранением данных в центрах обработки данных ЕС или США, поддерживающий строгие требования к размещению данных
- Сертификаты безопасности, включая SOC 2 Type II, включая сертификаты HIPAA, ISO 27001 и ISO 27799
- Комплексные возможности тонкой настройки, поддерживающие как LoRA, так и полное обучение модели, с простым развертыванием и размещением в один клик.
- Поддержка более 40 моделей с открытым исходным кодом, включая новейшие Deep Seek, Llama, OpenAI и Qwen, оптимизированные для последних чипов
- Управление по замыслу с управлением командами и доступом, единым входом, унифицированным выставлением счетов и удобными для аудита рабочими пространствами
- Совместимые с OpenAI API для беспроблемной миграции с собственных конечных точек
Доступность
Nebius Token Factory — это следующее поколение Nebius AI Studio, модернизированное для корпоративного использования и полного управления жизненным циклом моделей. Оно доступно уже сегодня и поддерживает более 60 моделей с открытым исходным кодом (текст, код и машинное обучение). Текущие пользователи AI Studio автоматически перейдут на Token Factory.
Чтобы начать, посетите tokenfactory.nebius.com
0 комментариев
Вставка изображения
Оставить комментарий