VDS с GPU вместо тысячи распродаж



Рады сообщить, что в линейке наших виртуальных серверов появилась новая услуга — аренда серверов с графическими ускорителями. Это отличное решение для задач, требующих высокой вычислительной мощности: от работы с нейросетями и машинным обучением до 3D-моделирования, рендеринга и обработки видео.

Что мы предлагаем:
  • Мощные видеокарты NVIDIA: RTX 4090, L4 и L40S.
  • Готовые шаблоны операционных систем с драйвером NVIDIA и CUDA.
  • Все ресурсы GPU под вашим контролем.
  • Посуточная/помесячная оплата.

Готовые конфигурации на выбор:


Серверы на базе процессоров Intel Xeon Scalable до 3.3 ГГц и AMD EPYC до 3.9 ГГц. Виртуализация KVM.

firstvds.ru/products/vps-vds-gpu

Аренда сервера с GPU для ИИ, нейросетей и рендеринга - от 27420р./месяц




У нас вы можете арендовать актуальные выделенные серверы с GPU от Nvidia для нейросетей, рендеринга и обучения ИИ в Европе. Конфигурации доступны на Nvidia RTX 4000 SFF, Nvidia RTX 6000 Ada Generation, Nvidia L4, Nvidia Tesla V100s, NVIDIA L40S и Tesla H100 80 GB HBM2.

  • Intel Core i5-13500 [14c-20t] (4.8GHz) / 64 GB DDR4 / 2x1.92 TB NVMe SSD / Nvidia RTX 4000 SFF Ada Generation (20GB GDDR6) — 27420р./месяц, 7900р. установка
  • Intel Xeon Gold 5412U [24c-48t] (3.9GHz) / 128 GB DDR5 ECC / 2x1.92 TB NVMe SSD / Nvidia RTX 6000 Ada Generation (48GB GDDR6) — 124700р./месяц, 0р. установка
  • Intel Xeon Gold 5412U [24c-48t] (3.9GHz) / 256 GB DDR5 ECC / 2x1.92 TB NVMe SSD / Nvidia RTX 6000 Ada Generation (48GB GDDR6) — 133500р./месяц, 0р. установка
  • AMD Epyc 9354 [32c-64t] (3.75GHz) / 192GB DDR5 ECC 4800MHz / 2x Nvidia L4 24GB / (System 2x960GB SSD NVMe) / 1Gbps — 143700р./месяц, 89700р. установка
  • AMD Epyc 9354 [32c-64t] (3.75GHz) / 192GB DDR5 ECC 4800MHz / 4x Nvidia L4 24GB / (System 2x960GB SSD NVMe) / 1Gbps — 188200р./месяц, 89700р. установка
  • AMD Epyc 9354 [32c-64t] (3.75GHz) / 384GB DDR5 ECC 4800MHz / 2x Nvidia L4 24GB / (System 2x960GB SSD NVMe) / 1Gbps — 158000р./месяц, 89700р. установка
  • AMD Epyc 9354 [32c-64t] (3.75GHz) / 384GB DDR5 ECC 4800MHz / 4x Nvidia L4 24GB / (System 2x960GB SSD NVMe) / 1Gbps — 202400р./месяц, 89700р. установка
  • AMD Epyc 9554 [64c-128t] (3.75GHz) / 192GB DDR5 ECC 4800MHz / 2x Nvidia L4 24GB / (System 2x960GB SSD NVMe) / 1Gbps — 152600р./месяц, 95400р. установка
  • AMD Epyc 9554 [64c-128t] (3.75GHz) / 192GB DDR5 ECC 4800MHz / 4x Nvidia L4 24GB / (System 2x960GB SSD NVMe) / 1Gbps — 197000р./месяц, 95400р. установка
  • AMD Epyc 9554 [64c-128t] (3.75GHz) / 384GB DDR5 ECC 4800MHz / 2x Nvidia L4 24GB / (System 2x960GB SSD NVMe) / 1Gbps — 167000р./месяц, 95400р. установка
  • AMD Epyc 9554 [64c-128t] (3.75GHz) / 384GB DDR5 ECC 4800MHz / 4x Nvidia L4 24GB / (System 2x960GB SSD NVMe) / 1Gbps — 211300р./месяц, 95400р. установка
  • 2xIntel Xeon Gold 6226R [32c-64t] (3.9GHz) / 384GB DDR4 ECC 2933MHz / 4x Nvidia Tesla V100s 32GB / 4x1.92TB SSD (System 2x 480GB SSD) / 1Gbps — 355000р./месяц, 213000р. установка
  • 2xAMD Epyc 9354 [64c-128t] (3.8GHz) / 384GB DDR5 ECC 4800MHz / 2x NVIDIA L40S 48GB / 2x3.84TB SSD NVMe (System 2x960GB SSD NVMe) / 1Gbps — 440000р./месяц, 275000р. установка
  • 2xAMD Epyc 9354 [64c-128t] (3.8GHz) / 384GB DDR5 ECC 4800MHz / 4x NVIDIA L40S 48GB / 2x3.84TB SSD NVMe (System 2x960GB SSD NVMe) / 1Gbps — 559000р./месяц, 275000р. установка
  • 2xIntel Xeon Silver 4510 [24c-48t] (4.1GHz) / 256 GB DDR5 ECC Reg / Tesla H100 80 GB HBM2 / 2x960 GB SSD + 2x1920 GB SSD NVMe — 632000р./месяц, 0р. установка

Можно увеличить оперативную память до 768 GB RAM или до 2.3TB в зависимости от конфигурации сервера и увеличить до 50Gbps приватной сети и до 10Gbps внешней сети.

Есть возможность добавить дополнительные диски так же в зависимости от конфигурации.
960 GB NVMe SSD
1.92 TB NVMe SSD
3.84 TB NVMe SSD
7.68 TB NVMe SSD
15.36 TB NVMe SSD

Доступные ОС к установке
CentOS Stream 10
openSUSE 15.6
Ubuntu 22.04.2 LTS
Ubuntu 24.04 LTS
Windows Server 2022

Дополнительные возможности
Панель управления сервером
Безлимитный трафик
Скорость сети 1Gbps
Anti-DDoS
Можно добавить дополнительные IP адреса

Заказать сервер вы можете в личном кабинете my.abcd.host/ либо пишите на почту sales@abcd.host
Другие конфигурации доступные для аренды abcd.host/dedicated

Спасибо, что остаетесь с нами!
ABCD.HOST

BareMetal 2.0: разбираемся, какие GPU выбрать



Недавно мы обновили BareMetal 2.0 в составе нашего «Публичного облака». Теперь в инфраструктуре есть выделенные физические серверы с высокопроизводительными GPU-картами. Они позволяют работать с задачами, где критична скорость вычислений.

Расскажем, что именно изменилось и какие задачи можно теперь решать быстрее. Но сначала небольшая справка.

Когда нужны графические ускорители?
Вычисления можно разделить на две категории: последовательные, где каждая операция выполняется строго одна за другой, и параллельные, где тысячи операций могут выполняться одновременно.

Процессоры (CPU) — это универсальные рабочие лошадки. Они отлично справляются с последовательными вычислениями: обработкой запросов, работой с базами данных, выполнением бизнес-логики. Но когда речь заходит о сложных вычислениях, требующих параллельной обработки (обучение нейросетей, рендеринг, обработка видео), их мощностей недостаточно.

В отличие от CPU, GPU созданы для объемных параллельных вычислений: вместо 16–64 мощных ядер, как у процессора, у GPU могут быть тысячи более простых, но специализированных ядер. Подход идеален для задач, которые можно разбить на множество мелких операций, выполняемых одновременно, например для data-parallel computing, обработки данных или работы с графикой.

Где нужны GPU?
  • Обучение и инференс больших языковых моделей LLM: развертывание on-premise решений для ChatGPT-подобных систем, RAG-архитектур (Retrieval-Augmented Generation), отраслевых LLM в медицине, юриспруденции, финансах.
  • Распознавание речи: создание высокоточных систем распознавания речи для call-центров, виртуальных ассистентов и т. д.
  • Корпоративные ИИ-решения: создание собственных решений на базе ИИ для повышения эффективности бизнес-процессов компании, аналитика Big Data с параллельной обработкой поведенческих данных.
  • Графика и рендеринг: в 3D-графике расчет сложных моделей в реальном времени возможен только с профессиональными GPU-картами.
  • Научные вычисления и инженерные расчеты: моделирование химических соединений, симуляции физических процессов, анализ Big Data.
  • Медицинская аналитика: обработка МРТ, КТ, рентгеновских снимков, трехмерная реконструкция изображений, системы поддержки принятий врачебных решений.
  • Построение прогнозных моделей: алгоритмическая торговля, риск-менеджмент и обработка больших потоков данных.
  • Визуализация больших массивов данных, например, в бизнес-аналитике.
Практически в любой отрасли найдутся сложные задачи, которые можно эффективно решить с применением GPU. И теперь такие сценарии можно реализовать в облаке, нет необходимости покупать дорогостоящее железо.

Какие GPU доступны в BareMetal 2.0 и что они могут?
В составе «Публичного облака» на сегодня доступны конфигурации BareMetal серверов с процессорами от 36 физических ядер, объемом оперативной памяти от 512 ГБ. Для хранения данных можно использовать локальное SSD-хранилище или внешнюю систему хранения.

Обновленный сервис предоставляет три ключевые модели графических ускорителей под определенные нагрузки: NVIDIA L4 (24 ГБ VRAM), RTX A6000 (48 ГБ VRAM), NVIDIA A100 (80 ГБ VRAM).


Универсальный ускоритель для ML и видео NVIDIA L4 (24 ГБ VRAM)
L4 — это оптимальный вариант для задач, связанных с обработкой видео, компьютерным зрением и легкими ML-вычислениями. Он быстрее предшественника Tesla T4 в 2,5 раза при генерации контента нейросетями, в 4 раза при рендеринге и в 3 раза при трассировке лучей.

Где нужен?
  • Системы распознавания лиц — быстрая обработка потокового видео для аналитики и безопасности.
  • Компьютерное зрение — анализ дорожной обстановки в сфере автономного транспорта, контроль качества в промышленности.
  • Чат-боты и NLP — модели Transformer для обработки и генерации текстов в реальном времени.
  • Медицинская визуализация — анализ снимков МРТ и КТ для диагностики на основе ИИ.
  • VR/AR — создание интерактивных сред с высокой детализацией.

NVIDIA RTX A6000 (48 ГБ VRAM) для графики, рендеринга и AI-разработки
Когда нужна максимальная мощность для 3D-моделирования, симуляции и визуализации, то A6000 — отличный выбор. В сравнении с предыдущим поколением RTX-карт он дает в 2 раза большую производительность при рендеринге и в 3 раза более быструю обработку AI-алгоритмов.

Где нужен?
  • Рендеринг в реальном времени — видеоигры, VR, киноиндустрия.
  • Создание контента нейросетями — работа с GAN-моделями, генерация изображений и анимаций.
  • Архитектурная и инженерная визуализация — быстрый расчет сложных 3D-моделей.
  • Научные вычисления — биоинформатика, молекулярное моделирование, климатические симуляции.
  • Медицина — рендеринг томографических снимков, анализ биоинженерных структур.

NVIDIA A100 (80 ГБ VRAM) — тяжелая артиллерия для больших моделей
A100 — это один из топовых ускорителей для обучения крупных нейросетей, аналитики Big Data и высокопроизводительных вычислений. Он в 8 раз быстрее, чем V100, в задачах Big Data Analytics, а его производительность для HPC-вычислений выше в 3 раза.

Где нужен?
  • Обучение больших языковых моделей (GPT-4, BERT, T5) — ускорение обработки текстов на терабайтных датасетах.
  • Финансовые вычисления — моделирование рисков, прогнозирование трендов на рынках.
  • 3D-рендеринг в кино и анимации — создание сложных сцен с фотореалистичными эффектами.
  • Научные исследования — моделирование климатических процессов, симуляция белков и молекулярное моделирование в биомеханике.
  • Обработка больших видео и изображений — автоматическая сегментация, классификация и анализ.

Гибридная инфраструктура: GPU + облако
BareMetal 2.0 в составе «Публичного облака» — это не просто выделенные серверы с GPU. Это еще и возможность интеграции физических серверов с виртуальной инфраструктурой, что позволяет выстраивать гибридные IaaS-решения.

Что это дает пользователю?
  • Гибкость. Можно использовать GPU-ускоренные серверы только для самых ресурсоемких задач, а остальные процессы запускать в облаке.
  • Экономия. Можно избежать капитальных затрат на покупку и обслуживание оборудования (электропитание, ремонт, апгрейд), оплачивая только те ресурсы, которые используются здесь и сейчас.
  • Масштабируемость. Можно легко добавлять мощности в зависимости от нагрузки.

Пример 1: Разработка чат-бота на основе нейросетей
Если ваша компания создает чат-бота с искусственным интеллектом, можно тренировать модель на A100, используя всю мощность выделенного GPU-сервера, а обработку пользовательских запросов выполнять на менее ресурсоемких инстансах с L4.

Пример 2: Анализ медицинских изображений
Допустим, у вас есть сервис, который анализирует снимки МРТ и КТ с помощью нейросетей. Обучение модели и сложные вычисления можно запускать на сервере BareMetal с RTX A6000, а облачная инфраструктура возьмет на себя хранение данных пациентов и обработку запросов врачей. Это исключит задержки в обращении к системе.

Этот подход позволяет комбинировать разные вычислительные мощности под конкретные задачи, создавая баланс между производительностью, стоимостью и эффективностью.

GPU в облаке — это не будущее, а реальность
Раньше высокопроизводительные вычисления были привилегией крупных корпораций. Теперь же благодаря BareMetal 2.0 доступ к GPU-решениям есть у любой компании, разработчика или исследовательской команды. Не надо инвестировать миллионы в собственные серверы, если нужна мощность для ИИ, анализа данных, графики или финансовых вычислений. Можно просто развернуть GPU в облаке и получить производительность как в дата-центрах мирового уровня.

GPU или CPU, вот в чем вопрос от FirstDEDIC



Когда мощности обычного процессора уже не хватает, на помощь могут прийти GPU-серверы. Они позволяют быстрее работать с нейросетями, анализировать большие данные, моделировать физические процессы и решать другие задачи, требующие массовой параллельной обработки.

У FirstDEDIC как раз появились новые конфигурации серверов с GPU на базе процессоров AMD EPYC и AMD Ryzen. Используют видеокарты последнего поколения Nvidia от 24 до 80 Гб: L4, L40, L40S, RTX 6000 Ada, RTX 4090 и H100.

При заказе сервера на длительный срок действует скидка за период.
1dedic.ru/gpu-servers

Чтобы помочь с выбором, FirstDEDIC подготовили новую статью, в которой подробно рассказывают:
  • Чем отличаются CPU и GPU и зачем нужны серверы с видеокартами
  • Почему GPU лучше подходит для нейросетей, Big Data и рендеринга
  • Какие видеокарты используются в серверных решениях
  • Как выбрать оптимальный GPU-сервер под ваши задачи
1dedic.ru/articles/chto-takoe-gpu-server-i-zachem-on-nuzhen

Новый сервер Hetzner GPU GEX130





Искусственный интеллект занимает центральное место во многих новых инновациях и технологиях и требует мощных серверных решений. Новый сервер Hetzner GPU GEX130 — идеальный выбор для ресурсоемких рабочих нагрузок, таких как обучение моделей ИИ. Благодаря сочетанию технологии NVIDIA GPU и надежной инфраструктуры Hetzner GEX130 устанавливает новые стандарты производительности, эффективности и надежности.

В основе GEX130 лежат 24-ядерный процессор Intel Xeon Gold 5412U «Sapphire Rapids» и графическая карта NVIDIA RTX поколения Ada с 48 ГБ графической памяти GDDR6 ECC, что дает пользователям огромную вычислительную мощность, которая идеально подходит для быстрого и эффективного анализа данных и оценки больших объемов данных. Независимо от того, хотят ли пользователи развернуть GEX130 для обучения моделей ИИ или для сложных задач обработки изображений и видео, 3D-моделирования или использования CAD/CAM, этот сервер может быстро справиться с несколькими рабочими нагрузками ИИ одновременно.

Базовая конфигурация содержит два 1,92 ТБ Gen4 Datacenter Edition NVMe SSD и 128 ГБ DDR5 ECC reg. RAM, но можно выбрать больше хранилища и/или памяти. GEX130 включает адрес IPv4, доступный всего за 838,00 евро в месяц или 1,3429 евро в час, плюс единовременная плата за установку в размере 79,00 евро.

Сервер Hetzner GPU GEX130 предлагает мощную платформу, которая может легко справиться даже с самыми сложными задачами ИИ.

www.hetzner.com/dedicated-rootserver/matrix-gpu/

Новые конфигурации серверов в европейских дата-центрах HOSTKEY

Мы постоянно расширяет спектр своих предложений, чтобы соответствовать растущим потребностям клиентов, и мы рады представить вам новые конфигурации серверов с процессорами AMD EPYC и Ryzen 9 и с профессиональными GPU-картами NVIDIA Tesla H100, которые уже доступны для заказа.

GPU-серверы


В нашем дата-центре в Исландии доступны VDS (виртуальные выделенные серверы) с выделенными профессиональными картами Tesla H100 80Gb. Все ресурсы карты доступны клиенту, который арендует сервер в следующей конфигурации: 1x H100 80Гб / 2,4 ГГц (32 ядра) / 160 Гб / 1Тб NVMe SSD / 1 Гбит/с.

Также доступно больше выделенных серверов с быстрой сдачей с картами RTX 4090 и RTX A5000, которые пользуются большим спросом: 1x RTX 4090 / 2,8 ГГц (8 ядер) / 64 Гб / 240 Гб NVMe SSD / 1 Гбит/с и 1x RTX A5000 / 2,8 ГГц (8 ядер) / 32 Гб / 240 Гб NVMe SSD / 1 Гбит/с.
Дата-центр в Исландии активно использует возобновляемые источники энергии, такие как гидро- и геотермальная энергия. Благодаря этому удается предлагать высокопроизводительные серверные услуги по самым низким ценам в Европе, полностью исключая выбросы парниковых газов. Такой подход полностью соответствует стратегии HOSTKEY по устойчивому развитию.

Готовые выделенные серверы с процессорами AMD EPYC и AMD Ryzen и быстрой сдачей


В дата-центре в Германии доступны для заказа серверы с процессорами AMD Ryzen 9 7950x и серверы с двумя процессорами AMD EPYC 7451:

  • Ryzen 7950x / 4,5 ГГц (16 ядер) / 128 Гб / 2x 1,92 Тб U2 NVMe / 1 Гбит/с
  • 2x EPYC 7451 / 2,0 ГГц (48 ядер) / 384 Гб / 4x 960 Гб SSD / 1 Гбит/с
  • 2x EPYC 7451 / 2,0 ГГц (48 ядер) / 384 Гб / 4x 1,92 Тб SSD / 1 Гбит/с

В дата-центре в Нидерландах доступны серверы с процессорами AMD Ryzen 9 7950x в конфигурации: Ryzen 7950x / 4,5 ГГц (16 ядер) / 128 Гб / 2x 1,92 Тб U2 NVMe / 1 Гбит/с.

В дата-центре в Финляндии доступны готовые серверы с процессорами AMD Ryzen 9 7950x и серверы с двумя процессорами AMD EPYC 7451 в следующих конфигурациях:

  • Ryzen 7950x / 4,5 ГГц (16 ядер) / 128 Гб / 2x 1,92 Тб U2 NVMe / 1 Гбит/с
  • 2x EPYC 7451 / 2,0 ГГц (48 ядер) / 384 Гб / 4x 1,92 Тб SSD / 1 Гбит/с

Подробнее о стоимости серверов и условиях их использования читайте по ссылке.

Количество серверов ограничено, спрос со стороны клиентов высокий. Мы ожидаем, что серверы будут распроданы в течение нескольких недель.

P.S. В конце февраля в дата-центре в Нью-Йорке планируется расширение конфигураций серверов. Следите за нашими анонсами.

Cloud4Y — вторые в рейтинге провайдеров GPU Cloud 2022



Первый в России рейтинг провайдеров облачных GPU-решений, организованный CNews, выявил раннюю стадию развития рынка и острую конкурентную борьбу между лидерами.

Аналитики Market.CNews проанализировали предложения, представленные на российском рынке. Выяснилось, что участников рынка немного, но борьба между ними серьёзная. Сравнение облачных провайдеров проводилось по следующим критериям:
  • Платформы виртуализации
  • Тип процессоров vCPU
  • Тип оперативной памяти RAM
  • Тип графических ускорителей GPU
  • Минимальная и максимальная конфигурации облачных серверов
  • Заявленный SLA
  • Параметры ЦОД, на базе которых оказывается услуга
  • Тестовый период и его ограничения
  • Стоимость

Балльная система оценки по каждому критерию позволила выделить лидеров по отдельным направлениям и в целом по решению. Участники рейтинга ранжировались по сумме баллов. Чем сумма, больше тем выше место. Корпоративный облачный провайдер Cloud4Y набрал в общей сложности 385 баллов, что позволило уверенно занять второе место в итоговом рейтинге GPU Cloud 2022.

Провайдер предлагает сервера на базе графических ускорителей NVIDIA Tesla V100, P100, M60 и M40. Особенность услуги является возможность работать с vGPU на терминальном сервере RDSH, где ресурсы vGPU будут равномерно разделяться между сессиями пользователей.

Выводы исследователей
Услугу GPU Cloudоказывает сравнительно небольшое количество провайдеров, в основном это крупные компании, давно работающие на рынке. Основной недостаток услуги в том, что многие подрядчики строят облако на базе одного дата-центра. Кроме того, доступные мощности часто невелики, а тарифы не гибкие. Впрочем, учитывая динамику развития отрасли, спрос на машинное обучение и искусственный интеллект, можно предположить, что из этого сегмента сформируется крупный рынок vGPU.

В настоящее время на рынке наблюдается две тенденции: заметен повышенный спрос на российских провайдеров из-за геополитической обстановки и есть ряд сложностей, вызванных уходом крупных вендоров вроде Nvidia.

Также часто неясна производительность инфраструктуры. Исследователи заметили, что быстродействие CPU и GPU у разных провайдеров может серьёзно отличаться при одинаковых характеристиках «железа». В связи с этим компаниям, которые заинтересованы в использовании услуги, необходимо перед заключением договора обсудить возможность проведения тестов в облачной платформе провайдера.

Узнать больше о GPU-серверах и других облачных решениях Cloud4Y можно у менеджеров компании по телефону, email или другим удобным способом.

Представляем Vultr Talon: доступные облачные виртуальные машины, ускоренные с помощью графических процессоров NVIDIA



Мы в Vultr гордимся тем, что делаем облачную инфраструктуру доступной для всех — разработчиков, малых и средних предприятий и крупных предприятий. Это желание снизить цены привело нас к созданию Vultr Talon, революционной платформы, которую мы представляем сегодня в бета-версии. С Vultr Talon мы теперь предлагаем лучшие в своем классе виртуализированные графические процессоры, начиная с графического процессора с тензорными ядрами NVIDIA A100, по цене в несколько раз дешевле полноценного графического процессора. Vultr — первый поставщик облачных услуг, предлагающий виртуализацию графических процессоров NVIDIA A100 для обеспечения совместного использования графических процессоров и обеспечения оптимального использования ресурсов.

Сегодняшний запуск представляет собой инновацию, создающую категорию, предоставляющую совершенно новый тип облачных виртуальных машин, который устраняет некоторые из самых больших препятствий на пути создания и развертывания производственных приложений с поддержкой ИИ с использованием графических процессоров.

Повышение рентабельности и использования экземпляров GPU
За последние несколько лет популярность графических процессоров NVIDIA резко возросла, и на то есть веские причины. Один графический процессор содержит тысячи специализированных ядер, идеально подходящих для параллельных вычислений. В дополнение к огромной вычислительной мощности графические процессоры NVIDIA — невероятно универсальные ускорители, которые можно использовать для искусственного интеллекта, машинного обучения, анализа данных, научных вычислений и многого другого.

Тем не менее, когда речь идет о рабочих нагрузках клиентов, не существует универсального решения. Разнообразные рабочие нагрузки имеют различные требования к вычислительным ресурсам, начиная от доли графического процессора и заканчивая несколькими графическими процессорами на одном узле или на нескольких узлах.

Предоставление нужного размера ускорения для вашей рабочей нагрузки и максимальное использование имеют решающее значение для оптимизации затрат на облако.

Исторически сложилось так, что пользователи облачных вычислений могли приобретать только целые физические графические процессоры, работающие в транзитном режиме и подключенные к экземплярам облачных вычислений. Высококачественные графические процессоры, поставляемые таким образом, обычно стоят тысячи долларов в месяц.

Эта стоимость часто оправдана для самых больших корпоративных рабочих нагрузок, некоторые из которых настолько ресурсоемки, что требуют параллельной работы нескольких графических процессоров. Но для многих предприятий и разработчиков стоимость даже одного графического процессора может быть непомерно высокой для начала работы, экспериментов или запуска приложений в средах разработки и тестирования. Даже предприятия со значительными ИТ-бюджетами могут в конечном итоге растратить значительные суммы денег, предоставив больше ресурсов графических процессоров, чем им действительно нужно, или просто решив вообще не использовать графические процессоры.

Виртуализация графического процессора NVIDIA A100 в облаке, обеспечивающая эффективные вычисления и снижающая затраты на ИИ

Графические процессоры имеют огромное потенциальное влияние, но многие клиенты, которые могли бы извлечь выгоду из этих возможностей, не могут ими воспользоваться. Дело в том, что удовлетворение потребности в вычислительных ресурсах для поддержки различных рабочих нагрузок ИИ не может быть универсальным подходом.

Используя наш опыт в области виртуализации и облачной инфраструктуры, мы стремились перевернуть модель предоставления GPU с ног на голову. Вместо того, чтобы предлагать целые физические графические процессоры по менее доступным ценам, мы стремились обеспечить совместное использование графических процессоров с помощью виртуализации всего за небольшую часть стоимости. Работая в тесном сотрудничестве с NVIDIA, мы разработали платформу Vultr Talon на базе графических процессоров NVIDIA и программного обеспечения NVIDIA AI Enterprise, которую мы представляем в сегодняшней бета-версии.

Изменившая мир технология графических процессоров NVIDIA теперь доступна по цене от 90 долларов в месяц или всего 0,13 доллара в час.

В основе Vultr Talon лежит современная платформа виртуализации графических процессоров NVIDIA. Вместо того, чтобы подключать целые физические графические процессоры к виртуальным машинам, мы подключаем только часть в виде виртуального графического процессора (vGPU). Виртуальные графические процессоры работают на базе NVIDIA AI Enterprise, которая включает программное обеспечение NVIDIA vGPU и оптимизирована для удаленного выполнения рабочих нагрузок ИИ и высокопроизводительного анализа данных.

Для вашей машины виртуальный графический процессор выглядит так же, как физический графический процессор. Каждый vGPU имеет собственную выделенную память, которая является частью памяти базовой карты. vGPU имеет доступ к соответствующей части вычислительной мощности физического GPU.

Vultr Talon использует технологию NVIDIA Multi-Instance GPU для виртуальных машин с объемом памяти GPU не менее 10 ГБ, что повышает ценность производительности за счет предоставления арендаторам гарантированного QoS, полностью изолированной памяти GPU с высокой пропускной способностью, кэш-памяти и выделенных вычислительных ядер.

Вы можете использовать виртуальные машины Vultr с виртуальными графическими процессорами для запуска всех тех же платформ, библиотек и операционных систем, которые вы бы запускали на физическом графическом процессоре. Как и во всех продуктах Vultr, вы можете легко увеличивать или уменьшать объемы использования, чтобы точно сопоставить расходы на GPU с вашими реальными потребностями.



Части NVIDIA A100 всего от 90 долларов в месяц
Графический процессор NVIDIA A100 с тензорными ядрами обеспечивает невероятное ускорение для глубокого обучения, высокопроизводительных вычислений (HPC) и анализа данных. Благодаря технологическим прорывам в архитектуре NVIDIA Ampere, таким как тензорные ядра третьего поколения, точность TensorFloat-32 (TF32) и структурная разреженность, NVIDIA A100 обеспечивает унифицированный ускоритель рабочих нагрузок для анализа данных, обучения ИИ, вывода ИИ и высокопроизводительных вычислений.

В сочетании с программным пакетом NVIDIA AI Enterprise, который оптимизирован для разработки и развертывания ИИ и сертифицирован для работы в виртуализированных средах, NVIDIA A100 ускоряет работу всех основных сред глубокого обучения и анализа данных, таких как TensorFlow и PyTorch, а также более 700 приложений HPC.

Облачные экземпляры с одним или несколькими физическими графическими процессорами обычно продаются за тысячи долларов в месяц. Напротив, сегодня мы представляем набор планов Vultr, которые дают вам часть графического процессора NVIDIA A100 с тензорными ядрами, а также выделенные виртуальные ЦП, ОЗУ, хранилище и пропускную способность по цене от 90 долларов в месяц или 0,13 доллара в час. Эти экземпляры позволяют выделять ресурсы графического процессора с большей степенью детализации и предоставляют разработчикам оптимальный объем ускоренных вычислений.



Прямо сейчас в нашей панели управления вы можете предоставить инстансы GPU с широким спектром спецификаций.

Что вы можете делать с виртуализированным графическим процессором NVIDIA A100 с тензорными ядрами?

Планы Vultr с графическим процессором NVIDIA A100 и программным обеспечением NVIDIA AI Enterprise подходят для широкого спектра сценариев использования в производстве и разработке. В частности, мы рекомендуем их для рабочих нагрузок вывода ML и построения моделей для обработки естественного языка, распознавания голоса и компьютерного зрения.

В дополнение к пакету программного обеспечения NVIDIA AI Enterprise, NVIDIA также предлагает каталог NGC, центр дополнительного программного обеспечения для искусственного интеллекта и высокопроизводительных вычислений, оптимизированного для графических процессоров. NGC включает в себя контейнеры корпоративного уровня, фреймворки, предварительно обученные модели, диаграммы Helm и отраслевые комплекты разработки программного обеспечения (SDK) для специалистов по данным, разработчиков и команд DevOps, чтобы быстрее создавать и развертывать свои решения. С помощью NGC разработчики могут развертывать оптимизированные по производительности программные контейнеры AI/HPC, предварительно обученные модели AI и ноутбуки Jupyter, которые ускоряют разработку AI и рабочие нагрузки HPC в любых локальных, облачных и пограничных системах с GPU.

Для ресурсоемких рабочих нагрузок ИИ, таких как подготовка данных и обучение глубокому обучению, клиенты могут выбрать использование нескольких графических процессоров или полноценного NVIDIA A100. Менее ресурсоемкие рабочие нагрузки, такие как вывод ИИ или периферийный ИИ, часто не требуют полной вычислительной мощности графического процессора и могут выполняться на предложениях меньшего размера виртуальных графических процессоров.

Графический процессор Bare Metal для больших рабочих нагрузок
Если вы хотите выполнить рабочую нагрузку, требующую нескольких физических графических процессоров, у нас также есть серверы Bare Metal с четырьмя графическими процессорами NVIDIA A100 и двумя 24-ядерными процессорами Intel Xeon.

Сегодняшний запуск — это бета-версия с начальной мощностью в Нью-Джерси. В ближайшие недели мы добавим глобальный ассортимент графических процессоров NVIDIA A100, A40 и A16, чтобы лучше поддерживать дополнительные регионы и более широкий спектр вариантов использования.

Если вы заинтересованы в том, чтобы попробовать Vultr Talon, вы можете предоставить экземпляры через нашу панель управления. Вы найдете дополнительные рекомендации о том, как начать работу, в разделе документации на нашем веб-сайте.

Если вы хотите поговорить с нами о ваших потребностях, мы рекомендуем вам связаться с нашим отделом продаж.

http://www.vultr.com