ML-дайджест: AMD атакует рынок AI



AMD купила стартап Brium — ставка на софтовый стек
AMD приобрела стартап Brium — он занимается оптимизацией инференса. Сделка подчеркивает курс на производительную и открытую экосистему для AI-разработчиков. А еще сокращает разрыв по качеству между софтом и железом AMD особенно в сравнении с NVIDIA и ее зрелой экосистемой CUDA + TensorRT.
Пока ROCm все еще догоняет, такие приобретения могут привести к паритету.
techcrunch.com/2025/06/04/amd-takes-aim-at-nvidias-ai-hardware-dominance-with-brium-acquisition/

AMD переманила всю инженерную команду Untether AI
AMD официально заявляет, что пополнение усилит компетенции в компиляторах, разработке ядер и цифровом дизайне. Судьба клиентов и текущих продуктов Untether остается туманной, поэтому продолжаем следить за происходящим.
www.tomshardware.com/tech-industry/amd-scoops-entire-untether-ai-chip-team-canada-ai-inference-outfit-will-cease-product-support

FuriosaAI сообщила про х2.25 ускорение LLM-инференса
Южнокорейская FuriosaAI неожиданно показала прирост более чем вдвое по сравнению с GPU в проде у LG AI Research. Интересно, что архитектурно они идут вразрез с типичными GPU-решениями, делая ставку на более плотную специализацию под инференс.
Как думаете, заинтересует ли эта новость AMD?
furiosa.ai/blog/lg-ai-research-taps-furiosaai-to-achieve-2-25x-better-llm-inference-in-production-vs-gpus

В 2026 году выйдет MI400 на 432 ГБ HBM4 от AMD
AMD официально подтвердила линейку Instinct MI400 с внушительной HBM4-памятью (432 ГБ). Такой объем позволяет запускать DeepSeek 671B на одном узле из четырех GPU.
Компания по-прежнему делает ставку на лучшее соотношение объема памяти к цене, что делает ее особенно привлекательной для инференса LLM.
videocardz.com/newz/amd-launches-instinct-mi350-series-confirms-mi400-in-2026-with-432gb-hbm4-memory

ROCm 7: ускорение до x3,5 и поддержка AI Max
Еще одна новость про AMD. Новая версия ROCm 7 обещает ускорение до 3,5 раз по сравнению с ROCm 6, а также поддержку настольных AI Max-процессоров. Теперь можно собрать машину с 128 ГБ общей памяти — недорогой и полностью AMD-ориентированный вариант для обучения и инференса.
ROCm обретает форму. Особенно в небольших инсталляциях — без необходимости использования CUDA.
www.tomshardware.com/pc-components/gpus/amd-unveils-rocm-7-new-platform-boosts-ai-performance-up-to-3-5x-adds-radeon-gpu-support

Huawei заявляет о превосходстве Ascend-кластера над NVIDIA
Huawei протестировал кластер CloudMatrix 384 на Ascend. В результате их производительность при запуске DeepSeek-R1 превысила аналогичный кластер на NVIDIA. Тенденция продолжается: все больше компаний начинают переписывать стек под альтернативные GPU.
www.tomshardware.com/pc-components/gpus/amd-unveils-rocm-7-new-platform-boosts-ai-performance-up-to-3-5x-adds-radeon-gpu-support

Рынок AI-агентов: customer service в фокусе
CB Insights опубликовали топ-20 самых успешных по выручке AI-агентов среди стартапов. Один из главных выводов: AI-агенты для поддержки клиентов получают самые высокие мультипликаторы — в среднем x127 выручки, против x52 по остальным направлениям.
Инвесторы верят в быструю замену человеческих саппортов на ИИ-агентов.
www.cbinsights.com/research/ai-agent-startups-top-20-revenue/
Выделенные серверы OVH
Выделенные серверы Hetzner

0 комментариев

Оставить комментарий