ML-дайджест: AMD атакует рынок AI



AMD купила стартап Brium — ставка на софтовый стек
AMD приобрела стартап Brium — он занимается оптимизацией инференса. Сделка подчеркивает курс на производительную и открытую экосистему для AI-разработчиков. А еще сокращает разрыв по качеству между софтом и железом AMD особенно в сравнении с NVIDIA и ее зрелой экосистемой CUDA + TensorRT.
Пока ROCm все еще догоняет, такие приобретения могут привести к паритету.
techcrunch.com/2025/06/04/amd-takes-aim-at-nvidias-ai-hardware-dominance-with-brium-acquisition/

AMD переманила всю инженерную команду Untether AI
AMD официально заявляет, что пополнение усилит компетенции в компиляторах, разработке ядер и цифровом дизайне. Судьба клиентов и текущих продуктов Untether остается туманной, поэтому продолжаем следить за происходящим.
www.tomshardware.com/tech-industry/amd-scoops-entire-untether-ai-chip-team-canada-ai-inference-outfit-will-cease-product-support

FuriosaAI сообщила про х2.25 ускорение LLM-инференса
Южнокорейская FuriosaAI неожиданно показала прирост более чем вдвое по сравнению с GPU в проде у LG AI Research. Интересно, что архитектурно они идут вразрез с типичными GPU-решениями, делая ставку на более плотную специализацию под инференс.
Как думаете, заинтересует ли эта новость AMD?
furiosa.ai/blog/lg-ai-research-taps-furiosaai-to-achieve-2-25x-better-llm-inference-in-production-vs-gpus

В 2026 году выйдет MI400 на 432 ГБ HBM4 от AMD
AMD официально подтвердила линейку Instinct MI400 с внушительной HBM4-памятью (432 ГБ). Такой объем позволяет запускать DeepSeek 671B на одном узле из четырех GPU.
Компания по-прежнему делает ставку на лучшее соотношение объема памяти к цене, что делает ее особенно привлекательной для инференса LLM.
videocardz.com/newz/amd-launches-instinct-mi350-series-confirms-mi400-in-2026-with-432gb-hbm4-memory

ROCm 7: ускорение до x3,5 и поддержка AI Max
Еще одна новость про AMD. Новая версия ROCm 7 обещает ускорение до 3,5 раз по сравнению с ROCm 6, а также поддержку настольных AI Max-процессоров. Теперь можно собрать машину с 128 ГБ общей памяти — недорогой и полностью AMD-ориентированный вариант для обучения и инференса.
ROCm обретает форму. Особенно в небольших инсталляциях — без необходимости использования CUDA.
www.tomshardware.com/pc-components/gpus/amd-unveils-rocm-7-new-platform-boosts-ai-performance-up-to-3-5x-adds-radeon-gpu-support

Huawei заявляет о превосходстве Ascend-кластера над NVIDIA
Huawei протестировал кластер CloudMatrix 384 на Ascend. В результате их производительность при запуске DeepSeek-R1 превысила аналогичный кластер на NVIDIA. Тенденция продолжается: все больше компаний начинают переписывать стек под альтернативные GPU.
www.tomshardware.com/pc-components/gpus/amd-unveils-rocm-7-new-platform-boosts-ai-performance-up-to-3-5x-adds-radeon-gpu-support

Рынок AI-агентов: customer service в фокусе
CB Insights опубликовали топ-20 самых успешных по выручке AI-агентов среди стартапов. Один из главных выводов: AI-агенты для поддержки клиентов получают самые высокие мультипликаторы — в среднем x127 выручки, против x52 по остальным направлениям.
Инвесторы верят в быструю замену человеческих саппортов на ИИ-агентов.
www.cbinsights.com/research/ai-agent-startups-top-20-revenue/

Июль — акция на День сисадмина, топ фильмов про айтишников и главные уязвимости месяца

Если бы ваше лето было фильмом, то каким? Мы решили, что на эту роль вполне подошла бы фантастика «Всё, везде и сразу». И не только из-за того, что часто хочется оказаться в нескольких местах одновременно — хотя явно не помешало бы. А потому, что происходит столько событий, что просто не успеваешь уследить за всеми.



Статьи и инструкции
Протокол POP3 и IMAP — в чем разница и какой лучше выбрать

Если настраиваете почтовый клиент и думаете, какой протокол выбрать, знание разницы между POP3 и IMAP поможет сэкономить кучу времени и нервов. В статье разобрали два популярных протокола работы с почтой и объяснили, когда и какой лучше использовать.
firstvds.ru/blog/protokoly-pop3-imap-v-chem-raznica

Модель TCP/IP: что это и как работает
Миллионы людей пользуются интернетом, но лишь немногие понимают, как он работает. А всё благодаря модели TCP/IP. В статье разберём, как устроена эта система и расскажем, почему интернет работает даже при сбоях.
firstvds.ru/technology/model-tcp-ip-chto-eto-i-kak-rabotaet

Хакнуть мир: фильмы и сериалы об айтишниках
Подготовили подборку фильмов и сериалов о тех, кто меняет правила игры: бунтарях, цифровых революционерах и гениях, бросивших вызов системе. Мощное кино для ценителей концептуального послевкусия.
firstvds.ru/blog/khaknut-mir-filmy-i-serialy-o-programmistakh-brosivshikh-vyzov-sisteme

Habr: самое интересное за июль
Зачем разрываться между «важно» и «интересно», когда можно не выбирать, а получить сразу и всё. В подборке Хабра и перспективы подводных энергохранилищ, и квантовые основы ИИ, и даже практические тонкости Go-разработки.

Ищем авторов для блога на Хабр
Подготовьте статью на одну из специальных тем или отправьте материал на тему месяца. И если ваша статья подойдёт для блога, вы получите повышенный гонорар. Тема августа: Карьера в IT-индустрии.
firstvds.ru/blog/vremya-pisat-stati-ischem-avtorov-dlya-blogov-i-bz

Новости июля
Новые возможности в S3-manager


Наша команда постоянно работает над улучшением услуги. Вот что было сделано в июле:
  • Обновлен функционал копирования/перемещения объектов. Перемещать и копировать объекты внутри бакета стало удобнее и интуитивно понятно.
  • Усовершенствована работа со списком объектов. Теперь вы можете выбрать несколько видов сортировки.
  • Оптимизирована загрузка и скачивание файлов, они стали гораздо быстрее.
  • Улучшена отзывчивость интерфейса. Работать с S3 Manager, теперь приятнее, так как он значительно прибавил в скорости работы.
  • S3 Manager может отображать содержимое бакетов независимо от количества объектов в них. Теперь в S3 Manager отображать содержимое бакетов с большим количеством объектов, сохраняя при этом внутреннюю иерархию/структуру бакета.
firstvds.ru/services/s3

День сисадмина 2025

В последнюю пятницу июля, по древней и почтённой традиции, мы празднуем День системного администратора — В честь праздника запустили акцию с 25 июля по 7 августа и дарим подарки.
firstvds.ru/actions/sysadmin_day_25-spirit_of_uptime

Топ новостей из мира безопасности
Пришла пора развенчать миф о беззаботном лете и обратиться к жанру психологического триллера. Пока Голливуд отдыхает в сторонке, рассказываем о самых опасных угрозах этого месяца и, конечно, спасительных обновлениях.

Опасная уязвимость в WordPress-теме Motors позволяет взламывать сайты
В популярной теме Motors для WordPress была обнаружена критическая уязвимость (CVE-2025-4322), которая позволяет злоумышленникам сбрасывать пароли администраторов. Проблема затрагивает версии до 5.6.67 и связана с некорректной проверкой данных в виджете Login Register.
Эксплуатация уязвимости началась еще в мае — злоумышленники отправляют специальные POST-запросы, подменяя параметры сброса пароля. Более масштабные атаки начались после 7 июня. По данным Wordfence, уже зафиксировано свыше 23 тысяч попыток взлома.
Эксперты советуют, не откладывая, обновить тему Motors до актуальной версии — разработчики StylemixThemes выпустили защитное обновление 5.6.68 ещё в мае, однако на многих сайтах до сих пор используются уязвимые версии темы. Также рекомендуется проверить список пользователей на подозрительные административные аккаунты и убедиться, что все пароли администраторов изменены.
xakep.ru/2025/06/24/motors-under-attacks/

WinRAR закрыл опасную уязвимость
Компания WinRAR выпустила обновление 7.12, устраняющее критическую уязвимость (CVE-2025-6218), которая позволяла злоумышленникам запускать вредоносный код через поддельные архивы. Проблема затрагивала только версии для Windows и могла привести к заражению системы при распаковке файла.
Уязвимость оценивается в 7,8 балла по шкале CVSS и позволяет записывать вредоносные файлы в системные папки, например, в автозагрузку. Компания уже выпустила исправление, однако пользователям необходимо вручную обновить WinRAR, так как автоматических обновлений нет.
3dnews.ru/1124971/winrar-ekstrenno-ustranila-opasniy-bag-pozvolyavshiy-cherez-arhiv-zapuskat-vredonosnoe-po/#685cb2a9742eec09be8b4572

Уязвимость в WordPress-плагине Forminator угрожает тысячам сайтов
В популярном плагине Forminator для WordPress обнаружена опасная уязвимость (CVE-2025-6463, 8.8 баллов по CVSS), позволяющая злоумышленникам удалять системные файлы и захватывать сайты. Проблема затрагивает версии до 1.44.2.
Уязвимость связана с недостаточной проверкой загружаемых файлов. Злоумышленник мог отправить вредоносный запрос, имитирующий загрузку файла, и при удалении записи администратором плагин стирал критически важные файлы, например, wp-config.php, что приводило к сбросу сайта.
Разработчики выпустили исправление в версии 1.44.3, добавив проверку путей файлов. Владельцам сайтов рекомендуется срочно обновить плагин или временно отключить его.
xakep.ru/2025/07/03/forminator-flaw/

Уязвимость в sudo позволяет получить root-доступ
В утилите sudo обнаружена опасная уязвимость (CVE-2025-32463). Она позволяет не имеющему прав пользователю выполнить произвольный код с root-доступом, даже если он не указан в файле sudoers. Проблема затрагивает версии 1.9.14–1.9.17 и, возможно, более ранние.
Причиной уязвимости стало то, что при использовании опции -R ("--chroot") sudo некорректно загружал файл /etc/nsswitch.conf из указанного каталога, а не из системного. Это позволяло злоумышленнику подменить конфигурацию и загрузить вредоносную библиотеку, выполняющую код с максимальными привилегиями.
Проблема устранена в sudo 1.9.17p1. Владельцам серверов на Ubuntu, Fedora, Debian и других дистрибутивах рекомендуется немедленно обновить пакет. В этой версии также исправлена вторая уязвимость (CVE-2025-32462), связанная с обходом ограничений в правилах sudoers через опцию -h ("--host").
www.opennet.ru/opennews/art.shtml?num=63505

Уязвимости в Redis и Valkey: риски RCE и DoS
Выпущены срочные обновления для СУБД Redis (версии 6.2.19 – 8.0.3) и Valkey (8.0.4 – 8.1.3), которые устраняют две опасные уязвимости:
CVE-2025-32023 — уязвимость в реализации алгоритма HyperLogLog. Позволяет удалённо выполнять код (RCE) через переполнение буфера. Атака требует доступа к отправке команд в СУБД.
CVE-2025-48367 — проблема аутентификации, которая происходит из-за неправильной обработки ошибок во время соединений и приводит к отказу в обслуживании (DoS). Как следствие, снижается производительность СУБД.
Рекомендуется как можно скорее обновить Redis/Valkey до актуальных версий и ограничить доступ к командам HLL через ACL (как временное решение). Уязвимости особенно опасны для публично доступных экземпляров СУБД.
www.opennet.ru/opennews/art.shtml?num=63537

Уязвимость в Linux позволяет взломать систему через Initramfs
Исследователи кибербезопасности из ERNW выявили критическую уязвимость в Linux, которая позволяет злоумышленникам с физическим доступом к устройству получить полный контроль над системой, даже если диск полностью зашифрован.
Проблема затрагивает Ubuntu 25.04 и Fedora 42. При нескольких неудачных попытках ввода пароля для расшифровки диска (в Ubuntu — после нажатия Esc и ввода специальной комбинации) система предоставляет отладочную оболочку (debug shell). Через неё злоумышленник может подключить USB-накопитель с инструментами для модификации initramfs — временной файловой системы, используемой при загрузке.
Поскольку initramfs не имеет цифровой подписи, изменения не обнаруживаются механизмами защиты. При следующей загрузке, когда владелец введёт правильный пароль, вредоносный код будет выполняться с повышенными привилегиями. Это может привести к утечке данных, удалённому доступу или внедрению кейлоггера.
Атака требует физического доступа и специальных навыков, поэтому наиболее актуальна для корпоративных систем и критической инфраструктуры. В качестве меры защиты рекомендуется настроить автоматическую перезагрузку после нескольких неудачных попыток ввода пароля.
www.linux.org.ru/news/security/18021212

Обновление Windows Server затрагивает работу Samba
Microsoft 8 июля выпустила обновления для Windows Server, усилившие проверки в протоколе Netlogon, используемом для аутентификации в Active Directory. Эти изменения привели к проблемам совместимости с серверами Samba, особенно при использовании бэкенда 'ad'.
После обновления Windows Server сервис winbind в Samba начинает некорректно обрабатывать запросы обнаружения контроллера домена (Netlogon DC Discovery). В результате пользователи не могут подключиться к SMB-ресурсам на серверах Samba, работающих в режиме члена домена.
Разработчики Samba оперативно выпустили патчи (4.22.3 и 4.21.7), устраняющие проблему. Администраторам рекомендуется как можно скорее обновить Samba, чтобы избежать сбоев в работе доменной инфраструктуры.
www.opennet.ru/opennews/art.shtml?num=63540

Атака TSA: уязвимости в процессорах AMD крадут данные из ядра и виртуальных машин
Исследователи из Microsoft и Швейцарской высшей технической школы Цюриха обнаружили новый класс атак на процессоры AMD — TSA (Transient Scheduler Attack). Уязвимости CVE-2024-36350 (TSA-SQ) и CVE-2024-36357 (TSA-L1) позволяют злоумышленнику обходить изоляцию между процессами, ядром и виртуальными машинами, извлекая конфиденциальные данные.
Атака основана на анализе времени выполнения инструкций после «ложного завершения» операций чтения из памяти. Процессор может спекулятивно выполнять инструкции, опираясь на некорректные данные, что создаёт уязвимости для утечки информации через микроархитектурные структуры (Store Queue и кэш L1D).
Проблема затрагивает процессоры AMD на архитектурах Zen 3 и Zen 4, включая линейки Ryzen 5000/6000/7000/8000, EPYC Milan/Genoa и Threadripper PRO и др.
Исправления уже включены в декабрьские обновления микрокода и PI-прошивок. Для полной защиты также требуется обновление ядра Linux (с возможностью отключения через параметр tsa=off) или гипервизора Xen.
www.opennet.ru/opennews/art.shtml?num=63557

Выпущены патчи для критических уязвимостей в Git
Разработчики Git выпустили экстренные обновления (2.43.7 – 2.50.1), закрывающие несколько опасных уязвимостей, которые позволяют выполнить произвольный код при работе с вредоносными репозиториями.
Основные проблемы:
  • CVE-2025-48384 – уязвимость в обработке субмодулей: из-за некорректной очистки символа возврата каретки (CR) атакующий может подменить путь и внедрить вредоносный Git hook, который выполнится после операции checkout.
  • CVE-2025-48385 – уязвимость в загрузке bundle-файлов, позволяющая записать данные в произвольное место файловой системы.
  • CVE-2025-48386 – переполнение буфера в Wincred (учётные данные Windows).
Кроме того, устранены уязвимости в графических интерфейсах Gitk и Git GUI:
  • CVE-2025-27613 – перезапись файлов через специальный репозиторий в Gitk.
  • CVE-2025-27614 – выполнение произвольного скрипт при запуске команды 'gitk filename' для специально подготовленного репозитория.
  • CVE-2025-46334 – запуск вредоносных .exe-файлов в Git GUI (Windows).
  • CVE-2025-46335 – создание или перезапись произвольных файлов при работе с репозиторием в Git GUI.
Рекомендуется немедленно обновить Git, особенно разработчикам, работающим с внешними репозиториями.
www.opennet.ru/opennews/art.shtml?num=63552

Взлом плагина Gravity Forms: зараженные версии содержали бэкдор
Популярный WordPress-плагин Gravity Forms, используемый для создания онлайн-форм, оказался заражен бэкдором после атаки на цепочку поставок. Вредоносный код попал в ручные установщики с официального сайта.
По данным PatchStack, плагин отправлял POST-запросы на подозрительный домен gravityapi[.]org, собирая метаданные сайтов, включая данные о темах, плагинах и версиях WordPress/PHP. Полученный в ответ вредоносный скрипт сохранялся на сервере и позволял выполнять произвольный код без аутентификации.
Разработчик RocketGenius подтвердил, что затронуты только версии 2.9.11.1 и 2.9.12, загруженные 10–11 июля 2025 года. Вредоносный код блокировал обновления, создавал скрытую учётную запись администратора и связывался с сервером злоумышленников.
Рекомендации:
  • Переустановите плагин, если загружали его в указанные даты.
  • Проверьте сайт на признаки взлома.
Служба Gravity API, отвечающая за автоматические обновления, не была скомпрометирована.
xakep.ru/2025/07/14/gravity-forms-backdoor/

Хакеры научились скрывать вредоносное ПО в DNS-записях
Эксперты DomainTools обнаружили новый метод заражения, при котором вредоносный код маскируется в DNS-записях типа TXT. Этот способ позволяет обходить системы защиты, так как DNS-трафик обычно считается безопасным.
Злоумышленники разбивают вредоносное ПО на фрагменты и распределяют их по поддоменам. При загрузке эти части автоматически собираются в полноценную вредоносную программу. Уже найдены примеры такого кода, включая Joke Screenmate (имитирует сбои системы) и PowerShell Stager (загружает дополнительные угрозы).
Пока реальных атак не зафиксировано, но специалисты предупреждают, что метод крайне опасен из-за своей скрытности. Для защиты рекомендуется:
  • мониторить DNS-трафик на аномальные запросы,
  • анализировать TXT-записи, выходящие за рамки стандартных функций,
  • использовать системы анализа угроз для выявления подозрительных доменов.
Эксперты считают, что массовые атаки с использованием этой техники — лишь вопрос времени.
3dnews.ru/1126189/nayden-sposob-zaragat-dnszapisi-vredonosnim-po/#687a4715742eecbde78b4568

Крупнейшая кибератака 2025 года: хакеры взломали 400 организаций через уязвимость в SharePoint
Все началось с предупреждения Microsoft о критической уязвимости в SharePoint, которую хакеры начали активно эксплуатировать. Если неделю назад речь шла о 100 скомпрометированных организациях, то теперь их число превысило 400. Среди пострадавших — правительственные учреждения США, включая Национальное управление ядерной безопасности, а также организации в Европе, Азии и Африке.
Нидерландская компания Eye Security, первой обнаружившая атаки, отмечает, что злоумышленники действуют методично: сначала проводят разведку, затем массово атакуют уязвимые системы. Особую тревогу вызывает возможная причастность китайских хакерских группировок, хотя официальный Пекин эти обвинения отвергает.
Microsoft оперативно выпустила патч, но многие серверы уже были скомпрометированы до его выхода. Эксперты предупреждают: реальный масштаб ущерба может быть значительно больше, так как хакеры используют методы, не оставляющие явных следов.
При этом хакеры могли получить доступ к данным о ядерных технологиях, хотя наиболее секретные системы США изолированы. Атаки продолжаются — другие группировки начали использовать ту же уязвимость. Национальная казначейская служба ЮАР уже подтвердила наличие вредоносного ПО в своих сетях, другие организации продолжают проверки.
ФБР и британские киберслужбы расследуют инцидент. По данным Shodan, под угрозой находятся более 8000 серверов, подключенных к интернету. Эта атака может войти в историю как одна из самых масштабных в 2025 году, подчеркивая необходимость срочного обновления SharePoint и усиленного мониторинга сетей.
3dnews.ru/1126465/ataka-na-serveri-microsoft-sharepoint-moget-stat-krupneyshey-kiberatakoy-2025-goda-chislo-postradavshih-previsilo-chetire-sotni/#6881cd16742eecb45c8b4569

Решила, что её лето похоже на мульт «Трое из Простоквашино» и оставила дописывать дайджест коллеге — Алёна М.

Обновление защиты сайтов от ботов, атак и взлома

Мы обновили базовую систему защиты сайтов на виртуальном хостинге. Теперь она стала ещё эффективнее и удобнее в управлении:
  • расширена база подозрительных IP-адресов — теперь она содержит более 1.6 млн записей
  • добавлены инструменты управления — можно просматривать события и гибко настраивать защиту как глобально, так и индивидуально для каждого сайта
  • внедрён модуль защиты от взлома сайтов — блокирует попытки использования известных уязвимостей ещё до выполнения кода


Сайты теперь лучше защищены от агрессивных ботов, парсеров, накрутки поведенческих факторов и попыток взлома — всё это уже включено в стоимость хостинга, без дополнительных платежей.
lite.host/faq/hosting/zashchita-saytov-ot-botov-atak-vzloma-waf

Мы обновили документ «Правила пользования сервисами и услугами»



Обновлён пункт 1.9, согласно которому при отсутствии реакции на претензию, относящуюся к типу «Нарушение Заказчиком интеллектуальных прав третьих лиц» в индивидуальном порядке мы можем ограничить доступ к IP-адресу заказчика ранее, чем через 14 суток.
Изменения вступят в силу 14 августа 2025 года. Все подробности — в поддержке.

Данное уведомление носит информационный характер и не требует каких-либо дополнительных действий.

Актуальная обновленная версия документа доступна по ссылке.
files.selectel.ru/docs/ru/terms-of-use-for-services.pdf

https://selectel.ru

Дешевые не-облачные VDS из selectel



Созданы просто так от балды, как противодействие людской жадности.
Мошенников и чернь конечно баним. Так что даже не пытайтесь просочиться на дешевые цены.
Но для личного пользования — идеально же. Зачем переплачивать за облако, когда можно купить старую добрую личную VDS из надежного ДЦ selectel.

  • i7-8700 (3,2 ГГц) [1 vCore] / 1 DDR4 / 25 ГБ SSD — 350р
  • i7-8700 (3,2 ГГц) [2 vCore] / 2 DDR4 / 50 ГБ SSD⁠ — 500р
  • i7-8700 (3,2 ГГц) [3 vCore] / 4 DDR4 / 100 ГБ SSD ⁠— 800р
  • i7-8700 (3,2 ГГц) [4 vCore] / 6 DDR4 / 150 ГБ SSD — 1100р
  • i7-8700 (3,2 ГГц) [6 vCore] / 8 DDR4 / 200 ГБ SSD — 1400р
  • [вечная] i7-8700 (3,2 ГГц) [1 vCore] / 1 DDR4 / 25 ГБ SSD — 6666р
  • [вечная] i7-8700 (3,2 ГГц) [2 vCore] / 2 DDR4 / 50 ГБ SSD⁠ — 11666р

Доступны локации Питер и Москва
Виртуалки делаются на raid0, бекапов не делаем, если сгорит, то сгорит. Для критически важных вещей не годится, но зато годится для всего остального, зачем переплачивать для примитивных вещей каким-то жадным облакам, когда можно тяп ляп и готово.

Заказать
Пока что тут bill.yacolo.net/billmgr
В будущем будет bill.fuckthem.cloud/billmgr

5 041 ₽ и выделенный сервер ваш на целый месяц



Аукцион от FirstDEDIC — это максимально низкие цены на выделенные серверы. Все серверы, представленные на аукционе, проверены и готовы к запуску. Установка и активация любой конфигурации займёт не больше часа.



1dedic.ru/auction

Сниженная цена будет действовать весь период аренды, включая дальнейшее продление сервера. При заказе от 3 месяцев также учитывается дополнительная скидка за период.
Количество серверов и время их размещения на аукционе ограничено.

Скидка 25% на заказ VDS в честь праздника



К Дню системного администратора вы заслужили аптайм, уважение и выгодный сервер. Акция в самом разгаре — получите скидку 25% по промокоду на заказ любого количества VDS

Промокод можно применить при покупке любого количества новых VDS. Скидка будет действовать на сроки аренды сервера: 1, 3, 6 или 12 месяцев.
firstvds.ru/actions/sysadmin_day_25-spirit_of_uptime

Индивидуальные ИТ-решения и решения по хостингу для вашего бизнеса



Откройте для себя бесчисленные возможности, которые Hetzner может вам предложить. Получите конфигурацию, адаптированную под ваши конкретные требования, и выведите свою IT-инфраструктуру на новый уровень вместе с нашей командой.

www.hetzner.com/custom-solutions


Частное межсоединение
Подключите серверы в вашем кластере напрямую друг к другу, независимо от того, находятся ли они в разных дата-центрах или городах. Нужна георезервированная конфигурация? Частные соединения обеспечат не только постоянную доступность ваших данных и резервных копий, но и быструю и бесперебойную передачу данных между различными точками. Мы можем снизить задержку, сократив расстояние между соединениями, и повысить производительность благодаря более широкой полосе пропускания до 100 Гбит/с.


Управляемые коммутаторы
С нашим управляемым коммутатором локальной сети вы получаете не только само оборудование, но и душевное спокойствие. Мы возьмём на себя настройку, мониторинг и обслуживание вашего коммутатора. У вас останется доступ на чтение к коммутатору, а также возможность создавать и просматривать сетевую статистику. Наши коммутаторы, как правило, поддерживают пропускную способность от 1 до 10 Гбит/с и имеют разное количество доступных портов.


Пользовательский сервер
Ни один из наших настраиваемых выделенных корневых серверов не соответствует вашим потребностям? Без проблем. Мы можем предоставить специальные конфигурации с дополнительным оборудованием для сложных систем. Нужен специальный RAID-контроллер, сетевая карта 25 Гбит/с или, возможно, особая разбивка дисков? Независимо от типа и размера сервера, мы можем создать конфигурацию, которая подходит именно вам.

Получите единый план для вашего собственного серверного кластера
Объедините существующие и новые серверы в единую индивидуальную концепцию ИТ-инфраструктуры.

Интегрируйте свое оборудование
У вас есть собственный брандмауэр или NAS? Используйте эти и многие другие типы устройств с вашими выделенными серверами.

Объединяйте серверы в кластеры
Объедините свою инфраструктуру в нескольких зданиях, местах и даже странах с помощью кросс-соединений, межсоединений и соединений на большие расстояния.

Получите индивидуальные LAN/WAN-подключения
Запросите внутренние и/или внешние подключения к вашему серверу и выберите нужную пропускную способность из широкого диапазона. Мы также можем подключить ваш выделенный сервер к внешнему провайдеру.

Развертывание суверенного чат-бота на базе искусственного интеллекта на платформе Scaleway: подробное техническое исследование Galene.AI



Прежде чем мы приступили к разработке, было ясно одно: наши клиенты должны иметь полный контроль над своими данными, моделями и соблюдением нормативных требований. Это было непреложным. Поэтому мы с нуля разработали полностью суверенную платформу ИИ, которая позволит компаниям уверенно внедрять наши технологии. Благодаря мощным графическим процессорам Scaleway и надежной инфраструктуре мы добились этого, обеспечив настоящий суверенитет данных и соблюдение нормативных требований.
Андреа Каппеллетти, основатель и генеральный директор Galene.AI

Генеративный ИИ меняет принципы работы компаний, но для многих европейских организаций внедрение мощных больших языковых моделей (LLM) сопряжено с критически важным компромиссом. Использование публичных SaaS-платформ означает отправку данных в сторонние экосистемы, часто за пределами ЕС. Это создаёт значительные риски, связанные с соблюдением требований GDPR и будущего Закона об искусственном интеллекте, не говоря уже о вопросах суверенитета данных, интеллектуальной собственности и привязки к поставщику.

Что если бы вы могли запустить высокопроизводительную, современную платформу разговорного ИИ, развернутую полностью в вашем частном, суверенном облаке?

Именно это и предлагает платформа Galene.AI, работающая на базе графической инфраструктуры Scaleway. Это комплексный, размещенный на собственном сервере стек диалогового ИИ, который предоставляет вам полный контроль над вашими моделями, данными и соблюдением нормативных требований. Давайте подробно рассмотрим техническую архитектуру и связанные с ней риски.

Разрыв в суверенитете в традиционных SaaS-решениях на основе искусственного интеллекта
Несмотря на удобство, стандартные SaaS-решения на базе ИИ создают проблемы, неприемлемые для компаний в регулируемых отраслях, таких как финансы, здравоохранение и производство, а также для любых государственных организаций.
Основные проблемы:
  • Раскрытие данных и резидентство: ваши запросы, документы и конфиденциальные данные клиентов обрабатываются и потенциально хранятся на серверах за пределами европейской юрисдикции. Местная юрисдикция, в которой находятся ваши серверы, может, в некоторых случаях, противоречить требованиям GDPR или Закона об искусственном интеллекте.
  • Утрата контроля над правами интеллектуальной собственности: данные, которые вы (ваши сотрудники или ваши клиенты) используете для взаимодействия с моделью, могут быть использованы для обучения будущих версий общедоступной модели поставщика. Ваша интеллектуальная собственность может фактически стать данными для обучения.
  • Непрозрачные операции: вы не видите всю цепочку поставок модели, её уровень безопасности и то, как она обрабатывает ваши данные. Этот подход «чёрного ящика» не позволяет проводить надлежащую оценку рисков, гарантировать соответствие требованиям, контролировать точность и стабильность с течением времени.
  • Привязка к поставщику и непредсказуемые расходы: лицензии на рабочее место и модели ценообразования на основе потребления могут стать чрезмерно дорогими по мере масштабирования, создавая долгосрочные зависимости при минимальной гибкости. Более того, они обычно не позволяют оптимизировать производительность с учётом ваших сценариев использования.
Эти проблемы не просто теоретические; они представляют собой практические препятствия для внедрения ИИ в производственных сценариях в больших масштабах.

Galene.AI — суверенная архитектура по умолчанию
Galene.AI разработан с нуля для устранения этих рисков. Платформа Galene позволяет развернуть и запустить её на вашей собственной инфраструктуре, локально или в вашем частном облаке Scaleway. Этот «проектируемый суверенный» подход гарантирует, что ваши данные никогда не выйдут из-под вашего контроля.
В основе платформы лежит частный кластер Kubernetes, обеспечивающий масштабируемость, безопасность и эксплуатационную гибкость. Вот как выглядит архитектура.

Основа: частный Kubernetes на графических процессорах Scaleway
Вся платформа Galene.AI контейнеризирована и оркеструется с помощью Kubernetes. Это обеспечивает бесперебойное развертывание в облаке Scaleway.
  • Локальное выполнение моделей. Все задачи ИИ обрабатываются локально на высокопроизводительных графических процессорах Scaleway (конфигурации от 2xL40S до H100), размещённых в экземплярах ваших виртуальных машин. Это исключает внешние вызовы API к сторонним моделям, значительно сокращая задержку и полностью устраняя риски раскрытия данных.
  • Зашифрованные данные Все данные шифруются при передаче (TLS 1.3) и при хранении (AES-256), что гарантирует защиту вашей конфиденциальной информации на каждом уровне стека.
  • Масштабируемость и отказоустойчивость Kubernetes обеспечивает масштабируемость для обработки изменяющихся рабочих нагрузок и отказоустойчивость для обеспечения высокой доступности — и все это в вашей частной сети.

Ядро: Частные агенты и Генеративный щит
Именно здесь объединяются интеллект и управление платформы.

1) Частные ИИ-агенты
Galene.AI опирается на мощную агентную структуру. Фреймворк не просто собирает информацию с помощью чат-ботов, но и координирует работу настраиваемых агентов для выполнения сложных задач. Благодаря протоколу Model Context Protocol (MCP) эти агенты могут безопасный доступ к внутренним базам знаний (например, к технической документации или кадровой политике), подключаться к корпоративным системам (CRM, ERP) и выполнять многошаговые рабочие процессы с возможностями логического мышления.

2) Генеративный щит — управление искусственным интеллектом в реальном времени
В платформу встроен Generative Shield — интегрированный уровень управления ИИ, который действует как межсетевой экран для всех взаимодействий человека и ИИ. Он обеспечивает соблюдение требований в режиме реального времени, отслеживая и фильтруя запросы и ответы на основе четырёх ключевых принципов:
  • Кибербезопасность и эксплуатируемость: защищает от мгновенных внедрений, враждебных атак и попыток кражи данных.
  • Соблюдение этических и правовых норм: обеспечивает соблюдение норм и этических принципов ЕС, предотвращая создание вредоносного или предвзятого контента.
  • Защита данных и конфиденциальность: обеспечивает соблюдение строгих правил обработки данных, предотвращая обработку или утечку конфиденциальных данных (PII, IP).
  • Точность и целостность: сверяет данные, полученные с помощью ИИ, с надежными источниками, чтобы исключить галлюцинации и гарантировать фактическую корректность.
Развертывая модели непосредственно в своей инфраструктуре и покрывая их Generative Shield, вы сохраняете полное право собственности и контроль, одновременно безопасно работая в рамках нормативных требований.

Интерфейс: приложение, ориентированное на пользователя, и API разработчика
Galene.AI создан как для бизнес-пользователей, так и для разработчиков, предлагая гибкую трехуровневую модель доступа.
  • Пользовательский интерфейс: понятный диалоговый пользовательский интерфейс в стиле ChatGPT позволяет нетехническим пользователям взаимодействовать с платформой, используя естественный язык, загружать документы для анализа или создавать персональных помощников.
  • Уровень агентов: здесь вы настраиваете и управляете частными агентами ИИ (определяя их навыки, источники знаний и рабочие правила через протокол контекста модели (MCP)), а также позволяете администраторам платформы обрабатывать разрешения RBAC, роли единого входа (SSO) и интегрировать централизованные базы знаний из Google Диска, SharePoint, S3 или реляционных баз данных.
  • Уровень REST API: для разработчиков Galene.AI предоставляет API, полностью совместимый со спецификациями API OpenAI. Это означает, что вы можете легко переносить существующие приложения или создавать новые решения, использующие внутренние возможности платформы (такие как распознавание документов, генерация кода и веб-поиск), без необходимости переобучения разработчиков.

Почему Galene.AI и Scaleway идеально подходят для суверенного ИИ
Развертывание платформы Galene.AI в облаке Scaleway создает мощный синергический эффект.
Гарантированное размещение данных и соблюдение нормативных требований.

Благодаря центрам обработки данных Scaleway, расположенным исключительно в ЕС (Франция, Польша, Нидерланды), вы автоматически соблюдаете требования GDPR к размещению данных и упрощаете соблюдение Закона об искусственном интеллекте. Ваши данные остаются в Европе, а вы пользуетесь прозрачной и надежной системой искусственного интеллекта.

Высокопроизводительные и экономичные графические процессоры.
Galene.AI работает на передовых графических процессорах NVIDIA H100 и L40S с тензорными ядрами от Scaleway, обеспечивая необходимую вычислительную мощность для быстрого и эффективного построения моделей по цене, которая делает суверенный ИИ доступным.
Предсказуемые и прозрачные расходы: модель лицензирования Galene.AI, основанная на количестве графических процессоров, исключает высокие затраты на рабочее место. В сочетании с прозрачным ценообразованием Scaleway вы получаете предсказуемое, масштабируемое и экономичное решение без привязки к поставщику.

Гибкость и безопасность.
Помимо решений Galene.AI, вы также можете развернуть любое программное обеспечение, дополняющее ваши сценарии использования ИИ, используя облачные продукты Scaleway. Используйте десятки продуктов, от Bare Metal до Serverless Functions, гарантируя, что ваши данные будут надежно защищены в вашем VPC.

Хотите ли вы внедрить собственный суверенный разговорный ИИ?
Эпоха выбора между инновациями в области ИИ и суверенитетом данных закончилась. С Galene.AI и Scaleway вы можете создать, развернуть и масштабировать мощное, конфиденциальное и соответствующее нормативным требованиям решение для разговорного ИИ, адаптированное к потребностям вашего бизнеса и соответствующее европейским ценностям.
Суверенитет — это новый фундамент доверия к ИИ.

Свяжитесь с Galene.AI, чтобы получить демонстрацию, индивидуальное предложение и дополнительную информацию о начале развертывания на Scaleway.
sales@galene.ai