Рейтинг
0.00

Servers-com Хостинг

4 читателя, 80 топиков

Сокращение задержек в SaaS с помощью распределенного bare metal



Когда речь идёт о хостинге SaaS-приложений, задержка должна быть как вопросом для руководителей, так и для инженеров. Физическое расстояние между вашими клиентами и вашими вычислительными ресурсами напрямую отражается в коэффициентах конверсии, кривых удержания, очередях на поддержку и продлениях контрактов.

Ваши клиенты сравнивают свой опыт с лучшими приложениями, которые они используют, а не только с вашими прямыми конкурентами. В то же время требования к размещению данных обязывают SaaS-команды обслуживать и хранить данные локально (а те, кто этого не делает, сталкиваются со штрафами и/или теряют сделки).

Именно здесь распределенный физический ресурс становится стратегическим преимуществом.

Размещение выделенных серверов в нескольких глобальных точках присутствия означает, что данным не придется проходить большие расстояния, чтобы достичь конечных пользователей, и повышает контроль над тем, где эти данные обрабатываются и хранятся.

Что такое распределенный bare metal?
Стратегия распределённого развертывания на физическом сервере (bare metal) предполагает установку приложений на нескольких изолированных физических серверах, а не на виртуальных машинах. Обычно эти физические серверы развёртываются у нескольких поставщиков и могут быть стратегически расположены рядом с вашей клиентской базой, чтобы сократить задержки SaaS-решений и повысить общую производительность платформы.

Почему низкая задержка в SaaS-решениях является стратегическим приоритетом
Современные приложения, включая корпоративные приложения, должны быть всегда включены и доступны, а зачастую им приходится обслуживать глобальную базу пользователей, которые ожидают практически мгновенного отклика независимо от того, где они находятся
пишет Филипп Меррик, генеральный директор и соучредитель pgEdge, Inc.

Для высоконагруженных SaaS-приложений даже миллисекундная задержка (небольшой процент запросов, обработка которых занимает значительно больше времени, чем обычно) приводит к отказу пользователей и потере дохода. Даже незначительные задержки в реагировании базы данных могут привести к серьёзным сбоям. Исследования показывают, что проблемы с производительностью базы данных приводят к потерям компаний в среднем на 7900 долларов США за минуту простоя. Это означает, что снижение задержки — неоспоримый фактор роста.

В некоторых случаях требования к задержке могут быть прямо установлены вашими конечными клиентами. Покупатели корпоративных SaaS-решений нередко ожидают достижения целевых показателей уровня обслуживания (SLO) с возможностью выплаты компенсации в случае невыполнения этих показателей. Обслуживание клиентов из близлежащих точек присутствия снижает дисперсию сети и делает эти SLO более обоснованными.

Даже кажущиеся незначительными задержки и задержки могут привести к замедлению, которое приводит к эскалации заявок и ненужным работам по устранению неполадок. Эти проблемы не только требуют времени, ресурсов и денег, но и наносят репутационный ущерб. Исследования показывают, что 68% клиентов SaaS рассматривают возможность перехода на другую платформу после всего лишь одного серьёзного сбоя.

Короче говоря, это означает, что приоритетное внимание к сокращению задержек во всем стеке является обязательным. По мере роста объёма SaaS-платформы изоляция и локальность серверов становятся всё важнее. Выделенные, изолированные по ресурсам серверы в сочетании с локальными развёртываниями помогают обеспечить стабильную производительность, что приводит к повышению уровня удержания и уменьшению числа инцидентов, связанных с реагированием.

Как распределенное «голое железо» снижает задержку
Для SaaS-команд задержка — это не просто цифра, а скорее показатель того, насколько быстро работает ваш продукт. Распределённые архитектуры на базе физических серверов размещают выделенные вычислительные ресурсы именно там, где находятся ваши пользователи. Запросы обрабатываются реже и сталкиваются с меньшим количеством конфликтов, чем при размещении в гипермасштабируемой облачной среде, что обеспечивает стабильную производительность, которую вы можете контролировать.

Этот принцип реализуется на практике посредством близости, охвата оборудования разных поставщиков и управления выделенным сервером.


1. Близость к конечным пользователям
Чтобы ваши SaaS-интерфейсы работали мгновенно, следует размещать вычислительные ресурсы в пределах 100–150 мс от кластеров наиболее ценных пользователей. Расстояние между обслуживающим оборудованием и кластером конечных пользователей составляет не более 5000 км.

Размещение приложений вблизи конечных пользователей сокращает количество дальних переходов и точек обмена интернет-трафиком на пути данных. Это, в свою очередь, снижает задержку и джиттер. В конечном счёте, кратчайший путь всегда оказывается выигрышным, и распределённое развертывание на физическом сервере означает, что вы можете быть уверены, что ваши серверы на физическом сервере будут развернуты в центрах обработки данных, соответствующих рекомендуемым параметрам.

2. Охват нескольких поставщиков
Ни один поставщик инфраструктуры не сможет предложить идеальную схему центров обработки данных для вашей конкретной базы пользователей. Поэтому внедрение гибридной SaaS-инфраструктуры путем сотрудничества с несколькими поставщиками — разумный шаг. Это означает, что вы можете повысить свои шансы разместить оборудование в оптимальных местах, тем самым обеспечивая бесперебойную работу конечных пользователей в этих регионах.

По этим причинам мы часто рекомендуем клиентам рассмотреть возможность использования мультивендорного подхода. Яркий пример — B2B-провайдер потокового видео в режиме реального времени nanocosmos, предлагающий свои решения для потоковой трансляции в режиме реального времени в виде SaaS-платформы.

Для клиентов nanocosmos бесперебойность работы не подлежит обсуждению. Поэтому, чтобы обеспечить 100% бесперебойность работы, мы совместно разработали стратегию географически распределенной инфраструктуры с использованием оборудования разных производителей, объединив оборудование Servers.com с различными другими вычислительными ресурсами. Это означает, что nanocosmos может устранить единые точки отказа, обеспечивая при этом близость инфраструктуры к конечным пользователям по всему миру. Как отметил Оливер Литц, генеральный директор nanocosmos:

Мы сотрудничаем с многочисленными партнёрами и постоянно ищем новые партнёрские отношения для укрепления наших позиций. Мы активно ищем высокоскоростные соединения на каждом сервере, современные серверы с большим количеством ядер и высокой частотой. В сочетании с широким выбором площадок для развёртывания это является хорошей отправной точкой.

Благодаря возможности выбора между несколькими локациями поставщиков гораздо выше вероятность того, что вы сможете развернуть решение в нужном вам регионе (часто даже в пределах конкретного мегаполиса). Это также означает, что вы сможете оптимизировать свой портфель SaaS-инфраструктуры за счёт комбинирования сетей и управления пропускной способностью во время пиковых нагрузок.


3. Стабильная работа
Многопользовательские виртуализированные среды создают непредсказуемые помехи. Когда несколько компаний используют общее базовое оборудование, им приходится конкурировать за ограниченные ресурсы, что приводит к снижению производительности: ошибкам, замедлению отклика, невыполнению запросов или даже системным сбоям, которые существенно сказываются на работе конечных пользователей.

Решения на базе «голого железа» исключают этот риск. Аппаратное обеспечение сервера не используется совместно с другими компаниями, поэтому конкуренция за ресурсы не влияет на производительность напрямую. Добавьте к этому дополнительные возможности настройки оборудования, которые предоставляет единоличный пользователь сервера (как минимум, выбор процессора, оперативной памяти и хранилища), и вы получите архитектуру, тщательно адаптированную к вашим требованиям к задержкам и общей производительности.

Это мнение все чаще разделяется в сообществе SaaS и находит свое отражение на таких форумах, как subreddit r/SaaS, где один из участников пишет, что «голое железо» — это «секретный ингредиент для множества стабильных SaaS-платформ, приносящих большой ежемесячный доход».

Преимущества не ограничиваются задержкой
Распределённое развертывание на физическом сервере (bare metal) — это не просто стратегия сокращения задержек. Оно обеспечивает более широкие преимущества для SaaS-хостинга. Например, при постоянных и стабильных рабочих нагрузках развертывание на физическом сервере (bare metal) является более экономичным вариантом, чем аналогичные решения в публичном облаке с их моделями ценообразования по требованию и сложными структурами выставления счетов.

Именно это обнаружила платформа для электронной коммерции Dukaan. Начав миграцию из облака на физическое решение в 2023 году, Dukaan значительно сократила расходы. Субхаш Чаудхари, соучредитель и технический директор Dukaan, объясняет:

«На каждом уровне нашего стека мы платили «налог за удобство». Мы платили AWS за привилегию не управлять базовым оборудованием».

Для обеспечения максимальной производительности во время пикового трафика команда использует прокси-серверы в 22 регионах по всему миру в распределенной сети, что позволяет направлять трафик и управлять им через различные местоположения серверов.

Субхаш Чаудхари, соучредитель и технический директор индийского стартапа электронной коммерции Dukaan, рассказал, как компания радикально сократила расходы, перейдя с Amazon Web Services на серверы без ОС. В своей книге «Случайный технический директор» (The Accidental CTO) Чаудхари объяснил, что ежемесячный счёт за Amazon Web Services (AWS) в размере 80 000 долларов США можно сократить до всего 5 000 долларов США при использовании серверов без ОС. Он отметил, что, хотя AWS обеспечивает простоту обслуживания, производительность и скорость, это сопряжено со значительными затратами, назвав это налогом на удобство, который платится за отсутствие управления базовым оборудованием.

Чаудхари подробно рассказал о том, как Dukaan осуществил миграцию без простоев с использованием шаблона Strangler Fig Pattern, постепенно перенаправив трафик с AWS на собственную инфраструктуру. Он подчеркнул, что наличие постоянного IP-адресного пространства было ключевым фактором, заявив, что этот IP-адрес был нашим постоянным переносимым адресом в Интернете и позволял осуществлять миграцию без ведома пользователей. Стартап использовал серверы Hetzner без ОС и такие инструменты, как k3s, для создания и тестирования кластеров Kubernetes в девяти центрах обработки данных по всему миру.

Изначально переведя лишь один процент европейского трафика из AWS и постепенно увеличивая его до 100%, Чоудхари подчеркнул необходимость тщательного мониторинга на каждом этапе. Он добавил, что каждый этап тщательно контролировался, и при необходимости трафик можно было мгновенно перенаправить обратно в AWS. Своим опытом и знаниями он открыто делится в своей книге на GitHub, предлагая ценные рекомендации другим компаниям, стремящимся оптимизировать расходы с помощью инфраструктуры на базе физических серверов, подобной таким, как OneUptime и Basecamp.


Стоит также отметить, что эта дополнительная экономия в сочетании со стабильностью производительности, обеспечиваемой специализированным оборудованием, является существенным преимуществом для ресурсоемких и ресурсоемких рабочих нагрузок ИИ, особенно тех, которые выполняются в течение длительных периодов времени.

Распределенные архитектуры на базе «голого железа» также обеспечивают значительно более высокий уровень стратегического контроля и управления рисками. Благодаря географическому разнообразию этих развёртываний, команды SaaS-решений также обладают гибкостью для соответствия меняющимся законам о местонахождении данных, демонстрируя чёткую изоляцию и возможность хранить регулируемые данные в стране или в одобренных регионах.

Аналогичным образом, при развертывании решений у нескольких поставщиков риск сбоя в работе одного поставщика или резкого повышения цен сводится к минимуму, что способствует долгосрочной избыточности системы и одновременно защищает вашу прибыль.

Архитектура для более быстрого и независимого SaaS
Задержка в SaaS — стратегический бизнес-фактор, а распределённое решение на базе bare metal — эффективная стратегия для предоставления более быстрых, предсказуемых и независимых SaaS-платформ. Размещая вычислительные мощности близко к пользователям, выбирая нужные метро и сетевые конфигурации, а также исключая «шумных соседей», SaaS-команды могут сократить задержку и повысить производительность.

Положительный эффект от достигнутого результата расширяет предыдущие показатели: более стабильные затраты для стабильных рабочих нагрузок, реальный контроль над тем, где находятся данные и как они перемещаются, и, в конечном счете, более качественный пользовательский опыт.