Бесплатный мониторинг доступности, который будет писать в поддержку вместо вас



Было ли у вас такое, что ваш сервер и сайты лежали всю ночь, пока вы спали, а может быть и несколько недель, пока вы наслаждались отдыхом? Потерянные позиции в выдаче, потерянные заказы и трафик. Если вы используете VPS это давольно частая ситуация. Из-за жестких ограничений в ресурсах в часы пик или при массовом наплыве поисковых (и не только) ботов сервер может зависнуть из-за нехватки памяти или других причин.

Именно поэтому несколько лет назад мы анонсировали бесплатную услугу мониторинга серверов/сайтов, которая успешно помогает нашим клиентам избежать таких проблем, ведь в случае недоступности сервера или отдельных сайтов наш технический отдел автоматически получает тикет о проблеме и незамедлительно приступает к ее решению, ведь круглосуточное администрирование и решение проблем уже включены в стоимость наших услуг.
Мы уверены, что поддерживать высокий аптайм ваших сайтов 24/7 — это наша непосредственная задача.

Мы пишем вам, так как видим, что по какой-то причине вы еще не используете нашу услугу мониторинга, поэтому мы рекомендуем вас ее подключить и настроить. Если вам требуется помощь в настройке, просто создайте тикет в службу поддержки.

Недавно мы решили пойти еще дальше. В данный момент наши разработчики работают над новой системой превентивного мониторинга, которая поможет предупреждать проблемы и зависания серверов из-за исчерпания ресурсов и других причин, таким образом вы будете знать о возможных проблемах до того, как они приведут к недоступности ваших сайтов. Как только все будет готово, мы сделаем отдельную рассылку.

Мониторинг доступности и работа сайта во время выходных


После покупки виртуального и/или выделенного сервера важно вовремя получать информацию о недоступности сервиса, то есть проводить мониторинг основных подсистем веб-сайта.

Надежный веб-сайт должен быть легкодоступен для пользователей 7 дней в неделю, поэтому его надо постоянно проверять как на предмет доступности, так и на предмет работоспособности:
  • регулярная самостоятельная проверка работоспособности веб-сайта с помощью бесплатных инструментов;
  • постоянный мониторинг доступности сайта, оптимальным для которого является часовой интервал: большинство пользователей попытаются вернуться на сайт в течение 1-2 часов, более частые проверки не гарантируют более оперативного исправления проблем быстрее, чем в течение часа;
  • мониторинг компонентов проекта и анализ метрик приложений: скорости ответа, ошибок компонентов, сервисов, скорость ответов базы данных, мониторинг запросов без индексов или медленных запросов;
  • мониторинг производительности веб-сайта: медленная загрузка страниц может стоить потери клиентов, в то время как в результате мониторинга приходит своевременное уведомление о проблемах, позволяющее оперативно их устранять и минимизировать последствия;
  • мониторинг проблем заключается в отслеживании нескольких параметров сайта с частотой не менее раза в минуту из нескольких географических точек, для чтобы максимально покрыть минутный интервал проверками и установить возможные проблемы, связанные с географией пользователей.

Среди возможных критериев проверки можно выделить следующие проблемы:
  • с DNS-сервером (когда в определенные интервалы времени адрес сайта не может быть определен, хотя сам сайт физически доступен);
  • с большим временем ответа (при обновлении кэша, например, или при выполнении «тяжелых» задач на стороне сервера);
  • с плановым выполнением задач (в результате которых сайт будет не доступен только в определенные моменты времени);
  • с большим времени ожидания статических файлов (например, из-за сетевой инфраструктуры или проблем с физическим носителем);
  • с подключением к базе данных.

blog.selectel.ru/monitoring-availability-site/

Мониторинг сервисов с Prometheus



В сегодняшней статье мы хотели бы вернуться к этой теме и рассказать об интересном инструменте под названием Prometheus. Он был создан в 2012 году в качестве внутренней системы мониторинга небезызвестного проекта SoundCloud, но впоследствии получил более широкое распространение.

blog.selectel.ru/monitoring-servisov-s-prometheus/