Мониторинг доступности и работа сайта во время выходных


После покупки виртуального и/или выделенного сервера важно вовремя получать информацию о недоступности сервиса, то есть проводить мониторинг основных подсистем веб-сайта.

Надежный веб-сайт должен быть легкодоступен для пользователей 7 дней в неделю, поэтому его надо постоянно проверять как на предмет доступности, так и на предмет работоспособности:
  • регулярная самостоятельная проверка работоспособности веб-сайта с помощью бесплатных инструментов;
  • постоянный мониторинг доступности сайта, оптимальным для которого является часовой интервал: большинство пользователей попытаются вернуться на сайт в течение 1-2 часов, более частые проверки не гарантируют более оперативного исправления проблем быстрее, чем в течение часа;
  • мониторинг компонентов проекта и анализ метрик приложений: скорости ответа, ошибок компонентов, сервисов, скорость ответов базы данных, мониторинг запросов без индексов или медленных запросов;
  • мониторинг производительности веб-сайта: медленная загрузка страниц может стоить потери клиентов, в то время как в результате мониторинга приходит своевременное уведомление о проблемах, позволяющее оперативно их устранять и минимизировать последствия;
  • мониторинг проблем заключается в отслеживании нескольких параметров сайта с частотой не менее раза в минуту из нескольких географических точек, для чтобы максимально покрыть минутный интервал проверками и установить возможные проблемы, связанные с географией пользователей.

Среди возможных критериев проверки можно выделить следующие проблемы:
  • с DNS-сервером (когда в определенные интервалы времени адрес сайта не может быть определен, хотя сам сайт физически доступен);
  • с большим временем ответа (при обновлении кэша, например, или при выполнении «тяжелых» задач на стороне сервера);
  • с плановым выполнением задач (в результате которых сайт будет не доступен только в определенные моменты времени);
  • с большим времени ожидания статических файлов (например, из-за сетевой инфраструктуры или проблем с физическим носителем);
  • с подключением к базе данных.

blog.selectel.ru/monitoring-availability-site/

Краткое введение в Riemann: мониторинг и анализ событий



По сравнению с другими системами мониторинга он отличается повышенной сложностью,
и в то же время — гораздо большей гибкостью и отказоуcтойчивостью. На просторах Интернета нам доводилось встречать публикации, где Riemann характеризуют как «самую гибкую систему мониторинга в мире».Riemann хорошо подходит для сбора информации о работе сложных высоконагруженных систем в реальном масштабе времени.

blog.selectel.ru/kratkoe-vvedenie-v-riemann-monitoring-i-analiz-sobytij/

Мониторинг администратором сервера 0,75 цента/месяц



Рады вам сообщить что для всех клиентов доступна очень полезная функция мониторинга серверов посредством ping и уведомлением по смс нашего администратора. Добавить возможно во время заказа или уведомлением в тикеты.
Цена от 0,75 цента/месяц — каждые 15 минут.

Monitoring-as-a-service для инфраструктур на примере сервиса Anturis

Мониторинг является одним из неотъемлемых компонентов менеджмента IT инфраструктур. На сегодняшний день существует множество решений и подходов к мониторингу, самые популярные из них можно выделить в две группы:

  • Только внешний мониторинг, который используется для анализа ситуации со стороны пользователей. В этом случае смотрятся такие метрики, как Response Time, Uptime, Round-trip Time и пр. Лидером в этом сегменте является шведский Pingdom, хотя существует множество аналогов (в т.ч. бесплатных), а также сервисов, специализирующихся на определенных регионах. Минусом таких решений является то, что при наличии понимания проблемы, сложно выявить ее причину и, соответственно, быстро устранить.
  • Open-source системы для мониторинга, такие как Nagios или Zabbix. Такой подход популярен прежде всего высокой степенью кастомизации и практически безграничным функционалом, который можно расширить с помощью самописных скриптов и сторонних плагинов. В то же время, такие системы требуют достаточно много времени на обучение внедрению и поддержку компонентов самого мониторинга. Кроме того, теряется некоторый функционал внешнего мониторинга (например, проверки из разных географических положений).

Monitoring-as-a-service
Существует множество IT специалистов, которым явно не хватает только внешнего мониторинга, а тратить большую часть своего времени и средств на разворачивание и поддержку собственной системы мониторинга они не готовы. Поэтому в последние несколько лет на рынке появился новый класс решений — monitoring-as-a-service или hosted monitoring.

В данном случае внутренние ресурсы (аппаратное и программное обеспечение, ресурсы сети) мониторятся в основном с помощью локальных агентов, а внешние (сторонние и собственные сервисы, синтетические транзакции и пр.) с помощью запросов с серверов вендора. Данные собираются на стороне сервиса, после чего создаются отчеты об ошибках, репорты и отправляются нотификации в случае возникновения проблем.

Вкратце, преимуществами hosted мониторинга являются:
  • Минимизация расходов на обучение работы с системой
  • Минимизация расходов на разворачивание и поддержку системы мониторинга
  • Простое масштабирование
  • Продвинутые возможности для внешнего мониторинга

Сервис Anturis
Одним из таких сервисов является Anturis. Схематично принцип его работы можно изобразить так (стрелками показаны зависимости между компонентами, а пунктиром сбор и передача данных):


Читать дальше →

Ваш сервер недоступен.... А какое время простоя допустимо для вашего проекта?



Наверняка каждому приходилось сталкиваться с тем, что сервер по какой-то причине не отвечает, недоступен.
Как повлияет на ваш проект отключение сервера в 2 часа ночи, тогда как вы об этом узнаете только в 9 утра?
Размышляя об этом мы решили запустить для клиентов новый сервис — сервис мониторинга ваших серверов.

Мониторинг? Какой еще мониторинг, зачем он мне?!
Представьте, что при недоступности сервера система мониторинга оповестила инженеров ServerClub и он был возвращен к работе в кратчайшие сроки, не после того как вы создали тикет в 9 утра, а спустя 5-10 минут с момента аварии?
Весомая разница в даунтайме, не так ли?

У вас может возникнуть ощущение, что этот наш мониторинг только за доступностью и следит.
Нет. Спешу вас уверить, что в основе сервиса лежит мощнейший и чрезвычайно гибкий инструмент(Zabbix, для тех кто в курсе), который позволяет наблюдать практически за любыми параметрами серверов/свитчей/маршрутизаторов и т.д. и т.п.
Ограничением часто служит только фантазия, «замониторить» можно практически все.

Для примера приведу набор предлагаемых нами опций мониторинга без дополнительной кастомизации, что называется «из коробки»:
  • Загрузка CPU
  • HDD свободное место
  • RAM доступно
  • Состояние SWAP
  • Состояние RAID
  • Состояние HDD(S.M.A.R.T. насколько жив/насколько мертв диск)

Для подписчиков действует специальное предложение:
по промо коду mail#48fj6& можно подключить базовый пакет «3 доп опции за 15$ за сервер», а так же расширенный пакет «7 опций + 1 кастомная за 25$ за сервер».
Для подключения достаточно создать тикет в личном кабинете и указать промо код.