Server monitoring — постоянное отслеживание состояния сервера/приложения, сбор метрик и алерты. Обязательно — без мониторинга клиенты узнают о проблеме первыми и злятся.
Метрики
Server: CPU, RAM, Disk I/O, Network, Load Average, Uptime. App: HTTP response time, error rate, requests, DB query time. Business: users, orders, revenue, conversion.
Инструменты
Prometheus + Grafana — open source, K8s стандарт. Self-hosted.
Datadog — SaaS, $15-31/host/мес. APM + logs + metrics всё в одном.
New Relic — APM-лидер. Free tier 100 ГБ log/мес.
Zabbix — open source, ветеран с 2001.
Nagios — корпоративный, сложно.
Better Stack — modern, logs + uptime.
Алертинг
CPU 80%+ 5 мин, disk 90%+, error 5%+. Каналы: PagerDuty, Opsgenie, Slack, Telegram. Priority: P1/P2/P3.
Практика Sayt.uz
Используем Prometheus + Grafana + AlertManager. Клиентам базовый мониторинг бесплатно. VPS Pro — помогаем подключить Datadog/New Relic. Совет: для бизнес-сайта UptimeRobot бесплатно. Для критичного — Datadog или Prometheus.