Калькулятор SLA
и стоимости простоя
Что такое SLA и Uptime
SLA (Service Level Agreement) — это соглашение об уровне обслуживания между провайдером услуги и клиентом. Одним из ключевых параметров SLA является Uptime — гарантированный процент времени, в течение которого сервис будет доступен. Чем больше «девяток» в показателе SLA, тем меньше допустимого времени простоя и тем выше требования к инфраструктуре.
Uptime (время работы)
Uptime — это процент времени, когда система доступна и работает штатно. Например, SLA 99.9% означает, что сервис может быть недоступен не более 8 часов 45 минут в год. Этот показатель измеряется внешними системами мониторинга, которые регулярно проверяют доступность сервиса.
Downtime (простой)
Downtime — это период, когда сервис недоступен пользователям. Включает плановые работы (обновления, миграции) и внеплановые инциденты (сбои оборудования, DDoS-атаки, ошибки конфигурации). В SLA обычно учитывается только внеплановый простой, плановые работы выносятся в отдельное окно обслуживания.
«Девятки» (Nines)
В индустрии уровни SLA принято считать в «девятках»: 99% — две девятки, 99.9% — три, 99.99% — четыре, 99.999% — пять. Каждая дополнительная девятка уменьшает допустимый простой в 10 раз, но экспоненциально увеличивает стоимость инфраструктуры и сложность поддержки.
Где применяется SLA
Соглашения об уровне обслуживания являются стандартом для любого IT-сервиса, от хостинга до облачных платформ.
Хостинг и дата-центры
Провайдеры веб-хостинга и колокации гарантируют доступность серверов на уровне 99.9-99.99%. Нарушение SLA влечёт компенсацию в виде кредитов на обслуживание. При выборе хостинга SLA — один из ключевых параметров.
Облачные платформы (Cloud)
AWS, Google Cloud, Yandex Cloud, Selectel — все крупные облачные провайдеры публикуют SLA для каждого сервиса. Виртуальные машины обычно имеют SLA 99.95%, управляемые базы данных — 99.99%, а CDN — 99.999%.
SaaS-сервисы
Программы как услуга (CRM, ERP, мессенджеры) указывают SLA в договорах с корпоративными клиентами. Для бизнес-критичных систем (платёжные шлюзы, медицинские системы) стандартом является SLA 99.99% и выше.
DevOps и SRE
Команды Site Reliability Engineering используют SLA для определения Error Budget — бюджета ошибок. Если простой за месяц укладывается в бюджет, команда может выпускать новые фичи. Если бюджет исчерпан — фокус переключается на надёжность.
Бизнес-планирование
Финансовые аналитики используют калькулятор SLA для оценки потенциальных потерь от простоя. Это помогает обосновать инвестиции в резервирование, мониторинг и disaster recovery перед руководством.
Управление инцидентами
При возникновении сбоя важно быстро оценить, укладывается ли инцидент в допустимый бюджет простоя. Обратный калькулятор позволяет мгновенно перевести фактический даунтайм в процент SLA.
Справочная таблица SLA/ стандартные уровни
Ниже приведены стандартные уровни SLA, используемые в индустрии. Каждый уровень указывает максимально допустимое время простоя за различные периоды. Данные помогают быстро сориентироваться при составлении или анализе SLA-контрактов.
| SLA % | Девятки | Простой / год | Простой / месяц | Простой / неделя | Применение |
|---|---|---|---|---|---|
| 99% | 2 | 3 дня 15 ч | 7 ч 12 мин | 1 ч 41 мин | Некритичные сервисы |
| 99.5% | 2.5 | 1 день 19 ч | 3 ч 36 мин | 50 мин | Внутренние системы |
| 99.9% | 3 | 8 ч 46 мин | 43 мин | 10 мин | Стандартный SLA |
| 99.95% | 3.5 | 4 ч 23 мин | 21 мин | 5 мин | Облачные сервисы |
| 99.99% | 4 | 52 мин | 4 мин 19 сек | 1 мин | Финансовые системы |
| 99.999% | 5 | 5 мин 15 сек | 26 сек | 6 сек | Телеком, медицина |
Заметка: каждая дополнительная «девятка» в SLA стоит примерно в 10 раз дороже предыдущей из-за необходимости дополнительного резервирования, автоматизации и инженерных ресурсов.
Совет: не стремитесь к 99.999% для всех сервисов. Определите критичность каждого компонента и выставите SLA, соответствующий бизнес-требованиям. Избыточная надёжность — это переплата.
Как повысить Uptime
Для достижения высокого уровня доступности необходимо системно работать над каждым звеном инфраструктуры. Ниже — ключевые стратегии повышения uptime.
Резервирование (Redundancy)
Дублирование критических компонентов: серверов, сетевых каналов, баз данных, систем хранения. Используйте кластеризацию (Active-Active или Active-Passive), мультизональное развёртывание и балансировку нагрузки. Каждый единичный компонент (Single Point of Failure) должен быть устранён.
Мониторинг и алертинг
Внедрите многоуровневый мониторинг: внешние проверки доступности (Uptime Robot, Pingdom), метрики приложения (Prometheus, Grafana), логирование (ELK Stack). Настройте эскалацию алертов: если инцидент не закрыт за 5 минут — уведомление уходит следующему уровню поддержки.
Disaster Recovery план
Разработайте и регулярно тестируйте план восстановления после катастрофы. Определите RPO (допустимую потерю данных) и RTO (время восстановления). Автоматизируйте переключение на резервную площадку. Проводите учения (Game Day) минимум раз в квартал, имитируя отказ компонентов.
CI/CD и автоматизация
Автоматизируйте развёртывание через CI/CD-пайплайны с Blue-Green или Canary-деплоями. Используйте Infrastructure as Code (Terraform, Ansible) для воспроизводимости среды. Автоматические откаты при обнаружении ошибок после деплоя значительно сокращают время инцидентов.
Советы по работе с SLA
Практические рекомендации для IT-менеджеров, DevOps-инженеров и владельцев бизнеса при составлении и контроле SLA.
1Определите критичность сервисов
Не все сервисы требуют одинакового SLA. Платёжный шлюз может требовать 99.99%, а внутренний wiki — 99.5%. Составьте матрицу критичности: разделите сервисы на категории (Tier 1, Tier 2, Tier 3) и назначьте соответствующий SLA для каждого уровня.
2Считайте композитный SLA
Если сервис зависит от нескольких компонентов последовательно, общий SLA равен произведению SLA каждого. Например, приложение (99.99%) + база данных (99.99%) + сеть (99.99%) = 99.97%. Учитывайте это при проектировании архитектуры и не обещайте больше, чем может обеспечить самое слабое звено.
3Используйте Error Budget
Бюджет ошибок — это допустимое количество минут простоя за период. Например, при SLA 99.9% в месяц бюджет составляет 43 минуты. Пока бюджет не исчерпан, команда может выпускать обновления. Если бюджет заканчивается, все силы направляются на стабилизацию.
4Фиксируйте метод измерения
В SLA-контракте чётко опишите, как измеряется доступность: с каких точек, с какой частотой, что считается инцидентом. Без этого SLA превращается в формальность. Определите, включаются ли в расчёт плановые работы и частичная деградация сервиса.
Связанные понятия
SLA тесно связан с другими метриками надёжности и производительности сервисов.
SLO (Service Level Objective)
Внутренняя цель по качеству сервиса. SLO обычно строже, чем внешний SLA: если SLA = 99.9%, то SLO может быть 99.95%. Это даёт запас для выявления проблем до нарушения контракта.
SLI (Service Level Indicator)
Конкретная метрика, по которой измеряется качество: процент успешных запросов, задержка p99, доля ошибок. SLI — это данные, SLO — целевое значение, SLA — юридическое обязательство.
MTTR (Mean Time To Recovery)
Среднее время восстановления после сбоя. Чем ниже MTTR, тем выше фактический SLA. Сокращается через автоматизацию отката, подготовленные runbook-инструкции и обученных дежурных инженеров.
MTBF (Mean Time Between Failures)
Среднее время между отказами. Показывает надёжность системы. Увеличивается через резервирование, качественное тестирование, постепенный rollout обновлений и анализ постмортемов.
RPO (Recovery Point Objective)
Допустимая потеря данных при катастрофе, выраженная во времени. RPO = 1 час означает, что допустима потеря данных за последний час. Определяет частоту бэкапов и стратегию репликации.
RTO (Recovery Time Objective)
Целевое время восстановления после катастрофы. RTO = 15 минут означает, что сервис должен быть восстановлен за четверть часа. Влияет на выбор архитектуры DR: hot standby vs cold backup.
Как пользоваться калькулятором
Три режима работы для решения любых задач, связанных с SLA и доступностью сервисов.
SLA -> Простой
Выберите уровень SLA (99%, 99.9%, 99.99% и т.д.) или введите свой процент. Калькулятор рассчитает допустимое время простоя за год, месяц, неделю и день в часах, минутах и секундах.
Простой -> SLA
Введите фактический простой (часы и минуты) за выбранный период. Калькулятор определит, какому уровню SLA соответствует ваш реальный uptime и покажет количество «девяток».
Стоимость простоя
Укажите выручку компании в час. Калькулятор покажет стоимость каждой минуты простоя и сравнительную таблицу финансовых потерь для разных уровней SLA.
Часто задаваемые вопросы
Был ли этот калькулятор полезен?
Инструмент справочный — не заменяет эксперта
Только для информационных целей. Все расчёты, результаты и данные, предоставляемые инструментом, носят исключительно ознакомительный и справочный характер. Они не являются профессиональной консультацией — медицинской, юридической, финансовой, инженерной или иной.
Точность результатов. Калькулятор основан на общепринятых формулах и методиках, однако фактические результаты могут отличаться в зависимости от индивидуальных условий, исходных данных и применяемых стандартов. Мы не гарантируем полноту, точность или актуальность приведённых расчётов.
Профессиональные решения — медицинские, финансовые, инженерные — должны приниматься только после консультации с квалифицированным специалистом. Не используйте автоматический расчёт как единственное основание для важных решений.
Ограничение ответственности. Авторы и разработчики сервиса не несут ответственности за прямой или косвенный ущерб, возникший из-за использования данных расчётов. Пользователь принимает на себя всю ответственность за интерпретацию результатов.
Похожие калькуляторы
Генератор Cron-выражений
Визуальный конструктор cron-расписаний с переводом на русский язык. Создайте cron-выражение для планировщика задач Linux, настройте расписание и посмотрите ближайшие запуски.
/generator-cronКонвертер Unix Timestamp ↔ дата
Онлайн конвертер Unix Timestamp в дату и обратно. Текущий Unix-таймстемп, конвертация с учётом часовых поясов России, форматы ISO 8601 и RFC 2822.
/konverter-unix-timestampYAML валидатор и форматтер
Онлайн проверка и форматирование YAML-файлов. Валидация синтаксиса, конвертация YAML ↔ JSON, подсветка ошибок с номерами строк.
/yaml-validatorКалькулятор размера Docker-образа
Оценка размера Docker-образа по базовому образу и зависимостям. Сравнение base images, советы по оптимизации и multi-stage сборке.
/razmer-docker-obrazaКалькулятор контейнеров (Docker)
Расчёты контейнеров: ресурсы, образы, Docker Compose, реестр, оркестрация, стоимость
/container-calculatorКалькулятор подсетей CIDR/IP
Онлайн калькулятор подсетей IPv4. Расчёт маски подсети, диапазона IP-адресов, количества хостов по CIDR-нотации. Бесплатный инструмент для сетевых инженеров.
/kalkulyator-podsetej-cidrКалькулятор контрастности (WCAG), шрифтов и сетки
Инструменты UI/UX дизайнера. Проверка контрастности цветов (WCAG AA/AAA), расчет модульной сетки и подбор типографической шкалы.
/contrast-gridКалькулятор микросервисной архитектуры
Расчёты микросервисов: ресурсы, сеть, надёжность, API Gateway, очереди, стоимость
/microservices-calculatorКалькулятор балансировки нагрузки
Расчёты балансировки: пропускная способность, бэкенды, SSL/TLS, алгоритмы, HA, стоимость
/load-balancer-calculatorDevOps калькулятор: DORA-метрики, SLA, CI/CD пайплайн, мониторинг
Комплексный DevOps калькулятор. DORA-метрики (deployment frequency, lead time, MTTR, change failure rate), расчёт SLA и доступности (uptime 99.9–99.999%), размер инфраструктуры (CPU/RAM/диск), мониторинг и алертинг, оптимизация облачных затрат (Reserved vs Spot), анализ CI/CD пайплайна.
/devops-calculatorCI/CD калькулятор: пайплайн, кэш, тесты, раннеры, деплой
Комплексный CI/CD калькулятор: оптимизация пайплайна (критический путь, параллелизация), кэш сборки (hit ratio, ROI), анализ тестов (flaky, шардирование), артефакты (Docker, npm), раннеры (автоскейлинг) и стратегии деплоя (Blue-Green, Canary, Rolling).
/ci-cd-calculatorКалькулятор технического долга: объём, SQALE, рефакторинг
Комплексный калькулятор технического долга: оценка объёма в часах и рублях, расчёт процентной ставки (стоимость бездействия), матрица приоритизации (impact vs effort), метрики качества кода (цикломатическая сложность, дупликация, покрытие тестами), план рефакторинга по спринтам, SQALE рейтинг A-E.
/technical-debt-calculatorГенератор Cubic Bezier (CSS transition)
Интерактивный генератор кривых Безье для CSS анимаций. Визуальная настройка плавности переходов, пресеты (ease, linear) и копирование кода.
/cubic-bezierКалькулятор код-ревью: время, размер PR, дефекты, нагрузка
Комплексный калькулятор код-ревью: оценка времени проверки кода, анализ размера PR (XS/S/M/L/XL), покрытие ревью и bus factor, плотность дефектов и escape rate, нагрузка команды ревьюеров, метрики качества (churn, rework, first-pass yield).
/code-review-calculatorКалькулятор теории цвета: гармония, конвертер, палитры, смешивание, дальтонизм
Комплексный инструмент для работы с цветом: цветовые гармонии (комплементарная, аналогичная, триадная, тетрадная), конвертер HEX/RGB/HSL/HSV/CMYK, генератор палитр (монохроматическая, shades, tints, tones), смешивание цветов (аддитивное/субтрактивное), симулятор дальтонизма и анализ цветовой температуры.
/color-theory-calculator