Data Compression Tools v1.0

Калькулятор сжатия данных

Шесть профессиональных инструментов для анализа компрессии: коэффициент сжатия, сравнение алгоритмов, экономия трафика, энтропия Шеннона, оценка архивов и веб-оптимизация.

6
Инструментов
Коэффициент, алгоритмы, трафик, энтропия, архивы, веб
6
Алгоритмов
Gzip, Brotli, Zstandard, LZ4, Snappy, Deflate
4
Типа данных
Текст, JSON, бинарные, изображения
3
Формата архивов
ZIP (Deflate), TAR.GZ (Gzip), 7z (LZMA2)

Сжатие данных: основы

Компрессия данных позволяет уменьшить объём хранимой и передаваемой информации. От веб-серверов до архивов - сжатие экономит терабайты трафика и дисковое пространство.

~

Без потерь (Lossless)

Gzip, Brotli, Zstd, LZ4 и Deflate - алгоритмы сжатия без потерь. Исходные данные полностью восстанавливаются при распаковке. Используются для текстов, кода, JSON, архивов и веб-ресурсов.

@

Энтропия Шеннона

Энтропия определяет теоретический предел сжатия. Чем меньше энтропия (больше повторений), тем лучше данные сжимаются. Случайные данные имеют максимальную энтропию и практически не сжимаются.

!

HTTP-компрессия

Современные веб-серверы (Nginx, Apache) поддерживают Content-Encoding: gzip и br (Brotli). Brotli обеспечивает на 15-25% лучшее сжатие для веб-ресурсов (HTML, CSS, JS), чем gzip.

Возможности калькулятора

Профессиональные инструменты для анализа компрессии данных: от теоретических основ до практической оптимизации.

~

Коэффициент сжатия

Рассчитайте коэффициент компрессии, процент экономии и освобождённое пространство. Поддержка байтов, КБ, МБ, ГБ.

@

Сравнение алгоритмов

Таблица сравнения 6 алгоритмов: gzip, brotli, zstd, lz4, snappy, deflate. Типичные коэффициенты для текста, JSON, бинарных данных и изображений.

#

Экономия трафика

Расчёт экономии при передаче данных: время загрузки, месячный и годовой объём трафика, финансовая экономия на разных скоростях сети.

%

Энтропия Шеннона

Анализ частотного распределения символов и расчёт информационной энтропии. Определение теоретического предела сжатия для любого текста.

!

Размер архивов

Оценка размера ZIP, TAR.GZ и 7z архивов для разных типов файлов. Время сжатия и распаковки, сравнение форматов.

*

Веб-сжатие

Сравнение Content-Encoding: gzip vs br (Brotli) для веб-ресурсов. Расчёт месячного трафика и экономии для сайтов любого масштаба.

Алгоритмы сжатия/ как это работает

Все алгоритмы сжатия без потерь основаны на двух принципах: устранение избыточности (повторяющиеся паттерны) и энтропийное кодирование (частые символы получают короткие коды).

LZ77 / LZ78 (основа Gzip, Deflate)

Алгоритмы семейства Lempel-Ziv ищут повторяющиеся подстроки в скользящем окне и заменяют их ссылками (смещение, длина). Deflate комбинирует LZ77 с кодированием Хаффмана. Gzip = Deflate + заголовки + контрольная сумма CRC32.

ABCABCABC -> ABC(3,3)(3,6)
Gzip: LZ77 + Huffman + CRC32
Deflate window: 32 КБ (стандарт)

Brotli (Google, RFC 7932)

Brotli использует LZ77 с окном до 16 МБ, контекстное моделирование и статический словарь из 13 000+ слов (HTML-теги, CSS-свойства, JS-ключевые слова). Даёт на 15-25% лучшее сжатие для веб-контента, чем gzip.

Content-Encoding: br
Уровни: 0 (быстрый) - 11 (максимум)
Словарь: 13 504 слова (HTML/CSS/JS)

Zstandard (zstd)

Zstd сочетает LZ77 с Finite State Entropy (tANS) кодированием. Отличается высокой скоростью при хорошем сжатии. Поддерживает словари для малых данных, потоковое сжатие и 22 уровня компрессии. Используется в ядре Linux, базах данных и хранилищах.

zstd -19 data.bin -o data.zst
Уровни: 1 (быстро, ~500 МБ/с) - 22 (макс.)
Распаковка: ~1700 МБ/с (всегда быстрая)

LZ4 / Snappy: Алгоритмы для реального времени. LZ4 (Yann Collet) сжимает до 500 МБ/с, распаковывает до 1.8 ГБ/с. Snappy (Google) оптимизирован для BigTable и MapReduce. Компрессия слабее, но скорость критична.

Nginx + Brotli в России: Для российских сайтов рекомендуется включить brotli_static on для предварительно сжатых ресурсов и gzip как fallback. Yandex, VK и Mail.ru активно используют Brotli для веб-ресурсов.

ЧАСТЫЕ ВОПРОСЫ

Часто задаваемые вопросы

Brotli (Content-Encoding: br) для статических ресурсов - он даёт на 15-25% лучшее сжатие, чем gzip. Для динамического контента используйте gzip или zstd, так как Brotli на высоких уровнях медленнее. В Nginx: brotli_static on для прекомпрессии, gzip как fallback.
JPEG и PNG уже содержат встроенную компрессию. JPEG использует DCT + Huffman, PNG - Deflate. Повторное сжатие даёт прирост 1-5%. Для уменьшения изображений лучше конвертировать в WebP/AVIF или уменьшить разрешение.
Энтропия Шеннона измеряет среднее количество бит информации на символ. Чем ниже энтропия, тем больше в данных повторений и тем лучше они сжимаются. Для ASCII текста типичная энтропия 4-5 бит/символ (из 8 максимальных), что даёт теоретический предел сжатия ~1.6-2:1.
Zstd превосходит gzip практически по всем параметрам: сжатие на 10-20% лучше при одинаковой скорости, а на одинаковом уровне сжатия Zstd в 3-5 раз быстрее. Распаковка Zstd в 2-3 раза быстрее gzip. Zstd поддерживается в HTTP (Content-Encoding: zstd, RFC 8878) и активно внедряется.
7z (LZMA2) обеспечивает лучшее сжатие, чем ZIP (Deflate): на 20-50% меньше размер архива для текстовых данных. Но 7z медленнее при сжатии (в 3-4 раза) и не поддерживается нативно во многих ОС. ZIP универсальнее и быстрее. Для максимального сжатия - 7z, для совместимости - ZIP.
В среднем gzip уменьшает HTML/CSS/JS на 60-80%, JSON на 80-85%. Для сайта с 100K просмотров в месяц и 2 МБ ресурсов на страницу это экономит ~120-160 ГБ трафика ежемесячно. Brotli добавляет ещё 15-25% экономии сверху. Включение - одна строка в конфиге Nginx.
LZ4 обычно лучше: выше коэффициент сжатия (2.1:1 vs 1.8:1 для текста) при сопоставимой скорости. LZ4 используется в ClickHouse, RocksDB, Kafka. Snappy - в Cassandra и BigTable. Оба обеспечивают скорость распаковки >1 ГБ/с, что критично для баз данных.
Нет, повторное сжатие почти не даёт результата и может даже увеличить размер из-за метаданных. Хорошо сжатые данные имеют энтропию, близкую к максимуму. Исключение: можно сменить алгоритм (например, с gzip на zstd) для лучшего результата, но это перекомпрессия, а не дополнительное сжатие.
Лиана Арифметова
АВТОРverifiedред. calcal.ru

Лиана Арифметова

Создатель и главный редактор

Миссия: демократизировать сложные расчёты. Превратить страх перед числами в ясность и контроль. Девиз: «Любая повторяющаяся задача заслуживает своего калькулятора».

Mathematical Engineering · МФТИ · редактирует каталог с 2012 года

Был ли этот калькулятор полезен?

ОТКАЗ ОТ ОТВЕТСТВЕННОСТИ

Инструмент справочный — не заменяет эксперта

Только для информационных целей. Все расчёты, результаты и данные, предоставляемые инструментом, носят исключительно ознакомительный и справочный характер. Они не являются профессиональной консультацией — медицинской, юридической, финансовой, инженерной или иной.

Точность результатов. Калькулятор основан на общепринятых формулах и методиках, однако фактические результаты могут отличаться в зависимости от индивидуальных условий, исходных данных и применяемых стандартов. Мы не гарантируем полноту, точность или актуальность приведённых расчётов.

Профессиональные решения — медицинские, финансовые, инженерные — должны приниматься только после консультации с квалифицированным специалистом. Не используйте автоматический расчёт как единственное основание для важных решений.

Ограничение ответственности. Авторы и разработчики сервиса не несут ответственности за прямой или косвенный ущерб, возникший из-за использования данных расчётов. Пользователь принимает на себя всю ответственность за интерпретацию результатов.

СМЕЖНЫЕ ИНСТРУМЕНТЫ

Похожие калькуляторы

15

Калькулятор код-ревью: время, размер PR, дефекты, нагрузка

Комплексный калькулятор код-ревью: оценка времени проверки кода, анализ размера PR (XS/S/M/L/XL), покрытие ревью и bus factor, плотность дефектов и escape rate, нагрузка команды ревьюеров, метрики качества (churn, rework, first-pass yield).

/code-review-calculator

Генератор Cron выражений (Crontab)

Создать и расшифровать Cron выражения онлайн. Удобный генератор расписания для скриптов и серверов. Перевод на понятный язык.

/cron-expression-generator

Инструменты разработчика: Base64, URL, HTML, JSON, YAML

Набор инструментов для веб-разработки: кодирование Base64, URL encode/decode, экранирование HTML, форматтер JSON и конвертер YAML.

/dev-tools-calculator

Парсер регулярных выражений (Regex Tester)

Онлайн тестер регулярных выражений JS. Проверка Regex паттернов, подсветка синтаксиса, группы захвата и шпаргалка.

/regex-tester

Калькулятор технического долга: объём, SQALE, рефакторинг

Комплексный калькулятор технического долга: оценка объёма в часах и рублях, расчёт процентной ставки (стоимость бездействия), матрица приоритизации (impact vs effort), метрики качества кода (цикломатическая сложность, дупликация, покрытие тестами), план рефакторинга по спринтам, SQALE рейтинг A-E.

/technical-debt-calculator

Unix Timestamp Converter (перевод времени)

Конвертер Unix Timestamp в дату и обратно. Текущее время Unix, live-режим, форматы ISO 8601, UTC.

/unix-timestamp-converter

Agile Sprint калькулятор: ёмкость спринта, velocity, burndown, оценка задач

Комплексный калькулятор для Agile/Scrum команд. Расчёт ёмкости спринта (capacity), прогноз velocity, burndown-диаграмма, story point оценка по Фибоначчи, планирование релизов (MoSCoW), метрики команды (lead time, cycle time, throughput, WIP, flow efficiency).

/agile-sprint-calculator

Chmod калькулятор (права доступа Unix)

Онлайн калькулятор chmod. Конвертация прав доступа (rwx) в числовой код (777, 755). Генератор команд для Linux.

/chmod-calculator

Объединить PDF онлайн — без загрузки на сервер

Склейка PDF в браузере через pdf-lib. До 20 файлов, до 50 МБ каждый. Локально, без отправки на сервер (152-ФЗ).

/obyedinit-pdf-onlajn-besplatno

Сжать PDF онлайн — уменьшить размер локально

Сжатие PDF в браузере без потери качества. 3 уровня (object streams, удаление метаданных). До 50 МБ. Через pdf-lib, локально.

/szhat-pdf-onlajn-umenshit-razmer

Разделить PDF на страницы — извлечь нужные онлайн

Разделение PDF на страницы локально: каждая страница отдельным файлом, диапазон или группами. Через pdf-lib, без отправки на сервер.

/razdelit-pdf-na-stranicy-onlajn

JPG в PDF — конвертер с объединением

Конвертация JPG/PNG в PDF в браузере: до 30 картинок в один документ. Форматы A4/A3/Letter или подгонка под изображение.

/jpg-v-pdf-konverter

Повернуть страницы PDF онлайн

Поворот всех или указанных страниц PDF на 90/180/270° за миллисекунды. Lossless. Через pdf-lib, без отправки на сервер.

/povernut-pdf-stranitsy-onlajn

Водяной знак на PDF онлайн (кириллица)

Нанесение текстового знака («КОНФИДЕНЦИАЛЬНО», «ЧЕРНОВИК») на все страницы PDF. Поддержка русского текста через Canvas. 4 положения, регулировка прозрачности.

/dobavit-vodyanoj-znak-na-pdf

Нумерация страниц PDF онлайн

Проставьте номера страниц PDF в браузере: 4 формата, 6 положений, пропуск титульной, кастомный старт. Поддержка кириллицы. Через pdf-lib + Canvas.

/numerovat-stranitsy-pdf-onlajn