Конвертер кодировок
текста
Что такое кодировки текста
Кодировка текста определяет, какому символу соответствует каждый байт в файле. Когда текст открывается не в той кодировке, в которой он был сохранен, вместо букв появляются нечитаемые символы. В русском интернете это явление получило название «кракозябры» (в международной терминологии — mojibake).
Однобайтовые кодировки
Windows-1251, KOI8-R, CP866 и ISO-8859-5 используют один байт (0-255) на символ. Каждая может представить не более 256 символов, поэтому они заточены под конкретный язык. Для русского создали несколько несовместимых кодировок, что и породило проблему кракозябр.
Unicode и UTF-8
Unicode решил проблему, присвоив уникальный номер каждому символу всех языков мира (более 150 000 символов). UTF-8 — самый популярный способ записи Unicode: латиница занимает 1 байт, кириллица — 2 байта, иероглифы — 3. Это стандарт современного веба.
Почему возникают кракозябры
Кракозябры появляются, когда программа читает файл не в той кодировке. Байт 0xCF в UTF-8 — часть двухбайтовой буквы «П», а в Windows-1251 — самостоятельный символ «П». Если прочесть UTF-8 текст как Windows-1251, каждая русская буква превращается в два непонятных символа.
Возможности конвертера
Полный набор инструментов для работы с кодировками текста, востребованный разработчиками, вебмастерами и системными администраторами.
Исправление кракозябр
Автоматическое определение и исправление типичных искажений русского текста. Пробует все комбинации кодировок и показывает наиболее вероятный результат с процентом уверенности.
Миграция баз данных
При переносе данных из старых систем (MySQL в latin1, legacy-приложения на Windows-1251) текст часто повреждается. Конвертер помогает понять, какая цепочка перекодировок произошла, и восстановить данные.
Работа с legacy-системами
Многие серверы 1С, банковские системы и государственные порталы до сих пор используют Windows-1251 или KOI8-R. Конвертер помогает подготовить данные для обмена между современными и устаревшими системами.
Конвертация файлов
Субтитры в SRT, файлы CSV из Excel, конфигурационные файлы — часто приходят в неожиданной кодировке. Вставьте содержимое в конвертер и получите текст в нужной кодировке за секунду.
Проблемы с email
Письма с кракозябрами — классическая проблема почтовых серверов. Конвертер поможет прочитать такое письмо, определив исходную кодировку отправителя и применив правильную перекодировку.
Hex-дамп и анализ
Просмотр байтового представления текста в каждой кодировке. Незаменимо для отладки проблем с кодировками в протоколах, API-ответах и бинарных файлах. Сравнивайте размер текста в разных кодировках.
Сравнение кодировок/ таблица совместимости
Все пять кодировок поддерживают базовую латиницу (ASCII, байты 0x00-0x7F) одинаково. Различия начинаются в верхней половине таблицы (0x80-0xFF), где размещены кириллица и специальные символы.
| Характеристика | UTF-8 | Win-1251 | KOI8-R | ISO-8859-5 | CP866 |
|---|---|---|---|---|---|
| Байт на кириллицу | 2 | 1 | 1 | 1 | 1 |
| Максимум символов | 1.1M+ | 256 | 256 | 256 | 256 |
| Украинские буквы | Да | Да | Нет | Да | Частично |
| Псевдографика | Да | Нет | Да | Нет | Да |
| Год создания | 1993 | 1996 | 1993 | 1988 | 1986 |
| Применение сегодня | Везде | Legacy | Редко | Редко | DOS |
| Совместимость с ASCII | Полная | Полная | Полная | Полная | Полная |
Рекомендация: всегда используйте UTF-8 для новых проектов. Это стандарт W3C, WHATWG и де-факто стандарт всех современных веб-платформ.
Факт: по данным W3Techs, более 98% всех сайтов в мире используют UTF-8. Для русскоязычных сайтов этот показатель превышает 95%.
История кодировок кириллицы
Путь от хаоса несовместимых кодировок к единому стандарту Unicode занял почти 30 лет. За это время русскоязычный интернет пережил настоящую «войну кодировок».
CP866 и эпоха DOS
Кодировка CP866 была создана IBM для MS-DOS. Она включала кириллицу и символы псевдографики для рисования рамок и таблиц в текстовом режиме. На ней работали Norton Commander, Lexicon, а позже — ранние BBS-сети в России. CP866 до сих пор используется в командной строке Windows.
KOI8-R и UNIX-мир
KOI8-R стала стандартом для русскоязычных UNIX-систем и раннего интернета (RFC 1489). Её главное достоинство — при потере старшего бита (частая проблема 7-битных каналов связи) кириллица превращалась в читаемую транслитерацию: «П» (0xF0) становилась «p» (0x70). Сети FIDO и Relcom активно использовали KOI8-R.
Windows-1251 и эра Windows
С массовым распространением Windows 95/98 в России кодировка Windows-1251 (CP1251) стала доминировать. Буквы в ней расположены в алфавитном порядке, что удобно для сортировки. К началу 2000-х большинство русскоязычных сайтов использовали именно Windows-1251. «Войны кодировок» между KOI8-R и Win-1251 были повседневной реальностью веб-мастеров.
Переход на UTF-8
Постепенный переход на UTF-8 начался с международных проектов. Русская Википедия перешла на UTF-8 в 2005 году, LiveJournal — в 2006. Gmail изначально использовал UTF-8. К 2010 году большинство новых сайтов создавались уже в UTF-8. Однако старые системы, базы данных и почтовые серверы продолжают хранить данные в Windows-1251, создавая проблемы при интеграции.
UTF-8 как стандарт
Сегодня UTF-8 — абсолютный стандарт. HTML5 рекомендует его по умолчанию. Современные базы данных (PostgreSQL, MySQL 8+) используют utf8mb4. Однако проблемы с кодировками не исчезли полностью: старые дампы, импорт из 1С, электронные документы и субтитры к фильмам регулярно требуют перекодировки.
Как избежать проблем с кодировками
Практические советы для разработчиков, вебмастеров и всех, кто работает с текстовыми данными.
1Указывайте кодировку явно
Всегда добавляйте <meta charset="UTF-8"> в HTML, Content-Type: text/html; charset=utf-8 в HTTP-заголовках, и BOM-метку при необходимости. Не полагайтесь на автоопределение браузера — оно часто ошибается.
2Настройте базу данных правильно
В MySQL используйте utf8mb4 (не utf8, который не поддерживает 4-байтовые символы). В PostgreSQL — стандартный UTF-8. Убедитесь, что соединение к базе данных также использует UTF-8 (SET NAMES utf8mb4).
3Проверяйте кодировку файлов
Используйте утилиты вроде file (Linux/macOS) или Notepad++ (Windows) для определения текущей кодировки файла перед обработкой. В hex-редакторе UTF-8 кириллица начинается с байтов 0xD0-0xD1.
4Не перекодируйте дважды
Типичная ошибка — конвертировать текст, который уже в нужной кодировке. Двойная UTF-8 конвертация (UTF-8 прочитан как Windows-1251, затем снова сохранён в UTF-8) создаёт «двойные кракозябры», исправить которые значительно сложнее.
5Единая кодировка в проекте
Настройте IDE, систему контроля версий (git) и CI/CD на использование UTF-8 без BOM. В .editorconfig укажите charset = utf-8. Это предотвратит случайное создание файлов в других кодировках.
6Тестируйте на реальных данных
При импорте данных из внешних источников (CSV, XML, API) всегда проверяйте кириллицу в первую очередь. Используйте тестовые строки с буквами «ё», «Ё», «щ», «ъ» — они чаще всего страдают от некорректной конвертации.
Как пользоваться конвертером
Простая инструкция для двух режимов работы: конвертация кодировок и исправление кракозябр.
Выберите режим
Конвертация — для перекодировки текста из одной кодировки в другую. Исправить кракозябры — для восстановления повреждённого текста.
Введите текст
Вставьте текст в поле ввода. В режиме конвертации — обычный читаемый текст. В режиме исправления — текст с кракозябрами.
Укажите кодировки
В режиме конвертации выберите исходную и целевую кодировки из списка. В режиме исправления кодировки определяются автоматически.
Скопируйте результат
Нажмите кнопку «Копировать» рядом с результатом. Включите hex-дамп для просмотра байтового представления текста.
Часто задаваемые вопросы

Лиана Арифметова
Миссия: Демократизировать сложные расчеты. Превратить страх перед числами в ясность и контроль. Девиз: «Любая повторяющаяся задача заслуживает своего калькулятора».
Отказ от ответственности
Только для информационных целей. Все расчёты, результаты и данные, предоставляемые данным инструментом, носят исключительно ознакомительный и справочный характер. Они не являются профессиональной консультацией — медицинской, юридической, финансовой, инженерной или иной.
Точность результатов. Калькулятор основан на общепринятых формулах и методиках, однако фактические результаты могут отличаться в зависимости от индивидуальных условий, исходных данных и применяемых стандартов. Мы не гарантируем полноту, точность или актуальность приведённых расчётов.
Медицинские, финансовые и профессиональные решения должны приниматься исключительно на основании консультации с квалифицированными специалистами — врачом, финансовым советником, инженером или другим профессионалом в соответствующей области. Не используйте результаты данного инструмента как единственное основание для принятия важных решений.
Ограничение ответственности. Авторы и разработчики сервиса не несут никакой ответственности за прямой или косвенный ущерб, возникший в результате использования данных расчётов. Пользователь принимает на себя всю ответственность за интерпретацию и применение полученных результатов.
Похожие инструменты
Строительный калькулятор
Расчет бетона, кирпича, плитки, крыши и лестниц. Универсальный калькулятор для ремонта и стройки.
Калькулятор стоимости сотрудника
Зарплата, НДФЛ, страховые взносы ПФР/ФСС/ФОМС, отпускные, больничные. Для работодателей России.
Стоматологический калькулятор: КПУ, OHI-S, CPI, анестезия и протезирование
Стоматологические расчёты онлайн: индекс КПУ (DMFT), гигиена OHI-S, пародонтальный CPI, доза анестетика, стоимость протезирования, IOTN.
Калькулятор интернет-тарифов (сравнение провайдеров по скорости и цене)
Подберите оптимальный интернет-тариф. Сравнение провайдеров (Ростелеком, МТС, Билайн, Дом.ру) по скорости, цене и технологии подключения (GPON, FTTB, xDSL, 4G/5G).
Калькулятор зелёного строительства: CO₂, вода, GREEN ZOOM
Расчёт экологических показателей здания. Углеродный след, водоэффективность, баллы GREEN ZOOM / LEED, анализ жизненного цикла, зелёная кровля.
Валидатор IBAN
Проверка международного банковского номера IBAN по алгоритму ISO 13616. Расшифровка структуры, страна, банк.
Калькулятор тригонометрии
Вычисление sin, cos, tan, cot, sec, csc. Решение треугольников, радианы/градусы, тригонометрические уравнения.
Калькулятор текстильного производства
Расчёты текстиля: пряжа, ткань, раскрой, крашение, себестоимость, качество
Калькулятор армирования: площадь, анкеровка, хомуты, спецификация
Расчёт арматуры: площадь As, подбор стержней, длина анкеровки и перехлёста, поперечная арматура, масса и стоимость.
Калькулятор биостатистики
Анализ выживаемости Каплана-Мейера, ROC-кривая, Бланда-Альтмана, каппа Коэна, мощность исследования, мета-анализ.
Счётчик символов и слов онлайн
Символы с пробелами и без, слова, предложения, время чтения. Для SEO, соцсетей и копирайтинга.
Калькулятор контроля качества
Расчёты контроля качества: контрольные карты, Cp/Cpk, выборочный контроль, Парето, GR&R, стоимость
Калькулятор дебиторской задолженности
Рассчитайте оборачиваемость дебиторской задолженности, DSO, резерв по сомнительным долгам и проведите aging-анализ просрочки.
Калькулятор транспортных потоков: интенсивность, пропускная способность
Расчёт интенсивности и пропускной способности дороги, уровня обслуживания, задержек на перекрёстке и длины очереди.
Калькулятор эмбриологии
Оценка эмбрионов по Гарднеру, гестационный возраст, прогноз ЭКО, рост фолликулов, морфология сперматозоидов, криоконсервация.