Что делает инструмент
Kогда нужно перенести статью с сайта в свою базу знаний (Notion / Obsidian) или в GitHub repo, html-копия неудобна — слишком много стилей и тегов. Markdown — компактный, читаемый текстовый формат, идеален для архивирования и редактирования.
Этот инструмент использует Turndown — стандарт де-факто для конвертации HTML → Markdown в JS. Сохраняет семантику (заголовки, списки, ссылки, цитаты, таблицы), отбрасывает «шум» (inline-стили, классы, кастомные атрибуты).
Сценарии использования
- Импорт статьи в Notion/Obsidian. Скопируйте HTML из DevTools → конвертация → вставка в базу знаний.
- Перенос блога. Со старого WordPress / Tilda / Битрикс на Hugo / Jekyll / Astro. Экспорт в HTML → Markdown → импорт в новый движок.
- Документация. Скопировал HTML с веб-API-документации → Markdown → сохранил в GitHub Wiki.
- Очистка HTML. Удалить inline-стили, скрипты, лишние теги. Markdown их игнорирует — получаете чистый текст.
- Цитирование. Цитата из веб-статьи → Markdown → вставка в свой блог-пост с правильной разметкой.
- RSS-агрегаторы. Многие принимают только Markdown.
Что не сохраняется
- Inline-стили (
style="…"). Цвет, шрифт, размер — Markdown не имеет. Жирность/курсив — через<strong>/<em>, не через style. - CSS-классы и id. Не нужны в Markdown.
- Скрипты, формы, кнопки. Markdown — для статичного контента.
- SVG inline. Большие SVG (иконки, иллюстрации) станут пустыми или пропущены.
- Сложные таблицы (merged cells, nested). Структура «уплощается».
- Web-components (custom-elements). Не понимает их семантику — пропускает или конвертирует как обычный div.
- Turndown — HTML to Markdown converter. Dom Christie. github.com/mixmark-io/turndown. 2024.
- CommonMark Specification. CommonMark. spec.commonmark.org. 2024.
