Что делает инструмент
Cеминальный сценарий: получили статью / спецификацию / документацию в Word, нужно опубликовать в GitHub Wiki / Notion / Obsidian / Hugo. Эти платформы используют Markdown — текстовый формат с минимальной разметкой (# для заголовков, - для списков, [text](url) для ссылок).
Этот инструмент берёт ваш .docx, парсит OOXML-структуру через библиотеку mammoth, и возвращает чистый Markdown. Всё в браузере — файл не уходит на сервер.
Философия mammoth
Mammoth не пытается воспроизвести Word: размеры шрифтов, межстрочные интервалы, поля. Вместо этого она извлекает семантику: что является заголовком, что списком, что цитатой. Это правильный подход для Markdown — там форматирование минимально, важна структура.
The aim is not to perfectly recreate the original Word document, but to extract the meaningful content into a clean, editable Markdown form.— Mike Williamson, автор mammoth
Если вам нужен точный визуальный аналог Word — используйте «DOCX → PDF» через печать (другой инструмент). Markdown — для контентной работы, не дизайна.
Когда использовать
- GitHub README.md. Получили описание проекта в Word — конвертировать в Markdown для коммита в репозиторий.
- Notion / Obsidian импорт. Перенос документации из Word в современную базу знаний.
- Hugo / Jekyll / Astro. Static site generators ожидают Markdown с frontmatter. Mammoth даёт чистый Markdown без frontmatter — добавляете руками.
- Документация API. Команда пишет в Word, тех-писатель публикует в GitLab Wiki / Confluence / Docusaurus.
- Блоги. Большинство современных блог-движков (Ghost, WordPress с плагинами, Substack — частично) поддерживают Markdown.
- Архивирование. Markdown — текстовый, читается через 50 лет любым редактором. .docx завтра может быть нечитаем.
- mammoth.js — DOCX to HTML/Markdown converter. Mike Williamson. github.com/mwilliamson/mammoth.js. 2024.
- OOXML Specification (ECMA-376). ECMA International. ecma-international.org. 2016.
- CommonMark Specification. CommonMark. commonmark.org. 2024.
