Что делает инструмент
XLSX → CSV — частая задача переноса данных из Excel в системы, которые не понимают XLSX: старые БД, скрипты на Python/R/JS, REST API, инструменты analyt: Power BI, Tableau (хотя они и сами умеют XLSX, иногда CSV проще). Также CSV — стандартный формат архивирования табличных данных: текстовый, без зависимостей, читается через 50 лет любым редактором.
Особенность нашего инструмента: multi-sheet поддержка. Если в Excel несколько листов, получите несколько CSV-файлов (по одному на лист), а не только первый.
Сценарии использования
- Импорт в БД. psql
\copy, MySQLLOAD DATA INFILE, MongoDBmongoimport— все принимают CSV. - Скрипты обработки. Python pandas
read_csv()работает быстрее чемread_excel(). R, Julia, Node.js — то же самое. - API. Загрузить данные в систему через REST API — часто нужно CSV. JSON тоже работает (через инструмент JSON → CSV).
- Архивирование. CSV — открытый формат, не зависит от Microsoft. Через 30 лет XLSX может стать как .doc сейчас, CSV точно прочитается.
- Diff между версиями. Git хорошо diff-ит CSV (текстовый), плохо XLSX (бинарный). Для версионирования табличных данных в репозитории — CSV.
- Подача данных в open data порталы. data.gov.ru, datasets с Kaggle принимают CSV.
Что не сохраняется
- Формулы. Сохраняются только вычисленные значения.
=SUM(A1:A10)с результатом 100 → «100» в CSV. - Форматирование. Жирный/курсив/цвета/рамки — нет в CSV.
- Объединённые ячейки. «Уплощаются» — значение только в верхней-левой, остальные пустые.
- Графики, картинки, sparklines. Не имеют CSV-эквивалента.
- Фильтры, условное форматирование, validation rules. Только данные.
- Несколько типов данных в одной колонке. CSV — текст, всё интерпретируется при парсинге обратно.
- SheetJS (xlsx) — comprehensive Excel parser. SheetJS LLC. sheetjs.com. 2024.
- OOXML SpreadsheetML. ECMA-376. ecma-international.org. 2016.
- RFC 4180 — CSV format. IETF. rfc-editor.org/rfc/rfc4180. 2005.
