Парсер Jaomix — FB2 & TXT

Извлекает главы с jaomix.ru и сохраняет их в FB2 или TXT с очисткой

作者
Идзуми Сэна
今日安裝
0
安裝總數
5
評價
1 0 1
版本
0.2
建立日期
2025-10-05
更新日期
2025-10-11
尺寸
19.6 KB
授權條款
未知
腳本執行於

Парсер Jaomix — FB2 & TXT

Назначение: Скачивание с сайта jaomix.ru в форматах FB2 и TXT.


📘 Возможности

  • Извлечение всех глав ранобэ с сайта jaomix.ru.
  • Поддержка экспорта в FB2 (электронная книга) и TXT (текстовый файл).
  • Настройка диапазона скачиваемых глав.
  • Возможность очищать текст от мусора (рекламы, футеров, комментариев и т. д.).
  • Поддержка декодирования скрытых глав (защищённых от копирования).
  • Возможность добавления задержки между запросами (чтобы избежать блокировки).
  • Встроенная панель управления на странице.

⚙️ Как использовать

  1. Откройте страницу любого ранобэ или отдельной главы.
  2. Справа появится плавающая панель:
   📗 Jaomix Downloader
   [Диапазон глав: 1 – 50]
   [Задержка (мс): 500]
   ☑ Очищать текст от мусора  
   ☑ Только секции (FB2)  
   ☑ Только текст (TXT)  
   [Скачать FB2]  
   [Скачать TXT]  
   [Прогресс: ▓▓▓░░ 60%]
  1. Выберите диапазон глав для скачивания (например, с 1 по 20).
  2. Установите нужные опции:
  • Очищать текст от мусора — удаляет рекламу, комменты и пустые блоки.
  • Только секции (FB2) — экспортирует только <section>-блоки без полного шаблона книги.
  • Только текст (TXT) — сохраняет без заголовков и аннотации.
  1. Укажите задержку между запросами (в миллисекундах), если сайт блокирует частые обращения.
  2. Нажмите нужную кнопку — FB2 или TXT.
  3. Дождитесь завершения процесса. Индикатор покажет прогресс.
  4. Готовый файл автоматически сохранится.

🧰 Интерфейс

Панель интерфейса добавляется автоматически при загрузке страницы. Она выглядит аккуратно и не мешает чтению:

Элемент Назначение
Диапазон глав Задает начальную и конечную главу для загрузки
Задержка (мс) Интервал между запросами (для обхода антиспама)
Очищать текст от мусора Вырезает рекламу, блоки комментариев и пустые строки
Только секции (FB2) Генерирует только секции без обёртки XML
Только текст (TXT) Сохраняет чистый текст без заголовков
Прогресс-бар Показывает процент загруженных глав

💡 Принцип работы

  1. Определяет, где вы находитесь — на странице главы или странице книги.
  2. При необходимости загружает главную страницу книги для сбора списка всех глав.
  3. Извлекает информацию:
  • Название произведения
  • Имя автора
  • Аннотацию
  • Полный список глав (включая ссылки и заголовки)

    1. После запуска загрузки:
  • Последовательно скачивает главы (с учётом задержки).

  • Распознаёт и декодирует защищённые (base64) тексты.

  • Очищает контент, если включена соответствующая опция.

  • Собирает итоговый текст и формирует файл .fb2 или .txt.

  • Автоматически сохраняет результат.


🧹 Очистка текста

При активной опции «Очищать текст от мусора» удаляются:

  • Блоки комментариев, капчи, рекламные вставки;
  • Ссылки «Убрать рекламу» и подобные фразы;
  • Повторные заголовки глав в начале текста;
  • Пустые <p> и избыточные <br>.

Текст при этом сохраняет разметку абзацев.


🧾 Форматы

FB2

  • Полностью совместим с читалками (CoolReader, FBReader, Bookmate и др.).
  • Формирует XML с тегами <description>, <body>, <section> и <title>.
  • При выборе “Только секции” создаёт фрагменты <section> без заголовка документа.

TXT

  • Простой читаемый формат.
  • Содержит заголовки глав и автора (если не выбрана опция “Только текст”).
  • Абзацы разделены пустыми строками.

📄 Технические детали

  • Скачивание глав выполняется через GM_xmlhttpRequest.
  • Очистка и парсинг HTML выполняются с помощью DOMParser.
  • Генерация файлов — стандартными средствами JavaScript (Blob, URL.createObjectURL).
  • Панель интерфейса стилизована через GM_addStyle.