Kleinanzeigen-Datenexport (TO LLM) & Seitennavigation 🚀

Erfasst sichtbare Inhalte und Metadaten als JSONL für LLM-Verarbeitung. Unterstützt kontinuierliches Sammeln über mehrere Seiten (persistenter Modus) und Seitennavigation mit A/D. Exportiert nur sichtbare/lesbare Daten + Anzeigen-ID.

作者
Moritz Baumeister
日安装量
0
总安装量
1
评分
0 0 0
版本
22.8 // Version angehoben für A/D Navigation immer aktiv
创建于
2025-06-07
更新于
2025-06-12
大小
35.4 KB
许可证
MIT
适用于

🤔 Was ist das Problem?

Als Entwickler, Datenanalyst oder Power-User stößt man oft an Grenzen. Man möchte nicht nur den sichtbaren Text einer Anzeige, sondern die gesamte technische Blaupause eines Elements verstehen: Wie ist es strukturiert? Welche CSS-Regeln wirken darauf? Wie lautet der exakte HTML-Code? Diese Informationen manuell aus den Entwickler-Tools zu extrahieren ist mühsam, fehleranfällig und extrem zeitaufwendig, besonders wenn man viele Anzeigen über mehrere Seiten hinweg vergleichen will.


✨ Die Lösung: Ein Automatisierungs- & Analyse-Werkzeug

Dieses UserScript ist ein professioneller Datenextraktor und Komponenten-Analysator, der für technische Tiefenanalysen und die automatisierte Datensammlung entwickelt wurde. Es verwandelt deinen Browser in ein interaktives Labor, mit dem du jede Anzeigenseite auf Kleinanzeigen mit einem Klick "sezieren" und eine extrem detaillierte, maschinenlesbare JSONL-Ausgabe erzeugen kannst – ideal für die direkte Verarbeitung durch Large Language Models (LLMs).


🚀 Die Features im Überblick

Dieses Tool geht weit über einfaches "Scraping" hinaus und bietet Funktionen für den anspruchsvollen Nutzer:

  • 🎯 Einfacher Klick für Einzeldaten: Ein kurzer Klick auf den Button kopiert sofort alle relevanten Daten der aktuellen Seite in deine Zwischenablage. Perfekt für die schnelle Analyse einer spezifischen Ergebnisseite.

  • ⚡ Kontinuierlicher Sammel-Modus (Langklick): Halte den Button gedrückt (Langklick), um den automatischen Sammel-Modus zu aktivieren. Das Skript erfasst dann selbstständig Daten von jeder neuen Seite, die Sie besuchen – ideal, um schnell Hunderte oder Tausende von Anzeigen zu sammeln, indem Sie einfach durch die Seiten navigieren. Der Status des Sammel-Modus bleibt auch über Seitenneuladen hinweg erhalten!

  • 🧠 Intelligente Daten-Extraktion: Das Skript extrahiert nicht nur Text, sondern versteht und strukturiert die Daten für dich.

    • Key-Daten: Titel, Beschreibung, Datum etc. werden sauber aufbereitet.
    • Preis-Parsing: Ein Preis wie "40 € VB" wird intelligent in {"betrag": 40, "zusatz": "VB"} zerlegt.
    • Standort-Parsing: Eine Adresse wie "58135 Hagen (65 km)" wird in {"plz": "58135", "stadt": "Hagen", "entfernung_km": 65} aufgeteilt.
  • 💻 Detaillierte technische Informationen: Jeder Datensatz enthält die volle Ladung an technischen Details – perfekt für Entwickler und die Analyse komplexer Layouts:

    • domPath: Der präzise CSS-Selektor-Pfad zum Element.
    • geometry: Exakte Position und Größe des Elements auf dem Bildschirm (x, y, width, height, inViewport).
    • css: Eine komprimierte Darstellung der relevanten, vom Standard abweichenden CSS-Stile.
    • structureTree: Eine detaillierte Baum-Ansicht der wichtigsten Kind-Elemente, um die HTML-Struktur zu verstehen.
    • rawChildrenHTML: Der komplette, komprimierte HTML-Code der Kinder des ausgewählten Elements.
  • 📋 Direkter JSONL-Export: Alle extrahierten Daten werden als perfekt formatiertes JSONL (JSON Lines) direkt in deine Zwischenablage kopiert. Dieses Format ist ideal für die sofortige Weiterverarbeitung in anderen Tools, Skripten oder für die direkte Eingabe in ein LLM, da jede Zeile ein unabhängiges JSON-Objekt ist.

  • 🕹️ Drag & Drop Interface: Der Button stört? Kein Problem! Ziehe ihn einfach an eine Stelle auf dem Bildschirm, wo er dich nicht ablenkt. Die Position wird für zukünftige Besuche gespeichert.


💡 Wie benutzt man das Tool?

  1. Button finden: Der Button (TO LLM) erscheint an der rechten Seite deines Browsers.
  2. Daten sammeln:
    • Aktuelle Seite erfassen: Klicke kurz auf den Button. Alle Daten der aktuell sichtbaren Anzeigen sowie Metadaten zur Seite werden als JSONL in die Zwischenablage kopiert.
    • Kontinuierlich sammeln: Halte den Button gedrückt, bis ein Countdown erscheint und er auf "STOP" wechselt. Nun ist der Sammel-Modus aktiv. Navigieren Sie einfach durch die Seiten (z.B. über die Paginierung oder Klicks auf Links, die zu neuen Listenansichten führen). Das Skript sammelt die Daten automatisch.
  3. Sammel-Modus beenden & Daten kopieren: Wenn der Sammel-Modus aktiv ist (Button zeigt "STOP"), klicken Sie einfach kurz darauf, um den Modus zu beenden. Alle bis dahin gesammelten Daten von allen besuchten Seiten werden gesammelt als JSONL in Ihre Zwischenablage kopiert.
  4. Analysieren: Füge die JSONL-Daten aus deiner Zwischenablage in dein bevorzugtes Analyse-Tool (z.B. VS Code, einen Online-JSONL-Viewer oder direkt in ein LLM) ein.

Dieses Werkzeug ist die ultimative Abkürzung für jeden, der tief in die technische Struktur von Kleinanzeigen eintauchen und effizient große Mengen an strukturierten Daten für LLMs oder andere Analysen sammeln will. Viel Spaß beim Analysieren! 🎉