erkannte Dubletten automatisch verschieben
Autor: Eric Beuchel · Stand: 09.10.2025
Kategorie: Digitales Archiv · Automatisierung · Debian · Docker
Grundidee
Paperless-ngx erkennt beim Import, wenn eine Datei bereits existiert („duplicate“).
Standardmäßig bleibt die Datei im Eingangsordner /consume/
.
Der hier dokumentierte Workflow ergänzt einen schlanken Hintergrundprozess,
der das Logfile überwacht und alle als Dublette erkannten Dateien automatisch
in einen separaten Ordner verschiebt.
Ziel des Workflows
- Saubere Trennung zwischen neuen und erkannten Dubletten.
- Keine Löschung: jede Datei bleibt erhalten, wird aber verschoben.
- Volle Nachvollziehbarkeit über ein eigenes Logfile.
Ordnerstruktur
/Daten/paperless-data/consume/ → regulärer Import
/Daten/paperless-data/duplicates/ → erkannte Dubletten
/Daten/paperless-data/logs/ → Logfiles und Protokolle
Ablauf
1. Paperless verarbeitet alle Dateien im /consume/
-Ordner.
2. Wird im Log ein Hinweis „duplicate“ erkannt, reagiert der Hintergrundprozess.
3. Die betroffene Datei wird in /duplicates/
verschoben.
4. Gleichzeitig erfolgt ein Eintrag im Logfile, z. B.:
[2025-10-09 13:42:55] Verschoben (duplicate): Rechnung_Koban.pdf → /duplicates/
5. Der reguläre Import bleibt davon unberührt.
Nutzen
- Keine Dubletten im Paperless-Archiv.
- Automatische Ablage ohne manuelles Eingreifen.
- Volle Kontrolle durch ein eigenes Logfile.
- Kein Eingriff in Paperless selbst, jederzeit rückbaubar.
Skripte auf Anfrage
Der vollständige Python-Code, die Systemd-Service-Datei und die zugehörige README
sind auf Anfrage erhältlich. Schreibe mir eine kurze E-Mail – ich sende dir das Paket zu.
Hinweis: Die Anfrage wird ausschließlich zur Beantwortung deiner E-Mail verwendet. Keine Weitergabe an Dritte.
Lizenz & Nutzung (MIT)
Dieses Projekt („Paperless-ngx Dubletten-Watcher“) wurde von
Eric Beuchel – IT & Organisation (Mötzingen) entwickelt
und steht unter der MIT License (MIT).
Kurzfassung: Frei nutzen, verändern und weitergeben – auch kommerziell –
bei Beibehaltung des Urheberhinweises.