Ordnerstruktur und Datenorganisation eines Paperless-Archivs
Warum eine klare Datenstruktur wichtig ist
Ein digitales Dokumentenarchiv besteht nicht nur aus einer Softwareinstallation. Ebenso wichtig ist eine klare und nachvollziehbare Struktur der zugrunde liegenden Datenverzeichnisse. Eine saubere Trennung der einzelnen Komponenten erleichtert Wartung, Backup und mögliche Migrationen des Systems.
Paperless-ngx selbst arbeitet intern mit mehreren Verzeichnissen, die unterschiedliche Aufgaben erfüllen. Diese Struktur sollte möglichst früh festgelegt werden, da sie die langfristige Organisation des Archivs beeinflusst.
In der hier dokumentierten Installation werden sämtliche Daten unter einem gemeinsamen Basisverzeichnis abgelegt:
/Daten/paperless-data/
Innerhalb dieses Verzeichnisses befinden sich mehrere spezialisierte Unterordner.
Die empfohlene Verzeichnisstruktur
Die folgende Struktur hat sich für den Betrieb eines privaten Dokumentenarchivs mit Paperless-ngx als stabil und übersichtlich erwiesen:
/Daten/paperless-data/data
/Daten/paperless-data/media
/Daten/paperless-data/export
/Daten/paperless-data/consume
/Daten/paperless-data/duplicates
/Daten/paperless-data/logs
Jeder dieser Ordner erfüllt eine klar definierte Funktion innerhalb des Systems.
Datenbankverzeichnis
Der Ordner data enthält die Datenbank des Systems. In vielen Installationen wird hier eine SQLite-Datenbank verwendet. Diese speichert alle Metadaten des Archivs, darunter Dokumenttitel, Tags, Korrespondenten und weitere organisatorische Informationen.
Da die Datenbank ein zentraler Bestandteil des Systems ist, sollte dieser Ordner regelmäßig gesichert werden.
Medienverzeichnis
Im Ordner media werden die eigentlichen Dokumente gespeichert. Hier legt Paperless-ngx die importierten Dateien sowie die erzeugten Archivversionen ab.
Dieser Ordner bildet somit den Kern des digitalen Archivs. Entsprechend groß kann dieses Verzeichnis im Laufe der Zeit werden.
Importverzeichnis
Der Ordner consume dient als Eingangsverzeichnis für neue Dokumente. Dateien, die in diesem Ordner abgelegt werden, werden automatisch von Paperless-ngx erkannt und verarbeitet.
Typische Quellen für diesen Ordner sind beispielsweise:
- Scanner mit Netzwerkablage
- automatische Downloads von E-Mail-Anhängen
- manuell abgelegte Dokumente
Nach erfolgreichem Import werden die Dokumente von Paperless-ngx in das Archiv übernommen.
Dublettenverzeichnis
Der Ordner duplicates enthält Dokumente, die vom System als mögliche Dubletten erkannt wurden. Paperless-ngx vergleicht dabei den Inhalt der Dateien und kann identische Dokumente erkennen.
Durch die separate Ablage bleibt das Archiv frei von mehrfach importierten Dokumenten, während der Benutzer dennoch die Möglichkeit behält, die Dateien zu überprüfen.
Exportverzeichnis
Der Ordner export wird verwendet, um Dokumente aus dem System heraus zu exportieren. Dies kann beispielsweise für externe Sicherungen oder den Austausch mit anderen Systemen sinnvoll sein.
Je nach Konfiguration können Dokumente hier mit sprechenden Dateinamen abgelegt werden.
Logverzeichnis
Im Ordner logs werden Protokolldateien des Systems gespeichert. Diese enthalten Informationen über den Betrieb der Container, Importvorgänge sowie mögliche Fehlermeldungen.
Bei der Fehlersuche oder Wartung des Systems sind diese Protokolle eine wichtige Informationsquelle.
Vorteile dieser Struktur
Die beschriebene Verzeichnisstruktur bietet mehrere praktische Vorteile:
- klare Trennung von Archivdaten und Systemkomponenten
- einfachere Backup-Strategien
- übersichtliche Organisation der Importprozesse
- leichtere Migration auf andere Systeme
Gerade für langfristig betriebene Archive ist eine solche Struktur entscheidend, um auch nach vielen Jahren noch nachvollziehen zu können, wie das System aufgebaut ist.
Nächster Schritt der Reihe
Im nächsten Beitrag wird die zentrale Konfigurationsdatei des Systems betrachtet. Diese Datei steuert zahlreiche Funktionen von Paperless-ngx, darunter OCR-Verarbeitung, Importverhalten und Dateinamenstruktur.
Aufbau der Artikelreihe
-
- Teil 0 – Übersichtsseite der Artikelreihe
- Teil 1 – Einführung in das Paperless-ngx Dokumentenarchiv
- Teil 2 – Installation von Paperless-ngx auf Debian mit Docker
- Teil 3 – Ordnerstruktur und Datenorganisation
- Teil 4 – Die Konfigurationsdatei (.env)
- Teil 5 – Automatischer Dokumentenimport
- Teil 6 – Dateinamen und Archivstruktur
- Teil 7 – Backup und Datensicherung eines Paperless-ngx Archivs

© Eric Beuchel, 2026 – KI-generiertes Beitragsbild
© Eric Beuchel, 2026 – KI-generiertes Beitragsbild
ChatGPT
KI-generiertes Bild mit DALL·E (OpenAI) via ChatGPT, basierend auf eigener Bildidee
