Ordnerstruktur von Paperless-ngx mit consume, media, export, data, duplicates und logs

Ordnerstruktur und Datenorganisation eines Paperless-Archivs

Warum eine klare Datenstruktur wichtig ist

Ein digitales Dokumentenarchiv besteht nicht nur aus einer Softwareinstallation. Ebenso wichtig ist eine klare und nachvollziehbare Struktur der zugrunde liegenden Datenverzeichnisse. Eine saubere Trennung der einzelnen Komponenten erleichtert Wartung, Backup und mögliche Migrationen des Systems.

Paperless-ngx selbst arbeitet intern mit mehreren Verzeichnissen, die unterschiedliche Aufgaben erfüllen. Diese Struktur sollte möglichst früh festgelegt werden, da sie die langfristige Organisation des Archivs beeinflusst.

In der hier dokumentierten Installation werden sämtliche Daten unter einem gemeinsamen Basisverzeichnis abgelegt:

/Daten/paperless-data/

Innerhalb dieses Verzeichnisses befinden sich mehrere spezialisierte Unterordner.

Die empfohlene Verzeichnisstruktur

Die folgende Struktur hat sich für den Betrieb eines privaten Dokumentenarchivs mit Paperless-ngx als stabil und übersichtlich erwiesen:

/Daten/paperless-data/data
/Daten/paperless-data/media
/Daten/paperless-data/export
/Daten/paperless-data/consume
/Daten/paperless-data/duplicates
/Daten/paperless-data/logs

Jeder dieser Ordner erfüllt eine klar definierte Funktion innerhalb des Systems.

Datenbankverzeichnis

Der Ordner data enthält die Datenbank des Systems. In vielen Installationen wird hier eine SQLite-Datenbank verwendet. Diese speichert alle Metadaten des Archivs, darunter Dokumenttitel, Tags, Korrespondenten und weitere organisatorische Informationen.

Da die Datenbank ein zentraler Bestandteil des Systems ist, sollte dieser Ordner regelmäßig gesichert werden.

Medienverzeichnis

Im Ordner media werden die eigentlichen Dokumente gespeichert. Hier legt Paperless-ngx die importierten Dateien sowie die erzeugten Archivversionen ab.

Dieser Ordner bildet somit den Kern des digitalen Archivs. Entsprechend groß kann dieses Verzeichnis im Laufe der Zeit werden.

Importverzeichnis

Der Ordner consume dient als Eingangsverzeichnis für neue Dokumente. Dateien, die in diesem Ordner abgelegt werden, werden automatisch von Paperless-ngx erkannt und verarbeitet.

Typische Quellen für diesen Ordner sind beispielsweise:

  • Scanner mit Netzwerkablage
  • automatische Downloads von E-Mail-Anhängen
  • manuell abgelegte Dokumente

Nach erfolgreichem Import werden die Dokumente von Paperless-ngx in das Archiv übernommen.

Dublettenverzeichnis

Der Ordner duplicates enthält Dokumente, die vom System als mögliche Dubletten erkannt wurden. Paperless-ngx vergleicht dabei den Inhalt der Dateien und kann identische Dokumente erkennen.

Durch die separate Ablage bleibt das Archiv frei von mehrfach importierten Dokumenten, während der Benutzer dennoch die Möglichkeit behält, die Dateien zu überprüfen.

Exportverzeichnis

Der Ordner export wird verwendet, um Dokumente aus dem System heraus zu exportieren. Dies kann beispielsweise für externe Sicherungen oder den Austausch mit anderen Systemen sinnvoll sein.

Je nach Konfiguration können Dokumente hier mit sprechenden Dateinamen abgelegt werden.

Logverzeichnis

Im Ordner logs werden Protokolldateien des Systems gespeichert. Diese enthalten Informationen über den Betrieb der Container, Importvorgänge sowie mögliche Fehlermeldungen.

Bei der Fehlersuche oder Wartung des Systems sind diese Protokolle eine wichtige Informationsquelle.

Vorteile dieser Struktur

Die beschriebene Verzeichnisstruktur bietet mehrere praktische Vorteile:

  • klare Trennung von Archivdaten und Systemkomponenten
  • einfachere Backup-Strategien
  • übersichtliche Organisation der Importprozesse
  • leichtere Migration auf andere Systeme

Gerade für langfristig betriebene Archive ist eine solche Struktur entscheidend, um auch nach vielen Jahren noch nachvollziehen zu können, wie das System aufgebaut ist.

Nächster Schritt der Reihe

Im nächsten Beitrag wird die zentrale Konfigurationsdatei des Systems betrachtet. Diese Datei steuert zahlreiche Funktionen von Paperless-ngx, darunter OCR-Verarbeitung, Importverhalten und Dateinamenstruktur.

Aufbau der Artikelreihe

Diese Artikelreihe dokumentiert eine reale Systemkonfiguration zu Demonstrations- und Dokumentationszwecken. Es werden keine Skripte, Tools oder vollständigen Konfigurationsdateien öffentlich bereitgestellt. Sensible Parameter wie Schlüssel oder Tokens werden grundsätzlich anonymisiert dargestellt.