Dateinamen und Archivstruktur in Paperless-ngx

Dateinamen und Archivstruktur

Neben der internen Datenbank speichert Paperless-ngx die eigentlichen Dokumente im Dateisystem. Für ein langfristig nutzbares Archiv ist es sinnvoll, dass diese Dateien auch außerhalb der Software verständlich strukturiert sind.

Paperless-ngx erlaubt deshalb die automatische Erzeugung von Dateinamen und Ordnerstrukturen auf Basis der Metadaten eines Dokuments.

Das Prinzip sprechender Dateinamen

Ein wichtiger Grundsatz digitaler Archivierung besteht darin, dass Dateien möglichst selbsterklärende Namen erhalten. Auch ohne Zugriff auf die Weboberfläche sollten Dokumente im Dateisystem nachvollziehbar bleiben.

Paperless-ngx nutzt dafür eine flexible Vorlagenfunktion, die Metadaten automatisch in den Dateipfad integriert.

Ein Beispiel für eine solche Struktur ist:

YYYY/MM/Korrespondent/Dokumenttyp/Datum - Titel.pdf

Ein konkreter Dateipfad könnte dann beispielsweise so aussehen:

2025/03/Telekom/Rechnung/2025-03-10 - Telekom Rechnung März.pdf

Damit lässt sich bereits auf Dateisystemebene erkennen, um welches Dokument es sich handelt.

Konfiguration über die .env-Datei

Die Struktur der archivierten Dateien wird über eine Konfigurationsvariable in der .env-Datei definiert.

PAPERLESS_FILENAME_FORMAT={{ created|date:'Y/MM' }}/{{ correspondent.name|default:'Ohne Korrespondent' }}/{{ document_type|default:'Ohne Typ' }}/{{ created|date:'Y-MM-dd' }} - {{ title }}

Diese Vorlage erzeugt eine mehrstufige Ordnerstruktur, die sich aus verschiedenen Metadaten zusammensetzt.

Jahr und Monat

Die ersten beiden Verzeichnisebenen enthalten das Jahr und den Monat des Dokuments. Dadurch entsteht eine chronologische Grundstruktur.

{{ created|date:'Y/MM' }}

Korrespondent

Der Korrespondent beschreibt den Absender oder die Organisation, von der das Dokument stammt.

{{ correspondent.name }}

Ist kein Korrespondent hinterlegt, wird automatisch ein Ersatzwert verwendet.

Dokumenttyp

Der Dokumenttyp dient zur thematischen Einordnung eines Dokuments, beispielsweise Rechnung, Vertrag oder Bescheid.

{{ document_type }}

Auch hier kann ein Standardwert definiert werden, falls keine Zuordnung erfolgt ist.

Datum und Titel

Der eigentliche Dateiname besteht aus dem Dokumentdatum und dem Titel.

{{ created|date:'Y-MM-dd' }} - {{ title }}

Dadurch entstehen klar lesbare Dateinamen, die auch außerhalb des Systems verständlich bleiben.

Bereinigung problematischer Zeichen

Damit Dateinamen in allen Betriebssystemen problemlos verwendet werden können, lassen sich problematische Zeichen automatisch entfernen.

PAPERLESS_FILENAME_FORMAT_SANITIZE=true

Dadurch werden beispielsweise unzulässige Sonderzeichen ersetzt.

Begrenzung der Titellänge

Sehr lange Dokumenttitel können zu übermäßig langen Dateipfaden führen. Deshalb ist es sinnvoll, die Länge des Titels zu begrenzen.

{{ title|truncatechars:120 }}

Diese Einstellung verhindert Probleme mit maximalen Dateipfadlängen des Betriebssystems.

Vorteile einer nachvollziehbaren Archivstruktur

Eine strukturierte Ablage der Dateien bietet mehrere praktische Vorteile:

  • Dokumente bleiben auch ohne Paperless-ngx verständlich
  • leichtere externe Backups
  • einfachere Migration auf andere Systeme
  • klare Orientierung im Dateisystem

Gerade für langfristige Archivprojekte ist eine solche Struktur ein wichtiger Bestandteil der digitalen Dokumentenorganisation.

Abschluss der Artikelreihe

Mit diesem Beitrag endet die Dokumentationsreihe zum Aufbau eines persönlichen Dokumentenarchivs mit Paperless-ngx. Die einzelnen Teile haben Installation, Datenstruktur, Konfiguration und automatischen Dokumentenimport beschrieben.

Zusammen bilden diese Komponenten die Grundlage für ein dauerhaft nutzbares digitales Archivsystem.

Aufbau der Artikelreihe

Diese Artikelreihe dokumentiert eine reale Systemkonfiguration zu Demonstrations- und Dokumentationszwecken. Es werden keine Skripte, Tools oder vollständigen Konfigurationsdateien öffentlich bereitgestellt. Sensible Parameter wie Schlüssel oder Tokens werden grundsätzlich anonymisiert dargestellt.