8.4 Filter

8.4.1 Übersicht und Grundprinzip

Filter ermöglichen es Ihnen, genau festzulegen, welche PDF-Dateien von einem Profil verarbeitet werden sollen. Wenn keine Filterkriterien definiert sind, werden alle PDF-Dateien in den überwachten Ordnern verarbeitet.

Wie Filter funktionieren

Bei jeder neuen PDF-Datei prüft das Programm: 1. Entspricht die Datei allen definierten Filterkriterien? 2. Falls ja: Die Datei wird verarbeitet 3. Falls nein: Die Datei wird übersprungen (Status: “Kein Treffer”, wenn von keinem Profil aufgrund der Filter verarbeitet)

Die Filter-Registerkarten

Die Filtereinstellungen sind in folgende Registerkarten unterteilt:

Registerkarte Beschreibung
Dateieigenschaften Filtert nach Dateiname, Pfad, Größe, Datum
PDF-Daten Filtert nach PDF-Metadaten, Inhalt, Anhängen und Barcodes
Ergebnisvorschau Zeigt Filterergebnisse für Beispieldateien
Prüfung auf Überschneidungen Prüft auf Konflikte mit anderen Profilen

8.4.2 Registerkarte: Dateieigenschaften

Hier filtern Sie nach Eigenschaften der Datei selbst.

Ordnerpfad enthält / enthält nicht

Filtert nach dem Speicherort der Datei.

Beispiel: Um nur Dateien aus dem Unterordner “Rechnungen” zu verarbeiten: - Ordnerpfad enthält: Rechnungen

Dateiname enthält / enthält nicht

Filtert nach dem Namen der PDF-Datei.

Beispiele: - Dateiname enthält: Rechnung - Verarbeitet alle Dateien mit “Rechnung” im Namen - Dateiname enthält nicht: ENTWURF - Ignoriert Dateien mit “ENTWURF” im Namen

Dateigröße

Filtert nach der Größe der Datei. Verfügbare Vergleichsoperatoren: - Kleiner als - Größer als - Zwischen

Einheiten: Bytes (B), Kilobytes (KB), Megabytes (MB)

Anwendungsfall: Sehr große Dateien (z.B. > 50 MB) in ein separates Profil zur Komprimierung leiten.

Erstellungsdatum / Änderungsdatum

Filtert nach dem Datum der Datei. Verfügbare Optionen: - Zwischen: Zwei feste Daten angeben - Älter als: X Tage/Wochen/Monate/Jahre - Jünger als: X Tage/Wochen/Monate/Jahre

Anwendungsfall: Nur Dateien verarbeiten, die in den letzten 7 Tagen erstellt wurden.


8.4.3 Registerkarte: PDF-Daten

Hier filtern Sie nach Inhalten und Eigenschaften der PDF-Datei selbst.

PDF-Metadaten

PDF-Dateien können Metadaten enthalten, die vom Ersteller-Programm gesetzt wurden.

Filter Beschreibung
Autor enthält / enthält nicht Der Autor des Dokuments
Titel enthält / enthält nicht Der Dokumenttitel
Betreff enthält / enthält nicht Der Betreff
Schlüsselwörter enthalten / enthalten nicht Hinterlegte Schlüsselwörter
Ersteller enthält / enthält nicht Das Erstellungsprogramm
Erzeuger enthält / enthält nicht Das Konvertierungsprogramm

Tipp: Sie können die Metadaten einer PDF-Datei in den Eigenschaften des Dokuments einsehen (Rechtsklick > Eigenschaften in vielen PDF-Viewern).

Anwendungsfall: Ein Scanner speichert seinen Namen als “Ersteller”. Sie können so Dateien von verschiedenen Scannern unterschiedlich verarbeiten.

Dokumenttext enthält / enthält nicht

Durchsucht den gesamten Text des PDF-Dokuments.

Beispiele: - Dokumententext enthält: Rechnung - Nur PDFs mit dem Wort “Rechnung” - Dokumententext enthält: Mustermann GmbH - Nur PDFs von diesem Absender

Seitenbereich: Optional können Sie den Suchbereich auf bestimmte Seiten einschränken: - Alle Seiten (Standard) - Nur erste Seite - Nur letzte Seite - Seitenbereich (z.B. “1-3”)

Seitenzahl

Filtert nach der Anzahl der Seiten. Vergleichsoperatoren: - Kleiner als - Größer als - Zwischen

Anwendungsfall: Einzelseiten-Dokumente anders verarbeiten als mehrseitige.

Zeichenzahl

Filtert nach der Anzahl der Zeichen im Dokument.

Anwendungsfall: PDFs ohne Text (Zeichenzahl = 0) zur OCR-Verarbeitung weiterleiten.

PDF-Anhänge

Manche PDF-Dateien enthalten eingebettete Anhänge.

Anhanganzahl: Filtert nach der Anzahl der eingebetteten Anhänge. Vergleichsoperatoren: - Kleiner als - Größer als - Zwischen

Anhangname enthält / enthält nicht: Filtert nach dem Namen der eingebetteten Anhänge.

Beispiel: ZUGFeRD-Rechnungen enthalten oft einen Anhang namens factur-x.xml: - Anhangname enthält: factur-x.xml

Anwendungsfall: PDFs mit Anhängen (z.B. ZUGFeRD-Rechnungen) gesondert verarbeiten.

Barcode

Filtert nach Barcode-Inhalten im PDF.

Option Beschreibung
PDF muss Barcode enthalten Nur PDFs mit mindestens einem Barcode
PDF darf keinen Barcode enthalten Nur PDFs ohne Barcodes
Barcode-Wert enthält Filtert nach dem Inhalt des Barcodes
Barcode-Wert enthält nicht Schließt bestimmte Barcode-Werte aus

Unterstützte Barcode-Typen: - 1D-Codes: Code128, Code39, EAN-13, EAN-8, UPC-A, ITF, Codabar - 2D-Codes: QR-Code, DataMatrix, PDF417, Aztec

Tipp: Die Barcode-Erkennung nutzt maschinelles Lernen für höhere Genauigkeit. Diese Option können Sie in den Programmoptionen unter Verarbeitung ein- oder ausschalten.


8.4.4 Registerkarte: Ergebnisvorschau

Die Ergebnisvorschau zeigt Ihnen, wie Ihre Filtereinstellungen auf die Beispieldateien wirken.

Voraussetzung

Fügen Sie auf der Registerkarte Beispieldateien mindestens 5 repräsentative PDF-Dateien hinzu, die den typischen zu verarbeitenden Dokumenten entsprechen.

Anzeige

Für jede Beispieldatei wird angezeigt: - Ja - Die Datei erfüllt alle Filterkriterien - Nein - Die Datei erfüllt mindestens ein Filterkriterium nicht (mit Angabe des nicht erfüllten Kriteriums)

So nutzen Sie die Vorschau effektiv

  1. Fügen Sie Dateien hinzu, die verarbeitet werden sollen (erwartetes Ergebnis: “Ja”)
  2. Fügen Sie Dateien hinzu, die NICHT verarbeitet werden sollen (erwartetes Ergebnis: “Nein”)
  3. Prüfen Sie, ob die Ergebnisse Ihren Erwartungen entsprechen
  4. Passen Sie die Filter bei Bedarf an

Tipp: Die Ergebnisvorschau ist besonders wichtig bei komplexen Filtern mit UND/ODER-Verknüpfungen oder regulären Ausdrücken.


8.4.5 Registerkarte: Prüfung auf Überschneidungen

Diese Registerkarte zeigt potenzielle Konflikte mit anderen Profilen an.

Funktionsweise

Das Programm prüft, ob andere Profile: - Dieselben überwachten Ordner verwenden - Ähnliche oder überlappende Filterkriterien haben

Angezeigte Informationen

Spalte Beschreibung
Profil Name des möglicherweise überlappenden Profils
Überwachte Ordner Gemeinsame überwachte Ordner
Filterüberschneidung Art der möglichen Überschneidung

Warum ist das wichtig?

Wenn mehrere Profile dieselben Dateien verarbeiten könnten: - Die Datei wird möglicherweise mehrfach verarbeitet - Die Reihenfolge der Verarbeitung könnte unvorhersehbar sein - Es können Konflikte bei Dateioperationen entstehen

Empfehlung: Stellen Sie sicher, dass Ihre Filter eindeutig sind oder aktivieren Sie “Verarbeitung nach Anwenden stoppen” im ersten zutreffenden Profil.


8.4.6 UND/ODER-Logik

Wenn Sie mehrere Begriffe in einem Filterfeld eingeben, können Sie diese mit logischen Operatoren verknüpfen.

UND-Verknüpfung

Alle Begriffe müssen vorhanden sein.

Syntax: <AND> oder <UND>

Beispiel: Rechnung<UND>Mustermann - Trifft zu bei: “Rechnung an Mustermann GmbH” - Trifft nicht zu bei: “Rechnung an Schmidt GmbH”

ODER-Verknüpfung

Mindestens einer der Begriffe muss vorhanden sein.

Syntax: <OR> oder <ODER>

Beispiel: Rechnung<ODER>Invoice<ODER>Faktura - Trifft zu bei jedem PDF, das “Rechnung”, “Invoice” oder “Faktura” enthält

Kombinationen

Sie können UND und ODER kombinieren. Dabei gilt: UND trennt die Ausdrücke, ODER wird innerhalb der Segmente ausgewertet.

Beispiel: Rechnung<AND>2024<OR>Invoice<AND>2024

Zur Verdeutlichung kann man <AND> wie einen Zeilenumbruch betrachten:

Rechnung
<AND>
2024<OR>Invoice
<AND>
2024

Dies bedeutet: (Rechnung) UND (2024 ODER Invoice) UND (2024)

Ergebnis: - Trifft zu bei: Text enthält “Rechnung” UND (“2024” ODER “Invoice”) UND “2024” - Trifft zu bei “Rechnung vom 15.12.2024” (enthält Rechnung, 2024, 2024) - Trifft zu bei “Rechnung Invoice 2024” (enthält Rechnung, Invoice, 2024) - Trifft nicht zu bei “Rechnung vom 15.12.2023” (enthält nicht “2024”)

Tipp: Testen Sie komplexe Filter immer mit der Ergebnisvorschau, um sicherzugehen, dass das gewünschte Ergebnis erreicht wird.


8.4.7 Reguläre Ausdrücke

Für fortgeschrittene Filterungen stehen reguläre Ausdrücke (Regex) zur Verfügung.

Syntax

Umschließen Sie den regulären Ausdruck mit: <BeginOfRegex>MUSTER<EndOfRegex>

Beispiele

Regex Beschreibung Trifft zu bei
<BeginOfRegex>RE-\d{5}<EndOfRegex> Rechnungsnummer mit 5 Ziffern RE-12345, RE-00001
<BeginOfRegex>^Rechnung<EndOfRegex> Beginnt mit “Rechnung” “Rechnung Nr. 123”
<BeginOfRegex>\d{2}\.\d{2}\.\d{4}<EndOfRegex> Datum im Format TT.MM.JJJJ 15.12.2024
<BeginOfRegex>€\s*\d+[,\.]\d{2}<EndOfRegex> Euro-Betrag € 123,45 oder €99.00

Häufig verwendete Regex-Elemente

Element Bedeutung
\d Eine Ziffer (0-9)
\d{5} Genau 5 Ziffern
\d+ Eine oder mehr Ziffern
\s Ein Leerzeichen
\s* Beliebig viele Leerzeichen (auch keines)
^ Anfang der Zeile/des Texts
$ Ende der Zeile/des Texts
. Ein beliebiges Zeichen
.* Beliebig viele beliebige Zeichen
[A-Z] Ein Großbuchstabe
[a-zA-Z] Ein Buchstabe (groß oder klein)

Tipp: Testen Sie Ihre regulären Ausdrücke auf Websites wie regex101.com, bevor Sie sie im Filter verwenden.


8.4.8 Zahlenbereiche

Mit der Syntax <NumberRange{MIN,MAX}> können Sie nach Zahlenbereichen filtern.

Syntax

<NumberRange{Minimum,Maximum}>

Beispiele

Filter Beschreibung
<NumberRange{1,99}> Zahlen von 1 bis 99
<NumberRange{2020,2025}> Jahre von 2020 bis 2025
<NumberRange{100,999}> Dreistellige Zahlen

Anwendungsfall

Filtern nach Dokumenten mit bestimmten Kundennummern: - Dokumenttext enthält: Kundennummer: <NumberRange{5100000,5200000}>

Dies trifft auf alle PDFs zu, die eine Kundennummer zwischen 5100000 und 5200000 enthalten.


8.4.9 Dynamische Filterlisten

Mit dynamischen Listen können Sie Filter flexibel gestalten, ohne das Profil ändern zu müssen.

So funktioniert es

  1. Erstellen Sie unter Extras > Programmoptionen > Dynamische Listen eine neue Liste
  2. Fügen Sie die gewünschten Einträge hinzu (z.B. Mandantennamen, Projektnummern)
  3. Verwenden Sie die Liste im Filter mit der Syntax: <EntryFromList{Listenname}>

Syntax

<EntryFromList{Name der Liste}>

Beispiel

Sie haben eine Liste “Wichtige Kunden” mit folgenden Einträgen: - Mustermann GmbH - Schmidt AG - Meyer & Co

Filter: Dokumenttext enthält: <EntryFromList{Wichtige Kunden}>

Das Programm prüft automatisch, ob einer der Listeneintrage im Dokument vorkommt.

Vorteile

  • Flexibilität: Neue Einträge können jederzeit zur Liste hinzugefügt werden
  • Zentrale Verwaltung: Eine Liste kann in mehreren Profilen verwendet werden
  • Übersichtlichkeit: Lange Listen müssen nicht im Filter selbst stehen

Tipp: Listen können auch aus externen Quellen wie Excel-Dateien oder Datenbanken importiert werden.


8.4.10 Praktische Tipps

Filter schrittweise aufbauen

Beginnen Sie mit einem einfachen Filter und erweitern Sie ihn schrittweise: 1. Erst nur nach Dateiname filtern 2. Dann Textfilter hinzufügen 3. Komplexere Bedingungen ergänzen

Nicht zu restriktiv filtern

Zu strenge Filter können dazu führen, dass Dateien übersehen werden: - Achten Sie auf unterschiedliche Schreibweisen (Rechnung/RECHNUNG) - Berücksichtigen Sie Tippfehler in den Quelldokumenten - Nutzen Sie ODER-Verknüpfungen für Varianten

Groß-/Kleinschreibung

Die normale Textsuche unterscheidet nicht zwischen Groß- und Kleinschreibung - “Rechnung”, “RECHNUNG” und “rechnung” werden gleich behandelt.

Hinweis: Reguläre Ausdrücke unterscheiden standardmäßig zwischen Groß- und Kleinschreibung. Verwenden Sie das Flag (?i) für case-insensitive Regex-Suche:

<BeginOfRegex>(?i)rechnung<EndOfRegex> findet “Rechnung”, “RECHNUNG”, “rechnung” etc.

Mehrere Profile statt komplexer Filter

Manchmal ist es einfacher, mehrere Profile mit einfachen Filtern zu erstellen, als ein Profil mit sehr komplexen Filtern.

Beispiel: Statt eines komplexen Filters für verschiedene Dokumenttypen: - Profil 1: Rechnungen (Filter: Dokumenttext enthält “Rechnung”) - Profil 2: Lieferscheine (Filter: Dokumenttext enthält “Lieferschein”) - Profil 3: Bestellungen (Filter: Dokumenttext enthält “Bestellung”)