Ordner überwachen - PDF-Daten mit individuellen Regeln automatisch extrahieren

Automatic PDF Processor

Automatic PDF Processor ist eine vielseitig einsetzbare Software zum automatischen Extrahieren von PDF-Daten. Regelmäßig eingehende PDF-Dokumente können nach einem einmaligen Einrichten einer Extrahierungsregel automatisiert verarbeitet werden. Daten lassen sich in PDF-Dokumenten mit variabler oder fester Position der zu extrahierenden Werte erfassen. Somit können beispielsweise Rechnungsinfomationen wie Rechnungsdatum, -nummer, Gesamtbetrag oder Bankdaten in einer CSV-Datei bzw. CSV- Sammeldatei gespeichert werden. Extrahierte PDF-Daten können durch den Einsatz von Platzhaltern auch für die strukturierte Ablage der Dokumente verwendet werden, also für den Pfad oder einen aussagekräftigen Dateinamen des jeweiligen Dokuments.

Für das Extrahieren von PDF-Daten lassen sich beliebig viele Extrahierungsregeln angelegen. Extrahierungsregeln beinhalten auch das optionale Validieren und Formatieren des extrahierten Wertes und sind Teil eines Profils. In einem Profil werden unter anderem Ordner festgelegt, in denen die zu verarbeitenden PDF-Dateien eingehen, Filterkriterien, um nur bestimmte Dokumente automatisch zu verarbeiten sowie verschiedene Aufgaben wie das Speichern der extrahierten PDF-Daten in einer CSV-Datei, ein anschließendes Verschieben, Drucken, etc. konfiguriert. Das Programm unterstützt unbegrenzt viele Profile.

Automatic PDF Processor jetzt unverbindlich 30 Tage testen ...     Zum Download

Beliebig viele Ordner überwachen

Eingehende PDF-Dateien untersuchen und passende Regeln anwenden

Optionale Filter anwenden

Zu verarbeitende PDF-Dateien eingrenzen durch flexible Filter

Daten automatisch extrahieren

Daten aus PDF-Dokumenten extrahieren und als CSV-Datei speichern

Optionale Weiter­verarbeitung

Anschließende Aufgaben ausführen z.B. PDF-Datei als Parameter an ein Programm übergeben

Mit Automatic PDF Processor können Sie (unter anderem):

  • Daten automatisiert aus PDF-Dokumenten extrahieren
  • Mit Hilfe von flexiblen Extrahierungsregeln PDF-Dateien in CSV-Dateien konvertieren
  • Extrahierte Daten an eine CSV-Sammeldatei anfügen
  • Die verarbeitete PDF-Datei zusätzlich umbenennen, verschieben, drucken, u.v.m.
  • Individuelle Profile für verschiedene Extrahierungsregeln erstellen
  • Beliebig viele Ordner überwachen
  • Filtern nach Dokumententext, Dateidatum, Anhangsname oder -anzahl, Titel ...
  • Alle PDF-Dateien eines Ordners (mit benutzerdefinierten Kriterien) nachträglich verarbeiten
  • Sich regelmäßig einen Excel-Bericht mit Übersicht und Detailinformationen erstellen und optional zusenden lassen
  • Die automatische Datenextrahierung aus PDF-Dateien auf bestimmte Tage und Zeiten begrenzen, um PDF-Dateien beispielsweise nur zu Bürozeiten zu verarbeiten
  • Abschließende Aktionen ausführen z.B. ein Programm mit dem Pfad der jeweiligen PDF-Datei als Parameter starten
  • Sich über verschiedene Verarbeitungsstatus per E-Mail informieren lassen

PDF-Daten von variabler Position extrahieren

Automatic PDF Processor - Extrahierungseinstellungen

Bei einer variablen Position der Daten, wie in Rechnungen, Lieferscheinen o. ä., erfolgt das Bestimmen des Datenbereichs durch ein Schlüsselwort (beispielsweise Rechnungsnummer:|Rechnungsnr.:|Rechnungs-Nr.:). Nach Angabe des Schlüsselworts wird die Position des Datenbereichs (z. B.: rechts daneben) ausgewählt. Sie erhalten eine Live-Vorschau des extrahierten Werts basierend auf den Beispielsdateien, die bei der Erstellung des Profils angegeben wurden. Optional können die extrahierten Daten bereinigt, validiert und formatiert werden.

Wenn mehrere Extrahierungsregeln mit dem gleichen Namen angelegt werden, ist es ausreichend, wenn eine dieser Regeln ein gültiges Ergebnis erzielt. Damit lassen sich Abweichungen in den einzelnen Dokumenten ausgleichen. Als letzte Regel des gleichen Namens lässt sich optional ein benutzerdefinierter Text (beispielsweise "Fehler", "n.v.", etc.) als Wert bereitstellen, um kenntlich zu machen, dass die erwarteten Daten nicht im Dokument enthalten waren bzw. dass eine Anpassung der Regel erforderlich ist.

PDF-Daten von fester Position extrahieren

Automatic PDF Processor - Konfigurationsbeispiel

Beim Extrahieren von Daten aus Dokumenten wie Formularen, in denen die Werte innerhalb eines vorgegebenen Bereichs eingetragen werden, erfolgt die Datenbestimmung positionsbasierend durch Verschieben eines Auswahlrechtecks. Die Größe des Auswahlrechtecks kann angepasst werden. Der extrahierte Text wird oberhalb der Vorschau des Dokuments in Echtzeit angezeigt. Verschiedene Versionen eines Formulars lassen sich durch Verwendung eines Filters für den Dokumententext unterscheiden.


Automatic PDF Processor jetzt unverbindlich 30 Tage testen ...     Zum Download