34 Sprachinstallation

34.1 Übersicht

Das Fenster Sprachinstallation ermöglicht das Herunterladen und Installieren zusätzlicher Sprachen für die OCR-Texterkennung. Standardmäßig ist nur Deutsch installiert. Für die Erkennung von Dokumenten in anderen Sprachen müssen die entsprechenden Sprachpakete nachinstalliert werden.

Aufrufen: Menü ExtrasOCR-Sprachen installieren…


34.2 Verfügbare Sprachen

Das System unterstützt über 100 Sprachen, darunter:

Westeuropäische Sprachen

  • Deutsch (vorinstalliert)
  • Englisch
  • Französisch
  • Spanisch
  • Italienisch
  • Portugiesisch
  • Niederländisch

Osteuropäische Sprachen

  • Polnisch
  • Tschechisch
  • Ungarisch
  • Russisch
  • Ukrainisch

Asiatische Sprachen

  • Chinesisch (vereinfacht und traditionell)
  • Japanisch
  • Koreanisch
  • Arabisch
  • Hebräisch

Weitere Sprachen

  • Die vollständige Liste ist im Installationsfenster verfügbar

34.3 Installation

Sprache auswählen

  1. Öffnen Sie das Fenster OCR-Sprachen installieren
  2. Suchen Sie die gewünschte Sprache in der Liste
  3. Aktivieren Sie die Checkbox neben der Sprache
  4. Klicken Sie auf Installieren

Download

Die Sprachpakete (Tessdata) werden von den offiziellen Tesseract-Repositories heruntergeladen: - Dateigröße: Je nach Sprache 1-50 MB - Speicherort: %APPDATA%\Gillmeister Software\Automatic PDF Processor 2\tessdata\

Mehrere Sprachen

Sie können mehrere Sprachen gleichzeitig auswählen und installieren. Der Download erfolgt nacheinander.


34.4 Deinstallation

Um eine installierte Sprache zu entfernen: 1. Deaktivieren Sie die Checkbox der Sprache 2. Klicken Sie auf Änderungen übernehmen 3. Die Sprachdatei wird gelöscht

Hinweis: Deutsch kann nicht deinstalliert werden, da es eine der Standardsprachen ist.


34.5 Verwendung in Profilen

Nach der Installation stehen die Sprachen in den OCR-Einstellungen der Profile zur Verfügung:

  1. Öffnen Sie ein Profil → AufgabenOCR
  2. Wählen Sie die Primäre Sprache
  3. Optional: Wählen Sie eine Sekundäre Sprache für mehrsprachige Dokumente

Primäre und sekundäre Sprache

Einstellung Verwendung
Primäre Sprache Hauptsprache des Dokuments (erforderlich)
Sekundäre Sprache Für Dokumente mit gemischtem Text (optional)

Beispiel: Ein deutsches Dokument mit englischen Fachbegriffen: - Primäre Sprache: Deutsch - Sekundäre Sprache: Englisch


34.6 Tipps und Hinweise

Sprachqualität

Die Erkennungsqualität hängt von der Sprache ab: - Sehr gut: Westeuropäische Sprachen mit lateinischer Schrift - Gut: Osteuropäische Sprachen, Griechisch - Variabel: Asiatische Sprachen, abhängig von Schriftqualität

Speicherbedarf

Sprachtyp Typische Größe
Europäische Sprachen 1-5 MB
Asiatische Sprachen 10-50 MB
Alle Sprachen ~500 MB

Offline-Installation

Für Umgebungen ohne Internetzugang können die Tessdata-Dateien manuell heruntergeladen und in den tessdata-Ordner kopiert werden.