34 Sprachinstallation
34.1 Übersicht
Das Fenster Sprachinstallation ermöglicht das Herunterladen und Installieren zusätzlicher Sprachen für die OCR-Texterkennung. Standardmäßig ist nur Deutsch installiert. Für die Erkennung von Dokumenten in anderen Sprachen müssen die entsprechenden Sprachpakete nachinstalliert werden.
Aufrufen: Menü Extras → OCR-Sprachen installieren…
34.2 Verfügbare Sprachen
Das System unterstützt über 100 Sprachen, darunter:
Westeuropäische Sprachen
- Deutsch (vorinstalliert)
- Englisch
- Französisch
- Spanisch
- Italienisch
- Portugiesisch
- Niederländisch
Osteuropäische Sprachen
- Polnisch
- Tschechisch
- Ungarisch
- Russisch
- Ukrainisch
Asiatische Sprachen
- Chinesisch (vereinfacht und traditionell)
- Japanisch
- Koreanisch
- Arabisch
- Hebräisch
Weitere Sprachen
- Die vollständige Liste ist im Installationsfenster verfügbar
34.3 Installation
Sprache auswählen
- Öffnen Sie das Fenster OCR-Sprachen installieren
- Suchen Sie die gewünschte Sprache in der Liste
- Aktivieren Sie die Checkbox neben der Sprache
- Klicken Sie auf Installieren
Download
Die Sprachpakete (Tessdata) werden von den offiziellen Tesseract-Repositories heruntergeladen: - Dateigröße: Je nach Sprache 1-50 MB - Speicherort: %APPDATA%\Gillmeister Software\Automatic PDF Processor 2\tessdata\
Mehrere Sprachen
Sie können mehrere Sprachen gleichzeitig auswählen und installieren. Der Download erfolgt nacheinander.
34.4 Deinstallation
Um eine installierte Sprache zu entfernen: 1. Deaktivieren Sie die Checkbox der Sprache 2. Klicken Sie auf Änderungen übernehmen 3. Die Sprachdatei wird gelöscht
Hinweis: Deutsch kann nicht deinstalliert werden, da es eine der Standardsprachen ist.
34.5 Verwendung in Profilen
Nach der Installation stehen die Sprachen in den OCR-Einstellungen der Profile zur Verfügung:
- Öffnen Sie ein Profil → Aufgaben → OCR
- Wählen Sie die Primäre Sprache
- Optional: Wählen Sie eine Sekundäre Sprache für mehrsprachige Dokumente
Primäre und sekundäre Sprache
| Einstellung |
Verwendung |
| Primäre Sprache |
Hauptsprache des Dokuments (erforderlich) |
| Sekundäre Sprache |
Für Dokumente mit gemischtem Text (optional) |
Beispiel: Ein deutsches Dokument mit englischen Fachbegriffen: - Primäre Sprache: Deutsch - Sekundäre Sprache: Englisch
34.6 Tipps und Hinweise
Sprachqualität
Die Erkennungsqualität hängt von der Sprache ab: - Sehr gut: Westeuropäische Sprachen mit lateinischer Schrift - Gut: Osteuropäische Sprachen, Griechisch - Variabel: Asiatische Sprachen, abhängig von Schriftqualität
Speicherbedarf
| Sprachtyp |
Typische Größe |
| Europäische Sprachen |
1-5 MB |
| Asiatische Sprachen |
10-50 MB |
| Alle Sprachen |
~500 MB |
Offline-Installation
Für Umgebungen ohne Internetzugang können die Tessdata-Dateien manuell heruntergeladen und in den tessdata-Ordner kopiert werden.