- 5. OCR
- 5.1 Werden 2 OCR Läufe benötigt, wenn ein durchsuchbares PDF und ALTO/MyBib eL-Format erzeugt werden sollen?
- 5.2 OCR wird nicht für gesamten Job durchgeführt – Probleme bei vielen oder sehr großen Images
- 5.3 Können Fraktur- und Antiqua- Klicks beim Umstieg von ABBYY 10 auf ABBYY 12 mitgenommen werden?
- 5.4 Warum sind vorhandene Fraktur-Klicks nicht abruf- und nutzbar?
- 5.5 Warum zeigt BCS-2 einen während des laufenden Betriebs gezogenen Dongle noch an?
5.1 Werden 2 OCR Läufe benötigt, wenn ein durchsuchbares PDF und ALTO/MyBib eL-Format erzeugt werden sollen?Abschnitt hinzufügen
Für die OCR-Engines sind die OCR-Verfahren in BCS-2 wie folgt umgesetzt:
- Für durchsuchbare PDFs ist ein separater OCR-Lauf mit Klickabbuchung bei ABBYY notwendig. Zusätzliche Volltexte, z.B. für die Kataloaganreicherung, werden als Derivat aus dem PDF extrahiert, so dass dafür keine zusätzlichen OCR-Läufe und -Klicks anfallen.
- Für alle anderen OCR-Ausgaben, z.B. Formate mit geometrischen Informationen, wie das ALTO- oder MyBib eL-Format, ist momentan ein separater OCR-Lauf mit eigener Klickabbuchung (ABBYY) erforderlich. Die unterschiedlichen Ausgabeformate können jedoch in einem OCR-Lauf erzeugt werden, wenn die Batch-Option ausgewählt wurde (siehe Beschreibung: https://manuals.imageware.de/bcs-2/bcs-2-pro/handbuecher/bcs-2-pro-handbuch/menue-job/#7.3). Falls nachträglich andere Formate erzeugt werden, ist ein weiterer OCR-Lauf mit Klickabrechnung bei ABBYY notwendig.
Erzeugen Sie durchsuchbare PDFs, oder benötigen ALTO- bzw. MyBib eL-Formate, fallen immer zwei ABBYY-Klicks pro Din A4-Seite an! Das ALTO-Format kann derzeit nur über ABBYY erzeugt werden.
5.2 OCR wird nicht für gesamten Job durchgeführt – Probleme bei vielen oder sehr großen ImagesAbschnitt hinzufügen
Bei Nutzung der ABBYY-OCR kommt es gelegentlich zum Abbruch des OCR-Laufs und der Beendigung von BCS-2 wenn Sie gleichzeitig viele Jobs oder Jobs mit sehr großen und vielen Images bearbeiten. Ursache ist der durch die OCR-Engine nicht komplett freigegebene Speicher.
Bei kleineren (bis zu 100 Seiten) und wenigen OCR-Jobs am Tag führt dies nicht zu Einschränkungen.
Bearbeiten Sie jedoch
- große und viele OCR-Jobs,
- große Images mit Fraktur-OCR,
- oder OCR für schlechte/schwierige Vorlagen (z.B. vergilbtes Papier, verschmierter Druck, Flecken oder Mikrofilm-Scans)
kommt es gelegentlich zu Abstürzen.
Zur Vermeidung empfehlen wir:
- Schließen Sie alle anderen Programme bei der Verarbeitung solcher Jobs.
- Lassen Sie immer nur eine begrenzte Anzahl an OCR-Jobs von der Stapelverarbeitung bearbeiten. Teilen Sie große OCR-Jobs bei der Batchverarbeitung in kleine Einheiten à 100 oder 250 Seiten auf.
- Stellen Sie sicher, dass auf ihrem PC „mindestens“ die doppelte Menge des größten Jobs an Speicherplatz frei ist, damit ABBYY das Zwischenergebnis auslagern kann.
- Starten, bzw. lassen Sie BCS-2 regelmäßig neu starten.
Führen Sie häufiger datenintensive Joboperationen durch, sprechen Sie bitte unseren Support an. Zur automatischen OCR über Nacht ohne Operatoren beraten wir Sie gerne.
Generell gibt es keine Empfehlung von ABBYY zur maximalen Jobgröße. Die OCR-Engine wurde jedoch für Clients und typische Clientanwendungen entwickelt. Als Faustregel gilt, dass Jobs mit bis zu 100 Seiten störungsfrei laufen. Für datenintensive Jobs bietet ABBYY eine Serverlösung an.
5.3 Können Fraktur- und Antiqua- Klicks beim Umstieg von ABBYY 10 auf ABBYY 12 mitgenommen werden?Abschnitt hinzufügen
Bei einem Upgrade von ABBYY Runtime Engine Version 10 auf Version 12 sind, laut ABBYY-Bestimmungen, Frakturklicks bzw. Volumenlizenzen allgemein nicht übertragbar. Erworbene Frakturklicks können nur mit der Version verbraucht werden, für die die Klicks erworben wurden.
5.4 Warum sind vorhandene Fraktur-Klicks nicht abruf- und nutzbar?Abschnitt hinzufügen
Achten Sie bei ABBYY OCR-Dongles mit einer festgelegten Anzahl an Antiqua- und Fraktur-Klicks darauf, dass die Anzahl der Antiqua-Klicks nicht Null erreicht. Sobald keine Antiqua-Klicks mehr auf dem Dongle zur Verfügung stehen, sind auch die Fraktur-Klicks nicht mehr abruf-und nutzbar.
Um die verbleibenden Fraktur-Klicks zu nutzen, müssen Sie das Kontingent an Antiqua-Klicks erst wieder auffüllen. Es handelt sich hier um ein technisches Problem der Firma ABBYY und kein BCS-2 Problem.
5.5 Warum zeigt BCS-2 einen während des laufenden Betriebs gezogenen Dongle noch an?Abschnitt hinzufügen
Für BCS-2 gilt der Dongle, wenn er während des laufenden Betriebs von BCS-2 gezogen wird weiterhin als gesteckt und aktiv. Erst nach einem Neustart von BCS-2 bemerkt BCS-2 die Änderung.