2. Durchführung der OCR und Übertragung der Jobs
Kapitel hinzufügen

Die OCR wird in BCS-2 durchgeführt, nachdem die Scans eines oder mehrerer Jobs erstellt wurden. Für die Qualität der OCR ist entscheidend, dass die Scans einwandfrei sind, oder vor dem OCR-Lauf entsprechend nachbearbeitet werden.

Für die Durchführung der OCR gibt es je nach Arbeitsablauf mehrere Möglichkeiten:

  • Die OCR wird manuell auf jeder Seite des Jobs durch Drücken der Taste „o“ ausgelöst.
  • Die OCR wird als Batch-Operation für alle Seiten eines oder mehrerer Jobs ausgeführt.
  • Die OCR wird automatisch aufgrund der entsprechenden Einstellungen in Mybib und im BCS-2-Workflow bei der Jobübertragung an Mybib durchgeführt.

Zur Nachbearbeitung der einzelnen Images vgl. Sie das Menü Image, zur OCR das Kapitel zum OCR-Menü im BCS-2 Handbuch.

2.1 Manueller OCR-Modus
Abschnitt hinzufügen

Jede Seite des Jobs wird gesichtet und nach eventuellen Korrekturen am Image durch Betätigen der Taste „o“ bzw. des OCR-Icons mit einem OCR-Ergebnis versehen. Bei dieser Methode ist eine parallele Qualitätskontrolle der Scans sowie des OCR-Ergebnisses möglich, allerdings müssen Sie hierfür jede Seite einzeln aufrufen und bearbeiten. Außerdem können Spracheinstellungen für die OCR entsprechend angepasst werden, falls notwendig.

Der Job kann anschließend direkt übertragen werden. Eine Übertragung aller abgearbeiteten Jobs im Stapel ist ebenfalls möglich, in dem Sie alle Jobs in der Jobliste markieren und dann auf „Job übertragen“ klicken. Während der Übertragung wird das durchsuchbare PDF erzeugt.

2.2 OCR als Batch-Operation
Abschnitt hinzufügen

Wenn Sie viele Jobs mit jeweils umfangreichen Inhaltverzeichnissen gescannt haben, bietet sich der OCR-Lauf als Batch-Operation an. Hierfür sollten Sie zunächst sicherstellen, dass die Sprachauswahl in den OCR-Einstellungen für den jeweiligen Job korrekt und die Scans einwandfrei sind.

Dann rufen Sie die Batchoperation über das Menü „Job“ und die Funktion „Operation auf dem Job ausführen“ auf.

Wählen Sie die Operation OCR für alle Seiten durchführen und alle Seiten des Jobs aus den beiden Listen aus. Dann können Die den OCR-Lauf durch Klicken auf den Button „Anwenden“ starten.

Die grünen Balken zeigen den Fortschritt des Prozesses an:

Nachdem der OCR-Lauf beendet ist, können Sie den „Dialog schließen“ und entweder direkt eine Qualitätskontrolle durchführen oder mit dem nächsten Job entsprechend fortfahren. Wenn die OCR bei allen Jobs durchgeführt wurde, können Sie die Qualitätskontrolle für alle Jobs am Ende anschließen, falls das noch nicht passiert ist. Für einzelne Seiten mit schlechten OCR-Ergebnissen lösen Sie den OCR-Lauf manuell, nach entsprechender Imagebearbeitung oder korrigierten OCR-Einstellungen, erneut aus.

Zum Übertragen der Aufträge markieren Sie alle bearbeiteten Jobs in der Jobliste von BCS-2 mit der Maus und starten die Übertragung mit dem entsprechenden Button. Während der Übertragung wird das durchsuchbare PDF erzeugt.

2.3 OCR-Automatik bei Übertragung der Jobs
Abschnitt hinzufügen

Sofern Sie an Ihrer Scanstation zur Abarbeitung der Aufträge für die Kataloganreicherung alle Arbeitsschritte durchführen, also sowohl das Scannen als auch die OCR, sind diese Funktionen standardgemäß entsprechend an zwei Orten konfiguriert : Im BCS-2-Workflow für die Kataloganreicherung und in den Einstellungen für das Peersystem bzw. Ihren Scanclient in Mybib eDoc. Da Ihr Scanclient also im Mybib eDoc-System für das Scannen und die OCR vorgesehen und registriert ist, fordert Mybib eDoc bei der Übertragung der gescannten Jobs die OCR-Dateien und ein durchsuchbares PDF ein. Wenn im Workflow Ihres BCS-2 die Einstellungen für Scannen und OCR durchführen angehakt sind, wie hier unten abgebildet, wird BCS-2 während der Übertragung der Jobs ein durchsuchbares PDF erstellen, was auch den OCR-Lauf mit einschließt, falls dieser noch nicht gelaufen ist.

Auf diese Art wird der OCR-Lauf lediglich durch die Voreinstellungen für die Interaktion von BCS-2 mit MyBib eDoc angestoßen. Für ein hohes Aufkommen an Aufträgen in der Kataloganreicherung ist diese Arbeitsweise sicher die schnellste und bequemste. Die Abläufe sollten allerdings überwacht werden, da MyBib eDoc keine Fehlermeldung ausgibt, falls die OCR z.B. aufgrund eines aufgebrauchten ABBYY-Dongles nicht möglich ist. Es wird also beim Upload nicht überprüft, ob das erhaltene PDF wirklich durchsuchbar ist oder nicht.

Deshalb müssen Sie hier genau darauf achten, dass die OCR wirklich durchgeführt werden kann. Dies gilt ebenso für die Qualität der Scans als Voraussetzung, sowie die Einstellungen für die OCR, die im Vorhinein angepasst werden sollten. Auch eine zumindest stichprobenartige Qualitätssicherung im Anschluss ist bei dieser Arbeitsweise unbedingt zu empfehlen.

Eine genauere Beschreibung zu den Einstellungen für Scanclients ist im MyBib eDoc-Handbuch zu finden.