6. OCR
Kapitel hinzufügen

  • OCR-Editor im Job anzeigen: Der Texteditor wird rechts neben dem Viewer angezeigt. Hier werden nach einem OCR-Lauf die OCR-Ergebnisse angezeigt und können dort auch editiert werden. Ist diese Option nicht aktiviert, werden die Ergebnisse nach dem OCR-Lauf in einem extra Dialog angezeigt, der vor dem Weiterverarbeiten geschlossen werden muss, aber jederzeit über „STRG+“ wieder geöffnet werden kann
  • OCR-Einstellungen jeden neuen Jobs dieses Workflows zuordnen: Diese Option hat zurzeit noch keine Funktion
  • wenn OCR für die gesamte Seite durchgeführt wird: das interne OCR-Ergebnis aufheben und später für zonierte OCR verwenden: Bei jedem OCR-Lauf schreibt BCS-2 die OCR-Ergebnisse in das IWC-OCR-DOC. Ist diese Option aktiviert, wird die Datei gespeichert und kann dann als Basis für die zonale OCR genutzt werden, so dass keine weiteren OCR-Läufe erfolgen müssen und das Ergebnis auf Basis der kontextsensitiven Seiten-OCR extrahiert werden kann
  • falls verfügbar: für zonierte OCR das interne OCR Ergebnis der Seite verwenden: S.o. Für die zonierte OCR wird auf einen gesonderten OCR-Lauf verzichtet. Die Ergebnisse werden aus dem IWC-OCR-Doc extrahiert
  • Nutzer kann den OCR-Text einer Kachel einem Index zuweisen: Nutzende können über den Eigenschaftendialog der Bereiche den OCR-Text einem zuvor definierten Index  zuweisen. Diese Funktion ist vor allem für das Clipping von Informationen und zur Datenanreicherung z.B. im Kontext Presseclipping sehr nützlich
  • Den Eigenschaften Dialog des Bereichs automatisch öffnen, wenn der Bereich selektiert wird: Der Eigenschaftendialog eines Bereichs muss nicht über das Kontextmenü des Bereichs geöffnet werden, er öffnet sich sobald man den Bereich anklickt.

spezielle OCR-Einstellungen für diesen Workflow: Diese Funktion ist vorbereitet aber noch nicht endgültig implementiert.

  • OCR-Einstellungen ändern, von globalen OCR-Einstellungen übernehmen, von den
  • OCR-Einstellungen des aktuellen Jobs übernehmen,
  • von den OCR-Einstellungen des aktuellen Images übernehmen

6.1 Job-Index steuert Sprache bzw. Schrift
Abschnitt hinzufügen

Ist die Funktion OCR-Sprache(n) mittels Index setzen aktiviert werden die OCR-Attribute für Sprache bzw. Schrift über Jobindizes gesetzt.

In den Feldern

  • Script-Ausdruck um die OCR-Sprache zu bestimmen  
  • Script-Ausdruck um die OCR-Text-Typ zu bestimmen 

werden die jeweiligen Indizes hinterlegt über die die Attribute ausgewählt werden. In der Dropdownliste  Index auswählen werden alle im Workflow definierten Indizes angezeigt und können automatisch als Skript-Ausdruck gesetzt werden.

 Wird der vordefinierte Index ISO639_3 für die Sprachen gewählt, muss der Ausdruck für den Index wie folgt aussehen: job.techIndex(Indexnummer)