1. C-3 Plus Komponenten
Kapitel hinzufügen

C-3 Plus besteht aus vier wesentlichen Komponenten:

  • Der Regel selbst (C-3 Plus-Rule)
  • Den Suchzielen (C-3 Plus-Items)
  • Den Start-. End-, bzw. globalen Bedingungen (C-3 Plus-Conditions)
  • Den Prädikaten (C-3 Plus-Predicates)
  • Den Parametern

Die dargestellte Reihenfolge stellt auch gleichzeitig die Hierarchie der Bestandteile dar: Eine Regel enthält mehrere Suchziele. Diese enthalten jeweils 3 mögliche Start-, End-, bzw. globale Bedingungen, welche wiederum beliebig viele Prädikate beinhalten können.

Alle Bestandteile besitzen einen Satz von Parametern, die ihre individuelle Funktionsweise beeinflussen können. Der jeweilige Parametersatz ist auf das jeweilige Exemplar zugeschnitten. Änderungen an den Parametern einer C-3 Plus-Komponente gelten auch nur für die jeweilige C-3 Plus-Komponente selbst.

1.1 Grundsätzliche Funktion
Abschnitt hinzufügen

C-3 Plus durchläuft die jeweiligen Bestandteile einer Regel in der Reihenfolge der Suchziele. Angewendet wird jede Regel auf die vorher festgelegten Kacheln des Scans (und damit der OCR-Daten für diesen Bereich).

Ein Suchziel sucht immer einen Textteil in der/den ausgewählten Kachel(n). Eingegrenzt werden kann er durch die ggf. gesetzten Start-, End-, bzw. globalen Bedingungen. Dort werden die Prädikate hinterlegt, die für die jeweilige Bedingung gelten, also für den Anfang, das Ende oder den gesamten Textabschnitt.

C-3 Plus betrachtet grundsätzlich zunächst Wörter und durchläuft jedes Wort einer Kachel. Die Kacheln stellen eine geeignete Wortreihenfolge sicher, die die OCR des ganzen Dokumentes ggf. in nicht geeigneter Form liefert. Für jedes Wort werden alle Prädikate getestet. Treffen alle zu, so ist die jeweilige Start-, End-, bzw. Globale Bedingung an dieser Stelle erfüllt und die nächste wird untersucht. Sind alle Bedingungen erfüllt, die das jeweilige Suchziel beschreiben, so ist es gefunden und das nächste Suchziel wird bearbeitet.

Beim Schritt von Bedingung zu Bedingung wird der aktuelle Wortindex beibehalten, beim Schritt von Suchziel zu Suchziel hingegen nicht. So ist es möglich, dass auf dem gleichen Wort beispielsweise eine Start und eine End Bedingung gelten können. Aber ein Wort kann nicht zu mehreren Suchzielen gehören.