1. C-3 Plus KomponentenKapitel hinzufügen
C-3 Plus besteht aus vier wesentlichen Komponenten:
- Dem Template
- Der Regel
- Den Suchzielen
- Den Start-, End-, bzw. globalen Bedingungen
- Den Prädikaten
- Den Parametern
Die dargestellte Reihenfolge stellt auch gleichzeitig die Hierarchie der Bestandteile dar: Jedes Template enthält eine Regel. Eine Regel enthält mehrere Suchziele. Diese enthalten jeweils 3 mögliche Start-, End-, bzw. globale Bedingungen, welche wiederum beliebig viele Prädikate beinhalten können.
Alle Bestandteile besitzen einen Satz von Parametern, der ihre individuelle Funktionsweise beeinflussen kann. Der jeweilige Parametersatz ist auf die jeweilige Komponente zugeschnitten. Änderungen an den Parametern einer C-3 Plus-Komponente gelten auch nur für die jeweilige C-3 Plus-Komponente selbst.
1.1 Grundsätzliche FunktionAbschnitt hinzufügen
C-3 Plus durchläuft die jeweiligen Bestandteile einer Regel in der Reihenfolge der Suchziele. Angewendet wird jede Regel auf die vorher festgelegten Kacheln des Scans (und damit der OCR-Daten für diesen Bereich).
Ein Suchziel sucht immer einen Textteil in der/den ausgewählten Kachel(n). Eingegrenzt werden kann er durch die ggf. gesetzten Start-, End-, bzw. globalen Bedingungen. Dort werden die Prädikate hinterlegt, die für die jeweilige Bedingung gelten, also für den Anfang, das Ende oder den gesamten Textabschnitt.
C-3 Plus betrachtet grundsätzlich zunächst Wörter und durchläuft jedes Wort einer Kachel. Die Kacheln stellen eine geeignete Wortreihenfolge sicher, die die OCR des ganzen Dokumentes ggf. in nicht geeigneter Form liefert. Für jedes Wort werden alle Prädikate getestet. Treffen alle zu, so ist die jeweilige Start-, End-, bzw. globale Bedingung an dieser Stelle erfüllt und die nächste wird untersucht. Sind alle Bedingungen erfüllt, die das jeweilige Suchziel beschreiben, so ist es gefunden und das nächste Suchziel wird bearbeitet.
Beim Schritt von Bedingung zu Bedingung wird der aktuelle Wortindex beibehalten, beim Schritt von Suchziel zu Suchziel hingegen nicht. So ist es möglich, dass auf dem gleichen Wort beispielsweise eine Start- und eine Endbedingung gelten können. Aber ein Wort kann nicht zu mehreren Suchzielen gehören.