7. OCR-TexteKapitel hinzufügen
Besonderheit: Dateiname und Zielordner legen Sie im Skript fest, nicht im Reiter „Basis“ des Workflows.
7.1 OCR-Texte pro Seite als Text-DateiAbschnitt hinzufügen
Ausgabe einer TXT-Datei pro Seite.
// -----------------------------------------------------------------
// Datum: 09.01.2018
// Zweck: Erzeuge eine Text-Datei mit dem OCR-Text pro Seite
// -----------------------------------------------------------------
var filename;
var folder = "C:/exports/ocr/";
var page;
for (i = 0; i < job.numPages; i++) {
page = job.pages[i];
// ut.notifyUser('seite ' + i+1, '"'+page.ocrText+'"');
filename = folder + page.pageNumber8 + '.txt';
// ut.notifyUser('filename' , filename);
ut.writeStringToFile (filename, page.ocrText);
} // for i
Den Ablagepfad erstellt BCS-2 automatisch, sofern die KeyMaps gefüllt sind. Der Dateiname entspricht dem Indexwert.
Name: FOLDER_FOLDER Wert: job.index1 Name: LOCAL_MASTER_FOLDER Wert: C:/
// -----------------------------------------------------------------
// Datum: 22.01.2021
// Zweck: Erzeuge eine Text-Datei mit dem OCR-Text pro Seite
// -----------------------------------------------------------------
var folder = job.getWfKeyValue('MASTER_FOLDER') + '/' + eval(job.getWfKeyValue('FOLDER_NAME'));
var file_name;
var page;
ut.createCompletePath(folder);
for (i = 0; i < job.numPages; i++) {
page = job.pages[i];
ut.notifyUser('seite ' + i+1, '"'+page.ocrText+'"');
file_name = folder + '/' + page.pageNumber8 + '.txt';
ut.notifyUser('file_name' , file_name);
ut.writeStringToFile(file_name, page.ocrText);
} // for i
7.2 OCR-Texte pro Seite als eL XML DateiAbschnitt hinzufügen
// -----------------------------------------------------------------
// Datum: 09.01.2018
// Zweck: Erzeuge eL XML-Dateien mit dem OCR-Text pro Seite
// -----------------------------------------------------------------
var filename;
var folder = "J:/2020/" + job.index2 + "/";
var page;
for (i = 0; i < job.numPages; i++) {
page = job.pages[i];
// ut.notifyUser('seite ' + i+1, '"'+page.ocrtexteL+'"');
filename = folder + page.pageNumber + '.xml';
// ut.notifyUser('filename' , filename);
ut.writeStringToFile (filename, page.ocrTexteL);
} // for i
7.3 OCR-Texte für den gesamten Job als Text-DateiAbschnitt hinzufügen
7.3.1.1 Alternative 1: Dateiname und Pfad definieren Sie wie gehabt unter „Basis“.
// -----------------------------------------------------------------
// Datum: 13.08.2019
// Zweck: Erzeuge eine Text-Datei mit den OCR-Texten aller Seiten
// -----------------------------------------------------------------
var ocr_texts = "";
for (i = 0; i < job.numPages; i++) {
ocr_texts += job.pages[i].ocrText + '\n';
} // for i...
ocr_texts;
7.3.1.2 Alternative 2:
// -----------------------------------------------------------------
// Datum: 09.01.2018
// Zweck: Erzeuge eine Text-Datei mit den OCR-Texten aller Seiten
Pfad und Dateinamen werden im Reiter Basis festgelegt.
// -----------------------------------------------------------------
//var filename = "C:/OCR-Texte/job.name.txt";
var page;
var ocr_texts = "";
for (i = 0; i < job.numPages; i++) {
page = job.pages[i];
ocr_texts += page.ocrText + '\n';
} // for i
ocr_texts;
7.3.1.3 Alternative 3 – BCS-2 erstellt den Ablagepfad automatisch, sofern die KeyMaps gefüllt sind. Der Dateiname entspricht dem Indexwert.
- Name: FOLDER_FOLDER
- Wert: job.index1
- Name: LOCAL_MASTER_FOLDER
- Wert: C:/
// —————————————————————– // Datum: 13.08.2019 // Zweck: Erzeuge eine Text-Datei mit den OCR-Texten aller Seiten // —————————————————————– var ocr_texts = „“; var folder = job.getWfKeyValue(‚MASTER_FOLDER‘) + ‚/‘ + eval(job.getWfKeyValue(‚FOLDER_NAME‘)); var file_name = folder +’/‘ + job.index1 + ‚.txt‘; for (i = 0; i < job.numPages; i++) { ocr_texts += job.pages[i].ocrText + ‚\n‘; } // for i… ut.createCompletePath(folder); ut.writeStringToFile(file_name, ocr_texts);


