7. OCR-TexteKapitel hinzufügen
Besonderheit: Dateiname und Zielordner legen Sie im Skript fest, nicht im Reiter „Basis“ des Workflows.
7.1 OCR-Texte pro Seite als Text-DateiAbschnitt hinzufügen
Ausgabe einer TXT-Datei pro Seite.
// ----------------------------------------------------------------- // Datum: 09.01.2018 // Zweck: Erzeuge eine Text-Datei mit dem OCR-Text pro Seite // ----------------------------------------------------------------- var filename; var folder = "C:/exports/ocr/"; var page; for (i = 0; i < job.numPages; i++) { page = job.pages[i]; // ut.notifyUser('seite ' + i+1, '"'+page.ocrText+'"'); filename = folder + page.pageNumber8 + '.txt'; // ut.notifyUser('filename' , filename); ut.writeStringToFile (filename, page.ocrText); } // for i
Den Ablagepfad erstellt BCS-2 automatisch, sofern die KeyMaps gefüllt sind. Der Dateiname entspricht dem Indexwert.
Name: FOLDER_FOLDER Wert: job.index1 Name: LOCAL_MASTER_FOLDER Wert: C:/
// ----------------------------------------------------------------- // Datum: 22.01.2021 // Zweck: Erzeuge eine Text-Datei mit dem OCR-Text pro Seite // ----------------------------------------------------------------- var folder = job.getWfKeyValue('MASTER_FOLDER') + '/' + eval(job.getWfKeyValue('FOLDER_NAME')); var file_name; var page; ut.createCompletePath(folder); for (i = 0; i < job.numPages; i++) { page = job.pages[i]; ut.notifyUser('seite ' + i+1, '"'+page.ocrText+'"'); file_name = folder + '/' + page.pageNumber8 + '.txt'; ut.notifyUser('file_name' , file_name); ut.writeStringToFile(file_name, page.ocrText); } // for i
7.2 OCR-Texte pro Seite als eL XML DateiAbschnitt hinzufügen
// ----------------------------------------------------------------- // Datum: 09.01.2018 // Zweck: Erzeuge eL XML-Dateien mit dem OCR-Text pro Seite // ----------------------------------------------------------------- var filename; var folder = "J:/2020/" + job.index2 + "/"; var page; for (i = 0; i < job.numPages; i++) { page = job.pages[i]; // ut.notifyUser('seite ' + i+1, '"'+page.ocrtexteL+'"'); filename = folder + page.pageNumber + '.xml'; // ut.notifyUser('filename' , filename); ut.writeStringToFile (filename, page.ocrTexteL); } // for i
7.3 OCR-Texte für den gesamten Job als Text-DateiAbschnitt hinzufügen
7.3.1.1 Alternative 1: Dateiname und Pfad definieren Sie wie gehabt unter „Basis“.
// ----------------------------------------------------------------- // Datum: 13.08.2019 // Zweck: Erzeuge eine Text-Datei mit den OCR-Texten aller Seiten // ----------------------------------------------------------------- var ocr_texts = ""; for (i = 0; i < job.numPages; i++) { ocr_texts += job.pages[i].ocrText + '\n'; } // for i... ocr_texts;
7.3.1.2 Alternative 2:
// ----------------------------------------------------------------- // Datum: 09.01.2018 // Zweck: Erzeuge eine Text-Datei mit den OCR-Texten aller Seiten Pfad und Dateinamen werden im Reiter Basis festgelegt. // ----------------------------------------------------------------- //var filename = "C:/OCR-Texte/job.name.txt"; var page; var ocr_texts = ""; for (i = 0; i < job.numPages; i++) { page = job.pages[i]; ocr_texts += page.ocrText + '\n'; } // for i ocr_texts;
7.3.1.3 Alternative 3 – BCS-2 erstellt den Ablagepfad automatisch, sofern die KeyMaps gefüllt sind. Der Dateiname entspricht dem Indexwert.
- Name: FOLDER_FOLDER
- Wert: job.index1
- Name: LOCAL_MASTER_FOLDER
- Wert: C:/
// —————————————————————– // Datum: 13.08.2019 // Zweck: Erzeuge eine Text-Datei mit den OCR-Texten aller Seiten // —————————————————————– var ocr_texts = „“; var folder = job.getWfKeyValue(‚MASTER_FOLDER‘) + ‚/‘ + eval(job.getWfKeyValue(‚FOLDER_NAME‘)); var file_name = folder +’/‘ + job.index1 + ‚.txt‘; for (i = 0; i < job.numPages; i++) { ocr_texts += job.pages[i].ocrText + ‚\n‘; } // for i… ut.createCompletePath(folder); ut.writeStringToFile(file_name, ocr_texts);