7. OCR-Texte
Kapitel hinzufügen

Besonderheit: Dateiname und Zielordner legen Sie im Skript fest, nicht im Reiter „Basis“ des Workflows.

OCR-Texte pro Seite

Ausgabe einer TXT-Datei pro Seite.

// -----------------------------------------------------------------
// Datum: 09.01.2018
// Zweck: Erzeuge eine Text-Datei mit dem OCR-Text pro Seite
// -----------------------------------------------------------------


var filename;
var folder = "C:/exports/ocr/";
var page;

for (i = 0; i < job.numPages; i++) {


  page = job.pages[i];

// ut.notifyUser('seite ' + i+1, '"'+page.ocrText+'"');
  filename = folder + page.pageNumber8 + '.txt';
// ut.notifyUser('filename' , filename);
  ut.writeStringToFile (filename, page.ocrText);

} // for i

Den Ablagepfad erstellt BCS-2 automatisch, sofern die KeyMaps gefüllt sind. Der Dateiname entspricht dem Indexwert.

Name: FOLDER_FOLDER Wert: job.index1 Name: LOCAL_MASTER_FOLDER Wert: C:/

// -----------------------------------------------------------------
// Datum: 22.01.2021
// Zweck: Erzeuge eine Text-Datei mit dem OCR-Text pro Seite
// -----------------------------------------------------------------


var folder    = job.getWfKeyValue('MASTER_FOLDER') + '/' + eval(job.getWfKeyValue('FOLDER_NAME'));
var file_name;
var page;

ut.createCompletePath(folder);

for (i = 0; i < job.numPages; i++) {


  page = job.pages[i];

  ut.notifyUser('seite ' + i+1, '"'+page.ocrText+'"');
  file_name = folder + '/' + page.pageNumber8 + '.txt';
  ut.notifyUser('file_name' , file_name);
 

  ut.writeStringToFile(file_name, page.ocrText);

} // for i

OCR-Texte für den gesamten Job

Alternative 1: Dateiname und Pfad definieren Sie wie gehabt unter „Basis“.

// -----------------------------------------------------------------
// Datum: 13.08.2019
// Zweck: Erzeuge eine Text-Datei mit den OCR-Texten aller Seiten
// -----------------------------------------------------------------


var ocr_texts = "";

for (i = 0; i < job.numPages; i++) {
  ocr_texts += job.pages[i].ocrText + '\n';
} // for i...

ocr_texts;

Alternative 2:

// -----------------------------------------------------------------
// Datum: 09.01.2018
// Zweck: Erzeuge eine Text-Datei mit den OCR-Texten aller Seiten
// -----------------------------------------------------------------


var filename = "C:/exports/ocr/ocr_job.txt";
var page;
var ocr_texts = "";

for (i = 0; i < job.numPages; i++) {

  page = job.pages[i];

  ocr_texts += page.ocrText + '\n';

} // for i

ut.writeStringToFile (filename, ocr_texts);

Alternative 3 – BCS-2 erstellt den Ablagepfad automatisch, sofern die KeyMaps gefüllt sind. Der Dateiname entspricht dem Indexwert.

  • Name: FOLDER_FOLDER
  • Wert: job.index1
  • Name: LOCAL_MASTER_FOLDER
  • Wert: C:/
// -----------------------------------------------------------------
// Datum: 13.08.2019
// Zweck: Erzeuge eine Text-Datei mit den OCR-Texten aller Seiten
// -----------------------------------------------------------------


var ocr_texts = "";
var folder    = job.getWfKeyValue('MASTER_FOLDER') + '/' + eval(job.getWfKeyValue('FOLDER_NAME'));
var file_name = folder +'/' + job.index1 + '.txt';

for (i = 0; i < job.numPages; i++) {
  ocr_texts += job.pages[i].ocrText + '\n';
} // for i...

ut.createCompletePath(folder);
ut.writeStringToFile(file_name, ocr_texts);