7. OCR-Texte
Kapitel hinzufügen

Besonderheit: Dateiname und Zielordner legen Sie im Skript fest, nicht im Reiter „Basis“ des Workflows.

7.1 OCR-Texte pro Seite als Text-Datei
Abschnitt hinzufügen

Ausgabe einer TXT-Datei pro Seite.

// -----------------------------------------------------------------
// Datum: 09.01.2018
// Zweck: Erzeuge eine Text-Datei mit dem OCR-Text pro Seite
// -----------------------------------------------------------------


var filename;
var folder = "C:/exports/ocr/";
var page;

for (i = 0; i < job.numPages; i++) {


  page = job.pages[i];

// ut.notifyUser('seite ' + i+1, '"'+page.ocrText+'"');
  filename = folder + page.pageNumber8 + '.txt';
// ut.notifyUser('filename' , filename);
  ut.writeStringToFile (filename, page.ocrText);

} // for i

Den Ablagepfad erstellt BCS-2 automatisch, sofern die KeyMaps gefüllt sind. Der Dateiname entspricht dem Indexwert.

Name: FOLDER_FOLDER Wert: job.index1 Name: LOCAL_MASTER_FOLDER Wert: C:/

// -----------------------------------------------------------------
// Datum: 22.01.2021
// Zweck: Erzeuge eine Text-Datei mit dem OCR-Text pro Seite
// -----------------------------------------------------------------


var folder    = job.getWfKeyValue('MASTER_FOLDER') + '/' + eval(job.getWfKeyValue('FOLDER_NAME'));
var file_name;
var page;

ut.createCompletePath(folder);

for (i = 0; i < job.numPages; i++) {


  page = job.pages[i];

  ut.notifyUser('seite ' + i+1, '"'+page.ocrText+'"');
  file_name = folder + '/' + page.pageNumber8 + '.txt';
  ut.notifyUser('file_name' , file_name);
 

  ut.writeStringToFile(file_name, page.ocrText);

} // for i

7.2 OCR-Texte pro Seite als eL XML Datei
Abschnitt hinzufügen

// ----------------------------------------------------------------- 

// Datum: 09.01.2018 

// Zweck: Erzeuge eL XML-Dateien mit dem OCR-Text pro Seite 

// ----------------------------------------------------------------- 

 

var filename; 

var folder = "J:/2020/" + job.index2 + "/"; 

var page; 




for (i = 0; i < job.numPages; i++) { 


page = job.pages[i]; 

 

// ut.notifyUser('seite ' + i+1, '"'+page.ocrtexteL+'"'); 

filename = folder + page.pageNumber + '.xml'; 

// ut.notifyUser('filename' , filename); 

ut.writeStringToFile (filename, page.ocrTexteL); 

 
} // for i 

7.3 OCR-Texte für den gesamten Job als Text-Datei
Abschnitt hinzufügen

7.3.1.1 Alternative 1: Dateiname und Pfad definieren Sie wie gehabt unter „Basis“.
// -----------------------------------------------------------------
// Datum: 13.08.2019
// Zweck: Erzeuge eine Text-Datei mit den OCR-Texten aller Seiten
// -----------------------------------------------------------------


var ocr_texts = "";

for (i = 0; i < job.numPages; i++) {
  ocr_texts += job.pages[i].ocrText + '\n';
} // for i...

ocr_texts;
7.3.1.2 Alternative 2:
// -----------------------------------------------------------------
// Datum: 09.01.2018
// Zweck: Erzeuge eine Text-Datei mit den OCR-Texten aller Seiten
Pfad und Dateinamen werden im Reiter Basis festgelegt. 
// -----------------------------------------------------------------


//var filename = "C:/OCR-Texte/job.name.txt";
var page;
var ocr_texts = "";

for (i = 0; i < job.numPages; i++) {

  page = job.pages[i];

  ocr_texts += page.ocrText + '\n';

} // for i

ocr_texts;
7.3.1.3 Alternative 3 – BCS-2 erstellt den Ablagepfad automatisch, sofern die KeyMaps gefüllt sind. Der Dateiname entspricht dem Indexwert.
  • Name: FOLDER_FOLDER
  • Wert: job.index1
  • Name: LOCAL_MASTER_FOLDER
  • Wert: C:/

// —————————————————————– // Datum: 13.08.2019 // Zweck: Erzeuge eine Text-Datei mit den OCR-Texten aller Seiten // —————————————————————– var ocr_texts = „“; var folder = job.getWfKeyValue(‚MASTER_FOLDER‘) + ‚/‘ + eval(job.getWfKeyValue(‚FOLDER_NAME‘)); var file_name = folder +’/‘ + job.index1 + ‚.txt‘; for (i = 0; i < job.numPages; i++) { ocr_texts += job.pages[i].ocrText + ‚\n‘; } // for i… ut.createCompletePath(folder); ut.writeStringToFile(file_name, ocr_texts);