questo non può essere una risposta ottimale, ma qui va:
io non sono sicuro se lo strumento da riga di comando ha opzioni per specificare il testo-regioni.
Quello che puoi fare è usare un wrapper Tesseract su un'altra piattaforma (EmguCV ha incorporato Tesseract). Quindi ottieni l'immagine scansionata, ritaglia le regioni di testo e assegnale a Tesseract una alla volta. In questo modo eviterete anche eventuali inesattezze nell'analisi del layout di pagina di Tesseract.
es.
Image<Gray,Byte> scannedImage = new Image<Gray,Byte>(path_to_scanned_image);
//assuming you know a text region
Image<Gray,Byte> textRegion = new Image(100,20);
scannedImage.ROI = new Rectangle(0,0,100,20);
scannedImage.copyTo(textRegion);
ocr.recognize(textRegion);
Hehe, che era il mio piano di riserva se Tesseract non accetta regioni :) – sashoalm