2015-07-26 6 views
5

Ho codice usando pytesseract e lavoro perfetto, solo che non funzionano quando l'immagine che cerco di riconoscere sono da 0 a 9. Se l'immagine ha solo una cifra non danno alcun risultato .pytesseract non funziona con un'immagine di una cifra

Questo un campione di un'immagine su cui sto lavorando https://drive.google.com/folderview?id=0B68PDhV5SW8BdFdWYVRwODBVZk0&usp=sharing

E questo il codice che sto utilizzando

import pytesseract 
    varnum= pytesseract.image_to_string(Image.open('images/table/img.jpg')) 
    varnum = float(varnum) 
    print varnum  

Grazie !!!!

Con questo codice sono in grado di leggere tutti i numeri

import pytesseract 


start_time = time.clock() 
y = pytesseract.image_to_string(Image.open('images/table/1.jpg'),config='-psm 10000') 
x = pytesseract.image_to_string(Image.open('images/table/1.jpg'),config='-psm 10000') 

print y 
print x 

y = pytesseract.image_to_string(Image.open('images/table/68.5.jpg'),config='-psm 10000') 
x = pytesseract.image_to_string(Image.open('images/table/68.5.jpg'),config='-psm 10000') 

print y 
print x 

print time.clock() - start_time, "seconds" 

risultato

>>> 
1 
1 
68.5 
68.5 
0.485644155358 seconds 
>>> 
+0

Puoi provare come - 'Varnum = pytesseract.image_to_string (Image.open ('images/table/img.jpg'), config = "- psm 1") '? –

+0

Oppure - 'varnum = pytesseract.image_to_string (Image.open ('images/table/img.jpg'), config =" - psm 10 ")'. –

risposta

6

Lei avrebbe bisogno di impostare la modalità di segmentazione pagina per essere in grado di leggere singoli caratteri/cifre.

Dal tesseract-ocr manual (che è ciò che pytesseract utilizza internamente), è possibile impostare la modalità di segmentazione pagina utilizzando -

-psm N

Set Tesseract per eseguire solo un sottoinsieme di analisi del layout e assumere una forma di immagine pari a . Le opzioni per N sono:

10 = Tratta l'immagine come un singolo carattere.

così si dovrebbe impostare l'opzione per -psm 10. Esempio -

varnum= pytesseract.image_to_string(Image.open('images/table/img.jpg'),config='-psm 10')