Sto lavorando al riconoscimento OCR del testo stampato. In particolare, mi sto concentrando sulla fase di pre-elaborazione per migliorare i risultati del motore Tesseract. Ho già ottenuto buoni risultati con soglie adattive, rimozione del rumore, correzione del testo, ecc ... Ma ancora Tesseract sembra fallire quando altri prodotti commerciali restituiscono risultati decenti.Miglioramento dei risultati OCR Tesseract con testo sfocato
Ho usato la seguente immagine di prova e qui ci sono i risultati ottenuti con Tesseract 3.04 rispetto a due apri commerciali OCR. Tutti i 3 servizi sono stati forniti con la stessa immagine binaria che contiene un testo leggermente sfocato.
Tesseract
Careers in Technology Consulting
Networking Lunch
21 m 2014, 11:00 - 14:30
Definingthecorporatellstmtegy, Wammmwdngdeal, creating
uniquebwinessisighnwilgbigdam-doesflismflxemmyouafioy?
Findoutmoreabanhowitfeektomkasatedlflogymbyjoiningour
for further mm please visit mAeloittexom/weers
ABBYY Fine Reader Online
Careers in Technology Consulting
Networking Lunch
21 November 2014,1140-14:30
Defining the corporate IT strategy, planning a multHnKon <Mar outsourcing deal, creating unique business insights using big data-doesthis sound Ifce something you enjoy?
Find out more about hour it feels to work as a technology consultant by joining our exclusive networking lunch,
For further information please visit wrwMuleloittexom/carcert
Careers in Technology Consulting Networking Lunch 21 November 2014, 11;00 —14:30
Defining the corporate IT strategy, planning a muiti-indlimi dollar outsourcing deal, creating unique business insights using big data—does this sound like something you enjoy?
Find out more about how it feels to work as a tedmology consultant by joining our exclusive networking lunch,
For further information' please visit wwwdeloitte,com/careers
Ora mi chiedo se il grande divario tra Tesseract e gli altri due prodotti è dovuto ad un motore diverso (di sicuro ABBYY utilizza il proprio motore, non è sicuro su OCR Web Service) o ci sono alcuni altri passaggi di pre-elaborazione che può essere fatto prima di eseguire Tesseract. Hai qualche suggerimento?
Che ne dici di controllare un post ooooold e accettare una risposta? – Claudio
Che ne dici di controllare un post ooooold e accettare una risposta? – Claudio