2011-02-03 11 views
9

Devo riconoscere i numeri dall'immagine della telecamera su iPhone, in tempo reale. So che non ci saranno più di 5 cifre sull'immagine.Il riconoscimento del numero su iPhone è possibile in tempo reale?

È questo problema realistico da risolvere in base alle specifiche di calcolo dell'iPhone? Qualcuno ha esperienza con la libreria OCR di Tesseract e pensi che potrebbe essere risolto usando?

+0

possibile duplicato di: http://stackoverflow.com/questions/3140455/training-tesseract-to-use-with-iphone –

+0

@ Daniel: Mentre questa domanda chiede come usa Tesseract per leggere i numeri in qualsiasi immagine fissa, questo sta studiando la possibilità di fare questo tipo di elaborazione da un flusso video live. Credo che qui ci sia abbastanza di differenza per giustificare una nuova domanda. –

risposta

1

Dovrebbe essere computazionalmente possibile. Ci sono app che possono ottenere un codice a barre in tempo reale e un'app che esegue la traduzione in tempo reale. (Word Lens). Non sono sicuro di quali librerie utilizzino, comunque.

11

Dipende dalla definizione di "tempo reale", ma sì, dovrebbe essere possibile eseguire un riconoscimento relativamente rapido delle sole cifre 0-9 su un iPhone 4, in particolare se è possibile utilizzare font, condizioni di illuminazione, ecc. . che appariranno in.

Consiglio vivamente di leggere l'articolo su how Sudoku Grab does its recognition of puzzles utilizzando la fotocamera dell'iPhone. Nel loro caso, è stata utilizzata una rete neurale addestrata per identificare le cifre, che dovrebbe essere ragionevolmente semplice e veloce sul moderno hardware iOS.

Le librerie di riconoscimento correnti disponibili, come OpenCV, utilizzeranno la CPU dell'iPhone per eseguire l'elaborazione. Ho sentito che possono svolgere anche compiti più complessi come il riconoscimento facciale abbastanza veloce da poter essere utilizzato con le sorgenti video mentre mostra una quantità minima di balbuzie.

Per prestazioni ancora migliori, credo che ci sia un sacco di potenziale nelle GPU programmabili sui nuovi dispositivi iOS. In my benchmarks, ho visto un aumento di velocità 14X - 28X quando si utilizza la GPU di iPhone 4 per la semplice elaborazione delle immagini. Mentre poche persone stanno guardando questo al momento, qualcosa come la rete neurale di Sudoku Grab dovrebbe essere un processo abbastanza parallelo per beneficiare dell'esecuzione sulla GPU.

+0

Lavoro utile http://www.benjaminloulier.com – iCoder86

0

Sì. Bender può aiutarti in questo. Ti permette di costruire ed eseguire reti neurali su iOS. Poiché utilizza il metallo sotto il cofano, scorre veloce e liscio. Supporta anche l'esecuzione diretta dei modelli TensorFlow.

Così si può eseguire in Bender un modello esistente in tensorflow allenato per il riconoscimento cifre Handwritten Digit Recognition using Convolutional Neural Networks in Python with Keras se hai bisogno di aiuto

Disclaimer: Ho lavorato su questo progetto.

0

C'è un SDK gratuito per questo: http://rtrsdk.com/ Supporta sia iOS che Andorid, funziona in tempo reale, ti aiuta a catturare qualsiasi testo, i numeri non dovrebbero essere un problema.

Disclaimer: io lavoro per ABBYY