2009-09-16 19 views
9

La mia lettura di questo article suggerisce che un vantaggio di ReCAPTCHA è che può avere gli umani verificare le parole non riconosciute nell'OCR/digitalizzazione dei libri. Lo fa usando queste parole in "Sei umano?" test. Quindi ReCAPTCHA uccide due piccioni con una fava. Grande!Come funziona ReCAPTCHA?

Ma non capisco. Se la parola non può essere riconosciuta dal processo di digitalizzazione, qual è l'ingresso inserito, dal presunto essere umano, verificato? Come funziona?

risposta

23

Mostra due parole. Uno di loro il computer lo sa già, l'altro no. Presume che se ottieni il noto giusto, devi conoscere l'altro.

Non sai quale dei due è già noto, quindi, teoricamente, non puoi ingannarlo. Inoltre, riprodurrà una parola con più persone per ottenere una conferma indipendente prima di inviarla alla fonte (società di stampa, gruppo di scansione dei libri) come risposta valida.

Ma se un computer non può leggere un tale CAPTCHA , come fa il sistema conosce la risposta corretta del puzzle? Ecco come come: Ogni nuova parola che non può essere letta correttamente da OCR viene assegnata a un utente in congiunzione con un'altra parola per che la risposta è già nota. L'utente viene quindi invitato a leggere entrambe le parole. Se risolvono quello per cui è nota la risposta , il sistema assume la risposta è corretta per il nuovo . Il sistema quindi dà la nuova immagine a un numero di altre persone a determinare, con maggiore sicurezza, se la risposta originale era corretta.

http://recaptcha.net/learnmore.html

+0

Vorrei notare che ReCAPTCHA funziona mostrando due parole, una che conosce e un'altra no. Hai solo bisogno di averne una corretta. Tuttavia, inviano di nuovo quello che non fanno diverse volte fino a che non ottengono un'alta percentuale che è corretta prima che la assorbano in quanto tale. –

+0

Buon punto, il sistema non è infallibile, anche se è intelligente. Mi ricorda il gioco Image Labeler di Google, che funziona secondo gli stessi principi per far sì che sconosciute etichettino le immagini: http://images.google.com/imagelabeler/ –

+0

Imagelabeler e ReCapcha sono dello stesso tipo: Luis von Ahn. Ha davvero aperto la strada usando gli umani per risolvere i problemi più difficili. –

2

Citato da LEARN HOW reCAPTCHA WORKS

Ma se un computer non può leggere un tale CAPTCHA, come fa il sistema conosce la risposta corretta del puzzle? Ecco come: Ogni nuova parola che non può essere letta correttamente da OCR viene assegnata a un utente insieme a un'altra parola per la quale la risposta è già nota. All'utente viene quindi chiesto di leggere entrambe le parole. Se risolvono quello per cui è nota la risposta, il sistema assume che la risposta sia corretta per quella nuova. Il sistema fornisce quindi la nuova immagine a un numero di altre persone per determinare, con maggiore sicurezza, se la risposta originale fosse corretta.