32

Sono interessato a scrivere alcune applicazioni di riconoscimento di oggetti computerizzati di base, quindi immagino di aver bisogno di un po 'di background teorico negli algoritmi di elaborazione delle immagini, insieme ad alcuni AI per le capacità decisionali.Dove posso iniziare a conoscere l'elaborazione delle immagini e il riconoscimento degli oggetti?

Sono un laureato in informatica, e un giorno ho intenzione di ottenere il mio Master, spero in uno di questi campi. Nel frattempo, mi piacerebbe avere un vantaggio e fare un po 'di autoapprendimento.

Quindi la mia domanda è, da dove comincio? Gradirei una freccia nella giusta direzione, alcuni collegamenti se possibile.

+0

Sei interessato in computer vision? – BobbyShaftoe

+0

Fondamentalmente, sì, questo è il risultato finale. Anche se non sto cercando di costruire un robot killer o qualcosa = ;-) – Yuval

risposta

13

Forse dare un'occhiata a: OpenCV. Davvero una buona libreria per l'elaborazione delle immagini, e quando saprai cosa usare per quale scopo, puoi dare un'occhiata "sotto il cofano" per sapere come funziona :)

+0

buona risposta rky! – Murko

7

Benvenuti nel divertente mondo della visione artificiale, che è fondamentalmente il campo in cui gestisci l'elaborazione delle immagini con algoritmi AI per eseguire il riconoscimento/tracciamento/segmentazione ecc. Senza essere esauriente, l'intera operazione riguarda l'acquisizione delle immagini, l'elaborazione delle immagini, la segmentazione delle immagini, il riconoscimento delle immagini.

Il modo più semplice per iniziare è probabilmente OpenCV. Nella maggior parte delle applicazioni, tuttavia, l'uso di OpenCV è probabilmente eccessivo, in quanto non è così difficile iniziare da zero. Una volta superata la fase di caricamento dell'immagine (probabilmente si vorrebbe considerare la parte BMP più semplice da analizzare), è possibile implementare molti algoritmi di elaborazione delle immagini di base se si è appena ottenuta la formula matematica. Ci sono anche altre librerie che probabilmente potresti provare, cose come torchvision, AForge (.NET) sono buone scelte.

Quando si tratta della parte AI, ecco dove le cose diventano interessanti. Probabilmente vorresti usare SVM dove esiste una serie di librerie che puoi usare, ad es. libsvm, SVMlight ed ecc.

3

Se sei interessato ai libri, consiglierei "Introduzione all'elaborazione e all'analisi delle immagini" di John Russ a livello introduttivo. Ho anche utilizzato ImageJ come una buona applicazione per l'analisi delle immagini gratuita, utile per la prototipazione e per provare le cose. Come altri hanno già detto, vale la pena anche guardare la libreria OpenCV.

0

Un SDK .NET open source implementato in C# & Il C++ è stato recentemente rilasciato da Microsoft con alcune interfacce di webcam e analisi delle immagini molto rudimentali. Potrebbe valere la pena prendere uno browse around the extremely well documented code solo per andare avanti.

1

buone risposte. Spero tu non sia matematico-fobico. La mia tecnica preferita in questi giorni è Markov-Chain Monte Carlo (Google Spiegelhalter). Il riconoscimento è un problema di ottimizzazione e MCMC è un modo generale per gestirli tramite l'inferenza bayesiana.

2

ho scritto qualche immagine OpenCV tutorial elaborazione/computer vision con connessione codice sorgente, così si potrebbe desiderare di guardare alcuni di loro per contribuire a ottenere un inizio: http://www.shervinemami.co.cc/openCV.html