"quante immagini per classe devono essere fornite al minimo?"
Dipende da come ti alleni.
Se si prepara un nuovo modello da zero, sotto la supervisione: per una regola empirica sul numero di immagini, è possibile esaminare le attività MNIST e CIFAR. Questi sembrano funzionare bene con circa 5.000 immagini per classe. Questo è se ti stai allenando da zero.
Probabilmente è possibile eseguire il bootstrap della rete iniziando con un modello addestrato su ImageNet. Questo modello avrà già delle buone caratteristiche, quindi dovrebbe essere in grado di imparare a classificare nuove categorie senza tanti esempi etichettati. Non penso che questo sia abbastanza ben studiato per dirti un numero specifico.
In caso di addestramento con dati senza etichetta, forse solo 100 immagini etichettate per classe. Vi sono molti lavori di ricerca recenti su questo argomento, sebbene non si adattino a compiti come Imagenet. semplice da implementare:
http://arxiv.org/abs/1507.00677
complicato da attuare: "? Abbiamo bisogno di appx fornire la stessa quantità di immagini di addestramento per classe o la quantità può essere per classe disparate"
http://arxiv.org/abs/1507.02672
http://arxiv.org/abs/1511.06390
http://arxiv.org/abs/1511.06440
Dovrebbe funzionare con diversi numeri di esempi per classe.
"qual è l'impatto dei dati di immagine errati nei dati di allenamento? Ad esempio 500 immagini di una scarpa da tennis e 50 di altre scarpe".
si consiglia di utilizzare l'etichetta di smoothing tecnica descritta in questo documento:
http://arxiv.org/abs/1512.00567
lisciare l'etichette, sulla base di stima del tasso di errore etichetta.
"è possibile addestrare un classificatore con molte più classi rispetto al modello inception-v3 recentemente pubblicato? Diciamo: 30.000."
Sì
Avete la definizione di rete Inception-v3, in modo che si può cambiare, o semplicemente la versione ridotta utilizzata per la classificazione (versione distribuzione)? –