Sono nuovo nell'apprendimento automatico. Mentre leggevo sull'apprendimento supervisionato, sull'apprendimento senza supervisione, sull'apprendimento rinforzato mi sono imbattuto in una domanda come quella seguente e mi sono confuso. Per favore aiutami a identificare in tre sotto quale è l'apprendimento supervisionato, l'apprendimento senza supervisione, l'apprendimento di rinforzo.Apprendimento supervisionato, (ii) Apprendimento non supervisionato, (iii) Rinforzo Impara
Quali tipi di apprendimento, se del caso, meglio descrivono i seguenti tre scenari:
(i) un sistema di classificazione della moneta è stato creato per un distributore automatico. Per fare questo, gli sviluppatori ottengono speculazioni di monete esatte dalla Zecca degli Stati Uniti e derivano un modello statistico delle dimensioni, del peso e della denominazione, che la macchina venditrice utilizza per classificare le sue monete.
(ii) Invece di chiamare la Zecca degli Stati Uniti per ottenere informazioni sulle monete, un algoritmo è presentato con un grande set di monete etichettate. L'algoritmo utilizza questi dati a inferire i limiti decisionali che il distributore automatico utilizza per classificare le sue monete .
(iii) Un computer sviluppa una strategia per giocare a Tic-Tac-Toe giocando ripetutamente e regolando la sua strategia penalizzando le mosse che alla fine portano a perdere.
Questo suona come compiti a casa. Se lo è, dovrebbe almeno essere etichettato di conseguenza. –
http://a1.phobos.apple.com/us/r30/CobaltPublic/v4/bd/c2/2a/bdc22a17-0243-30a9-ff33-f4c64a0b23ca/205-2184361167323353073-CS156_Problem_Set_1_Telecourse.pdf#!116627291 –
@LarsKotthoff , il tag dei compiti è stato reso obsoleto. –