2013-04-03 6 views
5

Sono nuovo nell'apprendimento automatico. Mentre leggevo sull'apprendimento supervisionato, sull'apprendimento senza supervisione, sull'apprendimento rinforzato mi sono imbattuto in una domanda come quella seguente e mi sono confuso. Per favore aiutami a identificare in tre sotto quale è l'apprendimento supervisionato, l'apprendimento senza supervisione, l'apprendimento di rinforzo.Apprendimento supervisionato, (ii) Apprendimento non supervisionato, (iii) Rinforzo Impara

Quali tipi di apprendimento, se del caso, meglio descrivono i seguenti tre scenari:

(i) un sistema di classificazione della moneta è stato creato per un distributore automatico. Per fare questo, gli sviluppatori ottengono speculazioni di monete esatte dalla Zecca degli Stati Uniti e derivano un modello statistico delle dimensioni, del peso e della denominazione, che la macchina venditrice utilizza per classificare le sue monete.

(ii) Invece di chiamare la Zecca degli Stati Uniti per ottenere informazioni sulle monete, un algoritmo è presentato con un grande set di monete etichettate. L'algoritmo utilizza questi dati a inferire i limiti decisionali che il distributore automatico utilizza per classificare le sue monete .

(iii) Un computer sviluppa una strategia per giocare a Tic-Tac-Toe giocando ripetutamente e regolando la sua strategia penalizzando le mosse che alla fine portano a perdere.

+3

Questo suona come compiti a casa. Se lo è, dovrebbe almeno essere etichettato di conseguenza. –

+3

http://a1.phobos.apple.com/us/r30/CobaltPublic/v4/bd/c2/2a/bdc22a17-0243-30a9-ff33-f4c64a0b23ca/205-2184361167323353073-CS156_Problem_Set_1_Telecourse.pdf#!116627291 –

+0

@LarsKotthoff , il tag dei compiti è stato reso obsoleto. –

risposta

2

Diciamo che il set di dati è rappresentato come matrice X. Ogni riga in X è un'osservazione (istanza) e ogni colonna rappresenta una particolare variabile (funzione).

Se si dispone anche (e si usa) del vettore y di etichette, corrispondenti alle osservazioni, allora questo è un compito di apprendimento supervisionato . C'è un "supervisore" coinvolto, che dice quali osservazioni appartengono alla classe n. 1, alla classe n. 2, ecc.

Se non si dispone di etichette per le osservazioni, è necessario prendere decisioni in base allo stesso set di dati X . Ad esempio, nell'esempio con le monete potresti voler costruire un modello di distribuzione normale per i parametri delle monete e creare un sistema che segnali quando la moneta ha parametri insoliti (e quindi può essere tentata una frode). In questo caso non hai alcun tipo di supervisore che possa dire quali monete sono ok e quali rappresentano i tentativi di frode. Pertanto, è l'attività di apprendimento non supervisionata .

In 2 esempi precedenti è stato prima addestrato il modello e quindi utilizzato, senza ulteriori modifiche al modello. Nel modello apprendimento rinforzo il modello viene continuamente migliorato in base ai dati elaborati e al risultato. Ad esempio, il robot che cerca di trovare la via dal punto A al punto B può prima calcolare i parametri dello spostamento, quindi spostarsi in base a questi parametri, quindi analizzare la nuova posizione e aggiornare i parametri di spostamento, in modo che la prossima mossa sia più accurata (ripetere fino ad arrivare al punto B).

Sulla base di questo, sono abbastanza sicuro che riuscirai a trovare la corrispondenza tra questi 3 tipi di apprendimento e i tuoi articoli.

+0

apprendimento supervisionato – user2201536

3

(i) apprendimento non supervisionato - come non ci sono dati l'etichetta è disponibile

(ii) sotto la supervisione di apprendimento - come già hanno etichettato i dati disponibili

(iii) rafforzamento Learning- dove si impara e imparare di nuovo basa su le azioni e gli effetti/i benefici di tali azioni.

+0

(ii) "un algoritmo viene presentato con un ampio set di ** monete ** etichettate" – ffriend

+2

(i) non è supervisionato: la vera distribuzione dei dati è nota. Ciò significa che puoi ottenere la regola di decisione ottimale di Bayes. Nessun dato etichettato -> senza supervisione è una regola troppo semplicistica, penso che la risposta corretta debba essere "nessuna delle precedenti". Per non essere sorvegliati, dovresti essere presentato con un mucchio di monete ma nessuna informazione su quali istanze appartenessero a quali tipi. –

+0

D'accordo, ma se un solo metodo deve essere scelto tra tre metodi dati, penso che dovrebbe essere l'apprendimento senza supervisione dato che non ci sono informazioni prontamente disponibili (etichette) – marc

0

In algoritmi supervisionati, le classi sono predeterminate. Queste classi possono essere concepite come un insieme finito, precedentemente arrivato da un umano. In pratica, un certo segmento di dati sarà etichettato con queste classificazioni. Il compito del discente è quello di cercare modelli e costruire modelli matematici. Questi modelli vengono poi valutati sulla base della loro capacità predittiva in relazione alle misure di varianza nei dati stessi. Molti dei metodi a cui si fa riferimento nella documentazione (induction tree induction, naive Bayes, ecc.) Sono esempi di tecniche di apprendimento supervisionate.

Gli studenti senza sorveglianza non sono forniti con le classificazioni. In effetti, il compito fondamentale dell'apprendimento non supervisionato è sviluppare automaticamente le etichette di classificazione. Gli algoritmi non sorvegliati ricercano la somiglianza tra parti di dati al fine di determinare se possono essere caratterizzati come formare un gruppo. Questi gruppi sono definiti cluster e vi è un'intera famiglia di tecniche di apprendimento automatico delle macchine.

+0

Una buona spiegazione, ma ti manca l'apprendimento di rinforzo. – 0xc0de

0

Ho scritto un articolo su Perceptron per novizi. Ho spiegato Apprendimento supervisionato in dettaglio con Delta Rule. Descritto anche Apprendimento non supervisionato e Apprendimento rinforzato (in breve). Puoi verificare se sei interessato.

"un intuitivo esempio di Artificial Neural Network (Perceptron) Rilevamento Auto/pedoni da una macchina self-driven"

https://www.spicelogic.com/Blog/Perceptron-Artificial-Neural-Networks-10