23

Per un progetto ai-class ho bisogno di implementare un algoritmo di apprendimento di rinforzo che batte un semplice gioco di tetris. Il gioco è scritto in Java e abbiamo il codice sorgente. Conosco le basi della teoria dell'apprendimento rinforzato, ma mi chiedevo se qualcuno nella comunità SO avesse esperienza pratica con questo tipo di cose.Buone implementazioni dell'apprendimento rinforzato?

  1. Quali sarebbero le letture consigliate per un'implementazione dell'apprendimento rinforzato in un gioco tetris?
  2. Ci sono dei buoni progetti open source che realizzano cose simili che varrebbe la pena di verificare?

Modifica: più sono specifici meglio è, ma le risorse generali sull'argomento sono benvenute.

Follow up:

pensato che sarebbe stato bello se ho postato un follow-up.

Ecco la soluzione (codice e correzione) che ho trovato per eventuali futuri studenti :).

Paper/Code

+7

+1 per chiedere una buona domanda a casa. È bello vedere qualcuno che chiede di imparare qualcosa piuttosto che chiedere di ricevere qualcosa. –

+3

Definitivamente d'accordo; chiedere buone risorse di apprendimento è una grande domanda, ed è anche utile per gli altri in futuro – Sukasa

risposta

12

Date un'occhiata ai 2009 RL-competition. Uno dei domini del problema è un tetris game. C'è stato un problema di tetris anche l'anno prima. Ecco lo 52-page final report del quinto finalista di quell'anno, che contiene molti dettagli su come ha funzionato l'agente.

+0

sembra interessante ma i link sembrano morti .... – mikera

+0

@mikera Parzialmente risolto; il sito web del concorso RL 2009 è sparito ma l'Internet Archive ha salvato gran parte del testo. – andrewdotn

+0

I collegamenti Dropbox danno 404 errori. –

3

Il Heaton Research ebook è abbastanza bravo a spiegare i concetti di reti neurali (con codice). Il capitolo 4 è dedicato all'apprendimento automatico e ai vari metodi di allenamento per le tue reti. C'è una libreria scaricabile e esempi di applicazioni da guardare.

2

TD-Gammon, gnubackgammon o qualsiasi altro progetto simile sono stati massicci successi nei giochi.

Sutton & Il libro di Barto "Apprendimento rinforzato: un'introduzione" ha anche altri Case Studies.

1

Questo non è specifico per l'apprendimento rinforzato, ma Stanford ha una grande serie di conferenze su machine learning on Youtube e iTunes.

Il collegamento è alla prima lezione che impiega circa 30 minuti per immergersi nel contenuto.

1

Burlap è una recente libreria Java che fornisce implementazioni di molti comuni algoritmi di apprendimento di rinforzo, nonché alcuni ambienti e strumenti utili.