13

Twitter, Google, Amazon, del.icio.us ecc. offrono tutti molti dati con cui giocare, tutto gratuitamente. Ci sono anche molti dati testuali disponibili attraverso iniziative come Project Gutenberg. E quello, a quanto pare, è solo la punta dell'iceberg.Quali sono alcuni modi per divertirsi con una grande quantità di dati? (ad esempio, le API di Twitter, del.icio.us ecc.)

Mi sono chiesto come utilizzare questi dati per divertimento. Sono uno studente IT del primo anno, quindi non ho conoscenza delle statistiche, apprendimento automatico, filtraggio collaborativo ecc. Il mio interesse in quest'area è stato suscitato dal libro Programmazione Intelligenza Collettiva di Toby Segaran, e ora voglio prendere un approfondimento su cosa puoi fare con i dati. Non so da dove iniziare. Qualche idea?

Mi sono anche chiesto se dovrei andare a comprare qualcosa come Paradigmi di Intelligenza Artificiale Programmando. Vale la pena il viaggio attraverso la città?

+0

Amazon vende libri :) perché viaggiare attraverso la città? –

+0

Non vende libri in India :( –

risposta

6

Prova a sparare libri in diversi stili da Guttenberg a un generatore di catene Markov: ce n'è uno in Perl here per iniziare.

+0

Mi picchia, le macchine Markov sono molto divertenti :) –

+0

Pubblica i risultati su un account Twitter tramite la sua API e guarda quanti follower puoi ottenere in base ai tweet generati dalla tua macchina. –

+1

Mi piace! Ma la maggior parte dei twit sembra essere una IA scarsamente programmata. Ho seri dubbi sulla loro capacità di superare il test di Turing. –

3

Visualizzazioni, li fanno, li condividono.

0

È possibile creare puzzle come i giochi dell'impiccato. O un mashup o prova i pipe Yahoo per unire le informazioni.

1

È possibile utilizzare alcuni di questi dati per fare soldi (se sei davvero bravo!) http://www.netflixprize.com/ Netflix ha reso disponibile un set di dati anonimi e chiede algoritmi migliori per prevedere le scelte dei clienti.

+0

Sì, stavo per suggerire questo. Ci sto lavorando proprio ora. –

0

Prevedere le tendenze future dei mercati azionari dai dati. Profitto!

+0

Più facile a dirsi, poi fatto. – Cerin

1

Se hai familiarità con Python prova a giocare con lo nltk. Ha tonnellate di librerie per l'estrazione di testo e persino l'apprendimento automatico in generale. Prova a lavorare su nltk book.

1

Se si desidera iniziare con un semplice problema di intelligenza artificiale, è possibile provare il clustering.

http://en.wikipedia.org/wiki/Data_clustering

Si potrebbe usarlo per immagini Flickr insieme per tag o qualcosa di fresco del genere.