16

tutti. Sono completamente nuovo sul tema degli algoritmi di classificazione e ho bisogno di alcuni buoni suggerimenti su dove iniziare una "lettura seria". Sono in questo momento in fase di ricerca, se l'apprendimento automatico e gli algoritmi di classificazione automatica potrebbero essere una cosa utile da aggiungere ad alcune mie applicazioni.Risorse per principianti/introduzioni agli algoritmi di classificazione

ho già scansionato attraverso "Come risolverlo: euristiche moderni" da Z. Michalewicz e D. Fogel (in particolare, i capitoli sui classificatori lineari che utilizzano le reti neuronali), e sul lato pratico, Attualmente sto guardando attraverso il codice sorgente WEKA toolkit. Il mio prossimo passo (pianificato) sarebbe immergersi nel regno degli algoritmi di classificazione bayesiani.

Purtroppo, mi manca una seria base teorica in questo settore (per non parlare di averlo usato fino ad ora), quindi qualsiasi accenno a dove guardare dopo sarebbe apprezzato; in particolare, sarebbe utile una buona introduzione degli algoritmi di classificazione disponibili. Essendo più un artigiano e meno un teorico, più pratico, meglio è ...

Suggerimenti, chiunque?

risposta

9

Ho sempre trovato Andrew Moore's Tutorials molto utile. Sono fondati su solide teorie statistiche e saranno molto utili per comprendere i documenti se si sceglie di leggerli in futuro. Ecco una breve descrizione:

Questi includono classificazione algoritmi come alberi decisionali, reti neurali, classificatori bayesiani, Support Vector Machines e a base di carter (aka non parametrici) apprendimento. Includono regressione algoritmi come regressione polinomiale multivariato , MARS, localmente Regressione ponderata, GMDH e reti neurali . E comprendono altri dati attività minerarie come il clustering (modelli della miscela, k-means e gerarchico), reti bayesiane e Reinforcement Learning

+0

Grazie. Questo era per quello che stavo cercando. – Dirk

4

Panoramica del Machine Learning

Per ottenere un buon panoramica del campo, guarda le lezioni video di Andrew Ng's Machine Learning course.

Questo corso (CS229) - tenuto dal professor Andrew Ng - offre un'ampia introduzione all'apprendimento automatico e al riconoscimento di pattern statistici. Gli argomenti includono apprendimento supervisionato, apprendimento senza supervisione, teoria dell'apprendimento, apprendimento di rinforzo e controllo adattivo. Vengono inoltre discusse le recenti applicazioni dell'apprendimento automatico, come il controllo robotico, il data mining, la navigazione autonoma, la bioinformatica, il riconoscimento vocale e l'elaborazione di testi e dati web.

Classificatori

quanto per il quale classificatore si dovrebbe usare, io consiglierei prima di partire con Support Vector Machines (SVM) per attività generali di classificazione applicata. Ti daranno prestazioni allo stato dell'arte, e non hai davvero bisogno di capire tutta la teoria che c'è dietro per utilizzare semplicemente l'implementazione fornita da un pacchetto come WEKA.

Se si dispone di un set di dati più grande, si potrebbe voler provare a utilizzare Random Forests. C'è anche lo an implementation di questo algoritmo in WEKA, e si allena molto più veloce su dati di grandi dimensioni. Anche se sono meno utilizzati rispetto agli SVM, la loro accuratezza tende ad eguagliare o quasi corrispondere all'accuratezza che si può ottenere da uno.

+0

Grazie. Un'introduzione molto leggibile per principianti come me a SVN sembra essere http://www.tristanfletcher.co.uk/SVM%20Explained.pdf – Dirk

6

answer referring to Andrew Moore's tutorials is a good one. Mi piacerebbe accrescerla, tuttavia, suggerendo alcune letture sul bisogno che guida la creazione di molti sistemi di classificazione in primo luogo: identificazione delle relazioni causali. Questo è rilevante per molti problemi di modellazione che coinvolgono l'inferenza statistica.

La migliore risorsa corrente che conosco per l'apprendimento della causalità e dei sistemi di classificazione (in particolare i classificatori bayesiani) è Judea Pearl's book "Causality: models, reasoning, and inference".