Ho una domanda molto generale: come scegliere la funzione del kernel corretta per SVM? So che la risposta definitiva è provare tutti i kernel, fare validazione fuori dal campione e scegliere quello con il miglior risultato di classificazione. Ma a parte questo, c'è qualche linea guida per provare le diverse funzioni del kernel?Come scegliere le giuste funzioni del kernel
risposta
Cerca qui la risposta.
https://stats.stackexchange.com/questions/18030/how-to-select-kernel-for-svm
In sostanza, non c'è invece nessun buon percorso di scegliere, a meno che non si sa qualcosa di importante sulla tua dati che potrebbero determinare una corretta kernel da utilizzare. Tuttavia, segui il link sopra per ottenere informazioni più specifiche.
Provare sempre il kernel lineare, semplicemente perché è molto più veloce e può produrre ottimi risultati in molti casi (in particolare problemi di alta dimensionalità).
Se il kernel lineare fallisce, in generale la soluzione migliore è un kernel RBF. Si sa che si comportano molto bene su una grande varietà di problemi.
Come fai a sapere se il kernel lineare "fallisce"? E 'possibile che il modello del kernel lineare funzioni peggio di altri modelli oltre a SVM? –
La maggior parte delle volte il kernel migliore da utilizzare è il kernel RBF. La ragione è che la maggior parte delle cose segue la distribuzione gaussiana. La risposta di "perché" è correlata al [teorema del limite centrale] (http://en.wikipedia.org/wiki/Central_limit_theorem) secondo me. –