Come devo impostare i parametri di gamma e costo in libSVM quando utilizzo un set di dati sbilanciato composto dal 75% di etichette "true" e 25% di "false" etichette? Sto ottenendo un errore costante di avere tutte le etichette previste impostate su "True" a causa dello squilibrio dei dati.squilibrio dei dati in SVM utilizzando libSVM
Se il problema non è con libSVM, ma con il mio set di dati, come dovrei gestire questo squilibrio dal punto di vista di Teoretical Machine Learning? * Il numero di funzioni che sto usando è tra 4-10 e ho un piccolo set di 250 punti dati.
c'è una domanda simile nella pagina delle FAQ che può aiuta: Q: I miei dati sono sbilanciati. Potrebbe libsvm gestire questi problemi? http://www.csie.ntu.edu.tw/~cjlin/libsvm/faq.html#f410 – McKelvin