Attualmente sono in difficoltà con un problema di apprendimento automatico mentre devo gestire grandi insiemi di dati non bilanciati. Cioè, ci sono sei classi ('1', '2' ... '6'). Purtroppo, ad es. per la classe '1' 150 esempi/istanze, per '2' 90 istanze e per la classe '3' solo 20. Tutte le altre classi non possono essere "addestrate" poiché non ci sono istanze disponibili per queste classi.Resample Filter di WEKA - Come interpretare il risultato
Finora, ho capito che WEKA (il toolkit di apprendimento automatico che sto utilizzando) fornisce questo filtro "Resample" supervisionato. Quando applico questo filtro con "noReplacement" = falso e "bialToUniformClass" = 1.0, questo risulta in un set di dati, dove il numero di istanze è piacevole e quasi uguale (per la classe "1" .. "3" e gli altri rimanere vuoto).
La mia domanda è ora: in che modo WEKA e questo filtro generano "nuove"/istanze aggiuntive per classi diverse.
Grazie mille in anticipo per eventuali suggerimenti o suggerimenti.
Acclamazioni Julian