Ho cercato su google di questo problema e non riesco a trovare qualcosa che spieghi questo algoritmo in modo semplice ma dettagliato.Perché l'algoritmo C4.5 usa l'eliminazione per ridurre l'albero decisionale e in che modo la potatura influisce sulla precisione della previsione?
Ad esempio, so che l'algoritmo ID3 non utilizza affatto la potatura, quindi se si dispone di una caratteristica continua, i tassi di successo della previsione saranno molto bassi.
Quindi il C4.5 per supportare le caratteristiche continue usa la potatura, ma è questa l'unica ragione?
Inoltre, non riesco proprio a capire nell'applicazione WEKA come esattamente il fattore di confidenza influenzi l'efficienza delle previsioni. Più piccolo è il fattore di confidenza, maggiore sarà la potatura dell'algoritmo, ma qual è la correlazione tra la potatura e l'accuratezza della previsione? Quanto più poti, meglio le previsioni o il peggio?
Grazie