2010-02-18 7 views
5

Sto cercando un'implementazione dell'albero decisionale ID3 in Python o in qualsiasi lingua che accetta un test e un file di test come input e restituisce previsioni.Albero decisionale ID3 con valori numerici

Ho trovato this e questo, ma non ho potuto adattarli ai valori numerici, ad es. a Iris dataset.

Conoscete l'implementazione dell'albero ID3 che funziona dalla console o qualsiasi scritto in Python? O qualsiasi suggerimento su come usare this con valori numerici sarà fantastico.

risposta

2

Ho un algoritmo simile C4.5 scritto in python. Funziona dalla console. Se sei interessato, lo metto qui.

Siamo spiacenti per un post se non è necessario questo.

BTW, ho provato su Iris insieme di dati :)

Aggiornamento:

Ho caricato sia: di codice e dati:

Spero che ti possa aiutare.

BTW, programma anche disegnare un albero in "png" via graphviz

+1

Sì, Io apprezzo se è possibile condividere l'algoritmo C4.5. –

+0

Grazie per il codice C4.5. Devo calcolare l'accuratezza della classificazione. Come posso ottenere le classi di previsione nel tuo codice? Ho provato ad usare classify (tree_root, ds) ma sembra che restituisca le stesse etichette di classe dell'originale - o sto facendo qualcosa di sbagliato :) –

+2

Sì, hai ragione. Le etichette sono le stesse perché i processi di apprendimento vengono eseguiti su un set di dati completo dell'iride. È sufficiente escludere alcuni dei vettori di dati dal file di dati (o farlo nella funzione 'load_iris') e utilizzare vettori esclusi per testare la previsione. – woo