I classificatori in pacchetti di machine learning come liblinear e NLTK offrire un metodo show_most_informative_features()
, che è davvero utile per il debug caratteristiche:Come ottenere la maggior parte delle funzioni informative per i classificatori di apprendimento di scikit?
viagra = None ok : spam = 4.5 : 1.0
hello = True ok : spam = 4.5 : 1.0
hello = None spam : ok = 3.3 : 1.0
viagra = True spam : ok = 3.3 : 1.0
casino = True spam : ok = 2.0 : 1.0
casino = None ok : spam = 1.5 : 1.0
mia domanda è se è implementato qualcosa di simile per i classificatori a scikit-learn. Ho cercato la documentazione, ma non ho trovato nulla di simile.
Se questa funzione non esiste ancora, qualcuno conosce una soluzione alternativa per ottenere tali valori?
Grazie mille!
Intendi il parametro più discriminante? – Simon
Non sono sicuro di cosa intendi con i parametri. Intendo le caratteristiche più discriminanti, come in un modello di tipo "bag of word" per la classificazione dello spam, che le parole danno la maggior prova per ogni classe.non i parametri che ho capito come "impostazioni" per il classificatore - come il tasso di apprendimento ecc. – tobigue
@eowl: in linguaggio di apprendimento automatico, * parametri * sono le impostazioni generate dalla procedura di apprendimento basata sulle * caratteristiche * del set di allenamento. Il tasso di apprendimento ecc. Sono * iperparametri *. –