Sto usando una pipeline molto simile a quello dato in this example:recuperare caratteristiche intermedie da un oleodotto in Scikit (Python)
>>> text_clf = Pipeline([('vect', CountVectorizer()),
... ('tfidf', TfidfTransformer()),
... ('clf', MultinomialNB()),
... ])
oltre che uso GridSearchCV
per trovare le migliori stimatori su una griglia di parametri.
Tuttavia, desidero ottenere i nomi delle colonne del mio set di allenamento con il metodo get_feature_names()
da CountVectorizer()
. Questo è possibile senza l'implementazione di CountVectorizer()
al di fuori della pipeline?