Questa è più una domanda "teorica". Sto lavorando con il pacchetto scikit-learn per eseguire alcuni task NLP. Sklearn fornisce molti metodi per eseguire sia la selezione delle caratteristiche che l'impostazione dei parametri del modello. Mi sto chiedendo cosa dovrei fare prima.Operazioni preliminari: selezione delle funzioni o impostazione dei parametri del modello?
Se utilizzo univariate feature selection, è abbastanza ovvio che dovrei prima selezionare la funzione e, con le funzioni selezionate, quindi ottimizzare i parametri dello stimatore.
Ma cosa succede se voglio utilizzare recursive feature elimination? Devo prima impostare i parametri con grid search utilizzando TUTTE le funzionalità originali e solo dopo eseguire la selezione delle funzioni? O forse dovrei prima selezionare le caratteristiche (con i parametri di default dello stimatore) e poi impostare i parametri con le caratteristiche selezionate?
Grazie in anticipo per qualsiasi aiuto tu possa darmi.
EDIT
sto avendo più o meno lo stesso problema dichiarato here. A quel tempo, non c'era una soluzione ad esso. Qualcuno sa se ne esiste uno adesso?
Grazie per il suggerimento. Dato che ho appena in programma di utilizzare LogistRegression e SVC, penso che chi2 e/o L1 sarebbero sufficienti. – feralvam