Come esempio di convalida incrociata senza alcuna pre-elaborazione, posso fare qualcosa di simile:Come utilizzare la preelaborazione/normalizzazione di scikit insieme alla convalida incrociata?
tuned_params = [{"penalty" : ["l2", "l1"]}]
from sklearn.linear_model import SGDClassifier
SGD = SGDClassifier()
from sklearn.grid_search import GridSearchCV
clf = GridSearchCV(myClassifier, params, verbose=5)
clf.fit(x_train, y_train)
Vorrei pre-elaborare i miei dati utilizzando qualcosa di simile
from sklearn import preprocessing
x_scaled = preprocessing.scale(x_train)
Ma non sarebbe una buona idea di fare questo prima di impostare la convalida incrociata, perché quindi i set di allenamento e di test saranno normalizzati insieme. Come si configura la convalida incrociata per sottoporre a preprogrammazione i set di allenamento e test corrispondenti separatamente per ciascuna corsa?