Sto tentando di utilizzare train_test_split
dal pacchetto scikit Learn, ma ho problemi con il parametro stratify
. Qui di seguito è il codice:Parametro "stratify" dal metodo "train_test_split" (scikit Learn)
from sklearn import cross_validation, datasets
X = iris.data[:,:2]
y = iris.target
cross_validation.train_test_split(X,y,stratify=y)
Tuttavia, continuo a ricevere il seguente problema:
raise TypeError("Invalid parameters passed: %s" % str(options))
TypeError: Invalid parameters passed: {'stratify': array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2,
2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2])}
Qualcuno ha un'idea di ciò che sta succedendo? Di seguito è riportata la documentazione della funzione.
[...]
stratificare: array-like o Nessuno (di default è None)
Altrimenti No, i dati è diviso in maniera stratificata, usando questo come le etichette array.
Nuovo nella versione 0.17: stratificare splitting
[...]
Ho provato questo e ancora non funziona. –
@ user5767535 Come si può vedere sta funzionando sulla mia macchina Ubuntu, con 'sklearn' della versione '0.17', distribuzione Anaconda per Python 3.5. Posso solo suggerire di controllare un'altra volta se inserisci il codice correttamente e aggiorni il tuo software. –
@ user5767535 BTW, "Novità nella versione 0.17: stratify splitting" mi rende quasi sicuro che devi aggiornare il tuo 'sklearn' ... –