Questo è il mio obiettivo (y):Ho molto di più di 3 elementi in ogni classe, ma ottengo questo errore: classe non può essere inferiore a k = 3 in scikit-learn
target = [7,1,2,2,3,5,4,
Non lo so perché mentre sto eseguendo: ... # divide il dataset in due parti uguali X_train, X_test, y_train, y_test = train_test_split ( X, Y, test_size = 0,5, random_state = 0)
# Set the parameters by cross-validation
tuned_parameters = [{'kernel': ['rbf'], 'gamma': [1e-3, 1e-4],
'C': [1, 10, 100, 1000]},
{'kernel': ['linear'], 'C': [1, 10, 100, 1000]}]
scores = ['precision', 'recall']
for score in scores:
print("# Tuning hyper-parameters for %s" % score)
clf = GridSearchCV(SVC(C=1), tuned_parameters)#scoring non esiste
#I get error in the line below, y_train, cv=5)
ho questo errore:
Traceback (most recent call last):
File "C:\Python27\", line 232, in <module>, y_train, cv=5) #The minimum number of labels for any class cannot be less than k=3.
File "C:\Python27\lib\site-packages\sklearn\", line 354, in fit
return self._fit(X, y)
File "C:\Python27\lib\site-packages\sklearn\", line 372, in _fit
cv = check_cv(cv, X, y, classifier=is_classifier(estimator))
File "C:\Python27\lib\site-packages\sklearn\", line 1148, in check_cv
cv = StratifiedKFold(y, cv, indices=is_sparse)
File "C:\Python27\lib\site-packages\sklearn\", line 358, in __init__
" be less than k=%d." % (min_labels, k))
ValueError: The least populated class in y has only 1 members, which is too few. The minimum number of labels for any class cannot be less than k=3.
È anche possibile passare un parametro "cv", ad esempio "KFold". Quale versione hai tra l'altro, penso che la validazione dell'input per StratifiedKFold (il cv predefinito) abbia ottenuto meno rigore nella nuova versione di sklearn. Stai attento nell'interpretazione dei risultati, però. Probabilmente non sono così significativi. –
@AndreasMueller, Non ho provato la convalida dell'input in caso di StratifiedKFold. Sicuramente controllerò. Grazie per il suggerimento. – jitendra