sto provando a usare scikit learn 0.17 con anaconda 2.7 per un problema di classificazione multilabel. qui è il mio codice import pandas as pd
import pickle
import re
from sklearn.cross_validation
I dati di testo sono organizzati come vettore con 20.000 elementi, come [2, 1, 0, 0, 5, ...., 0]. l'elemento i-esimo indica la frequenza dell'i-esima parola in un testo. I dati dell'etichetta di verit