Supponiamo che ho un dataframe con i paesi che va come:Pandas: convertire categorie per i numeri
cc | temp
US | 37.0
CA | 12.0
US | 35.0
AU | 20.0
So che c'è un pd.get_dummies funzione per convertire i paesi a 'codifiche one-hot'. Tuttavia, desidero convertirli in indici, in modo tale che ottenga invece cc_index = [1,2,1,3]
.
sto supponendo che ci sia un modo più veloce rispetto all'utilizzo dei get_dummies insieme a un NumPy clausola where come illustrato di seguito:
[np.where(x) for x in df.cc.get_dummies().values]
Questo è un po 'più facile da fare in R mediante 'fattori' in modo Spero che i panda abbiano qualcosa di simile.
Significa 'cc_ind ex = [0,1,0,2] '? –
sicuro, ho dimenticato l'indice python 0 –
La serie categoriale o le colonne in un DataFrame possono aiutare. – min2bro