"ValueError: labels ['timestamp'] not contained in axis"
non avete le intestazioni nel file, in modo che il modo in cui si è caricato che hai un df
dove la i nomi delle colonne sono le prime file dei dati. Hai provato ad accedere a colunm timestamp
che non esiste.
vostri u.data
non ha intestazioni in esso
$head u.data
196 242 3 881250949
186 302 3 891717742
Così lavorano con i nomi delle colonne non sta andando essere possibile a meno che aggiungere le intestazioni. Puoi aggiungere le intestazioni al file u.data
, ad es. L'ho aperto in un editor di testo e ho aggiunto la riga a b c timestamp
(sembra un file separato da tabulazioni, quindi fai attenzione quando aggiungi l'intestazione per non utilizzare gli spazi, altrimenti interrompe il formato)
$head u.data
a b c timestamp
196 242 3 881250949
186 302 3 891717742
ora le tue opere di codice e data.columns
rendimenti
Index([u'a', u'b', u'c', u'timestamp'], dtype='object')
e il resto della traccia del codice di lavoro è ora
(100000, 4) # the shape
['a', 'b', 'c', 'timestamp'] # the columns
a b c timestamp # the df
0 196 242 3 881250949
1 186 302 3 891717742
2 22 377 1 878887116
3 244 51 2 880606923
4 166 346 1 886397596
5 298 474 4 884182806
6 115 265 2 881171488
7 253 465 5 891628467
8 305 451 3 886324817
9 6 86 3 883603013
Se non si desidera aggiungere intestazioni
Oppure si può eliminare la colonna 'timestamp' utilizzo di indice (presumibilmente 3), siamo in grado di farlo usando df.ix
sotto di esso seleziona tutte le righe, colonne di indice da 0 a indice 2 , lasciando cadere in tal modo la colonna con indice 3
data.ix[:, 0:2]
Possibile duplicato di [ValueError: labels \ ['timestamp' \] non contenuto nell'asse] (http://stackoverflow.com/questions/37763715/valueerror-labels-timestamp-not-contained-in-axis) – pekapa