cercando di leggere csv file in panda dataframe con la formattazioneImpostazione tipi di colonna durante la lettura csv con i panda
dp = pd.read_csv('products.csv', header = 0, dtype = {'name': str,'review': str,
'rating': int,'word_count': dict}, engine = 'c')
print dp.shape
for col in dp.columns:
print 'column', col,':', type(col[0])
print type(dp['rating'][0])
dp.head(3)
Questo il seguente è l'output:
(183531, 4)
column name : <type 'str'>
column review : <type 'str'>
column rating : <type 'str'>
column word_count : <type 'str'>
<type 'numpy.int64'>
Posso capire che panda potrebbe essere difficile trovare una rappresentazione di stringa di un dizionario in un dizionario dato this e this. Ma come può il contenuto della colonna "valutazione" essere sia str che numpy.int64 ???
A proposito, le modifiche come non specificare un motore o un'intestazione non cambiano nulla.
Grazie e saluti
Grazie, è stata una scivolata da parte mia :) Scelgo questa come risposta accettata perché è una risposta diretta alla mia domanda. – user2738815
Immagino sia stato un errore di battitura, a volte difficile da rilevare se focalizzato sul codice;) –