2016-01-11 22 views
6

Sto cercando di utilizzare Google Datalab per leggere in un file in ipython, il pd.read_csv() di base in quanto non riesco a trovare il percorso del file. Lo ho localmente e anche caricato su Google Cloud Storage in un secchio.Lettura in un file con datalab di Google

Ho eseguito il seguente comando per capire dove mi trovo

os.getcwd() 

dà '/content/[email protected]'

os.listdir('/content/[email protected]') 

dà [ '.git', '.gitignore' , 'Datalab', 'Ciao World.ipynb','] .ipynb_checkpoints

risposta

9

di seguito legge il contenuto dell'oggetto in una variabile stringa denominata text:

%%storage read --object "gs://path/to/data.csv" --variable text 

Poi

from cStringIO import StringIO 
mydata = pd.read_csv(StringIO(text)) 
mydata.head() 

Speriamo Pandas sosterranno "gs://" URL (come fa per s3:// attualmente per consentire la lettura direttamente dal magazzino Google Cloud.

ho trovato i seguenti documenti veramente utile:

https://github.com/GoogleCloudPlatform/datalab/tree/master/content/datalab/tutorials

Speranza che aiuta (appena iniziato con Datalab troppo, così forse qualcuno avrà un metodo più pulito a breve).

+0

ottengo questo errore: la magia delle cellule '%% storage' non trovato (ma esiste linea magica'% storage', volevi dire che, invece?)? – vvv

+0

sembra anche che debba specificare il percorso, ma questo è ciò che mi è sconosciuto :) – vvv

+0

'%% storage' funziona per me. I due bit di codice sono in celle separate nel notebook, '%%' è una magia cellulare. Giusto per chiarire il percorso, 'gs: // path/the/data.csv' punta al file su Google Cloud Storage nel tuo bucket, non localmente sul tuo laptop, quindi quello che hai caricato. 'gs: // bucket/file.csv' – Chris