2015-05-19 22 views
25

Sto cercando di ottenere un raggruppate grafico a scatole di lavoro utilizzando Seaborn come da exampleSeaborn load_dataset

posso ottenere l'esempio precedente lavoro, tuttavia la linea:

tips = sns.load_dataset("tips") 

non è spiegato a tutti. Ho localizzato il file tips.csv, ma non riesco a trovare documentazione adeguata su cosa load_dataset faccia specificamente. Ho provato a creare il mio csv e caricare questo, ma senza risultato. Ho anche rinominato il file punte e funzionava ancora ...

La mia domanda è dunque:

Dove sta load_dataset in realtà alla ricerca di file? Posso effettivamente usare questo per i miei boxplot?

EDIT: Sono riuscito a ottenere i miei grafici a scatole di lavoro utilizzando il mio DataFrame, ma sto ancora chiedendo se load_dataset è usato per qualcosa di più di esempi del tutorial misteriosi.

+2

'load_dataset' è solo una comoda funzione per la documentazione di Seaborn. – mwaskom

risposta

36

load_dataset cerca file csv online su https://github.com/mwaskom/seaborn-data. Ecco la docstring:

Caricare un set di dati dal repository online (richiede Internet).

Parametri


nome: str Nome del set di dati (.csv name su https://github.com/mwaskom/seaborn-data). È possibile ottenere un elenco di set di dati disponibili utilizzando: func: get_dataset_names

KWS: dict, opzionale passato al pandas.read_csv

Se si desidera modificare tale set di dati in linea o portare i propri dati, si probabilmente usare pandas. load_dataset restituisce effettivamente un oggetto panda DataFrame, che è possibile confermare con type(tips).

Se hai già creato i propri dati in un file CSV denominato, per esempio, tips2.csv, e salvato nella stessa posizione dello script, utilizzare questo (dopo l'installazione di panda) per caricarlo in:

import pandas as pd 

tips2 = pd.read_csv('tips2.csv')