Sto provando a tracciare una serie temporale di istogrammi in Python. There has been a similar question about this, but in R. Quindi, fondamentalmente, ho bisogno della stessa cosa, ma sono davvero pessimo in R. Di solito nel mio set di dati sono presenti 48 valori al giorno. Dove - 9999 rappresenta i dati mancanti. Here's l'esempio dei dati.Intervalli di stampa degli istogrammi in Python
Ho iniziato con la lettura dei dati e la costruzione di un pandas
DataFrame
.
import pandas as pd
df = pd.read_csv('sample.csv', parse_dates=True, index_col=0, na_values='-9999')
print df
<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 336 entries, 2008-07-25 14:00:00 to 2008-08-01 13:30:00
Data columns (total 1 columns):
159.487691046 330 non-null values
dtypes: float64(1)
ora posso raggruppare i dati per giorno:
daily = df.groupby(lambda x: x.date())
ma poi mi sono bloccato. Non so come usarlo con matplotlib
per ottenere i miei tempi degli istogrammi. Qualsiasi aiuto è apprezzato, non necessariamente utilizzando pandas
.
aggiunta al ricettario! – Jeff
Grazie! Questo dovrebbe farlo. Ho completamente dimenticato di menzionare che - 9999 è un numero mancante e dovrebbe essere ignorato. Lo aggiungerà alla domanda. – abudis
Questo è molto bello! –