Resample intraday panda dataframe senza aggiungere nuovi giorni

voglio downsample alcuni dati intraday senza l'aggiunta di nuovi giorniResample intraday panda dataframe senza aggiungere nuovi giorni

df.resample('30Min')

Aggiungerà fine settimana ecc, che è indesiderabile. C'è un modo per aggirare questo?

fonte

2013-02-15 Dave Anderson

Trovo che questo sia un grosso problema nei panda, questo problema si ripresenta ripetutamente e non esiste una soluzione standard. – Mannaggia

A groupby/resample combinato potrebbe funzionare:

In [22]: dates = pd.date_range('01-Jan-2014','11-Jan-2014', freq='T')[0:-1] 
    ...: dates = dates[dates.dayofweek < 5] 
    ...: s = pd.TimeSeries(np.random.randn(dates.size), dates) 
    ...: 

In [23]: s.size 
Out[23]: 11520 

In [24]: s.groupby(lambda d: d.date()).resample('30min').size 
Out[24]: 384 

In [25]: s.groupby(lambda d: d.date()).resample('30min') 
Out[25]: 
2014-01-01 2014-01-01 00:00:00 0.202943 
      2014-01-01 00:30:00 -0.466010 
      2014-01-01 01:00:00 0.029175 
      2014-01-01 01:30:00 -0.064492 
      2014-01-01 02:00:00 -0.113348 
      2014-01-01 02:30:00 0.100408 
      2014-01-01 03:00:00 -0.036561 
      2014-01-01 03:30:00 -0.029578 
      2014-01-01 04:00:00 -0.047602 
      2014-01-01 04:30:00 -0.073846 
      2014-01-01 05:00:00 -0.410143 
      2014-01-01 05:30:00 0.143853 
      2014-01-01 06:00:00 -0.077783 
      2014-01-01 06:30:00 -0.122345 
      2014-01-01 07:00:00 0.153003 
... 
2014-01-10 2014-01-10 16:30:00 -0.107377 
      2014-01-10 17:00:00 -0.157420 
      2014-01-10 17:30:00 0.201802 
      2014-01-10 18:00:00 -0.189018 
      2014-01-10 18:30:00 -0.310503 
      2014-01-10 19:00:00 -0.086091 
      2014-01-10 19:30:00 -0.090800 
      2014-01-10 20:00:00 -0.263758 
      2014-01-10 20:30:00 -0.036789 
      2014-01-10 21:00:00 0.041957 
      2014-01-10 21:30:00 -0.192332 
      2014-01-10 22:00:00 -0.263690 
      2014-01-10 22:30:00 -0.395939 
      2014-01-10 23:00:00 -0.171149 
      2014-01-10 23:30:00 0.263057 
Length: 384 

In [26]: np.unique(_25.index.get_level_values(1).minute) 
Out[26]: array([ 0, 30]) 

In [27]: np.unique(_25.index.get_level_values(1).dayofweek) 
Out[27]: array([0, 1, 2, 3, 4])

fonte

2013-02-17 07:53:54

La soluzione più semplice in questo momento è probabilmente qualcosa di simile:

rs = df.resample('30min') 
rs[rs.index.dayofweek < 5]

fonte

2013-02-17 03:12:46

Grazie, Chang. Sono andato per l'altra risposta in quanto è un po 'più flessibile - non aggiungerà nei giorni festivi. Grazie per il tuo lavoro con i panda, fa un salto! –

Probabilmente il modo più semplice è di fare solo un dropna poi sbarazzarsi delle righe vuote, ad es

df.resample('30Min').dropna()

fonte

2014-09-26 02:22:48 fantabolous

Resample intraday panda dataframe senza aggiungere nuovi giorni

risposta

Problemi correlati