Ho un set di dati con le seguenti prime tre colonne. Includi ID carrello (identificativo univoco), Importo vendita (in dollari) e data della transazione. Voglio calcolare la seguente colonna per ogni riga del set di dati, e mi piacerebbe farlo in Python.Python - funzioni di allineamento temporale e "data"
Vendita precedente dello stesso paniere (se presente); Conteggio vendite fino ad oggi per il paniere corrente; Mean To Date per il carrello corrente (se disponibile); Max A Data per il carrello attuale (se disponibile)
Basket Sale Date PrevSale SaleCount MeanToDate MaxToDate
88 $15 3/01/2012 1
88 $30 11/02/2012 $15 2 $23 $30
88 $16 16/08/2012 $30 3 $20 $30
123 $90 18/06/2012 1
477 $77 19/08/2012 1
477 $57 11/12/2012 $77 2 $67 $77
566 $90 6/07/2012 1
Sono abbastanza nuovo con Python, e ho davvero fatica a trovare qualcosa da fare in un modo elegante. Ho ordinato i dati (come sopra) da BasketID e Data, così posso ottenere la vendita precedente alla rinfusa spostando in avanti di uno per ogni singolo paniere. Nessun indizio su come ottenere MeanToDate e MaxToDate in modo efficiente, a parte il looping ... qualche idea?
Quale formato è il "set di dati" corrente in (le prime tre colonne)? È un file o stai usando una sorta di struttura dati al momento? – askewchan
scusa, ho dimenticato di dirlo. proviene da un file di testo, ma è memorizzato nel dataframe di un panda. –