Desidero eseguire un'operazione di unione/unione/aggiunta su un dataframe con indice datetime.join o unione con sovrascrittura in panda
Diciamo che ho df1
e voglio aggiungere df2
ad esso. df2
può avere un numero inferiore o inferiore di colonne e indici sovrapposti. Per tutte le righe in cui gli indici corrispondono, se df2
ha la stessa colonna di df1
, desidero che i valori di df1
vengano sovrascritti con quelli da df2
.
Come posso ottenere il risultato desiderato?
Penso che questo è davvero ciò che voglio, grazie mille. – saroele
C'è un problema con 'combine_first': usarlo per combinare tre dataframes di circa 30k righe ogni volta supera tutta la mia memoria. In qualche modo intorno a questo? – scry
Penso che sarebbe molto più intuitivo se questa funzionalità fosse parte della funzione 'df.update' con argomento opzionale' join = 'outer'' (attualmente è implementato solo 'left'). Nel mio caso, 'df2' (calcolato da' df1') ha colonne molto meno di 'df1' (ma alcuni che non sono in' df1'), e voglio aggiornare 'df1' con i valori calcolati dove possibile più le colonne extra. Per questo, penso che 'df1.update (df2, join = 'outer')' sarebbe molto più facile da capire di 'df1 = df2.combine_first (df1)'. PS. Questo è un cavillo minore, ma altrimenti "panda" è quasi esclusivamente fantastico! =) – Axel