Dati due DF con indici non univoci e colonne multidimensionali:Unire più dataframes con indici non univoci
ars:
arsenal arsenal arsenal arsenal
NaN B3 SK BX BY
2015-04-15 NaN NaN NaN 26.0
2015-04-14 NaN NaN NaN NaN
2015-04-13 26.0 26.0 23.0 NaN
2015-04-13 22.0 21.0 19.0 NaN
Che:
chelsea chelsea chelsea chelsea
NaN B3 SK BX BY
2015-04-15 NaN NaN NaN 1.01
2015-04-14 1.02 NaN NaN NaN
2015-04-14 NaN 1.05 NaN NaN
qui in formato csv
,arsenal,arsenal,arsenal,arsenal
,B3,SK,BX,BY
2015-04-15,,,,26.0
2015-04-14,,,,
2015-04-13,26.0,26.0,23.0,
2015-04-13,22.0,21.0,19.0,
,chelsea,chelsea,chelsea,chelsea
,B3,SK,BX,BY
2015-04-15,,,,1.01
2015-04-14,1.02,,,
2015-04-14,,1.05,,
Mi piacerebbe unirmi/unirli, una sorta di join esterno in modo che le righe non vengano eliminate.
vorrei l'output di essere:
arsenal arsenal arsenal arsenal chelsea chelsea chelsea chelsea
NaN B3 SK BX BY B3 SK BX BY
2015-04-15 NaN NaN NaN 26.0 NaN NaN NaN 1.01
2015-04-14 NaN NaN NaN NaN 1.02 NaN NaN NaN
2015-04-14 NaN NaN NaN NaN NaN 1.05 NaN NaN
2015-04-13 26.0 26.0 23.0 NaN NaN NaN NaN NaN
2015-04-13 22.0 21.0 19.0 NaN NaN NaN NaN NaN
Nessuno degli strumenti di panda che conosco lavorato: merge
, join
, concat
. L'outer join di merge fornisce un prodotto punto che non è quello che sto cercando, mentre concat
non può gestire indici non univoci.
Avete qualche idea su come raggiungere questo obiettivo?
Nota: le lunghezze dei dataframes non saranno identiche.
Hi, thx per l'input. Ha funzionato in questo esempio, dove le lunghezze dei frame erano indifferenti. Tuttavia, non è garantito nel mio caso. –
L'ho provato con diversi numeri di file e sembrava funzionare bene. – TheBlackCat