Panda è grande per affrontare un ampio spettro di casi d'uso nell'analisi dei dati. Può essere un po 'scoraggiante esplorare la documentazione per capire qual è il modo migliore per eseguire un particolare compito.Differenza (s) tra unione() e concat() in panda
Attualmente sto cercando di capire la differenza essenziale (s) tra pd.DataFrame.merge()
e pd.concat()
. Finora, questo è quello che posso articolare:
.merge()
può utilizzare solo colonne (più indici di righe) ed è semanticamente adatto per operazioni di tipo database. .concat()
può essere utilizzato con entrambi gli assi, utilizzando solo indici e offre l'opzione per l'aggiunta di un indice gerarchico.
Incidentalmente, ciò consente la seguente ridondanza: entrambi possono combinare due frame di dati utilizzando gli indici di righe.
E come per pd.DataFrame.join()
, sembra che offra solo una scorciatoia per un sottoinsieme dei casi d'uso di .merge()
.
Qualcuno potrebbe per favore commentare quanto completa e accurata è la mia comprensione a questo punto?
Grazie.
Inoltre, in relazione: http://stackoverflow.com/a/37891437/1972495 una discussione intorno '' '' .merge() '' '' e '' '' .join() '' ''. – WindChimes