Sto cercando di trovare le correlazioni più alte per le diverse colonne con i panda. So può ottenere matrice di correlazione conPanda: come eliminare l'auto-correlazione dalla matrice di correlazione
df.corr()
so di poter ottenere i massimi correlazioni dopo che con
df.sort()
df.stack()
df[-5:]
Il problema è che questi correlazione anche contengono valori per la colonna con la colonna stessa (1) . Come rimuovo queste colonne che contengono la correlazione con sé? So che posso rimuoverli rimuovendo tutti i valori 1 ma non voglio farlo perché potrebbero esserci anche 1 correlazioni effettive.
Si potrebbero anche avere valori negativi per le correlazioni. Quindi sarebbe meglio impostarli su un valore inferiore a -1. –
@FabianRost Questo è un punto eccellente. Aggiornerò Grazie! –
Forse puoi aggiungere sample 'df = pd.DataFrame ({'one': [0.1, .32, .2, 0.4, 0.8], 'two': [. 23, .18, .56, .61,. 12], 'tre': [. 9, .3, .6, .5, .3], 'four': [. 34, .75, .91, .19, .21], 'zive': [ 0.1, .32, .2, 0.4, 0.8], 'sei': [. 9, .3, .6, .5, .3], 'drive': [. 9, .3, .6, .5 , .3]}) ' – jezrael