Sto cercando di trovare distance correlation tra le colonne, guarda il codice qui sotto. La maggior parte del tempo ritorna superiore a 1 risultato, il che non è possibile, poiché la correlazione della distanza è compresa tra 0 e 1. È possibile leggere la correlazione della distanza di scipy here.Scipy: la correlazione della distanza è superiore a 1
import numpy as np
from scipy.spatial import distance
x = np.random.uniform(-1, 1, 10000)
print distance.correlation(x, x**2)
1,00210811815
Qual è il problema qui o come posso misurarla?
UPD1:Link to issue su github
Sembra strano. L'ho provato in R usando il pacchetto energia e finisco sempre con valori intorno a 0.49, quindi sembra che manchi un fattore 0.5. Nessun indizio ... potrebbe valere la pena aprire un problema nella loro pagina github. – Cleb
@Cleb, Certo, aprirò un problema – Rocketq
@Rocketq: perché pensi che la funzione calcoli la distanza di correlazione --- la documentazione dice che sta calcolando la distanza di correlazione --- che forse è una cosa completamente diversa? –