Ho un file di testo con circa 8,5 milioni di punti di dati nella forma:Usare Python per generare un grafico connessione di rete/
Company 87178481
Company 893489
Company 2345788
[...]
voglio usare Python per creare un grafico di connessione per vedere ciò che la rete tra le aziende sembra. Dal campione sopra riportato, due aziende condividono un vantaggio se il valore nella seconda colonna è lo stesso (chiarimento da/per Hooked).
Ho utilizzato il pacchetto NetworkX e sono stato in grado di generare una rete per qualche migliaio di punti, ma non lo è attraverso il file di testo completo da 8,5 milioni di nodi. L'ho eseguito e lasciato per circa 15 ore, e quando sono tornato, il cursore nella shell stava ancora lampeggiando, ma non c'era un grafico di output.
È sicuro presumere che fosse ancora in esecuzione? Esiste un approccio migliore/più veloce/più facile per rappresentare milioni di punti?
Come sono le aziende in contatto? Cioè è un vantaggio condiviso tra società A e B se la seconda colonna è la stessa? – Hooked
Sì, è corretto. – Jon
Non posso dire di aver avuto problemi con 8.5million in networkx. Quanti vertici distinti hai? Stai usando diretto/non diretto? Inoltre, quando dici "nessun grafico di output", cosa intendi esattamente? [ad esempio, non hai provato a stamparlo o qualcosa del genere] –