Ho appena iniziato la mia escursione ai metodi e agli strumenti di elaborazione del grafico. Ciò che fondamentalmente facciamo - contiamo alcune metriche standard come pagerank, coefficiente di clustering, conteggio dei triangoli, diametro, connettività, ecc. In passato era felice con Octave, ma quando abbiamo iniziato a lavorare con grafici che diciamo 10^9 nodi/bordi abbiamo bloccato .Neo4j o GraphX / Giraph cosa scegliere?
nuvola Così le possibili soluzioni possono essere distribuite fatto con Hadoop/Giraph, Spark/Graphx, Neo4j su di essi, ecc
Ma dal momento che io sono un principiante, qualcuno può consigliare ciò che è effettivamente scegliere? Non ho avuto la differenza quando usare Spark/GraphX e quando Neo4j? In questo momento considero Spark/GraphX, poiché ha più sintassi Python allo stesso modo, mentre neo4j ha il proprio Cypher. La visualizzazione in neo4j è interessante ma non utile in così larga scala. Non capisco c'è un motivo per usare un ulteriore livello di software (neo4j) o semplicemente usare Spark/GraphX? Da quando ho capito neo4j non salverà così tanto tempo come se lavorassimo con hadoop puro vs Giraph o GraphX o Hive.
Grazie.
cosa intendi usando "Neo4j con GraphX"? Vuoi dire usarli contemporaneamente? Come e perché? –
Può essere fattibile usando il neo4j-spark-connecter che ho fornito con il link come risposta. –