Mi sono divertito a usare i grafici per analizzare i big data. Sta funzionando benissimo e davvero divertente, ma mi chiedo cosa fare man mano che i dati diventano sempre più grandi?È possibile memorizzare grafici hbase? se sì, come si modella il database per supportare una struttura grafica?
Fatemi sapere se c'è qualche altra soluzione, ma ho pensato di provare HBase perché scale orizzontale e posso ottenere Hadoop per l'esecuzione di analisi sul grafico (la maggior parte del mio codice è già scritto in Java), ma io sono sicuro come strutturare un grafico su un database nosql? So che ogni nodo può essere una voce nel database ma non sono sicuro di come modellare i bordi e aggiungere proprietà a loro (come il nome di nodi, attributi, pagerank, pesi sui bordi, ecc.).
Vedere come hbase/hadoop viene modellato dopo la riduzione di tabelle e mappe grandi. Sospetto che ci sia un modo per farlo, ma non si sa come. Eventuali suggerimenti?
Inoltre, questo ha senso che sto cercando di fare? o ci sono soluzioni migliori per i grafici dei big data?
Al punto - È possibile memorizzare grafici in Hbase. Ma non è la soluzione migliore per gestire i dati collegati. La traversata sarebbe soggetta a problemi. È necessario utilizzare i filtri per il recupero in base ai valori (valori delle proprietà) nel caso in cui il nodoide (nodo src) venga utilizzato come chiave di riga. Il modo migliore sarebbe utilizzare i database Graph disponibili che supportano BigData. Questo è solo un suggerimento, non una risposta, quindi sto aggiungendo questo attraverso il blocco dei commenti. –