Scusate se è stupido ma stavo solo pensando che dovrei fare un tentativo. Supponiamo che io abbia un grafico enorme (ad esempio, 100 miliardi di nodi). Neo4J supporta 32 miliardi e altri supportano più o meno la stessa cosa, quindi dire che non posso avere l'intero set di dati in un database allo stesso tempo, posso eseguire pagerank su di esso se è un grafico diretto (nessun loop) e ogni serie di nodi connettono al prossimo set di nodi (quindi nessun nuovo collegamento verrà creato all'indietro, solo nuovi collegamenti verranno creati per nuovi insiemi di dati).È possibile eseguire il pagerank senza l'intero set di dati?
C'è un modo per prendere in qualche modo i punteggi dei pagerank precedenti e applicarli a nuovi set di dati (mi interessa solo il pagerank per il set di dati più recente ma ho bisogno del pagerank del set precedente per ricavare gli ultimi dati di set)?
Ha senso? Se è così, è possibile farlo?
Credo Riak in grado di gestire grandi numeri e si può attraversare link ** ** da MapReduce – aitchnyu