Sono quasi atterrato a Cassandra dopo le mie ricerche su soluzioni di archiviazione di dati su larga scala. Ma in generale ha affermato che Hbase è la soluzione migliore per l'elaborazione e l'analisi di dati su larga scala.Elaborazione di dati su larga scala Hbase vs Cassandra
Mentre entrambi sono la stessa memoria di chiavi/valore ed entrambi sono/possono essere eseguiti (Cassandra di recente), il layer Hadoop rende quindi Hadoop un candidato migliore quando è richiesta l'elaborazione/analisi su dati di grandi dimensioni.
Ho anche trovato buoni dettagli sulle sia a http://ria101.wordpress.com/2010/02/24/hbase-vs-cassandra-why-we-moved/
ma sto ancora cercando i vantaggi concreti di HBase.
Mentre sono più convinto di Cassandra perché la sua semplicità è l'aggiunta di nodi e funzionalità di replica continua e senza punti critici. E mantiene anche la funzionalità di indice secondario, quindi è un ottimo vantaggio.
Sono sicuro che i frammenti di Facebook su 100 nodi HBAse cluster per altri motivi relativi al loro stack software modulare. In un recente intervento, Todd Lipcon di Cloudera ha menzionato [1PT 1000 node HBase cluster] (http://www.slideshare.net/cloudera/sf-nosql2011/58) e ho visto menzionare 700+ nodi di nodi HBase. – cftarnas
Buon punto. Potrebbe essere anche qualcosa di specifico per il carico di lavoro. – jbellis
Tanti vantaggi di Cassandra sopra. Ma perché Facebook ha scelto HBase invece di Cassandra alla fine !? –