Un punto laterale è che il master non è un SPOF in HBase, poiché è possibile avere una configurazione Multi-Master. http://wiki.apache.org/hadoop/Hbase/MultipleMasters
Avere i master rende un po 'più facile sapere dove sono i dati e dove sta andando. È anche basato su Hadoop, quindi l'integrazione con Map Reduce è abbastanza piacevole (in cui un lavoro su Map sarà naturalmente suddiviso tra i server della regione e ti darà una riga). Penso che questo sia il vantaggio principale.
Il "con" primario di Cassandra è il modello di coerenza finale, anche se consente di scegliere i modelli di consistenza.
Un punto di confronto è che i dati in HBase sono ordinati per chiave, dove è casuale in Cassandra. Ciò può fornire alcuni vantaggi con i tasti intelligenti in HBase, sebbene sia sempre possibile scegliere un GUID o una chiave casuale per emulare il comportamento di Cassandra. Cassandra può partizionare in modo non casuale, ma HBase è ancora meglio per le scansioni dei range.
Ho usato entrambi, ed entrambi funzionano, ed entrambi richiedono molto lavoro per continuare a lavorare.
potrebbe essere un po 'troppo discorsiva per StackOverflow, ma dal momento che hai una buona reputazione, si potrebbe farla franca ;-) – halfer
So che è un un po 'discorsivo. Sto pensando di passare un po 'di tempo su HBase o Cassandra, così ho iniziato a guardare entrambi. Quindi, la domanda? Non ho potuto ottenere un confronto tra questi due modelli. Quindi, qualsiasi suggerimento è apprezzato. –