2012-01-24 20 views
5

HBase ha un modello master-slave, mentre Cassandra ha un modello peer-to-peer. Sono consapevole che in un modello master-slave, il master è un SPOF (Single Point of Failure) e non esiste una cosa del genere in un modello peer-to-peer.Computazione distribuita master-slave vs peer-to-peer

Esistono altri vantaggi e svantaggi di ciascun modello? Specialmente sto cercando qualsiasi vantaggio di master-slave rispetto al modello peer-to-peer.

+0

potrebbe essere un po 'troppo discorsiva per StackOverflow, ma dal momento che hai una buona reputazione, si potrebbe farla franca ;-) – halfer

+0

So che è un un po 'discorsivo. Sto pensando di passare un po 'di tempo su HBase o Cassandra, così ho iniziato a guardare entrambi. Quindi, la domanda? Non ho potuto ottenere un confronto tra questi due modelli. Quindi, qualsiasi suggerimento è apprezzato. –

risposta

0

Un punto laterale è che il master non è un SPOF in HBase, poiché è possibile avere una configurazione Multi-Master. http://wiki.apache.org/hadoop/Hbase/MultipleMasters

Avere i master rende un po 'più facile sapere dove sono i dati e dove sta andando. È anche basato su Hadoop, quindi l'integrazione con Map Reduce è abbastanza piacevole (in cui un lavoro su Map sarà naturalmente suddiviso tra i server della regione e ti darà una riga). Penso che questo sia il vantaggio principale.

Il "con" primario di Cassandra è il modello di coerenza finale, anche se consente di scegliere i modelli di consistenza.

Un punto di confronto è che i dati in HBase sono ordinati per chiave, dove è casuale in Cassandra. Ciò può fornire alcuni vantaggi con i tasti intelligenti in HBase, sebbene sia sempre possibile scegliere un GUID o una chiave casuale per emulare il comportamento di Cassandra. Cassandra può partizionare in modo non casuale, ma HBase è ancora meglio per le scansioni dei range.

Ho usato entrambi, ed entrambi funzionano, ed entrambi richiedono molto lavoro per continuare a lavorare.

+0

Ho guardato sia a Cassandra che a HBase e conosco un po 'tutti e due - come menzionato nell'OP la query riguardava il calcolo distribuito tra master-slave e peer-to-peer. Pro e contro di questi due modelli di calcolo distribuiti. –

+0

Il mio obiettivo principale era correggere la tua affermazione che il master in HBase è un SPOF, poiché sono possibili più mastermaster. Le funzionalità che ho citato in Hbase sono quelle abilitate avendo un controllo master sul partioning dei dati. – MattMcKnight

-1

struttura master-slave è più efficace, il P2P è più stabile