2011-02-28 7 views
5

Ho scritto un crawler in C++ e sto cercando un file system distribuito che ho trovato 2 1) HBase 2) Hypertableperché abbiamo bisogno di Hadoop per Hypertable

entrambi sono l'attuazione di grande tavolo e ho appena rivisto hypertable .. perché è stato implementato in C++ e..hbase è più ampiamente utilizzato la mia domanda è il modo in cui abbiamo bisogno di hadoop ... c'è qualche vantaggio se eseguo hypertable su hadoop?

+0

Penso che la tua domanda principale sia: In termini di prestazioni in cui la funzione hypertable è migliore (su file system normale o su hadoop)? – ygaradon

risposta

4

Non è necessario utilizzare Hadoop. Hypertable richiede solo di essere eseguito sul filesystem distribuito. Quindi, puoi scegliere tra Hadoop DFS, KosmosFS, GlusterFS, Ceph e forse anche altri (come MooseFS o Lustre).

I vantaggi comuni sono determinati dai requisiti dell'applicazione e dall'infrastruttura esistente. Dal punto di vista della risoluzione dei problemi, anche la dimensione della community (specialmente di Hadoop) è il fattore principale.

+3

HyperTable può anche essere eseguito su un semplice file system locale. –

+0

In termini di prestazioni in cui la funzione hypertable è migliore (su file system normale o su hadoop)? – ygaradon

0

Puoi anche guardare in cassandra (http://cassandra.apache.org/) un'altra implementazione in qualche modo simile a Big Table.