HDFS e GridFS sono due ottime tecnologie per il salvataggio di file distribuiti, ma quali sono le loro differenze? Che tipo di problemi si adattano meglio a ciascuno?HDFS vs GridFS: quando usare quale?
risposta
GridFS è po 'lento vs altri fs ... in un primo momento pensare ad altre FS come Ceph ...
Distributed File System - Wikipedia, l'enciclopedia libera ->http://en.wikipedia.org/wiki/Distributed_file_system
penso HDFS è davvero fs ma GridFS è griglia unica banca dati
finalmente punto di riferimento l'uso, ma difficilmente suggerire qualcosa di file system distribuito
- nginx-GridFS Benchma rking Risultati grezzi | ypass.net ->http://www.ypass.net/solaris/nginx-gridfs-benchmarks/rawresults.php
Utilizzare HDFS se si utilizza Hadoop e si utilizza GridFS se si utilizza MongoDB. Né sono grandioso solo per la memorizzazione di file casuali. Sono costruiti per funzionare con la piattaforma analitica.
Si consiglia di utilizzare GridFS, se si sta solo archiviare i file senza alcun lavoro di analisi e riduzione della mappa. È più facile da personalizzare e mantenere. Ho usato per l'applicazione di file hosting. HFDS in questo caso è eccessivo.
HDFS destinati per l'elaborazione batch (stai sa, quando si esegue una query che leggerà molti dei vostri file uno per uno), ma in realtà schifo quando voi che fate ad accesso casuale operazioni ed è dolore al collo per mantenerlo o persino dispiegarlo (lo sai, tutti questi Zookepers, Namenode e così via). D'altro canto GridFS è più lento nei batch, ma non nel caso in cui si eseguano molti accessi casuali, ma si abbia un overhead di storage più grande rispetto a HDFS.
Direi che dovresti usare HDFS per analitycs e GridFS per il back-up del sito web.