Come parte del mio lavoro otteniamo circa 25 TB di file di registro all'anno, attualmente è stato salvato su un file system basato su NFS. Alcuni sono archiviati come in zip/tar.gz mentre altri risiedono in formato di puro testo.Memorizzazione di milioni di file di registro - Circa 25 TB all'anno
Sto cercando alternative all'utilizzo di un sistema basato su NFS. Ho guardato MongoDB, CouchDB. Il fatto che si tratti di un database orientato ai documenti sembra adattarlo correttamente. Tuttavia, il contenuto dei file di registro deve essere modificato in JSON per essere memorizzato nel DB. Qualcosa che non sono disposto a fare. Ho bisogno di mantenere il contenuto dei file di registro così com'è.
Per quanto riguarda l'utilizzo, intendiamo inserire una piccola API REST e consentire alle persone di ottenere l'elenco dei file, i file più recenti e la possibilità di ottenere il file.
Le soluzioni/idee proposte devono essere una forma di database distribuito o di file system a livello di applicazione in cui è possibile memorizzare file di registro e scalare in modo efficace in orizzontale aggiungendo più macchine.
Ankur
Solo per fare i conti: sono 500 GB/settimana o 100 GB ogni giorno lavorativo. – egrunin
Cosa stai registrando? – ChaosPandion
@egrunin Grazie per la matematica. Abbiamo già dati per anni. @chaosQuesti file di registro provengono da array di archiviazione installati globalmente. –