Recentemente ho messo in piedi una casella Ubuntu di test stack ELK per testare la funzionalità e ne sono stato molto contento. Il mio caso d'uso per la produzione comporterebbe l'ingestione di almeno 100 GB di tronchi al giorno. Voglio essere il più scalabile possibile, in quanto questo 100GB/giorno può aumentare rapidamente dato che avevamo più sorgenti log.Perché ho bisogno di un broker per la mia produzione ELK stack + specifiche della macchina?
Ho letto alcuni articoli sulla produzione ELK, incluso il fantastico Logz.io ELK Deployment. Mentre ho un'idea generale di cosa devo fare, non sono sicuro su alcuni concetti chiave, su quante macchine ho bisogno per una grande quantità di dati e se ho bisogno di un broker come Redis incluso nella mia architettura.
Qual è il punto di un broker come Redis? Nella mia istanza di test, ho più fonti di log che inviano i log su TCP, syslog e forwarder logstash al mio Logstash direttamente sul mio server ELK (che ha anche Elasticsearch, Nginx e Kibana installati configurati con SSL).
Al fine di mantenere una disponibilità elevata, un cluster di produzione all'avanguardia, quali macchine + specifiche ho bisogno per almeno 100 GB di dati al giorno, probabilmente in scala verso 150 GB o più in futuro? Sto pianificando di utilizzare i miei server. Da quello che ho cercato, il punto di partenza dovrebbe essere qualcosa del tipo (supponendo che includo Redis):
- 2/3 server con un'istanza Redis + Logstash (indicizzatore) per ogni server. Per le specifiche, sto pensando 32 GB di RAM, veloce I/O disco 500 GB forse SSD, 8 core (i7)
- 3 server per Elasticsearch (questo è quello di cui sono più insicuro) - So che ho bisogno di almeno 3 nodi master e 2 nodi dati, quindi 2 server avranno 1 master/1 dati ciascuno - questi saranno potenti 64 GB di RAM, 20 TB, 8 core. L'altro nodo master rimanente può trovarsi su una macchina con specifiche basse, in quanto non sta gestendo i dati.
- 2 server per Nginx/Kibana: si tratta di macchine con bassa specifica, in quanto sono solo il server Web e l'interfaccia utente. È necessario un bilanciamento del carico qui?
MODIFICA: Pianificazione della conservazione dei registri per 60 giorni.
Per quanto tempo manterrai i registri? Vedi http://stackoverflow.com/questions/30331768/logstash-elasticsearch-kibana-resource-planning per alcuni numeri. –