numero di partizione determina la parallelismo del tema da una partizione può essere consumato solo da un consumatore in un gruppo di consumatori. Ad esempio, se si hanno solo 10 partizioni per un argomento e 20 consumatori in un gruppo di consumatori, 10 consumatori sono inattivi e non ricevono alcun messaggio. Il numero dipende molto dalla tua applicazione, ma 1-1000 sono tutti ragionevoli.
Il numero di replica è determinato dal requisito di durata. Per un argomento con fattore di replica N, Kafka può tollerare fino a errori del server N-1 senza perdere alcun messaggio impegnato nel log. 3 repliche sono configurazioni comuni. Naturalmente, il numero della replica deve essere più piccolo o uguale al numero del tuo broker.
auto.create.topics.enable controlli di proprietà quando Kafka abilita la creazione automatica di argomento sul server. Se questo è impostato su true, quando le applicazioni tentano di produrre, consumare o recuperare i metadati per un argomento inesistente, Kafka creerà automaticamente l'argomento con il fattore di replica e il numero di partizioni predefiniti. Consiglierei di spegnerlo in produzione e creare argomenti in anticipo.
Grazie per informazioni brevi e pulite – Ratha
Non chiedere al numero di repliche di essere uguale al numero di nodi rende il cluster estremamente fragile? Un nodo si interrompe e improvvisamente il tuo cluster non risponde più perché deve attendere il giusto numero di repliche. –
@SethPaulson Non c'è attesa perché un nodo scende. In tale scenario, il leader lo rimuoverà dall'elenco delle repliche "in-sync" e tenterà di ripristinarlo qualora dovesse tornare. Vedi [Kafka Documentation on Replication] (https://kafka.apache.org/documentation/#replication) per una descrizione dettagliata. –