Sto usando il nutch 2.3. Tutti i lavori vengono eseguiti uno dopo l'altro, ovvero il primo generatore, il recupero, l'analisi, l'indice, ecc. Voglio eseguire alcuni lavori contemporaneamente. So che alcuni lavori non possono essere eseguiti in parallelo ma altri possono, ad esempio, analizzare il lavoro, dbupdate, indexjob deve essere eseguito con fetch.Come eseguire apache nutch diversi processi in modo parallelo
È possibile? Il mio obiettivo principale è quello di eseguire il lavoro fetcher tutto il tempo. Suppongo che possiamo farlo con timestamp diversi. Qualcuno può guidarmi nel modo giusto?
Potresti usare l'hasdoop con il nutch. –