2015-10-23 27 views
8

Qual è la differenza tra flusso di lavoro, coordinatore e pacchetto Oozie?Qual è la differenza tra flusso di lavoro, coordinatore e pacchetto Oozie

Il flusso di lavoro Oozie definisce una sequenza di azioni. E dobbiamo invocare manualmente ogni volta che vogliamo che venga eseguito. Dove è possibile pianificare lo stesso flusso di lavoro tramite il coordinatore. Questa comprensione è corretta?

Quindi cosa è in più in bundle?

Immagino sia usato di nuovo per programmare un gruppo di coordinatori. Quindi, perché un coordinatore non può essere utilizzato per pianificare altri coordinatori come un flusso di lavoro può avere un altro flusso di lavoro secondario.

+2

Se il coordinatore è programmato alle 7 del mattino e il coordinatore due è programmato alle 10:00. Quando raggruppiamo questi 2 insieme 1) È necessario programmare anche Bundle? 2) Se il coordinatore One fallisce o è in ritardo oltre le 10.00, Bundle interromperà l'esecuzione del Coordinatore Due? La prego di chiarire. – chandra

risposta

5

flusso di lavoro:

Si tratta di una sequenza di azioni. E 'scritto in XML e le azioni possono essere la mappa di ridurre, alveare, maiale ecc

Coordinatore:

Si tratta di un programma che fa scattare le azioni (comunemente posti di lavoro del flusso di lavoro), quando una serie di condizioni sono soddisfatte. Le condizioni possono essere un tempo-frequenza, gli altri eventi esterni ecc

Fascio:

Essa è definita come un'astrazione oozie livello superiore che lotti un insieme di coordinatore jobs.We può specificare il tempo per il processo di fascio inizia pure.

+0

grazie per la risposta. Ma queste definizioni non chiariscono ancora la differenza/necessità di Bundle rispetto a Coordinator. –

+0

Solo un livello più alto di astrazione ... Gruppo di coordinatori di flussi di lavoro ... Gruppo di coordinatori fascio .... – madhu

1

Il flusso di lavoro non dispone di specifiche temporali per l'esecuzione di alcun lavoro hadoop. Il lavoro di coordinatore ha le specifiche del tempo sul lavoro in coordinator.xml utilizzando il tag di frequenza. I lavori di coordinatore collettivo sono considerati come un lavoro di gruppo. Nel lavoro Bundle, i singoli utenti possono assegnare i propri lavori utilizzando i loro job.properties, per i rispettivi lavori.

0

Per la mia comprensione, utilizzando fascio potrebbe gruppo un paio di coordinatori, quindi sarà meglio al responsabile, per visualizzare, per avviare/arrestare ...

Probabilmente abbiamo due pipeline di dati, uno è per log passare (raccogliere/analizzare/ETL), uno è per la logica aziendale.

Quindi creo due gruppi per raggruppare i diversi tipi di coordinatori.