2013-08-27 14 views
6

Qualcuno potrebbe dirmi, quali sono le differenze tra MapReduce e YARN esistenti, perché non trovo tutte le chiare differenze tra questi due?Differenze tra MapReduce e YARN esistenti (MRv2)

P.S: Sto chiedendo qualcosa come un confronto tra questi.

Grazie!

risposta

11

MRv1 utilizza JobTracker per creare e assegnare attività ai nodi dati, che possono diventare un collo di bottiglia per le risorse quando il cluster si ridimensiona sufficientemente (in genere circa 4.000 nodi).

MRv2 (noto anche come YARN, "Ancora un altro negoziatore di risorse") dispone di un gestore risorse per ciascun cluster e ogni nodo dati esegue un gestore nodo. Per ogni lavoro, un nodo slave agirà come il Maestro applicazione, il monitoraggio risorse/attività, ecc

+1

Cloudera ha un [video che fornisce una spiegazione visiva per supportare questo qui] (http://university.cloudera.com/certification/prep/ccdh.html) ... '(16:06 nel video attraverso 22 : 15) ' –

+0

Il collegamento è rotto – vumaasha

3

MRv1 che è anche chiamato come Hadoop 1 dove il HDFS (gestione delle risorse e la pianificazione) e MapReduce (Programmazione Quadro) sono strettamente accoppiati. A causa di queste applicazioni non batch non è possibile eseguire sul hasdoop 1. Ha un singolo namenode quindi non fornisce elevata disponibilità e scalabilità del sistema.

MRv2 (aka Hadoop 2) in questa versione del Hadoop della gestione delle risorse e la pianificazione delle attività sono separate da MapReduce che è separata da FILATO (Yet Another Resource Negotiator). Il livello di gestione delle risorse e di pianificazione si trova al di sotto del livello MapReduce. Fornisce inoltre elevata disponibilità e scalabilità del sistema in quanto è possibile creare NameNode ridondanti. La nuova funzionalità di snapshot attraverso la quale possiamo eseguire il backup dei file system che aiuta il disaster recovery.