Amazon EMR Documentation to add steps to cluster afferma che un singolo passo Elastic MapReduce può inviare diversi lavori a Hadoop. Tuttavia, Amazon EMR Documentation for Step configuration suggerisce che un singolo passaggio può ospitare solo un'esecuzione di hadoop-streaming.jar (ovvero, HadoopJarStep è un HadoopJarStepConfig piuttosto che un array di HadoopJarStepConfigs).Come posso inviare più di un lavoro a Hadoop in una fase utilizzando l'API Elastic MapReduce?
Qual è la sintassi corretta per l'invio di più lavori a Hadoop in una fase?
è possibile specificare con quale linguaggio (lingua) si desidera inviare lavoro. Voglio dire in quale lingua si desidera codificare per inviare il processo EMR sul cluster. – hayat
C'è un oggetto JSON che descrive il flusso di lavoro che viene letto da EMR, a prescindere da cosa, quindi la lingua che usi in origine per descrivere il flusso di lavoro non ha importanza: viene tradotta in JSON, ad esempio, la CLI di AWS secondo alcune specifiche . In realtà non penso che questa specifica soddisfi esplicitamente l'invio di più processi a Hadoop in un solo passaggio, ma probabilmente puoi usare script_runner.jar per farlo: http://docs.aws.amazon.com/ElasticMapReduce/latest/DeveloperGuide/emr -hadoop-script.html. Qualcuno che esplori questo più profondamente può scrivere una risposta. Ne accetterò uno buono. – verve
Hai trovato una soluzione a questo? Sto ancora cercando come farlo usando AWS SDK. Sto usando le API di Javascript. – nishant