Come trovare lo MAX
di una tupla nel maiale?Hadoop PIG Max di tupla
Il mio codice è simile al seguente:
A,20
B,10
C,40
D,5
data = LOAD 'myData.txt' USING PigStorage(',') AS key, value;
all = GROUP data ALL;
maxKey = FOREACH all GENERATE MAX(data.value);
DUMP maxKey;
Questo restituisce 40, ma voglio la coppia chiave-valore pieno: C,40
. Qualche idea?
fa questo lavoro per pig-0.13.0? Grazie. – BlueFeet
Molto probabilmente sì :) – Frederic
Solo un heads-up: mentre il calcolo dei dati "C" dovrebbe essere filtrato da B.val invece di C.val – Zibi