Sto imparando come usare Hadoop Pig ora.Hadoop Numero conteggio dei maiali
Se ho un file di input come questo:
a,b,c,true
s,c,v,false
a,s,b,true
...
L'ultimo campo è quello che ho bisogno di contare ... Quindi voglio sapere quanti 'vero' e 'falso' in questo file .
cerco:
records = LOAD 'test/input.csv' USING PigStorage(',');
boolean = foreach records generate $3;
groups = group boolean all;
Ora mi si blocca. Voglio usare:
count = foreach groups generate count('true');"
Per ottenere il numero di "vero" ma ho sempre l'errore:
2013-08-07 16:32:36,677 [main] ERROR org.apache.pig.tools.grunt.Grunt - ERROR 1070: Could not resolve count using imports: [, org.apache.pig.builtin., org.apache.pig.impl.builtin.] Details at logfile: /etc/pig/pig_1375911119028.log
Qualcuno può dirmi dove è il problema?
Grazie, funziona! – user2597504