2012-06-21 14 views
6

Sto provando a fare un "clusterdump" sull'output dell'istanza di cluster di mahout kmeans (sintassi_controllo). Ma sto sperimentando il seguente errore:c'è qualche opzione seqFileDir per "clusterdump" nell'ultima libreria "apache mahout"?

> ~/MAHOUT/trunk/bin/mahout clusterdump --seqFileDir clusters-10-final --pointsDir clusteredPoints --output a1.txt 

MAHOUT_LOCAL is not set; adding HADOOP_CONF_DIR to classpath. 
Running on hadoop, using /usr/lib/hadoop/bin/hadoop and HADOOP_CONF_DIR=/usr/lib/hadoop/conf/ 
MAHOUT-JOB: /home/<username>/MAHOUT/trunk/examples/target/mahout-examples-0.8-SNAPSHOT-job.jar 

12/06/21 22:43:18 WARN conf.Configuration: DEPRECATED: hadoop-site.xml found in the classpath. Usage of hadoop-site.xml is deprecated. Instead use core-site.xml, mapred-site.xml and hdfs-site.xml to override properties of core-default.xml, mapred-default.xml and hdfs-default.xml respectively 

12/06/21 22:43:25 ERROR common.AbstractJob: Unexpected --seqFileDir while processing Job-Specific Options: 
usage: <command> [Generic Options] [Job-Specific Options] 
..... 

quindi credo che non esiste alcuna opzione "seqFileDir" per clusterdump ma tutti i tutorial online (es https://cwiki.apache.org/MAHOUT/cluster-dumper.html) si riferiscono questa opzione. Potete per favore suggerirmi il rimedio o quello che mi manca?

risposta

2

Hai provato a specificarlo come opzione --input?

+1

sì, sì. Quando ho sostituito --seqFileDir per --input, è stato generato un file di output , ma era VUOTO! Sai perché i tutorial parlano dell'opzione --seqFileDir? –

+2

Stavo lavorando a questo problema. Magicamente ho trovato la soluzione !!! Grazie per il tuo suggerimento - input lavorato al posto dell'opzione --seqFileDir. Quello che stavo facendo è sbagliato, non mi sono reso conto che clusterdump (con HADOOP_HOME set) legge da HDFS e scrive l'output sul filesystem locale. Ad ogni modo, le cose stanno andando bene ora! –