Ho appena scaricato la VM sandbox di Hortonworks, al suo interno ci sono Hadoop con la versione 2.7.1. Aggiungendo alcuni file utilizzando ilCome eliminare file da HDFS?
hadoop fs -put /hw1/* /hw1
... comando. Dopo che sto eliminando i file aggiunti, dal ... comando
hadoop fs -rm /hw1/*
, e dopo la pulizia del cestino, dal ... comando
hadoop fs -expunge
. Ma lo spazio rimanente DFS non è cambiato dopo la pulizia del cestino del recyle. Anche io posso vedere che i dati sono stati veramente cancellati dal/hw1/e dal cestino del recyle. Ho il fs.trash.interval parameter = 1
.
Attualmente posso trovare tutti i miei dati suddivisi in blocchi nella cartella /hadoop/hdfs/data/current/BP-2048114545-10.0.2.15-1445949559569/current/finalized/subdir0/subdir2
e questo mi sorprende molto, perché mi aspetto che vengano eliminati.
Quindi la mia domanda su come eliminare i dati nel modo in cui saranno effettivamente cancellati? Dopo poche aggiunte e cancellazioni ho esaurito lo spazio libero.
Significa il 'namenode' cancellato i metadati, ma il' datanode' non ha cancellato i dati. Controlla i log 'namenode' e' datanode' per errori o avvisi. Prova a eseguire 'hdfs dfsadmin -report' e vedi se hai qualche informazione utile. – alvits
Inoltre ci vorrà del tempo per eseguire la contabilità. –
Hadoop sposta il contenuto nella directory thrash sul comando -rm. Se si desidera eliminare definitivamente le cartelle, è necessario utilizzare il comando 'hadoop fs -rm -skipTrash/hw1/*' –