O que é HDFS ?
O Hadoop Distributed File System (HDFS) é o sistema de arquivos do Hadoop, nele os dados são divididos em blocos e os blocos replicados nas máquinas que compõe o Cluster Hadoop, a ideia é utilizar hardwares commodity ( padronizados ) sem necessitar de hardware muito potente para montar um sistema de dados
Comandos HDFS
No HDFS seus comandos seguem o POSIX, comandos como cd, ls, mkdir, rm, rmdir e etc.
Para quem está acostumado a usar Linux, terá mais facilidade em operar o terminal para manipular o sistema de arquivo, existem 2 apresentações comuns para fazer um list ( ls ) :
hadoop fs -ls ou hdfs dfs -ls
A primeira ( hadoop fs ) é a mais antiga e está sendo substituida pela 2 ( hdfs dfs ) que se tornou padrão.
Pessoal para quem está iniciando os estudos em Hadoop, segue uma lista oficial dos comando usados para manipular o HDFS.
http://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/CommandsManual.html
Abraço
Marco Garcia.