Solución:
Piénselo así:
Hadoop tiene un sistema de archivos especial llamado “hdfs” que se ejecuta sobre el sistema de archivos existente, por ejemplo, Linux. No existe un concepto de directorio de trabajo actual o presente, también conocido como pwd
Digamos que tenemos la siguiente estructura en hdfs:
d1/
d2/
f1
d3/
f2
d4/
f3
Podría hacer cd en su sistema de archivos Linux pasando de uno a otro, pero ¿cree que cambiar de directorio en hadoop tendría sentido? HDFS es como un sistema de archivos virtual y no interactúa directamente con hdfs excepto a través del comando hadoop o el rastreador de trabajos.
HDFS proporciona varias funciones que permiten acceder fácilmente a HDFS (Hadoop Filesystem) en máquinas locales o nodos de borde. Tiene la opción de montar HDFS mediante cualquiera de los siguientes métodos. Una vez que el sistema de archivos Hadoop está montado en su máquina, puede usar el comando cd para navegar a través del sistema de archivos (es como montar un sistema de archivos de red remoto como NAS)
- Fusible dfs (disponible a partir de Hadoop 0.20 en adelante)
- Acceso de puerta de enlace NFSv3 a datos HDFS (disponible a partir de la versión de Hadoop
Hadoop 2.2.0)