使用Java API操作HDFS文件系统

Configuration

org.apache.hadoop.conf.Configuration 用来创建HDFS的配置对象(conf),一般可通过它来设置hdfs文件系统的uri

Path

org.apache.hadoop.fs.Path 用来定义文件路径对象(path),类似java中Path

FileSystem

org.apache.hadoop.fs.FileSystem 用来定义hdfs文件系统对象(fs)

  • 初始化fs实例的方法:
    • FileSystem.get(conf)
    • FileSystem.get(uri,conf)
    • path.getFileSystem(conf) 这个实际上创建path时会传入uri,实际上调用第二种方法FileSystem.get(uri,conf)
  • fs具体方法:
    • 创建目录:public boolean mkdirs(Path f) throws IOException
    • 创建文件:public static FSDataOutputStream create(FileSystem fs, Path file, FsPermission permission) throws IOException

IOUtils

觉得有帮助的话,不妨加个鸡腿,O(∩_∩)O哈哈~