java api 远程连接 hdfs

IDEA中新建Maven工程，添加POM依赖，在IDE的提示中，点击 Import Changes 等待自动下载完成相关的依赖包。

<?xml version="1.0" encoding="UTF-8"?>

<project xmlns="http://maven.apache.org/POM/4.0.0"

         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">

    <modelVersion>4.0.0</modelVersion>

    <groupId>cn.itcast</groupId>

    <artifactId>example-hdfs</artifactId>

    <version>1.0-SNAPSHOT</version>

    <dependencies>

        <dependency>

            <groupId>org.apache.hadoop</groupId>

            <artifactId>hadoop-common</artifactId>

            <version>2.7.5</version>

        </dependency>

        <dependency>

            <groupId>org.apache.hadoop</groupId>

            <artifactId>hadoop-hdfs</artifactId>

            <version>2.7.5</version>

        </dependency>

        <dependency>

            <groupId>org.apache.hadoop</groupId>

            <artifactId>hadoop-client</artifactId>

            <version>2.7.5</version>

        </dependency>

        <dependency>

            <groupId>junit</groupId>

            <artifactId>junit</artifactId>

            <version>RELEASE</version>

        </dependency>

    </dependencies>

</project>

启动hadoop后，在IDEA中测试mkdir, put, get 创建文件夹，上传，下载

package cn.lshm.hdfs;

import org.apache.commons.io.IOUtils;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FSDataOutputStream;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

import java.io.FileInputStream;

public class TestHDFSClient {

    public static void main(String[] args) throws Exception {

        Configuration conf = new Configuration();

        //这里指定使用的是 hdfs文件系统

        conf.set("fs.defaultFS", "hdfs://master:9000");

        //通过这种方式设置java客户端身份

        System.setProperty("HADOOP_USER_NAME", "root");

        FileSystem fs = FileSystem.get(conf);

        //或者使用下面的方式设置客户端身份

        //FileSystem fs = FileSystem.get(new URI("hdfs://master:9000"),conf,"root");

        // fs.create(new Path("/helloByJava")); //创建一个目录

        //文件下载到本地 如果出现0644错误或找不到winutils.exe,则需要设置windows环境和相关文件.

        //fs.copyToLocalFile(new Path("/zookeeper.out"), new Path("D:\\test\\examplehdfs"));

        //使用Stream的形式操作HDFS，这是更底层的方式

        FSDataOutputStream outputStream = fs.create(new Path("/2.txt"), true); //输出流到HDFS

        FileInputStream inputStream = new FileInputStream("D:/test/examplehdfs/1.txt"); //从本地输入流。

        IOUtils.copy(inputStream, outputStream); //完成从本地上传文件到hdfs

        fs.close();

    }

}

Run之后，没有报错，到hdfs上查看，是否有对应的结果。

最后，老师创建了一个类，方便调用。

package cn.lshm.hdfs;

import java.io.FileNotFoundException;

import java.io.IOException;

import java.net.URI;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.BlockLocation;

import org.apache.hadoop.fs.FileStatus;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.LocatedFileStatus;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.fs.RemoteIterator;

import org.junit.Before;

import org.junit.Test;

public class HdfsClient {

    FileSystem fs = null;

    @Before

    public void init() throws Exception {

        Configuration conf = new Configuration();

        // conf.set("fs.defaultFS", "hdfs://node-1:9000");

        /**

         * 参数优先级： 1、客户端代码中设置的值 2、classpath下的用户自定义配置文件 3、然后是jar中默认配置

         */

        // 获取一个hdfs的访问客户端

        fs = FileSystem.get(new URI("hdfs://master:9000"), conf, "root");

    }

    /**

     * 往hdfs上传文件

     *

     * @throws Exception

     */

    @Test

    public void testAddFileToHdfs() throws Exception {

        // 要上传的文件所在的本地路径

        // 要上传到hdfs的目标路径*/

        Path src = new Path("d:/GameLog.txt");

        Path dst = new Path("/");

        fs.copyFromLocalFile(src, dst);

        fs.close();

    }

    /**

     * 从hdfs中复制文件到本地文件系统

     *

     * @throws IOException

     * @throws IllegalArgumentException

     */

    @Test

    public void testDownloadFileToLocal() throws IllegalArgumentException, IOException {

        // fs.copyToLocalFile(new Path("/mysql-connector-java-5.1.28.jar"), new

        // Path("d:/"));

        fs.copyToLocalFile(false, new Path("/install.log.syslog"), new Path("e:/"), true);

        fs.close();

    }

    /**

     * 目录操作

     *

     * @throws IllegalArgumentException

     * @throws IOException

     */

    @Test

    public void testMkdirAndDeleteAndRename() throws IllegalArgumentException, IOException {

        // 创建目录

        fs.mkdirs(new Path("/a1/b1/c1"));

        // 删除文件夹 ，如果是非空文件夹，参数2必须给值true ，删除所有子文件夹

        fs.delete(new Path("/aaa"), true);

        // 重命名文件或文件夹

        fs.rename(new Path("/a1"), new Path("/a2"));

    }

    /**

     * 查看目录信息，只显示文件

     *

     * @throws IOException

     * @throws IllegalArgumentException

     * @throws FileNotFoundException

     */

    @Test

    public void testListFiles() throws FileNotFoundException, IllegalArgumentException, IOException {

        RemoteIterator<LocatedFileStatus> listFiles = fs.listFiles(new Path("/"), true);

        while (listFiles.hasNext()) {

            LocatedFileStatus fileStatus = listFiles.next();

            System.out.println(fileStatus.getPath().getName());

            System.out.println(fileStatus.getBlockSize());

            System.out.println(fileStatus.getPermission());

            System.out.println(fileStatus.getLen());

            BlockLocation[] blockLocations = fileStatus.getBlockLocations();

            for (BlockLocation bl : blockLocations) {

                System.out.println("block-length:" + bl.getLength() + "--" + "block-offset:" + bl.getOffset());

                String[] hosts = bl.getHosts();

                for (String host : hosts) {

                    System.out.println(host);

                }

            }

            System.out.println("--------------打印的分割线--------------");

        }

    }

    /**

     * 查看文件及文件夹信息

     *

     * @throws IOException

     * @throws IllegalArgumentException

     * @throws FileNotFoundException

     */

    @Test

    public void testListAll() throws FileNotFoundException, IllegalArgumentException, IOException {

        //可以右击方法名，Run 测试一下。

        FileStatus[] listStatus = fs.listStatus(new Path("/"));

        String flag = "";

        for (FileStatus fstatus : listStatus) {

            if (fstatus.isFile()) {

                flag = "f-- ";

            } else {

                flag = "d-- ";

            }

            System.out.println(flag + fstatus.getPath().getName());

            System.out.println(fstatus.getPermission());

        }

    }

}

java api 远程连接 hdfs的更多相关文章

客户端用java api 远程操作HDFS以及远程提交MR任务(源码和异常处理)
两个类,一个HDFS文件操作类,一个是wordcount 词数统计类,都是从网上看来的.上代码: package mapreduce; import java.io.IOException; impo ...
利用JAVA API远程进行HDFS的相关操作
学习HDFS有一段时间了,现在把自己总结的HDFS的相关操作代码展示给大家. 主要有HDFS的增删改查,文件的追加,windows本地文件的上传,hdfs文件的下载,文件重命名,创建目录,文件是否存在 ...
使用Java API方式连接HDFS Client测试
IDEA中新建Maven工程,添加POM依赖, 在IDE的提示中, 点击 Import Changes 等待自动下载完成相关的依赖包. <?xml version="1.0" ...
JAVA本地远程连接linux程序监控状态
环境: 1.本地window 2.程序部署在centos 一,启动访问权限安全守护程序新建文件:jstatd.all.policy ,注意路径 grant codebase "$JA ...
Java驱动远程连接mongoDB(简明易懂版)
mongodb默认是不能远程连接的,而且在linux安装完你会发现,它的目录极其简单,连个配置文件都没有. 我的mongodb的版本是3.6,目前最新的.https://www.mongodb.com ...
第3节 sqoop：7、通过java代码远程连接linux执行shell命令
数据库的数据同步软件sqoop 数据同步关系型数据库到大数据平台任务:sqoop 是批量导入数据太慢,如何做到实时的数据同步实时的数据同步工具: canal 阿里开源的一个数据库数据实时同步的软 ...
java程序远程连接Linux服务器
JSCH或 Ganymed Ganymed: Ganymed SSH-2 for Java是用纯Java实现SSH-2协议的一个包. 可以利用它直接在Java程序中连接SSH服务器.官网地址为 htt ...
[bug] Window远程连接hdfs错误：java.lang.UnsatisfiedLinkError: org.apache.hadoop.util.NativeCrc32.nativeComput
原因 hadoop.dll 版本问题解决查询远程主机中hadoop版本,下载相同或稍高版本的hadoop.dll,将下载的 hadoop.dll 复制到windows系统的c:/window/sy ...
Java Api Consumer 连接启用Kerberos认证的Kafka
java程序连接到一个需要Kerberos认证的kafka集群上,消费生产者生产的信息,kafka版本是2.10-0.10.0.1: Java程序以maven构建,(怎么构建maven工程,可去问下度 ...

随机推荐

Spark以yarn方式运行时抛出异常
Spark以yarn方式运行时抛出异常: cluster.YarnClientSchedulerBackend: Yarn application has already exited with st ...
tf.reduce_max 与 reduce 系列 API
reduce 可以理解为 python 里的 reduce 函数: tensorflow 中有很多 reduce_ API,其用法完全相同 tf.reduce_max 以这个为例进行说明 def re ...
SSH项目Dao层和Service层及Action的重用
泛型 1.泛型的定义 1.泛型是一种类型 1.关于Type //是一个标示接口,该标示接口描述的意义是代表所有的类型 public interface Typ ...
Cookie信息保存到本地（MozillaCookieJar）
from urllib import request from http.cookiejar import MozillaCookieJar cookiejar = MozillaCookieJar( ...
GO 面向对象-方法
package main import ( "fmt" ) /* 定义结构体 */ type Circle struct { radius float64 } func main( ...
附：Struts2-CRM，拦截器实现权限访问
拦截器代码: package mycrm.interceptor; import org.apache.struts2.ServletActionContext; import com.opensym ...
使用jquery select2实现下拉框搜索功能
由于公司后台系统下拉框数据量太多了,用户操作起来要不方便所以增加了下拉框里面一个搜索功能 1从官网下载jquery select2 下来地址https://select2.github.io/ 2: ...
linux 部署java 项目命令
1:服务器部署路径:/home/tomcat/tomcat/webapps (用FTP工具链接服务器把包上传到此目录) 2:进入项目文件夹 cd /home/tomcat/tomcat/webapp ...
Curl常用函数介绍
一.LibCurl基本编程框架在基于LibCurl的程序里,主要采用callback function (回调函数)的形式完成传输任务,用户在启动传输前设置好各类参数和回调函数,当满足条件时libc ...
spring-cloud-服务调用流程

java api 远程连接 hdfs

java api 远程连接 hdfs的更多相关文章

随机推荐

热门专题