Hadoop 学习笔记（二） HDFS API

4.删除HDFS上的文件

package proj;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

public class DeleteFile {

    public static void main(String[] args) throws IOException {

        Configuration conf = new Configuration();

        //要点：没有这句会传到本地文件系统，而不是hdfs

        conf.set("fs.default.name","hdfs://localhost:9000");

        FileSystem hdfs = FileSystem.get(conf);

        Path delef = new Path("in/test3.txt");

        boolean isDeleted = hdfs.delete(delef, false);

        //递归删除

        //boolean isDelete = hdfs.delete(delef, true);

        System.out.println("delete? "+ isDeleted);

    }

}

检查文件是否存在
package proj;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

public class CheckFile {

    public static void main(String[] args) throws IOException {

        Configuration conf = new Configuration();

        //要点：没有这句会传到本地文件系统，而不是hdfs

        conf.set("fs.default.name","hdfs://localhost:9000");

        FileSystem hdfs = FileSystem.get(conf);

        Path findf = new Path("in/hello.c");

        boolean exist = hdfs.exists(findf);

        System.out.println("exist ? " + exist);

    }

}

查找某个文件在HDFS集群的位置
package proj;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.BlockLocation;

import org.apache.hadoop.fs.FileStatus;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

public class FileLocal {

    public static void main(String[] args) throws IOException{

        Configuration conf = new Configuration();

        //要点：没有这句会传到本地文件系统，而不是hdfs

        conf.set("fs.default.name","hdfs://localhost:9000");

        FileSystem hdfs = FileSystem.get(conf);

        Path fpath = new Path("in/hello.c");

        FileStatus filestatus = hdfs.getFileStatus(fpath);

        BlockLocation[] blkLocations = hdfs.getFileBlockLocations(filestatus, 0, filestatus.getLen());

        int blockLen = blkLocations.length;

        for (int i = 0; i < blockLen; i++) {

            String[] hosts = blkLocations[i].getHosts();

            System.out.println("block "+i+" location "+ hosts[i]);

        }

    }

}

获取HDFS集群上所有节点名称
package proj;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;

import org.apache.hadoop.fs.FileSystem;

import org.apache.hadoop.fs.Path;

import org.apache.hadoop.hdfs.DistributedFileSystem;

import org.apache.hadoop.hdfs.protocol.DatanodeInfo;

public class GetList {

    public static void main(String[] args) throws IOException {

        Configuration conf = new Configuration();

        //要点：没有这句会传到本地文件系统，而不是hdfs

        conf.set("fs.default.name","hdfs://localhost:9000");

        FileSystem fs = FileSystem.get(conf);

        DistributedFileSystem hdfs = (DistributedFileSystem)fs;

        DatanodeInfo[] dataNodeStats = hdfs.getDataNodeStats();

        String[] names = new String[dataNodeStats.length];

        for (int i = 0; i < dataNodeStats.length; i++) {

            names[i] = dataNodeStats[i].getHostName();

            System.out.println("node " + i + " name " + names[i]);

        }

    }

}

Hadoop 学习笔记（二） HDFS API的更多相关文章

ZooKeeper学习笔记二：API基本使用
Grey ZooKeeper学习笔记二:API基本使用准备工作搭建一个zk集群,参考ZooKeeper学习笔记一:集群搭建. 确保项目可以访问集群的每个节点新建一个基于jdk1.8的maven项 ...
Hadoop学习笔记： HDFS
注:该文内容部分来源于ChinaHadoop.cn上的hadoop视频教程. 一. HDFS概述 HDFS即Hadoop Distributed File System, 源于Google发表于200 ...
Hadoop学习笔记(2)-HDFS的基本操作(Shell命令)
在这里我给大家继续分享一些关于HDFS分布式文件的经验哈,其中包括一些hdfs的基本的shell命令的操作,再加上hdfs java程序设计.在前面我已经写了关于如何去搭建hadoop这样一个大数据平 ...
hadoop 学习笔记二
NameNode的持久化(persistent)(day4,1) 类似于:Redis redis中的持久化文件是相互独立的当两个持久化文件同时存在时默认使用的是aof ,但是namenode 的持久化 ...
Hadoop学习笔记二
一.设置无密码sudo权限,不用在普通用户和root用户间来回切换 chmod u+w /etc/sudoers vim /etc/sudoers #首行添加如下的内容: hadoop ALL=(ro ...
Hadoop-HBASE案例分析-Hadoop学习笔记<二>
之前有幸在MOOC学院抽中小象学院hadoop体验课. 这是小象学院hadoop2.X概述第八章的笔记主要介绍HBase,一个分布式数据库的应用案例. 案例概况: 1)时间序列数据库(OpenTSD ...
hadoop学习笔记贰 --HDFS及YARN的启动
1.初始化HDFS :hadoop namenode -format 看到如下字样,说明初始化成功. 启动HDFS,start-dfs.sh 终于启动成功了,原来是core-site.xml 中配置 ...
Hadoop学习笔记(三) ——HDFS
参考书籍:<Hadoop实战>第二版第9章:HDFS详解 1. HDFS基本操作 @ 出现的bug信息 @-@ WARN util.NativeCodeLoader: Unable to ...
hadoop学习笔记（四）：HDFS文件权限，安全模式，以及整体注意点总结
本文原创,转载注明作者和原文链接! 一:总结注意点: 到现在为止学习到的角色:三个NameNode.SecondaryNameNode.DataNode 1.存储的是每一个文件分割存储之后的元数据信息 ...
Hadoop学习笔记—22.Hadoop2.x环境搭建与配置
自从2015年花了2个多月时间把Hadoop1.x的学习教程学习了一遍,对Hadoop这个神奇的小象有了一个初步的了解,还对每次学习的内容进行了总结,也形成了我的一个博文系列<Hadoop学习笔 ...

随机推荐

ionic之应用首次启动引导页
用户首次启动app先进入引导页,localstroge记录状态,下次启动应用不再显示引导页. HTML: <html> <head> <meta charset=&quo ...
堆排序中建堆过程时间复杂度O(n)怎么来的？
首先这个循环是从i = headsize/2 -> 1,也就是说这是一个bottom-up的建堆.于是,有1/2的元素向下比较了一次,有1/4的向下比较了两次,1/8的,向下比较了3次,.... ...
Hadoop入门--HDFS（单节点）配置和部署 (一)
一配置SSH 下载ssh服务端和客户端 sudo apt-get install openssh-server openssh-client 验证是否安装成功 ssh username@192.16 ...
Info.plist和pch文件的作用，UIApplication，iOS程序的启动过程，AppDelegate 方法解释，UIWindow，生命周期方法
Info.plist常见的设置建立一个工程后,会在Supporting files文件夹下看到一个“工程名-Info.plist”的文件,该文件对工程做一些运行期的配置,非常重要,不能删除注:在旧 ...
Android RecyclerView 瀑布流
<LinearLayout xmlns:android="http://schemas.android.com/apk/res/android" android:layout ...
[转] restrict关键字用法
PS: 在函数中,指针参数指定了restrict,表示这个指针指向的这段区域只能通过这个指针修改 c99中新增加了一个类型定义,就是restrict. 看了下网上的相关贴子,但还是问题解决的不够.下面 ...
python 之路，Day11 (下)- sqlalchemy ORM
python 之路,Day11 - sqlalchemy ORM 本节内容 ORM介绍 sqlalchemy安装 sqlalchemy基本使用多外键关联多对多关系表结构设计作业 1. ORM ...
AS 进行单元测试
以下为本人在AndroidStudio 2.0 上实测后得出的结论,不像网上那一堆堆的误人子弟的文章,都是过时的或者根本就是不对的. 简介和eclipse需要配置清单文件不同,AndroidStud ...
(转)PHP中的ob_start用法详解
用PHP的ob_start();控制您的浏览器cache Output Control 函数可以让你自由控制脚本中数据的输出.它非常地有用,特别是对于:当你想在数据已经输出后,再输出文件头的情况.输出 ...
xmpp发送文件
xmpp 文件传输协议: XEP-0096: SI File Transfer:文件传输流初始化协议 XEP-0065: SOCKS5 Bytestreams:带外socks5代理字节流传输协议 XE ...

Hadoop 学习笔记（二） HDFS API

Hadoop 学习笔记（二） HDFS API的更多相关文章

随机推荐

热门专题