Hadoop Java API 操作 hdfs--1
Hadoop文件系统是一个抽象的概念,hdfs仅仅是Hadoop文件系统的其中之一。
就hdfs而言,访问该文件系统有两种方式:(1)利用hdfs自带的命令行方式,此方法类似linux下面的shell命令;(2)利用hdfs的java接口,通过编写java程序来实现。
操作环境:hadoop-1.0.4,java1.7.0_65,Ubuntu 14.04.1 LTS
- import java.io.InputStream;
- import java.net.URI;
- import org.apache.hadoop.conf.Configuration;
- import org.apache.hadoop.fs.FSDataInputStream;
- import org.apache.hadoop.fs.FileSystem;
- import org.apache.hadoop.fs.Path;
- import org.apache.hadoop.io.IOUtils;
- public class FileSystemCat {
- public static void main(String[] args) throws Exception {
- String uri = args[0];
- Configuration conf = new Configuration();
- FileSystem fs = FileSystem.get(URI.create(uri), conf);
- InputStream in = null;
- try {
- in = fs.open(new Path(uri));
- IOUtils.copyBytes(in, System.out, 4096, false);
- } finally {
- IOUtils.closeStream(in);
- }
- }
- }
气死我了,这个程序都还没运行成功。
一开始,搞不清楚到底需要import那些类, 关于代码中的类需要import哪些package,可以查这个API文档:http://hadoop.apache.org/docs/current/api/index.html
现在能javac编译成功了,但用hadoop filename 还是不能运行,报错提示:
hadoop FileSystemCat hdfs://conf.sh
Error: Could not find or load main class FileSystemCat
气死我了!!!!!!!!!!!!!!!!!!!!!!1
-----------------------------------
我想一定是关于java程序运行,以及classpath的问题,,,,,我需要搞清楚!21:28:54 2014-10-23
------------------------------
问题搞定了,hadoop-env.sh这个文件里面有个CLASSPATH的参数设置,这个设置值要和javac编译生成的.class文件一致 2014-10-23 23:59:53
今天发现,在没有启动hadoop的情况下,居然可以直接启动hbase 2014-10-28 11:12:29
用javac FileSystemCat.java时,会出现很多报错,
- stu@master:~$ javac FileSystemCat.java
- FileSystemCat.java:4: error: package org.apache.hadoop.conf does not exist
- import org.apache.hadoop.conf.Configuration;
- ^
- FileSystemCat.java:5: error: package org.apache.hadoop.fs does not exist
- import org.apache.hadoop.fs.FSDataInputStream;
- ^
- FileSystemCat.java:6: error: package org.apache.hadoop.fs does not exist
- import org.apache.hadoop.fs.FileSystem;
- ^
- FileSystemCat.java:7: error: package org.apache.hadoop.fs does not exist
- import org.apache.hadoop.fs.Path;
- ^
- FileSystemCat.java:8: error: package org.apache.hadoop.io does not exist
- import org.apache.hadoop.io.IOUtils;
- ^
- FileSystemCat.java:17: error: cannot find symbol
- Configuration conf = new Configuration();
- ^
- symbol: class Configuration
- location: class FileSystemCat
- FileSystemCat.java:17: error: cannot find symbol
- Configuration conf = new Configuration();
- ^
- symbol: class Configuration
- location: class FileSystemCat
- FileSystemCat.java:18: error: cannot find symbol
- FileSystem fs = FileSystem.get(URI.create(uri), conf);
- ^
- symbol: class FileSystem
- location: class FileSystemCat
- FileSystemCat.java:18: error: cannot find symbol
- FileSystem fs = FileSystem.get(URI.create(uri), conf);
- ^
- symbol: variable FileSystem
- location: class FileSystemCat
- FileSystemCat.java:21: error: cannot find symbol
- in = fs.open(new Path(uri));
- ^
- symbol: class Path
- location: class FileSystemCat
- FileSystemCat.java:22: error: cannot find symbol
- IOUtils.copyBytes(in, System.out, 4096, false);
- ^
- symbol: variable IOUtils
- location: class FileSystemCat
- FileSystemCat.java:24: error: cannot find symbol
- IOUtils.closeStream(in);
- ^
- symbol: variable IOUtils
- location: class FileSystemCat
- 12 errors
- stu@master:~$
这时需要在编译的时候,把hadoop里面的相应jar文件设置为classpath参数,即如下就对了:
- stu@master:~$ javac -classpath /home/stu/hadoop-1.0.4/hadoop-core-1.0.4.jar FileSystemCat.java
然后把生成的FileSystemCat.java复制到 hadoop-env.sh里面设定的文件夹下即可。
# Extra Java CLASSPATH elements. Optional.
export HADOOP_CLASSPATH=/home/stu/myclass
Hadoop Java API 操作 hdfs--1的更多相关文章
- Hadoop Java API操作HDFS文件系统(Mac)
1.下载Hadoop的压缩包 tar.gz https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/stable/ 2.关联jar包 在 ...
- 使用Java API操作HDFS文件系统
使用Junit封装HFDS import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.*; import org ...
- 使用Java Api 操作HDFS
如题 我就是一个标题党 就是使用JavaApi操作HDFS,使用的是MAVEN,操作的环境是Linux 首先要配置好Maven环境,我使用的是已经有的仓库,如果你下载的jar包 速度慢,可以改变Ma ...
- hadoop学习笔记(五):java api 操作hdfs
HDFS的Java访问接口 1)org.apache.hadoop.fs.FileSystem 是一个通用的文件系统API,提供了不同文件系统的统一访问方式. 2)org.apache.hadoop. ...
- 使用java api操作HDFS文件
实现的代码如下: import java.io.IOException; import java.net.URI; import java.net.URISyntaxException; import ...
- Hadoop之HDFS(三)HDFS的JAVA API操作
HDFS的JAVA API操作 HDFS 在生产应用中主要是客户端的开发,其核心步骤是从 HDFS 提供的 api中构造一个 HDFS 的访问客户端对象,然后通过该客户端对象操作(增删改查)HDFS ...
- HDFS 05 - HDFS 常用的 Java API 操作
目录 0 - 配置 Hadoop 环境(Windows系统) 1 - 导入 Maven 依赖 2 - 常用类介绍 3 - 常见 API 操作 3.1 获取文件系统(重要) 3.2 创建目录.写入文件 ...
- JAVA API 实现hdfs文件操作
java api 实现hdfs 文件操作会出现错误提示: Permission denied: user=hp, access=WRITE, inode="/":hdfs:supe ...
- hadoop的API对HDFS上的文件访问
这篇文章主要介绍了使用hadoop的API对HDFS上的文件访问,其中包括上传文件到HDFS上.从HDFS上下载文件和删除HDFS上的文件,需要的朋友可以参考下hdfs文件操作操作示例,包括上传文件到 ...
随机推荐
- pandas的分布式执行框架之modin
Scale your pandas workflows by changing one line of code To use Modin, replace the pandas impo ...
- Linux输入法问题
本篇博文简单介绍一下介绍Linux输入相关问题及解决方案 关于Invalid UTF-8参见https://www.baidu.com/link?url=QDh2Fa1uJcmyiaKZBzAFkNn ...
- [物理学与PDEs]第2章第4节 激波 4.2 熵条件
1. R.H. 条件仅仅给出了越过激波时的能量守恒定律, 即热力学第一定律; 但客观的流体运动过程还需满足热力学第二定律, 即越过激波是个熵增过程: $$\bex S_1>S_0\quad(0 ...
- [物理学与PDEs]第1章第2节 预备知识 2.3 Faraday 电磁感应定律
1. Faraday 电磁感应定律: 设 $l$ 为任一闭曲线, 则 $$\bex \oint_l{\bf E}\cdot\rd {\bf l} =-\int_S \cfrac{\p {\bf B} ...
- sublime text3格式化html,css,js代码
需要安装HTML/CSS/JS prettify插件. 安装步骤:首选项 -> Package Control -> Install Package -> HTML-CSS-JS P ...
- Java(6)for循环
一.for循环的使用场合 1.1.while循环——先判断,再循环 while(1.条件表达式){ //2.循环操作 //3.更改循环条件表达式 } 1.2.do…while——先 ...
- vue构造函数(根实例化时和组件实例对象选项)参数:选项详解
实例选项(即传给构造函数的options):数据,DOM,生命周期钩子函数,资源,组合,其他 数据 data 属性能够响应数据变化,当这些数据改变时,视图会进行重渲染. 访问方式: 1.通过 vm.$ ...
- Django REST Framework API Guide 07
本节大纲 1.Permissions 2.Throttling Permissions 权限是用来授权或者拒绝用户访问API的不同部分的不同的类的.基础的权限划分 1.IsAuthenticated ...
- Excel 2010如何打开多个独立窗口?
https://jingyan.baidu.com/article/86fae346acca7d3c49121ad4.html
- vue-地址插件 v-region
demo地址:https://terryz.gitee.io/vue/#/region/demo