操作hadoop的经验积累

操作hadoop的经验积累

Hadoop namenode –format

在执行格式化-format命令时，要避免namenode的namdespaceid与datanode的namespaceid的不一致。这是因为每格式化一次就会产生name,data,temp等临时文件记录信息，多次格式化会产生很多的name,data,temo，这样容易导致id的不同，使hadoop不能正常运行。每次执行格式化—format命令时，就需要将datanode和namenode上原来的data,temp文件删除。

查看群集状态，

$ ./hadoop dfsadmin-report

ConfiguredCapacity: 53895745536 (50.19 GB)

Present Capacity:8199200768 (7.64 GB)

DFS Remaining:8199159808 (7.64 GB)

DFS Used: 40960 (40KB)

DFS Used%: 0%

Under replicatedblocks: 0

Blocks with corruptreplicas: 0

Missing blocks: 0

-------------------------------------------------

Datanodesavailable: 1 (1 total, 0 dead)

Name:127.0.0.1:50010

Decommission Status: Normal

ConfiguredCapacity: 53895745536 (50.19 GB)

DFS Used: 40960 (40KB)

Non DFS Used:45696544768 (42.56 GB)

DFS Remaining:8199159808(7.64 GB)

DFS Used%: 0%

DFS Remaining%:15.21%

Last contact: MonAug 19 06:36:47 EDT 2013

在安装hadoop集群时，把要安装的软件解压到集群内的所有机器上，软件的安装目录也要一致。集群里所有机器中的hadoop_home目录代表安装的根路径，集群中的机器要求hadoop_home路径一致。如果集群中的机器环境一致，可以采用这种方法统一安装和配置集群的机器，先在一台机器上配置好，然后把配置好的软件的整个文件夹复制到集群中其他机器的目录中，这样就可以保障集群中的机器配置一致性。

操作hadoop的经验积累的更多相关文章

超人学院二期学员分享hadoop工作经验
定于2月17日--2月23日的某一天,邀请咱们学员分享一下hadoop工作经验.对于没工作过的同学或者没从事过hadoop工作的同学,抓住机会啊,你可以提前准备自己关心的各种问题! 具体时间请关注QQ ...
Hadoop学习笔记（三）：java操作Hadoop
1. 启动hadoop服务. 2. hadoop默认将数据存储带/tmp目录下,如下图: 由于/tmp是linux的临时目录,linux会不定时的对该目录进行清除,因此hadoop可能就会出现意外情况 ...
操作Hadoop集群
操作Hadoop集群所有必要的配置完成后,将文件分发到所有机器上的HADOOP_CONF_DIR目录.这应该是所有机器上相同的目录. 一般来说,建议HDFS和YARN作为单独的用户运行.在大多数安装 ...
通过流的方式操作hadoop的API
通过流的方式操作hadoop的API 功能: 可以直接用来操作hadoop的文件系统可以用在mapreduce的outputformat中设置RecordWrite 参考: 概念理解 http:// ...
Python API 操作Hadoop hdfs详解
1:安装由于是windows环境(linux其实也一样),只要有pip或者setup_install安装起来都是很方便的 >pip install hdfs 2:Client——创建集群连接 ...
C#、JAVA操作Hadoop（HDFS、Map/Reduce）真实过程概述。组件、源码下载。无法解决：Response status code does not indicate success: 500。
一.Hadoop环境配置概述三台虚拟机,操作系统为:Ubuntu 16.04. Hadoop版本:2.7.2 NameNode:192.168.72.132 DataNode:192.168.72. ...
使用HBaseShellPro操作Hadoop 2系列发行版CDH4.4
前言对于hadoop,hbase由于项目紧张原因好几个月没有时间认真的来总结下了,最近有一些空,就来继续的把项目中用到的一些技术实际的写出来,动动手,好久没有写东西了,都生疏了,说起hadoop,公 ...
学习笔记：Twitter核心数据类库团队的Hadoop优化经验
一.来源 Streaming Hadoop Performance Optimization at Scale, Lessons Learned at Twitter (Data platform @ ...
Java操作Hadoop集群
mavenhdfsMapReduce 1. 配置maven环境 2. 创建maven项目 2.1 pom.xml 依赖 2.2 单元测试 3. hdfs文件操作 3.1 文件上传和下载 3.2 RPC ...

随机推荐

STL之nth_element()（取容器中的第n大值）
nth_element()函数头文件:#include<algorithm> 作用:nth_element作用为求第n大的元素,并把它放在第n位置上,下标是从0開始计数的,也就是说求第0 ...
【中途相遇+二进制】【NEERC 2003】Jurassic Remains
例题25 侏罗纪(Jurassic Remains, NEERC 2003, LA 2965) 给定n个大写字母组成的字符串.选择尽量多的串,使得每个大写字母都能出现偶数次. [输入格式] 输入包含 ...
FineUI
window间传值: Window1.GetSaveStateReference(new string[] { TextBox1.ClientID, ak.ClientID })收 ActiveWin ...
使用DBCC CHECKIDENT重置自增标识
原来ID=8的记录删除后, 下一个Insert记录为9 当插入ID=10的记录后, 使用 ) 当再次Insert记录, 就会是ID为8. 不过以上不是真实的使用场景, 以上情况应该插入包含ID的记录就 ...
80端口被NT kernel & System 占用pid= 4的解决方法
引用http://www.2cto.com/os/201111/111269.html的方法.亲测可用该进程是Http.sys.它是http API的驱动组件,Http栈服务器.如果该端口被Http ...
跨服务器的sql使用
由于想从别的服务器上的数据库导入一些数据过来经网上查阅,得到 select * from openrowset( 'SQLOLEDB', '服务器名字'; '用户名'; '密码',数据库名字.dbo ...
在IIS上Office Word下载失败，检索 COM 类工厂中 CLSID 为000209FF的组件失败，80070005 拒绝访问。
最近在做一个网站时,有一个下载word文档功能,在本地直接调试是可以下载的,但部署到IIS上就出现问题了. 出现问题如下:Error:下载简历方法出错:检索 COM 类工厂中 CLSID 为 {000 ...
Android 自动更新 + IIS7 添加APK mime
如果APK文件放在IIS下面需要添加APK的mime,否则会出现下面错误可以在IIS上添加mime映射 .apk application/vnd.android 下面内容转自:http://ww ...
Sql Server trace flags
Tace flag number Description -T1205 每次deadlock算法运行时,都收集相关的信息 -T1204 当deadlock算法发现死锁时才收集相关信息 -T3604 把 ...
Putty使用公钥认证时，报错：Disconnected: No supported authentication methods available(server sent:public key) 问题的解决
Putty使用公钥认证时,按照常规方法设置,一直报错:Disconnected: No supported authentication methods available (server sent: ...

操作hadoop的经验积累

操作hadoop的经验积累的更多相关文章

随机推荐

热门专题