Hbase记录-Hbase其他工具】的更多相关文章

垃圾回收优化当region服务器处理大量的写入负载时,繁重的任务会迫使JRE默认的内存分配策略无法保证程序的稳定性 所以我们可能需要对region服务器的垃圾回收机制进行一些参数调整(因为master并不处理实际任务,所以没有优化的必要) 首先来了解JAVA内存中的几个概念 在HBase构架中我们可以知道 数据会被写入到memstore内存中直到达到一个阈值之后刷写持久化到磁盘 但是由于数据是客户端在不同时间写入的,这些数据占据的JAVA内存中的堆空间很可能是不连续的,所以JAVA虚拟机的内存会…
HBase是什么? HBase是建立在Hadoop文件系统之上的分布式面向列的数据库.它是一个开源项目,是横向扩展的. HBase是一个数据模型,类似于谷歌的大表设计,可以提供快速随机访问海量结构化数据.它利用了Hadoop的文件系统(HDFS)提供的容错能力. 它是Hadoop的生态系统,提供对数据的随机实时读/写访问,是Hadoop文件系统的一部分. 人们可以直接或通过HBase的存储HDFS数据.使用HBase在HDFS读取消费/随机访问数据. HBase在Hadoop的文件系统之上,并提…
HBase Shell HBase包含可以与HBase进行通信的Shell. HBase使用Hadoop文件系统来存储数据.它拥有一个主服务器和区域服务器.数据存储将在区域(表)的形式.这些区域被分割并存储在区域服务器. 主服务器管理这些区域服务器,所有这些任务发生在HDFS.下面给出的是一些由HBase Shell支持的命令. 通用命令 status: 提供HBase的状态,例如,服务器的数量. version: 提供正在使用HBase版本. table_help: 表引用命令提供帮助. wh…
1.RowCounter工具可以查看某张表有多少行,效率非常高 2.count命令在数据量大的时候效率非常差 执行./hbase  org.apache.hadoop.habse.mapreduce.RowCounter test 3.WAL(Write Ahead Log)预写日志HLog,发生的更新操作,只有WAL写入成功,才会更新memstore里面的数据 4.将WAL进行分割,执行./hbase org.apache.hadoop.hbase.regionserver.wal.FSHLo…
1.Hmaster的Web接口-端口参数:hbase.master.info.port  默认为16010 http://hbase_master_server:16010 可查看hbase的版本信息,hbase的基本配置信息,hbase在hdfs中的存储路径.zookeeper的节点.集群的负载信息.表.region和region server的信息,可进行compat和split操作 2.RegionServer的Web接口-端口参数:hbase.regionserver.info.port…
Hbase是什么 HBase是一种构建在HDFS之上的分布式.面向列的存储系统,适用于实时读写.随机访问超大规模数据的集群. HBase的特点 大:一个表可以有上亿行,上百万列. 面向列:面向列表(簇)的存储和权限控制,列(簇)独立检索. 稀疏:对于为空(NULL)的列,并不占用存储空间,因此,表可以设计的非常稀疏. 无模式:每一行都有一个可以排序的主键和任意多的列,列可以根据需要动态增加,同一张表中不同的行可以有截然不同的列. 数据多版本:每个单元中的数据可以有多个版本,默认情况下,版本号自动…
1.进入hbase shell  执行./bin/hbase shell 2.进入后,help  帮助信息,如可以使用help 'create' 3.创建表:create 'test','cf'  表名-列族 4.列出所有表:list  5.查看表的结构信息:describe 'test' 6.插入数据:put 'test','row1','cf:a','values1' put命令比较简单,只有这一种用法:  hbase> put 't1′, 'r1′, 'c1′, 'value', ts1…
#版本支持 #官网下载二进制包,解压到/usr/app下,配置/etc/profile: export HBASE_HOME=/usr/app/hbase export PATH=$HBASE_HOME/bin:$PATH #根据实际情况是否拷hadoop/share/hadoop 下所有 hadoop*.jar 到 hbase/lib 下:find /usr/hadoop/share/hadoop -name "hadoop*.jar" | xargs -i cp {} /usr/a…
hbase.tmp.dir:本地文件系统的临时目录,默认是java.io.tmpdir/hbase−java.io.tmpdir/hbase−{user.name}: hbase.rootdir:hbase持久化的目录,被所有regionserver共享,默认${hbase.tmp.dir}/hbase,一般设置为hdfs://namenode.example.org:9000/hbase类似,带全限定名: hbase.cluster.distributed:hbase集群模式运作与否的标志,默…
HBase扫描   scan 命令用于查看HTable数据.使用 scan 命令可以得到表中的数据.它的语法如下: scan ‘<table name>’ 下面的示例演示了如何使用scan命令从表中读取数据.在这里读取的是emp表. hbase(main):010:0> scan 'emp' ROW COLUMN+CELL 1 column=personal data:city, timestamp=1417521848375, value=hyderabad 1 column=pers…