Hbase知识点总结:  
hbase表中为什么列族的数量不能太多?

因为当一个列族数据溢写的时候,其他列族也会发生数据溢写,但是其他列族中数据的数量还没有达到溢写的阈值,就会导致产生的小文件数量增多.而hbase有小文件合并操作,小文件数量增多就会导致合并次数增多,从而使io资源消耗量增多。

hbase表结构的创建:通过增加表的数量,实现对表中字段复杂关系的解耦

google protocol buffer:是google公司内部的混合语言数据标准,用于rpc系统和持续数据存储系统。
protocol buffers:是一种轻便高效的结构化数据存储格式,可以用于结构化数据串行化,或者说序列化,很适合做数据存储或者RPC数据交换格式。可用于通讯协议、数据存储等领域的语言无关、平台无关、可扩展的序列化结构数据格式。

安装protocol :  对于安装的节点没有具体环境要求
1、解压安装  tar -zxvf protocol-2.5.0.tar.gz
2、编译安装: 安装之前需要先安装环境  yum grouplist   (grouplist安装一个软件组)
3、yum groupinfo “development tools”(中间有空格加双引号)
4、yum groupinstall "development tools"
5、安装configure文件  ./configure  (生成makefile文件)
6、make && make install (生成可执行文件)
7、指定规则文件 以.proto结尾的文件  
定义proto规则文件的要求:
package lm;   (包名称)
message helloword (class类名称)
{
   required int32   id = 1; (必须的属性)
   required string str =2;
   optional  int32   opt = 3 ;(可选的属性)
}

package com.wcg.hbase (包名--与项目中的包名保持一致)
message PhoneDetail (class文件的名称)
{
  required string dnum = 1;
  required string type = 2;
  required string length = 3;  
  required string date = 4;  //后面的这个值是一个序列号,无所谓大小,前提是不能重复
}
8、在根目录中新建一个文件 phone.proto
9、编译 proto文件  
10、查找生成的可执行文件  whereis protoc  
11、查看protoc文件如何使用
./protoc --help  
12、/usr/local/bin/protoc phone.proto --java_out=/root/  (/root/ --proto文件执行后生成java文件的路径)
13、在java中插入数据的时候可以直接调用生成的该java文件的方法 (里面的接口都是google封装好的)
--实现将100条数据放置到一个rowkey中  
package com.wcg.hbase (包名--与项目中的包名保持一致)
message PhoneDetail (class文件的名称)
{
  required string dnum = 1;
  required string type = 2;
  required string length = 3;  
  required string date = 4;  //后面的这个值是一个序列号,无所谓大小,前提是不能重复
}
message dayPhoneDetail
{
  repeated PhoneDetail dayofPhone = 1;
}

--HBASE和mr的整合以及用本地环境模拟mr yarn进行数据计算
1、将hadoop的安装包的本地路径配置到windows/hadoop Map/Reduce 中
2、在windows环境变量中配置hadoop的相关路径 ,在path路径中配置hadoop_home/bin和hadoop_home/sbin
3、将eclipse中自带的jdk换成安装的jdk
4、将hadoop源码导入项目中
5、导入hadoop jar包

hbase的优化:

Hbase--知识点总结3的更多相关文章

  1. hbase 知识点

    hbase 教程:http://www.yiibai.com/hbase/ mac下hbase安装:https://www.jianshu.com/p/510e1d599123 HBase是建立在Ha ...

  2. 大白话详解大数据HBase核心知识点,老刘真的很用心(2)

    前言:老刘目前为明年校招而努力,写文章主要是想用大白话把自己复习的大数据知识点详细解释出来,拒绝资料上的生搬硬套,做到有自己的理解! 01 HBase知识点 第6点:HRegionServer架构 为 ...

  3. 大白话详解大数据HBase核心知识点,老刘真的很用心(3)

    老刘目前为明年校招而努力,写文章主要是想用大白话把自己复习的大数据知识点详细解释出来,拒绝资料上的生搬硬套,做到有自己的理解! 01 HBase知识点(3) 第13点:HBase表的热点问题 什么是热 ...

  4. 用大白话讲大数据HBase,老刘真的很用心(1)

    老刘今天复习HBase知识发现很多资料都没有把概念说清楚,有很多专业名词一笔带过没有解释.比如这个框架高性能.高可用,那什么是高性能高可用?怎么实现的高性能高可用?没说! 如果面试官听了你说的,会有什 ...

  5. 大数据核心知识点:Hbase、Spark、Hive、MapReduce概念理解,特点及机制

    今天,上海尚学堂大数据培训班毕业的一位学生去参加易普软件公司面试,应聘的职位是大数据开发.面试官问了他10个问题,主要集中在Hbase.Spark.Hive和MapReduce上,基础概念.特点.应用 ...

  6. HBase核心知识点总结

    一.HBase介绍 1.基本概念 HBase是一种Hadoop数据库,经常被描述为一种稀疏的,分布式的,持久化的,多维有序映射,它基于行键.列键和时间戳建立索引,是一个可以随机访问的存储和检索数据的平 ...

  7. 一文让您全面了解清楚HBase数据库的所有知识点,值得收藏!

    一.HBase基本概念:列式数据库 在Hadoop生态体系结构中,HBase位于HDFS(Hadoop分布式文件系统)的上一层,不依赖于MapReduce,那么如果没有HBase这种Nosql数据库会 ...

  8. Hbase框架原理及相关的知识点理解、Hbase访问MapReduce、Hbase访问Java API、Hbase shell及Hbase性能优化总结

    转自:http://blog.csdn.net/zhongwen7710/article/details/39577431 本blog的内容包含: 第一部分:Hbase框架原理理解 第二部分:Hbas ...

  9. 【甘道夫】HBase基本数据操作的详细说明【完整版,精绝】

    介绍 之前具体写了一篇HBase过滤器的文章.今天把基础的表和数据相关操作补上. 本文档參考最新(截止2014年7月16日)的官方Ref Guide.Developer API编写. 全部代码均基于& ...

随机推荐

  1. Ubuntu16.04下安装elasticsearch+kibana实现php客户端的中文分词

    1.下载安装java, elasticsearch和kibana apt-get install default-jre default-jdk wget https://artifacts.elas ...

  2. sql server 2005中的分区函数用法(partition by 字段)

    分组取TOP数据是T-SQL中的常用查询, 如学生信息管理系统中取出每个学科前3名的学生.这种查询在SQL Server 2005之前,写起来很繁琐,需要用到临时表关联查询才能取到.SQL Serve ...

  3. js中正则表达式使用

    js中使用正则表达式,除了了解正则表达式基本的匹配规则外.还需要了解下面的基本的知识: python,js,groovy这些脚本语言都有在线调试的网站,可以在线测试是否有语法错误,用起来也很方便. v ...

  4. [UE4]抓取准备

    一.引擎的VR实例工程是使用手柄进行抓取的.我们需要加上可以使用鼠标进行抓取操作. 二.将左右手保存到全局变量. 三.左右手分别调用抓取和扔方法

  5. [UE4]Spline Mesh Actor

    作用: 1.按照Spline设置的轨迹,进行显示网格物体. 曲线模型 一.赋值Static Mesh,任意的Static Mesh都可以. 二.调整方向 三.Spline Mesh Actor有2个端 ...

  6. 集成学习(ensemble learning)

    集成学习,又称为“多分类器系统”(multi-classifier system).“基于委员会的学习”(committee-based learning)等.基本的想法是结合多个学习器,获得比单一学 ...

  7. Docker CMD in detail

    CMD CMD 指令就是用于指定默认的容器主进程的启动命令的,我们直接 docker run -it ubuntu 的话,会直接进入 bash.我们也可以在运行时指定运行别的命令,如 docker r ...

  8. Sublime Text 3安装Package Control

    Package Control官网:https://packagecontrol.io/installation#st3 ctrl + ` 或者 View > Show Console呼出控制台 ...

  9. Win 10更新版1709有哪些新功能值得关注!

    windows 10秋季创意者更新版1709发布已经有段时间了,也有很多用户选择升级这次更新的系统.那么,这次Win 10 更新版1709有哪些新功能值得关注呢?下面,一起随主机吧来看一看吧! 1. ...

  10. 关于如何在电脑上安装adb来操作手机(Android)的方法及步骤

    1.需要真实的安卓手机: 2.安卓手机需要开启USB调试模式,允许电脑进行调试(各个手机的开启方式可能不同,不知道的自行百度): 3.电脑需要安装ADB驱动,这里提供一个下载地址:https://ad ...