Hbase(补充)

1、用sqoop 从mysql数据库导入数据到hbase时:

可以用 sqoop list-databases --connect jdbc:mysql://192.168.1.152:3306/ --username sqoop --password sqoop 测试是否可以连接到mysql数据库

2、hbase 命令时，无法删除打错的命令，解决办法：option——session options——Terminal——Enulation——选择Linux。可以按住Ctrl +回车键删除

3、CRT 修改字体大小：option——session options——Terminal——Appearance——Front （修改背景颜色是current color scheme）

4、sqoop导入数据从mysql到hbase时，mysql中的数据类型可以使基本数据类型，不能是二进制类型的，导入hbase后，都以字节数组存储

5、创建一个列簇压缩格式为snappy的表： create 'CarData', { NAME => 'car', COMPRESSION => 'SNAPPY' }

6、如果修改表压缩格式为snappy：

disable 'test'

alter 'test', NAME => 'f', COMPRESSION => 'snappy'

NAME即column family，列族。HBase修改压缩格式，需要一个列族一个列族的修改。而且这个地方要小心，别将列族名字写错，或者大小写错误。因为这个地方任何错误，都会创建一个新的列族，且压缩格式为snappy。当然，假如你还是不小心创建了一个新列族的话，可以通过以下方式删除：

alter 'test', {NAME=>'f', METHOD=>'delete'}

enable 'test'

major_compact 'test'

describe 该表，验证是否生效

7、hbase 过滤时：

scan.setTimeRange() 方法是左闭右开，根据数据的入库时间过滤

8、spark 从hbase 根据列值过滤器过滤出数据形成RDD：

   val conf = new SparkConf().setAppName("daycount")

//      .setMaster("local")

    val sc = new SparkContext(conf)

    val hbaseConf = HBaseConfiguration.create()

    val tablename = " "

    val sca=new Scan()

    val filter1=new SingleColumnValueFilter(Bytes.toBytes("gps"),

      Bytes.toBytes("GPSTime"),

      CompareOp.LESS,

      new BinaryComparator(Bytes.toBytes(getTodayZero_time)))

    filter1.setFilterIfMissing(true)

    val filter2=new SingleColumnValueFilter(Bytes.toBytes("gps"),

      Bytes.toBytes("GPSTime"),

      CompareOp.GREATER_OR_EQUAL,

      new BinaryComparator(Bytes.toBytes(getYesTZero_time)))

    filter2.setFilterIfMissing(true)

    val filterArr=new util.ArrayList[Filter]()

    filterArr.add(filter1)

    filterArr.add(filter2)

    val filterlist=new FilterList(FilterList.Operator.MUST_PASS_ALL,filterArr)

    sca.setFilter(filterlist)

 hbaseConf.set("hbase.zookeeper.quorum", "        ")

    hbaseConf.set("hbase.zookeeper.property.clientPort", "2181")

//    hbaseConf.set("hbase.zookeep.znode.parent", "/hbase")

//    hbaseConf.set("hbase.master", "   ")

    hbaseConf.set(TableInputFormat.INPUT_TABLE, tablename)

    hbaseConf.set(TableInputFormat.SCAN,convertScanToString(sca))

    val hBaseRDD = sc.newAPIHadoopRDD(hbaseConf, classOf[TableInputFormat],

      classOf[org.apache.hadoop.hbase.io.ImmutableBytesWritable],

      classOf[org.apache.hadoop.hbase.client.Result])

Hbase(补充)的更多相关文章

HBase+Phoenix整合入门--集群搭建
环境:CentOS 6.6 64位 hbase 1.1.15 phoenix-4.7.0-HBase-1.1 一.前置环境: 已经安装配置好Hadoop 2.6和jdk 1.7 二.安装hba ...
HBASE概念补充
HBASE概念补充 HBase的工作方式: hbase中的表在行的方向上分隔为多个HRegion,分散在不同的RegionServer中这样做的目的是在查询时可以将工作量分布到多个RegionSer ...
Hbase 学习（二）补充自定义filter
本来这个内容是不单独讲的,但是因为上一个页面太大,导致Live Writer死机了,不能继续编辑了,所以就放弃了这里要讲的是自定义filter,从FilterBase继承 public class ...
HBase 实战(2)--时间序列检索和面检索的应用场景实战
前言: 作为Hadoop生态系统中重要的一员, HBase作为分布式列式存储, 在线实时处理的特性, 备受瞩目, 将来能在很多应用场景, 取代传统关系型数据库的江湖地位. 本篇主要讲述面向时间序列/面 ...
HBase配置性能调优(转)
因官方Book Performance Tuning部分章节没有按配置项进行索引,不能达到快速查阅的效果.所以我以配置项驱动,重新整理了原文,并补充一些自己的理解,如有错误,欢迎指正. 配置优化 zo ...
HBase读延迟的12种优化套路
任何系统都会有各种各样的问题,有些是系统本身设计问题,有些却是使用姿势问题.HBase也一样,在真实生产线上大家或多或少都会遇到很多问题,有些是HBase还需要完善的,有些是我们确实对它了解太少.总结 ...
HBase 高性能获取数据(多线程批量式解决办法) + MySQL和HBase性能测试比较
摘要: 在前篇博客里已经讲述了通过一个自定义 HBase Filter来获取数据的办法,在末尾指出此办法的性能是不能满足应用要求的,很显然对于如此成熟的HBase来说,高性能获取数据应该不是问题. ...
HBase性能调优
因官方Book Performance Tuning部分章节没有按配置项进行索引,不能达到快速查阅的效果.所以我以配置项驱动,重新整理了原文,并补充一些自己的理解,如有错误,欢迎指正. 配置优化 zo ...
hadoop、hbase、hive、zookeeper版本对应关系
本文引用自:http://www.aboutyun.com/blog-61-62.html 最新版本: hadoop和hbase版本对应关系: Hbase Hadoop 0.92.0 1.0.0 ...

随机推荐

Qt-QMl-自定义自己想要的TabView
上效果图上实现源码,这里的代码都是来自Qt官方源码修改其中某一行内容 /* 作者:张建伟时间:2018年4月8日简述:自定义TabView,主要实现Tab和实现内容重叠,不在占用独立空间该文件 ...
selenium自动化之元素高亮显示
目的: 在UI自动化的时候,有时候我们需要查看运行的过程.为了更好的显示这个过程,可以进行元素高亮,以显眼的颜色来提示测试人员目前的操作在哪一步. 解决办法: 使用js代码来将元素的背景颜色和边框颜色 ...
创建oracle数据表示例sql
CREATE TABLE "BRAND_RELATION" ( "ID" NUMBER(10,0) NOT NULL ENABLE, ...
hadoop之mapper类妙用
1. Mapper类首先 Mapper类有四个方法: (1) protected void setup(Context context) (2) Protected void map(KEYIN k ...
Altera FPGA AS,PS,Jtag配置模式区别
Altera FPGA AS,PS,Jtag配置模式区别 FPGA器件有三类配置下载方式:主动配置方式(AS)和被动配置方式(PS)和最常用的(JTAG)配置方式. AS模式(active seri ...
斯坦福大学机器学习（Andrew Ng@2014）--自学笔记
今天学习Andrew NG老师<机器学习>之6 - 6 - Advanced Optimization,做笔记如下: 用fminunc函数求代价函数最小值,分两步: 1.自定义代价函数 f ...
算法笔记（c++）--使用一个辅助栈排列另一个栈
算法笔记(c++)--使用一个辅助栈排列另一个栈仅仅使用一个辅助栈,不使用其他数据结构来排列一个栈,要求,上大下小. 分析下.肯定是先吧主栈中的数据都放到辅助栈中,在辅助栈中上小下大. 1.首先循环 ...
ERROR [IM002] [Microsoft][ODBC 驱动程序管理器] 未发现数据源名称并且未指定默认驱动程序
在用c#生成应用程序的时候,读写dbf时,open方法出错 ERROR [IM002] [Microsoft][ODBC 驱动程序管理器] 未发现数据源名称并且未指定默认驱动程序以前这个程序是用着好 ...
常用的比较器：实现方式Compareable和Comparator
class Dog{ int size; int weight; public Dog(int s, int w){ size = s; weight = w; } } 目的:对于Dog对象作为元素所 ...
lintcode-433-岛屿的个数
433-岛屿的个数给一个01矩阵,求不同的岛屿的个数. 0代表海,1代表岛,如果两个1相邻,那么这两个1属于同一个岛.我们只考虑上下左右为相邻. 样例在矩阵: [ [1, 1, 0, 0, 0], ...

Hbase(补充)

Hbase(补充)的更多相关文章

随机推荐

热门专题