HDInsight HBase概观

什么是HBase的?

HBase它是基于HadoopApache开源NoSQL数据库。它提供了很多非结构化和半结构化数据一致性的随机存取能力的。它是仿照谷歌的BigTable。以家庭为中心的列式数据库。

数据被存储在一个行内的表和数据的行由列族分组。 HBase的是在这个意义上,不管是列也不存储在当中的数据的类型,须要使用它们之前。定义一个无模式数据库。开放源码是首次公布由Mike Cafarella于2007年,线性扩展处理PB级数据的数千个节点。它能够依赖于数据的冗余。批量处理和通过在的Hadoop生态系统的分布式应用程序中提供的其它功能。

什么是AzureHDInsight HBase的?

HDInsight的HBase提供一个管理的集群集成到Azure环境。该簇被配置为直接在Azure斑点存储,这提供了在性能/成本选择低等待时间和添加的弹性存储数据。这使客户能够构建大型数据集工作的交互式站点,构建存储传感器和遥測数据,从数以百万计的端点的服务,以及分析这些数据与Hadoop作业。 HBase的和的Hadoop都是非常好的出发点,在Azure大数据项目,特别是。能够实现实时应用与大型数据集工作。

在HDInsight实现利用HBase的的横向扩展架构,可提供自己主动分片表,强一致性读取和写入,和自己主动故障转移。性能提高了内存快速缓存的读取和高通量流式写入。

虚拟网络的配置也可用于HDInsight HBase的。有关具体信息。请參阅提供HDInsight群集在Azure上的虚拟网络

怎样在HDInsight HBase的数据管理?

数据能够在HBase的使用创造GET,PUT和扫描从HBase的shell命令进行管理。数据通过表决。并阅读使用get命令写入到数据库中。

扫描命令用于获得在一个表中,从多行数据。数据也能够使用HBase的C#的API。它提供了一个客户机库的HBase的REST API的顶端管理。一个HBase的数据库也能够使用Hive查询。的介绍,这些编程模型,请參阅获取使用HBase的用Hadoop在HDInsight開始。协处理器也能够同意在数据库所在的节点数据的处理。

场景:什么是用例HBase的?

BigTable。推而广之,HBase的创建为其典型用例是网页搜索。

搜索引擎建立一个映射条款,包含它们的网页索引。但也有非常多其它的用例HBase的适用哪几个的。都逐项本节。

用例1:key-value存储

HBase的可作为一个键值存储,适用于管理信息系统。 Facebook的HBase的使用他们的邮件系统,它是理想的存储和管理网络通信。

WebTable使用HBase的搜索和管理从网页中提取表。

用例#2:传感器数据

Hase的是用于捕获是从各种来源的增量收集的数据是实用的。这包含社交分析,时间序列,保持交互式仪表盘了解最新的趋势和专柜,以及管理审计日志系统。样例包含彭博交易终端和开放时间序列数据库(OpenTSDB),它存储并提供訪问收集了server系统的健康指标。

用例3:实时查询

Phoenix是Apache HBase的一个SQL查询引擎。它是作为一个JDBC驱动程序和能使查询和使用SQL管理HBase的表。

用例4:HBase的一个平台

应用程序能够在HBase的顶部使用它作为数据存储上执行。样例包含凤凰城,OpenTSDB,KIJI,和Titan。

应用程序还能够整合HBase的。样例包含Hive,Pig,Solr的,风暴,水槽,黑斑羚。星火,神经节和钻孔。

接下来的步骤

得到HDInsight開始使用HBase的用Hadoop

提供HDInsight群集在Azure上的虚拟网络

与HBase的在HDInsight分析微博人气

使用Maven来构建使用HBase的使用HDInsight Java应用程序(的Hadoop)

C#HBase的SDK

另请參阅

Apache的HBase

Bigtable:分布式存储系统的结构化数据

本文翻译自Microsoft Azure官网:http://azure.microsoft.com/en-us/documentation/articles/hdinsight-hbase-overview/

HDInsight HBase概观的更多相关文章

  1. Azure HDInsight HBase DR解决方案

    Sun wei  Sat, Feb 28 2015 3:07 AM Apache HBase是目前非常流行的NoSQL数据库,通过HDFS+Zookeep+Master+Region Server的架 ...

  2. 在Azure HDInsight HBase集群中使用Thrift接口

    Sun wei  Wed, Feb 25 2015 2:17 AM Apache Thrift 是一种可扩展的跨语言服务接口,可以通过内置的代码生成引擎帮助创建跨语言服务类库,Apache HBase ...

  3. 基于HDInsight 3.4 HBase集群规划参考

    基于linux 创建HDInsight HBase集群,选择最小配置,zk(3).NN(2).WN(2),集群节点默认组件服务规划如下 NN0: Active NameNode /HDFS ZKFai ...

  4. HDInsight - 1,简介

    最近工作需要,要看HDInsight部分,这里要做笔记.自然是官网资料最权威,所以内容都从这里搬过来:https://azure.microsoft.com/en-us/documentation/a ...

  5. 微软Azure云平台Hbase 的使用

    In this article What is HBase? Prerequisites Provision HBase clusters using Azure Management portal ...

  6. HBase(三): Azure HDInsigt HBase表数据导入本地HBase

    目录: hdfs 命令操作本地 hbase Azure HDInsight HBase表数据导入本地 hbase hdfs命令操作本地hbase: 参见  HDP2.4安装(五):集群及组件安装 , ...

  7. Azure平台 对Twitter 推文关键字进行实时大数据分析

    Learn how to do real-time sentiment analysis of big data using HBase in an HDInsight (Hadoop) cluste ...

  8. 我个人有关 Azure 网络 SLA、带宽、延迟、性能、SLB、DNS、DMZ、VNET、IPv6 等的 Azure 常见问题解答

    Igor Pagliai(微软)   2014 年 9月 28日上午 5:57  年 11 月 3 年欧洲 TechEd 大会新宣布的内容). 重要提示:这篇文章中我提供的信息具有时间敏感性,因为这些 ...

  9. Azure HDInsight 和 Spark 大数据实战(一)

    What is HDInsight? Microsoft Azure HDInsight 是基于 Hortonoworks Data Platform (HDP) 的 Hadoop 集群,包括Stor ...

随机推荐

  1. Codeforces Round #256 (Div. 2) C. Painting Fence 或搜索DP

    C. Painting Fence time limit per test 1 second memory limit per test 512 megabytes input standard in ...

  2. HTTP相关概念

    最近观看HTTP权威指南.这本书是一个小更,欲了解更多详细信息,我们不能照顾.但一些基本概念仍然应该清楚.在这里,我整理: HTTP--因特网的多媒体信使 HTTP 使用的是可靠的传输数据协议,因此即 ...

  3. 【hadoop之翊】——基于CentOS的hadoop2.4.0伪分布安装配置

    今天总算是把hadoop2.4的整个开发环境弄好了,包括 windows7上eclipse连接hadoop,eclipse的配置和測试弄得烦躁的一逗比了~ 先上一张成功的图片,hadoop的伪分布式安 ...

  4. Matlab Error (Matrix dimensions must agree)

    xOld =input('Enter initial guess: '); errortmp =2; counter =0; while (errortmp>10^-10) xNew =xOld ...

  5. 【SICP读书笔记(一)】正则序展开的特殊情况

    scheme解释器有两种实现方式,一种是应用序,先对每个参数求值,再以首过程对所有求得的参数求值. 第二种是正则序,会“完全展开然后归约”(书中原文) SICP中的练习1.5,让我困惑了一下.原题如下 ...

  6. WPF技术触屏上的应用系列(三): 视频播放器的使用及视频播放、播放、暂停、可拖动播放进度效果实现

    原文:WPF技术触屏上的应用系列(三): 视频播放器的使用及视频播放.播放.暂停.可拖动播放进度效果实现 去年某客户单位要做个大屏触屏应用,要对档案资源进行展示之用.客户端是Window7操作系统,5 ...

  7. linux 下安装jdk及配置jdk环境图解

    linux 下安装jdk及配置jdk环境图解 一:先检測是否已安装了JDK 运行命令: # rpm -qa|grep jdk  或   # rpm -q jdk  或  #find / -name j ...

  8. Java没有源代码的同步集合~

    存档~~~~ Synchronized,volatile,lock 锁定->[就绪队列,阻塞队列] 第一个是jvm等级达到. 与volatile所不同的是,后者不能从工作存储器写回到主存储器. ...

  9. 怎样设制 select 不可编辑 仅仅读

    1. <select style="width:195px" name="role"  id="role" onfocus=" ...

  10. Channel Allocation (poj 1129 dfs)

    Language: Default Channel Allocation Time Limit: 1000MS   Memory Limit: 10000K Total Submissions: 12 ...