企业打开云HBase的正确方式,来自阿里云云数据库团队的解读
一、HBase的历史由来
HBase是一个开源的非关系型分布式数据库(NoSQL),基于谷歌的BigTable建模,是一个高可靠性、高性能、高伸缩的分布式存储系统,使用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。
HBase最初是以Hadoop子项目的形式进行开发建设,直到2010年5月才正式成为Apache的顶级项目独立发展。伴随着互联网时代数据的澎湃增长,HBase作为基础存储系统得到了快速发展与应用,大批知名商业公司(Facebook、Yahoo、阿里等)自主地加入到了HBase生态建设队伍,成为Apache最活跃的社区之一。
在大批知名公司的推动下,以及结合HBase自身的能力,HBase应用场景非常广泛,例如Cube分析、推荐画像、对象存储、消息/订单存储、时序数据、Feeds流、时空数据、NewSQL等多个领域。
二、HBase普及和应用难点
整个Hadoop技术体系也不知不觉的走过了10年的青葱岁月,但相比关系型数据库超过40年的发展,还显得稚嫩。相比成熟的关系型数据库,HBase的普及和应用,有以下难点:
- 生产部署至少4个节点,起步成本高。
- 原始只有API接口,偏底层,需要较强编程功底。
- 技术资料少。
- 社区活动少。
三、技术平民化,阿里云HBase团队在行动
为了普及和推广HBase生态,降低HBase使用难度,让更多的公司享受到HBase技术红利。
阿里云HBase团队在产品,生态,客户服务方面积极投入,希望通过微薄的力量造福整个中国HBase技术生态,让HBase技术平民化,让那些只有大公司才玩的起的技术真正走进SME,校园和广大开发者。
1、推出云HBase单节点版本,极低成本,降低使用门槛
阿里云云HBase服务正式推出单节点版本,欢迎访问https://promotion.aliyun.com/ntms/act/hbasesingle.html 了解更多。
HBase单节点版本是在集群版本的基础上推出的基础版本,相比集群版本的4个节点起步,单节点版本HBase服务全部部署在一个节点上,因此单节点版本价格非常低。同时单节点是具备小规模生产能力的,具备纵向伸缩能力,提供11个9的数据集可靠性和2个9的服务可用性,所以单节点版本非常适合开发、测试以及非核心业务小规模生产环境。
HBase单节点有以下特点:
- 体验一致 :和云数据库HBase集群版本各种操作,监控体验一致
- 低成本 :年度爆款,99元/3月,399元/年
- 高性能:深度内核优化,性能高于社区版本50%-200%
- 弹性灵活:多种规格选择,未来支持实例升级变配,选择灵活
2、提供SQL能力,造福广大DBA和开发者
过于底层的API,使得HBase使用起来难度巨大。相比原生API,SQL能力是广大DBA和开发者提升开发和使用效率的利器,云HBase服务默认包含Phoneix服务。
Phoenix是一个开源的HBASE SQL层。它不仅可以使用标准的JDBC API替代HBASE client API创建表,插入和查询HBASE,也支持二级索引、事务以及多种SQL层优化。
另外,我们在云栖社区中推出一系列专业文章,帮助HBase用户很好的理解和使用HBase和Phoenix:Phoenix系列文章。此系列文章将会从Phoenix的语法和功能特性、相关工具、实践经验以及应用案例多方面从浅入深的阐述。希望对Phoenix入门、在做架构设计和技术选型的同学能有一些帮助。
另外,功能更强大和完善的HBase SQL能力也持续研发中,HBase使用难度会进一步降低,适应场景更加广泛。
3、回馈社区,积极推动社区发展
阿里由于业务上的需要,内部深度使用HBase,内部集群规模整体超过12000台,单集群超过1000台。在长期的实践和使用中,也培养了大量的专家,积累了雄厚的技术实力,目前拥有 3 HBase PMC、6 Committer、数十位内核贡献者。我们在收获社区的技术支持的同时,也积极回馈社区,给社区贡献超过 200+ Patch,同时阿里云平台提供了多种方便易上手的数据产品工具。除了产品上,我们在社区的推广和建设中也积极投入人力和物力。
- 主办Apache HBasecon Asia 2018大会
HBaseCon大会是Apache HBase™官方举办的技术会议,发起于2012年,是HBase技术人员的盛会。阿里云主办2018届HBase亚洲大会,大会预计在下半年举行,我们会在第一时间公布在技术社区中。欢迎广大HBase技术爱好者关注。
- 打造HBase中文社区,完善HBase中文资料
HBase发源于美国,发源于社区,所以存在资料不完善,核心资料都是英文的问题,进一步加大了开发人员学习和掌握HBase的难度。
云HBase团队联合国内众多大公司的研发leader,HBase社区PMC,推出HBase中文社区,打造一个技术人员的技术交流家园,组织广大的社区爱好者积极分享HBase技术文章,共同促进HBase技术氛围的形成。也欢迎更多的同学加入HBase技术社区,一起营造HBase技术家园。
4、一颗公益之心,义务抢救客户数据
4.13日,某公司使用自建一个HBase集群挂了!整个集群有30+T 业务数据,是公司的数据中心,集群直接启动不了。他们也是经历了熬战一天一夜的情况下,依旧没有解决恢复,还曾有过重装集群重导数据念头。最后,通过钉钉HBase技术交流群找到阿里云的技术团队同学。技术同学立刻自发组成抢救小分队,尽力最大的努力,使用最低风险的方式,抢救最完整的集群。
事后,技术负责人王华激动的表示:非常感谢阿里大牛的帮助,协助我们解决了关键问题,避免了30TB业务数据遗失的重大损失。
感谢这群单纯的技术人,让HBase技术社区有温度!
四、写到最后
一项技术的发展和成熟,都要经历无数的技术人员,无数个日夜,不眠不休持续奋战。也需要集全社会的力量,更多的公司一起参与进来共同打造更好的产品和更好的生态。
阿里云HBase团队希望通过这些星星之火,点燃HBase以及整个Hadoop技术生态的草原。
普及HBase,阿里云HBase团队在行动!
本文作者:所在jason
企业打开云HBase的正确方式,来自阿里云云数据库团队的解读的更多相关文章
- 八年技术加持,性能提升10倍,阿里云HBase 2.0首发商用
摘要: 早在2010年开始,阿里巴巴集团开始研究并把HBase投入生产环境使用,从最初的淘宝历史交易记录,到蚂蚁安全风控数据存储,HBase在几代阿里专家的不懈努力下,已经表现得运行更稳定.性能更高效 ...
- 打开ElasticSearch、kibana、logstash的正确方式
作者:玩世不恭的Coder时间:2020-03-08说明:原创不易,本文为原创文章,未经允许不可转载,转载前请联系作者 打开ElasticSearch.kibana.logstash的正确方式 前言一 ...
- OpenStack 企业私有云的若干需求(10):OpenStack 的前景和钱景
本系列会介绍OpenStack 企业私有云的几个需求: 自动扩展(Auto-scaling)支持 多租户和租户隔离 (multi-tenancy and tenancy isolation) 混合云( ...
- OpenStack 企业私有云的若干需求(5):主流硬件支持、云快速交付 和 SLA 保证
本系列会介绍OpenStack 企业私有云的几个需求: 自动扩展(Auto-scaling)支持 多租户和租户隔离 (multi-tenancy and tenancy isolation) 混合云( ...
- OpenStack 企业私有云的若干需求(1):Nova 虚机支持 GPU
本系列会介绍OpenStack 企业私有云的几个需求: 自动扩展(Auto-scaling)支持 多租户和租户隔离 (multi-tenancy and tenancy isolation) 混合云( ...
- OpenStack企业私有云新需求(1):Nova 虚机支持 GPU
作者:Sammy Liu 刘世民 本系列会介绍OpenStack 企业私有云的几个需求: GPU 支持 自动扩展(Auto-scaling)支持 混合云(Hybrid cloud)支持 物理机(Bar ...
- 云Hbase数据库在亿方云实践之路
本文主要先介绍了亿方云,进而谈及了数据架构,着重分析了HBase实践等 2017云栖大会HBase专场,亿方云科技CTO 王成军带来HBase在亿方云客户端同步系统中的应用实践的演讲.本文主要先介绍了 ...
- 阿里云HBase推出普惠性高可用服务,独家支持用户的自建、混合云环境集群
HBase可以支持百TB数据规模.数百万QPS压力下的毫秒响应,适用于大数据背景下的风控和推荐等在线场景.阿里云HBase服务了多家金融.广告.媒体类业务中的风控和推荐,持续的在高可用.低延迟.低成本 ...
- 为什么企业全面云化需要IT战略支撑和驱动?
引子:为什么传统企业全面云化一直磨磨唧唧举步维艰? 笔者将企业上云大体上分为几个阶段: 第一个阶段是基础设施虚拟化.即将应用从物理机搬到(lift and shift migration)虚拟机上.基 ...
随机推荐
- gradle自动化打包apk
前堤是要在安卓项目中配置好gradle.build脚本 ## !/bin/sh ## 项目名 ##使配置文件生效,否则会报gradle:命令找不到 source /etc/profile TARGET ...
- vue分页练习
<!doctype html> <html> <head> <meta charset="UTF-8"> <title> ...
- Java thread(1)
这一部分主要讨论 java多线程的基本相关概念以及两种java线程的实现方式: 线程与进程: 这个操作系统书上介绍得很详细,这里就列出一些比较主要的: 线程: 线程本身有很少的资源,因为所拥有的资源较 ...
- Entity Framework 中遇到的一些小问题
一.在多表关联中,一个表中有另一个表的model累,在Include方法里提示lambda表达式不是委托类型,这时候需要using System.Data.Entity; 二.插入数据时,主键并非自增 ...
- TCGA癌症缩写、癌症中英文对照
Cohort 英文名称 中文名称 ACC Adrenocortical carcinoma 肾上腺皮质癌 BLCA Bladder Urothelial Carcinoma 膀胱尿路上皮癌 BRCA ...
- CentOS删除Applications中的菜单项
有时候会错误的安装一些软件,可能安装被不成功,但是在左上角的Applications菜单中还是会显示出来,让人很不爽. 现在介绍一个删除掉CentOS Applications中菜单项的方法: 1.安 ...
- RMQ(连续相同最大值)
http://poj.org/problem?id=3368 Frequent values Time Limit: 2000MS Memory Limit: 65536K Total Submi ...
- bfs(最短路径)
链接:https://ac.nowcoder.com/acm/contest/993/F来源:牛客网 Farmer John is leaving his house promptly at 6 AM ...
- rancher部署K8S
环境:centos7 docker 日期准确 关闭防火墙 安装docker 创建 vim /etc/docker/daemon.json { "registry-mirrors&quo ...
- C. DZY Loves Sequences
C. DZY Loves Sequences time limit per test 1 second memory limit per test 256 megabytes input standa ...