概述 Hbase –Haddop Database 是一个高性能,高可靠性.面向列.可伸缩的分布式存储系统. Hbase利用HDFS作为文件存储系统,利用MapReduce来处理Hbase的海量数据,利用Zookeeper作为协调工具. 是NoSQL的一种. 数据模型 表(table),是用来存储管理数据的,是在schema声明的时候定义 行健(row key),类似于MySQL中的主键,与MySQL不同的是Hbase表天然自带的. 可以是字符串.整数.二进制串.串行化的结构. 按照字典顺序由低…
环境 虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4       jdk8       hadoop-3.1.1 伪分布式就一台机器:主节点和从节点都在一个机器上,这里我们使用:node1 192.168230.11 一.平台和软件平台:GNU/Linux软件:JDK+SSH+rsync+hadoop3.1.1修改主机/etc/hosts和/etc/sysconfig/network: [切记]192.168.230.1…
Spark学习之路 (三)Spark之RDD   https://www.cnblogs.com/qingyunzong/p/8899715.html 目录 一.RDD的概述 1.1 什么是RDD? 1.2 RDD的属性 1.3 WordCount粗图解RDD 二.RDD的创建方式 2.1 通过读取文件生成的 2.2 通过并行化的方式创建RDD 2.3 其他方式 三.RDD编程API 3.1 Transformation 3.2 Action 3.3 Spark WordCount代码编写 3.…
Spark学习笔记2 配置spark所需环境 1.首先先把本地的maven的压缩包解压到本地文件夹中,安装好本地的maven客户端程序,版本没有什么要求 不需要最新版的maven客户端. 解压完成之后在解压好的maven客户端的文件夹内打开conf文件夹,修改里面的settings.xml文件 然后只需要修改这一行就可以了 ,把这一行替换成你自己本地的maven仓库的路径 最好是自己有一个完整点的maven仓库,然后把这个修改过的xml文件放到maven仓库下 到这里,你本地的maven客户端环…
一.hadoop解决了什么问题 hdfs 解决了海量数据的分布式存储,高可靠,易扩展,高吞吐量mapreduce 解决了海量数据的分析处理,通用性强,易开发,健壮性 yarn 解决了资源管理调度 二.hadoop生态系统 分层次讲解----> 最底层平台 hdfs yarn mapreduce spark---- > 应用层 hbase hive pig sparkSQL nutch ----> 工具类 zookeeper flume 三.版本 Apache:  官方版本 Clouder…
一.伪分布式安装kylin 2018年4月15日 15:06 安装需要的环境 1. hadoop集群环境:由于安装的是CDH5.14.0的版本,所以相关组件都是跟5.14.0相关 2. spark采用的是2.2.1版本,是根据hadoop2.6.0进行编译的 3. kylin采用的是2.3.1,根据cdh5.7进行编译的 安装过程 启动hadoop集群以及hiveserver2和metastore服务(否则kylin无法访问hive的元数据) nohup hive --service hives…
HBase1.2.2伪分布式安装(HDFS)+ZooKeeper-3.4.8安装配置+HBase表和数据操作+HBase的架构体系+单例安装,记录了在Ubuntu下对HBase1.2.2的实践操作,HBase的安装到数据库表的操作.包含内容1.HBase单例安装2.HBase伪分布式安装(基于Hadoop的HDFS)过程,3.HBase的shell编程,对HBase表的创建,删除等的命令,HBase对数据的增删查等操作.4.简单概述了Hbase的架构体系.5.zookeeper的单例安装和常用操…
指导手册02:伪分布式安装Hadoop(ubuntuLinux)   Part 1:安装及配置虚拟机 1.安装Linux. 1.安装Ubuntu1604 64位系统 2.设置语言,能输入中文 3.创建hadoop账户 sudo useradd -m hadoop -s /bin/bash sudo passwd hadoop //输入2遍密码 sudo adduser hadoop sudo   #设置hadoop用户的管理员权限 5.更新apt 设置更新和服务中,更新站点选中国阿里云,执行“s…
Hadoop伪分布式安装之Linux环境准备 一.软件版本 VMare Workstation Pro 14 CentOS 7 32/64位 二.实现Linux服务器联网功能 网络适配器双击选择VMnet8 2.1 VMare NAT工作模式 只有CentOS和Windows中的VMnet8生成的虚拟网卡都在VMare虚拟网关字段中才能组成一个网络,实现联网功能. 2.2 VMare设置 1.打开VMare -> 编辑 -> 虚拟网络编辑器 2.VMnet8 -> NAT设置 ->…
一.准备工作 1. 远程连接工具的安装 PieTTY 是在PuTTY 基础上开发的,改进了Putty 的用户界面,提供了多语种支持.Putty 作为远程连接linux 的工具,支持SSH 和telnet.但是,我们使用的时候经常出现乱码.PieTTY 可以很好地解决这个问题.该软件不需要安装,直接打开使用即可,如图1.1 所示 图 1.1 在Host Name 中输入Centos的ip 地址,其余设置使用默认值,然后点击最下面的“Open”按钮,就会提示输入用户名和密码,我们需要输入Centos…