Hadoop生态圈-phoenix完全分布式部署 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. phoenix只是一个插件,我们可以用hive给hbase套上一个JDBC壳,但是你有没有体会到Hive执行SQL语句是很慢的,因此我们采用phoenix插件的方式给hbase套上JDBC的壳. 一.Phoenix简介 1>.其实Phoenix可以看成是在hbase的hive,它是使用SQL方式访问HBase数据: 2>.内置多种协处理器实现,轻松实现二级索引和聚合查询: 二.部…
Hadoop生态圈-zookeeper完全分布式部署 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 本篇博客部署是建立在Hadoop高可用基础之上的,关于Hadoop高可用部署请参考:https://www.cnblogs.com/yinzhengjie/p/9070017.html.本篇博客是将Hadoop的高可用配置和zookeeper完全分布式结合使用! 一.分布式协调框架 1>.分布式框架的好处 a>.可靠性: 一个或几个节点的崩溃不会导致整个集群的崩溃. b>…
Hadoop 2.6.0分布式部署參考手冊 关于本參考手冊的word文档.能够到例如以下地址下载:http://download.csdn.net/detail/u012875880/8291493 1.环境说明 1.1安装环境说明 本列中.操作系统为Centos 7.0.JDK版本号为Oracle HotSpot 1.7,Hadoop版本号为Apache Hadoop 2.6.0.操作用户为hadoop. 2.2 Hadoop集群环境说明: 集群各节点信息參考例如以下: 主机名 IP地址 角色…
Hadoop生态圈-CentOs7.5单机部署ClickHouse 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 到了新的公司,认识了新的同事,生产环境也得你去适应新的集群环境,我新入职的公司的大数据开发同时并不看好hbase,而是对clickhouse青睐有加,听他们口头把ClickHouse吹的那么的出神入化,听的我是有种迫不及待想要对它一探究竟. 最新的一手资料请参考官网:https://clickhouse.yandex/ 一.ClickHouse的独特功能 1>.真…
Hadoop生态圈-zookeeper本地搭建以及常用命令介绍 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.下载zookeeper软件 下载地址:https://www.apache.org/dyn/closer.cgi/zookeeper/ 二.安装zookeeper 1>.解压源文件 [yinzhengjie@s101 ~]$ .tar.gz -C /soft/ 2>.创建软连接 [yinzhengjie@s101 ~]$ / /soft/zk 3>.配置环…
Hadoop生态圈-phoenix的视图(view)管理 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任.…
Hadoop生态圈-phoenix(HBase)的索引配置 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 创建索引是为了优化查询,我们可以在phoenix上配置索引方式. 一.修改hbase配置文件,以便支持索引  1>.xrsync.sh 脚本内容 [yinzhengjie@s101 ~]$ more `which xrsync.sh` #!/bin/bash #@author :yinzhengjie #blog:http://www.cnblogs.com/yinzhe…
mvn 3.0.4 创建maven项目命令  mvn  archetype:generate   -DgroupId=damocles-autocredit -DartifactId=damocles-autocredit  -DarchetypeArtifactId=maven-archetype-quickstart     -DinteractiveMode=false  -X 1 下载源代码:mvn dependency:sources -DdownloadSources=true -D…
mvn 3.0.4 创建maven项目命令  mvn  archetype:generate   -DgroupId=damocles-autocredit -DartifactId=damocles-autocredit  -DarchetypeArtifactId=maven-archetype-quickstart     -DinteractiveMode=false  -X     1 下载源代码:mvn dependency:sources -DdownloadSources=tru…
docker的镜像文件作用就是:提供container运行的文件系统层级关系(基于AUFS实现),所依赖的库文件.已经配置文件等等. 安装docker yum install -y docker 启动docker systemctl start docker 获取docker使用帮助 docker --help 获取centos 镜像 1:查看 docker search centos   2:获取 docker pull centos 获取busybox镜像 1:查看 docker searc…
Linux操作系统安全-OpenSSL工具常用命令介绍 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.OpenSSL开源项目有三个组件 openssl: 多用途的命令行工具,包openssl libcrypto: 加密算法库,包openssl-libs libssl: 加密模块应用库,实现了ssl及tls,包nss [root@node101.yinzhengjie.org.cn ~]# yum search openssl Loaded plugins: fastest…
一.cdm命令介绍:CMD命令是一种命令提示符,CMD是command的缩写,即命令提示符(CMD),位于C:\Windows\System32的目录下,是在OS/2,Win为基础的操作系统(包括Windows 2000和XP中,Vista中,和Server 2003)下的"MS-DOS 方式" 二.启动cmd命令 1.用户启动: Win+r 输入cmd,Enter 2.使用管理员账户启动 Win+r 输入cmd,Ctrl+Shift+Enter 三.修改背景文字颜色: 打开cmd,右…
1.规划好哪些服务运行在那个服务器上 需要配置的配置文件 2. 修改配置文件,设置服务运行机器节点 首先在   hadoop-senior  的这台主机上 进行   解压 hadoop2.5   按照伪分布式的配置文件来进行配置 使用命令  :tar -zxvf hadoop-2.5.0.tar.gz -C /opt/app/    (解压 hadoop 2.5) 然后进入   cd  /opt/app/hadoop-2.5.0/etc 将里面一开始的配置文件重命令   mv  hadoop …
大数据的发展历史 3V:volume.velocity.variety(结构化和非结构化数据).value(价值密度低) 大数据带来的技术挑战 存储容量不断增加 获取有价值的信息的难度:搜索.广告.推荐 大容量.多类型.高时效的数据处理场景,使得从数据中获取有价值的信息变得非常困难 hadoop理论概述 hadoop发展简史 apache nutch项目,是一个开源网络搜索引擎 谷歌发表GFS,是HDFS的前身 谷歌发表了mapreduce分布式编程思想 nutch开源实现了mapreduce…
HDFS背景 随着数据量的增大,在一个操作系统中内存不了了,就需要分配到操作系统的的管理磁盘中,但是不方便管理者维护,迫切需要一种系统来管理多态机器上的文件,这就是分布式文件管理系统. HDFS的概念 HDFS英文hadoop distributed file system ,是一个分布式文件系统,用于存储文件,通过目录树记录定位文件,其次他是分布式的,由很多服务器联合起来实现其功能,集群中的服务器各有角色.HDFS的设计适合一次吸入,多次读取的场景,且不支持文件的修改.适合做数据分析. HDF…
在Linux环境中部署web项目中常用到一些命令,在此记录已做备用: 1. 查看当前工作目录: pwd [选项] 常用参数: pwd -P 显示出实际路径,而非使用连接(link)路径. 2. 列出目标目录中所有的子目录和文件 ls [选项] [目录名] 常用参数: -a, –all 列出目录下的所有文件,包括以 . 开头的隐含文件 -A 同-a,但不列出“.”(表示当前目录)和“..”(表示当前目录的父目录) -l 除了文件名之外,还将文件的权限.所有者.文件大小等信息详细列出来 -t 以文件…
一.Maven的基本概念 主要服务于基于Java平台的项目构建,依赖管理和项目信息管理. 1.1.项目构建 项目构建过程包括[清理项目]→[编译项目]→[测试项目]→[生成测试报告]→[打包项目]→[部署项目]这几个步骤,这六个步骤就是一个项目的完整构建过程. 1.2.依赖管理 依赖指的是jar包之间的相互依赖,比如我们搭建一个Struts2的开发框架时,光光有struts2-core-2.3.16.3.jar这个jar包是不行的,struts2-core-2.3.16.3.jar还依赖其它的j…
需要给一个apk加签名,用到了keytool这个工具,下面转载一篇介绍keytool的文章 http://blog.chinaunix.net/uid-17102734-id-2830223.html —————————————— Keytool 是一个Java 数据证书的管理工具 ,Keytool 将密钥(key)和证书(certificates)存在一个称为keystore的文件中. 在keystore里,包含两种数据: (1)密钥实体(Key entity)——密钥(secret key)…
aaarticlea/png;base64,iVBORw0KGgoAAAANSUhEUgAAAhgAAAFLCAYAAACUdvXUAAAgAElEQVR4nO3da1da58L2fT5KfPvc96v4HTKS79COfoKMkVx2tddaXaubrDRZbdp0E5uk1iYhJhqNiRqToDGKG1AEBQFl4x4BBUFAwf2L43nRNb2RsJnoxBMmh2P8RlOFyYmRnH/PuUFzeHgIIiIiIiVpRA+AiIiI1IeBQURERIpjYBAREZHiGBhER…
介绍常用命令,在忘记时便于即使查询 复制.移动.删除     cp.mv.rm.pwd 1. CP 介绍 用法:CP [-adfilprsu]  源文件  目标文件 参数:参数说明: -a:是指archive的意思,也说是指复制所有的目录 -d:若源文件为连接文件(link file),则复制连接文件属性而非文件本身 -f:强制(force),若有重复或其它疑问时,不会询问用户,而强制复制 -i:若目标文件(destination)已存在,在覆盖时会先询问是否真的操作 -l:建立硬连接(hard…
一.git 常用命令 git clone 地址 克隆项目 git status 查看当前状态 git add 文件或文件夹 (加入本地暂存目录) git commit -m "注释" 提交到本地版本库(暂存区) git commit -a -m "注释" 提交全部改动文件 git push origin master 从本地分支提交到远程分支 git pull origin master 从远程分支拉取代码到本地分支 git log 查看提交日志 二.撤回.回滚.清…
 Docker常用命令使用介绍 docker中常用的命令: 1.docker search image_name:搜查镜像 2.docker pull image_name:从镜像库中拉去镜像 3.docker run image_name:运行容器 --restart=always:容器退出后重新启动 --name:自定容器名字 --d:后台运行容器 --i:交互模式 --t:打开一个伪终端 --v:将容器中某个文件(目录)影射到主机上的某个文件(目录) --p:将容器中的某个端口号影射到主机…
1.输入 npm config ls -l 可以查看当前的设置 2.针对某一项设置,可以通过下面方式: npm config set 属性名 属性值 eg:npm config set prefix "C:\123\" 3.读取某一项配置,可以通过下面方式: npm config  get  属性名 eg:npm config get prefix 4.npm的常用命令: npm -v:查看npm安装的版本npm help xxx  查看帮助npm install xxx 安装模块np…
mysql命令介绍 mysql 是数据库管理命令 通过mysql --help来查看相关参数及使用说明 mysql --help                #mysql数据库管理命令 Usage: mysql [OPTIONS] [database]                 #语法格式 --help  #查看帮助文档 --auto-rehash #自动补全功能 -A, --no-auto-rehash            #不需自动补全 -B, --batch #不使用历史文件,禁…
大家好,今天来给大家分享一些Linux的常用命令,希望对大家有用 命令行的基本格式:   命令字 [选项] [参数]     其中,命令字.选项.参数之间用空格分开,多余的空格将被忽略.[ ]括起来的部分 表示可以省略,即命令行可以只有命令字,也可以只有命令字.选项,或者只有命令字.参 数.    Ctrl+U 组合键:快速删除当前光标处之前的所有字符内容.  Ctrl+K 组合键:快速删除从当前光标处到行尾的所有字符内容.  Ctrl+L 组合键:快速清空当前屏幕中的显示内容,只在左上角显示命…
Hadoop 下载 (2.9.2) https://hadoop.apache.org/releases.html 准备工作 关闭防火墙 (也可放行) # 停止防火墙 systemctl stop firewalld # 关闭防火墙开机自启动 systemctl disable firewalld 修改 hosts 文件,让 hadoop 对应本机 IP 地址 (非 127.0.0.1) vim /etc/hosts 127.0.0.1 localhost localhost.localdoma…
本文主要介绍 Hadoop 常用的命令. test命令 用于检测文件或目录是否存在,判断文件或目录大小. -test -[defsz] <path> : Answer various questions about <path>, with result via exit status. -d return if <path> is a directory. -e return if <path> exists. -f return if <path&…
1.ansible的安装方式 1.1使用yum源安装 yum install ansible -y 1.2使用rpm包安装 https://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm 2.主机认证 2.1主机分配 采用2台主机做测试环境 主控制端 192.168.152.129 被控制端 192.168.152.130 2.2单向主机认证 ssh-keygen -t rsa -f ~/.ssh/id_rsa -N…
前言:一般项目都会使用阿里云等服务器作为云服务器.此时必不可免会使用到一系列常用的命令.这里我整合一下常用的命令 1.一般链接阿里云服务器常用的的是xshell跟xftp. 下载路径:https://xshell.en.softonic.com/ 2.一开始常用的命令是cd: cd是用于切换文件路径的,其中../可以切换到上当前路径的上一个路径 3.开启tomcat服务器命令(首先需要切换到tomcat的bin目录下): 一般使用的是  ./startup.sh  或者 bash startup…
一.HDFS的客户端种类 1.网页形式  =>用于测试 网址为你的namenode节点的ip+50070的端口号,如: 192.168.50.128:50070 2.命令行形式 =>用于测试 3.企业级API 二.HDFS客户端的命令行操作 注释:/hdfs为HDFS上的目录 /root/linux为本地集群路径 1.查看帮助 hdfs dfs -help 2.查看目录下的信息 hdfs dfs -ls / hdfs dfs -ls -R / (查看根目录下所有文件和目录) 3.上传文件到HD…