大数据的发展历史 3V:volume.velocity.variety(结构化和非结构化数据).value(价值密度低) 大数据带来的技术挑战 存储容量不断增加 获取有价值的信息的难度:搜索.广告.推荐 大容量.多类型.高时效的数据处理场景,使得从数据中获取有价值的信息变得非常困难 hadoop理论概述 hadoop发展简史 apache nutch项目,是一个开源网络搜索引擎 谷歌发表GFS,是HDFS的前身 谷歌发表了mapreduce分布式编程思想 nutch开源实现了mapreduce…
转自 http://blog.csdn.net/zhaogezhuoyuezhao/article/details/7328313 centos系统自带ssh,版本为openssh4.3 免密码ssh设置(合适的权限很重要) 登入hadoop账户,建立ssh文件夹    mkdir .ssh 现在确认能否不输入口令就用ssh登录本机:$ ssh namenode 如果不输入口令就无法用ssh登陆namenode,执行下面的命令:$ ssh-keygen -t rsa –f ~/.ssh/id_r…
Hadoop有三种分布模式:单机模式.伪分布.全分布模式,相比于其他两种,伪分布是最适合初学者开发学习使用的,可以了解Hadoop的运行原理,是最好的选择.接下来,就开始部署环境. 首先要安装好Linux环境,可以是真机,也可以是虚拟机,我的环境是VMWare下安装的CentOS 6.3的虚拟机,如果你还没有安装好Linux环境,可以参考我的另一篇文章:window7环境下VMWare自定义安装Linux虚拟机完全教程,希望可以帮到你. 等你安装好了Linux环境,我们就可以真正开始部署hado…
.实验环境说明 注意:本实验需要按照上一节单机模式部署后继续进行操作 1. 环境登录 无需密码自动登录,系统用户名 shiyanlou,密码 shiyanlou 2. 环境介绍 本实验环境采用带桌面的 Ubuntu Linux 环境,实验中会用到桌面上的程序: XfceTerminal:Linux 命令行终端,打开后会进入 Bash 环境,可以使用 Linux 命令 Firefox:浏览器,可以用在需要前端界面的课程里,只需要打开环境里写的 HTML/JS 页面即可 GVim:非常好用的编辑器,…
本作品由Man_华创作,采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可.基于http://www.cnblogs.com/manhua/上的作品创作. 请先按照上一篇文章Hadoop单机模式配置安装好java和hadoop后再进行伪分布模式的配置. Hadoop伪分布模式:一台机器,每个Hadoop守护进程都是一个独立的JVM进程 安装ssh服务 sudo apt-get install openssh-server (如果没有安装ssh服务,将会出现如下情况: ma…
Hadoop伪分布模式的安装 [环境参数] (1)Host OS:Win7 64bit (2)IDE:Eclipse Version: Luna Service Release 2 (4.4.2) (3)虚拟机:VMware 10 (4)Client OS:CentOS 6.4 32bit. 注意: 若是CentOS 64bit,则在启动hadoop时,会报出警告. 原因:Hadoop的本地库($HADOOP_HOME/lib/native/libhadoop.so.1.0.0)是在32 bit…
http://blog.csdn.net/wangloveall/article/details/20195813 摘要:本文介绍Hadoop伪分布模式操作,适合于Hadoop学习.开发和调试. 关键词:Hadoop    伪分布式   文件配置 启动Hadoop支持三种模式操作,分别是单机模式操作.伪分布模式操作和全分布模式操作. 单机模式操作是Hadoop的默认操作模式,当首次解压Hadoop的源码包时,Hadoop无法了解硬件安装环境,会保守地选择最小配置,即单机模式.该模式主要用于开发调…
软件环境 操作系统 :  OracleLinux-R6-U6 主机名: hadoop java: jdk1.7.0_75 hadoop: hadoop-2.4.1 环境搭建 1.软件安装 由于所需的软件均为绿色包,所以将java和hadoop分别解压到操作系统根目录即可. [root@hadoop training]# ls -l / 总用量 110 dr-xr-xr-x. 2 root root 4096 5月 17 19:13 bin dr-xr-xr-x. 5 root root 1024…
( 温馨提示:图片中有id有姓名,不要盗用哦,可参考流程,有问题评论区留言哦 ) 一.任务目标 1.了解Hadoop的3种运行模式 2.熟练掌握Hadoop伪分布模式安装流程 3.培养独立完成Hadoop伪分布安装的能力 二.系统环境 Linux Ubuntu 16.04 三.任务内容 在只安装Linux系统的服务器上,安装Hadoop2.6.0伪分布模式. 四.任务步骤 1.此步为可选项,建议用户创建一个新用户及用户组,后续的操作基本都是在此用户下来操作.但是用户亦可在自己当前非 root 用…
Java的cmd配置(也即Java的JDK配置及相关常用命令) ——找不到或无法加载主类  的解决方法 这段时间一直纠结于cmd下Java无法编译运行的问题.主要问题描述如下: javac 命令可以正常运行,而java命令有时可以正常运行,有时却不可以,不可以的症状就是显示“找不到或无法加载主类”. 在网上找了各种资料,最终发现是因为代码里含有package语句,所以无法在cmd下运行java命令解释.class文件.而那些可以运行的文件就是因为没有使用package语句. 我这种问题的解决方法…
一.ubuntu 15.04.openjdk1.7.tomcat7环境配置 1. 配置openjdk1.7,输入命令: -jdk 2. 查看java是否安装成功,输入命令: envjava -version 3. 查看jdk真实安装路径,如果是解压安装则用whereis java update-alternatives --config java 4. 配置java环境变量,在/etc/profile文件下加入以下代码 export JAVA_HOME=/usr/lib/jvm/java--op…
阅读目录 ~/.ssh/authorized_keys 把公钥加到用于认证的公钥文件中,authorized_keys是用于认证的公钥文件 方式2: (未测试,应该可用) 基于空口令创建新的SSH密钥,以实现无密码登录 su - hadoop ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys chmod 600 ~/.ssh/authorized_keys 4. 测试…
为了学习这部分的功能,我们这里的linux都是使用root用户登录的.所以每个命令的前面都有一个#符号. 伪分布模式安装步骤: 关闭防火墙 修改ip地址 修改hostname 设置ssh自动登录 安装JDK 安装hadoop 1. 关闭防火墙 具体的操作过程参见博文:我用过的Linux命令--关闭防火墙 2. 修改ip地址,设置静态ip地址 这里使用Host-only的方式,注意虚拟机的网关地址要写windows对应的软网卡的IP地址.CentOS重新启动网络的命令: #service netw…
1 Hadoop环境搭建 hadoop 的6个核心配置文件的作用: core-site.xml:核心配置文件,主要定义了我们文件访问的格式hdfs://. hadoop-env.sh:主要配置我们的java路径. hdfs-site.xml:主要定义配置我们的hdfs的相关配置. mapred-site.xml:主要定义我们的mapreduce相关的一些配置. slaves:控制我们的从节点在哪里,datanode nodemanager在哪些机器上. yarn-site.xml:配置我们的re…
一:安装JDK hadoop 是以java语言写的,因此需要在本地计算机上预先安装JDK,安装JDK的方法这里不再详述. 二:创建hadoop用户 为hadoop创建一个专门的用户,将所有的hadoop的工作放到这个用户下. $sudo adduser hadoop 回车后会提示输入新建用户hadoop的密码,输入密码后会有一些选项确认:             Changing the user information for username            Enter the new…
安装环境: 系统:Ubuntu 14.10   64bit hadoop:2.5.1 jdk:1.8.0_11 安装步骤: 一.安装JDK 安装 jdk,并且配置环境以及设置成默认 sudo gedit /etc/profile 添加 export JAVA_HOME=/opt/javaexport JRE_HOME=/opt/java/jreexport CLASSPATH=.:$CLASSPATH:$JAVA_HOME/lib:$JRE_HOME/libexport PATH=$PATH:$…
Hadoop生态圈-phoenix完全分布式部署 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. phoenix只是一个插件,我们可以用hive给hbase套上一个JDBC壳,但是你有没有体会到Hive执行SQL语句是很慢的,因此我们采用phoenix插件的方式给hbase套上JDBC的壳. 一.Phoenix简介 1>.其实Phoenix可以看成是在hbase的hive,它是使用SQL方式访问HBase数据: 2>.内置多种协处理器实现,轻松实现二级索引和聚合查询: 二.部…
(内核make menuconfig之后,通过insmod安装的驱动都应该重新make,可能会出现一些莫名的问题) (nor flash/SDRAM/DM9000都受内存控制器控制,需要配置内存控制器对应的位宽,表示一次能取得多少字节数据:norflash在接开发板时,地址线错开一位的原因就是因为当读0地址时,nor返回一个2字节数据,当读0x02地址时,因为2440的地址1号线接nor的地址0号线,相当于0x02右移一位,nor返回一个2字节数据:对2440来说一个地址表示一个字节,nor一个…
Git:常用命令.... git clone <repo> git config –list git diff –staged add后,commit前的撤销:git rm –cached commit后的回滚:git reset –hard commit-id,比如:git reset –hard HEAD Git是一个分布式版本控制/软件配置管理软件,原来是linux内核开发者林纳斯·托瓦兹(Linus Torvalds)为了更好地管理linux内核开发而创立的. Git配置 git co…
Mysql免安装版配置教程 图文版 配置环境变量 新建一个my.ini文件,添加下面内容 [mysqld] basedir=C:\\software\Mysql\mysql-5.7.14-winx64 datadir=C:\\software\Mysql\mysql-5.7.14-winx64\data port=3306 以管理员身份运行cmd,切换到bin目录下 执行下面语句,初始化 mysqld --initialize --user=mysql --console 安装mysql服务,执…
一般来说,github上大多的java项目都是使用maven,ant等进行构建的.由于之前没有使用过maven,因此这几天对maven进行了简单的学习.古话说:“温故而知新”,一些命令长时间不使用都会遗忘,所以想通过这篇博客记录一下自己对maven学习的成果,等到使用时再温习.下面将首先对maven进行介绍,然后介绍maven的安装配置以及与eclipse的集成,最后介绍maven常用命令,maven一般的项目结构,以及maven的pom文件. 一. maven简介 maven是一个强大的项目构…
一.Git教程网站 廖雪峰网站 易百GitHub命令:https://www.yiibai.com/git/git_clone.html 完成Windows环境命令下Git config配置 设置好之后,路径C:\Users\用户名下面有一个.gitconfig生成的配置文件,里面存着你的相关信息. 如果想要检查你的配置,可以使用 git config --list 命令来列出所有 Git 当时能找到的配置 二.Git 中 SSH key 生成步骤 由于本地Git仓库和GitHub仓库之间的传输…
redis配置密码 1.通过配置文件进行配置yum方式安装的redis配置文件通常在/etc/redis.conf中,打开配置文件找到 [plain] view plain copy   #requirepass foobared 去掉行前的注释,并修改密码为所需的密码,保存文件 [plain] view plain copy   requirepass myRedis 重启redis [plain] view plain copy   sudo service redis restart #或…
Download hadoop-2.7.7.tar.gz 下载稳定版本的hadoop-2.7.7.tar.gz(我用的2.6.0,但是官网只能下载2.7.7的了) Required Software Linux所需的软件包括: 必须安装Java.HadoopJavaVersions描述了推荐的Java版本. 必须安装ssh并且必须运行sshd才能使用管理远程Hadoop守护进程的Hadoop脚本. 安装jdk.ssh免密登录请看: linux安装java 1.8 ssh免密登录 Prepare…
一 安装JDK 下载JDK      jdk-8u112-linux-i586.tar.gz 解压JDK     hadoop@ubuntu:/soft$ tar -zxvf jdk-8u112-linux-i586.tar.gz 配置环境变量    使配置生效  hadoop@ubuntu:/soft/jdk1.8.0_112$ source /etc/profile 检验配置:hadoop@ubuntu:/soft/jdk1.8.0_112$ java Usage: java [-optio…
1. 分析 (1)配置集群 (2)启动.测试集群增.删.查 (3)执行WordCount案例 2. 执行步骤 (1)配置集群 (a)配置:hadoop-env.sh Linux系统中获取JDK的安装路径: [atguigu@ hadoop101 ~]# echo $JAVA_HOME /opt/module/jdk1.8.0_144 修改JAVA_HOME 路径: 在Hadoop的目录下,vim Hadoop-env.sh export JAVA_HOME=/opt/module/jdk1.8.…
https://blog.csdn.net/google_huchun/article/details/53314046 用Android Studio一年多了,都没有使用其调试adb,今天就分享adb配置的方法,分享给大家. 直接打开电脑-属性-高级配置-环境变量. 这里我用图示范给大家:   这样常用adb就配置成功. 紧接着还有平时常用的adb命令,我简单的写几个给大家: 显示当前运行的全部模拟器: adb devices 1 2 安装应用程序: adb install -r 应用程序.a…
1.安装配置例子 有空再写 2.注意事项 (1)启动mysql 在/etc/mysql 目录下 service mysql start  新版本是(service mysqld start  ) (2)暂停 mysql service mysql stop 新版本是(service mysqld stop ) (3)重启 mysql service mysql restart新版本是(service mysqld restart) (4)客户端连不上linux的mysql数据库 解决:修改一个文…
如果你想精通Git,直接到 Git官网 把这本ProGit掌握已足以Pro Git 配置用户信息 user和email,--global参数全局配置,当然你也可以不加此参数,不同的项目用不同的用户名和email git config --global user.name Super git config --global user.email 1342449****@163.com 配置全局别名 此配置在开发中相当重要,尤其是对于使用Terminal,习惯使用命令行的朋友,由于git不支持tab…