吴裕雄--天生自然 HADOOP大数据分布式处理：添加主机和服务器的域名映射

吴裕雄--天生自然 HADOOP大数据分布式处理：安装配置MYSQL数据库

安装之前先安装基本环境:yum install -y perl perl-Module-Build net-tools autoconf libaio numactl-libs # 下载mysql源安装包 wget http://dev.mysql.com/get/mysql57-community-release-el7-8.noarch.rpm /installpackage # 安装mysql源 yum localinstall mysql57-community-release-el7-…

吴裕雄--天生自然 HADOOP大数据分布式处理：安装WinSCP

下载安装包…

吴裕雄--天生自然 HADOOP大数据分布式处理：安装XShell

下载安装包…

吴裕雄--天生自然 HADOOP大数据分布式处理：CenterOS 7 多台物理机、虚拟机相互桥连接ping通，并且能够成功连接外网

选择用于桥接模式下的虚拟交换机,并且要选择对应的有线或者无线的网卡,如果主机是插网线联网的,那就选择有线网卡,如果主机是连无线网络的就选择无线网卡.Realtek PCIe GBE Family Controller:有线网卡什么是桥接模式?桥接模式就是将主机网卡与虚拟机虚拟的网卡利用虚拟网桥进行通信.在桥接的作用下,类似于把物理主机虚拟为一个交换机,所有桥接设置的虚拟机连接到这个交换机的一个接口上,物理主机也同样插在这个交换机当中,所以所有桥接下的网卡与网卡都是交换模式的,相互可以访问而不干…

吴裕雄--天生自然 HADOOP大数据分布式处理：修改CenterOS 7 IP设置

…

吴裕雄--天生自然 HADOOP大数据分布式处理：安装配置Tomcat服务器

下载链接:https://tomcat.apache.org/download-80.cgi tar -zxvf apache-tomcat-8.5.42.tar.gz -C /usr/local/src 进入Tomcat目录下的conf目录: cd apache-tomcat-8.5.42/conf 通过vim命令编辑tomcat-users.xml文件,在tomcat-users标签对中增加如下代码: <role rolename="admin-gui"/> <r…

吴裕雄--天生自然 HADOOP大数据分布式处理：安装配置JAVA

tar -xzvf jdk-8u151-linux-x64.tar.gz -C /usr/local/src sudo vim /etc/profile .编辑/etc/profile # JAVA export JAVA_HOME=/usr/local/src/jdk1..0_151 export JRE_HOME=$JAVA_HOME/jre export CLASS_PATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOM…

吴裕雄--天生自然 HADOOP大数据分布式处理：使用WinSCP连接本机与虚拟机

…

吴裕雄--天生自然 HADOOP大数据分布式处理：使用XShell远程连接主机与服务器并配置它们之间SSH免密登录

…

吴裕雄--天生自然 HADOOP大数据分布式处理：添加主机和服务器的域名映射

…

吴裕雄--天生自然 Hadoop大数据分布式处理：centos7修改系统时间、时区

cp -f /usr/share/zoneinfo/Asia/Shanghai /etc/localtime 修改完后需要重启.…

吴裕雄--天生自然 Hadoop大数据分布式处理：关闭CenterOS 7防火墙

使用命令:systemctl status firewalld.service 查看防火墙状态执行后可以看到绿色字样标注的“active(running)”,说明防火墙是开启状态使用命令:systemctl stop firewalld.service 关闭运行的防火墙关闭后,使用命令systemctl status firewalld.service 查看防火墙状态可以看到,disavtive(dead)的字样,说明防火墙已经关闭前面的方法,一旦重启操作系统,防火墙就自动开启了,该怎…

吴裕雄--天生自然 HADOOP大数据分布式处理：修改CenterOS 7系统时间为北京时间

…

吴裕雄--天生自然HADOOP操作实验学习笔记：分布式资源调度系统yarn的安装

实验目的复习配置hadoop初始化环境复习配置hdfs的配置文件学会配置hadoop的配置文件了解yarn的原理实验原理 1.yarn是什么前面安装好了hdfs文件系统,我们可以根据需求进行数据的读写操作.hdfs解决了大数据的存储,接下来的问题就是根据实际的业务需求进行计算.目前大数据的计算业务主要有离线计算.实时计算.交互式查询.机器学习.图计算.例如storm是处理实时计算的,hadoop的mapreduce是处理批处理计算业务的.hive则是进行交互式查询的.这么多计算框架在…

吴裕雄--天生自然HADOOP操作实验学习笔记：hdfs分布式文件系统安装

实验目的复习安装jdk 学习免密码登录掌握安装配置hdfs集群的方法掌握hdfs集群的简单使用和检查其工作状态实验原理 1.hdfs是什么 hadoop安装的第一部分是安装hdfs,hdfs是一个磁盘文件系统,提供的功能类似于本地文件系统一样,可以通过命令进行增删改查文件,不同的是,hdfs通过将很多机器放在一起组成一个节点,大大提高了存储文件和处理文件的能力,也简化了对文件的操作. 2.hdfs的组成 hdfs的文件系统主要包括两个部分:namenode(管理节点)和datanode(…

吴裕雄--天生自然HADOOP学习笔记：hadoop集群实现PageRank算法实验报告

实验课程名称:大数据处理技术实验项目名称:hadoop集群实现PageRank算法实验类型:综合性实验日期:2018年 6 月4日-6月14日学生姓名吴裕雄学号 15210120331 班级软工三班专业名称软件工程实验组其他成员无实验地点 F110 实验成绩 (教师签名) 实验目的与要求了解PageRank算法学会用mapreduce解决实际的复杂计算问题搭建hadoop分布式集群编写mapreduce代码根据输入的网页链接数据,能够得到最终的pagera…

吴裕雄--天生自然HADOOP操作实验学习笔记：mapreduce代码编程

实验目的深入了解mapreduce的底层了解IDEA的使用学会通过本地和集群环境提交程序实验原理 1.回忆mapreduce模型前面进行了很多基础工作,本次实验是使用mapreduce的API进行简单的大数据业务处理. MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算.概念"Map(映射)"和"Reduce(归约)",和它们的主要思想,都是从函数式编程语言里借来的,还有从矢量编程语言里借来的特性.它极大地方便了编程人员在不会分布式…

吴裕雄--天生自然HADOOP操作实验学习笔记：hbase微博案例

实验目的熟悉hbase表格设计的方法熟悉hbase的javaAPI 通过API理解掌握hbase的数据的逻辑视图了解MVC的服务端设计方式实验原理上次我们已经初步设计了学生选课案例的,具体功能还不完善,但是实现方式都是在已经设计好的表格之上,调用hbase已有的API,本次我们将会实现一个稍微复杂的业务逻辑,类似新浪微博的项目.实际上新浪微博是一个特别庞大的系统,光内存数据库Redis就有几千台集群,每天的访问量和流量几乎是全国最高的网站,这样一个复杂的集群架构也特别复杂,我们只是实现…

吴裕雄--天生自然HADOOP操作实验学习笔记：hbase的shell应用v2.0

HRegion 当表的大小超过设置值的时候,HBase会自动地将表划分为不同的区域,每个区域包含所有行的一个子集.对用户来说,每个表是一堆数据的集合,靠主键来区分.从物理上来说,一张表被拆分成了多块,每一块就是一个HRegion.我们用表名+开始/结束主键来区分每一个HRegion,一个HRegion会保存一个表里某段连续的数据,从开始主键到结束主键,一张完整的表是保存在多个HRegion上面的. HMaster 管理HRegionServer,实现其负载均衡. 管理和分配HRegion,比如在…

吴裕雄--天生自然HADOOP操作实验学习笔记：hadoop框架认识以及基本操作

实验目的了解Hadoop的概念和原理学习HDFS架构原理熟悉mapreduce框架熟悉mapred和yarn命令实验原理 1.hadoop和hadoop生态系统 hadoop的思想来源是Google,Google曾经面对一个问题,大量的网页怎么存储,怎么快速搜索的问题,于是三篇论文诞生了GFS.Map-Reduce.BigTable,这三篇论文的开源实现版本分别就是hadoop的hdfs.mapreduce和hbase,分别对应大数据存储.大数据分析计算.列式非关系型数据库. hado…

吴裕雄--天生自然HADOOP学习笔记：基本环境配置

实验目的学习安装Java 学习配置环境变量学习设置免密码登陆的方法掌握Linux环境下时间同步的配置实验原理 1.Java的安装 java是大数据的黄金语言,这和java跨平台的特性是密不可分的,大数据的大部分框架,包括hadoop.hbase.tachyon等,都是用java实现,而spark框架的scala语言,也是基于java的虚拟机的,所以安装java是进行大数据处理的第一步. java的安装很简单,我们采用编译安装的方法安装.找到jdk的安装包,实验安装包在文档末,同学们可以参…

吴裕雄--天生自然Hadoop学习笔记：Hadoop简介

Hadoop是一个由Apache基金会所开发的分布式系统基础架构.用户可以在不了解分布式底层细节的情况下,开发分布式程序.充分利用集群的威力进行高速运算和存储.Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS.HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上:而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序.HDF…

【吴裕雄--天生自然 HADOOP大数据分布式处理：添加主机和服务器的域名映射】的更多相关文章

吴裕雄--天生自然 HADOOP大数据分布式处理：主机与服务器时间同步设置

吴裕雄--天生自然 HADOOP大数据分布式处理：安装配置MYSQL数据库

吴裕雄--天生自然 HADOOP大数据分布式处理：安装WinSCP

吴裕雄--天生自然 HADOOP大数据分布式处理：安装XShell

吴裕雄--天生自然 HADOOP大数据分布式处理：CenterOS 7 多台物理机、虚拟机相互桥连接ping通，并且能够成功连接外网

吴裕雄--天生自然 HADOOP大数据分布式处理：修改CenterOS 7 IP设置

吴裕雄--天生自然 HADOOP大数据分布式处理：安装配置Tomcat服务器

吴裕雄--天生自然 HADOOP大数据分布式处理：安装配置JAVA

吴裕雄--天生自然 HADOOP大数据分布式处理：使用WinSCP连接本机与虚拟机

吴裕雄--天生自然 HADOOP大数据分布式处理：使用XShell远程连接主机与服务器并配置它们之间SSH免密登录

吴裕雄--天生自然 HADOOP大数据分布式处理：添加主机和服务器的域名映射

吴裕雄--天生自然 Hadoop大数据分布式处理：centos7修改系统时间、时区

吴裕雄--天生自然 Hadoop大数据分布式处理：关闭CenterOS 7防火墙

吴裕雄--天生自然 HADOOP大数据分布式处理：修改CenterOS 7系统时间为北京时间

吴裕雄--天生自然HADOOP操作实验学习笔记：分布式资源调度系统yarn的安装

吴裕雄--天生自然HADOOP操作实验学习笔记：hdfs分布式文件系统安装

吴裕雄--天生自然HADOOP学习笔记：hadoop集群实现PageRank算法实验报告

吴裕雄--天生自然HADOOP操作实验学习笔记：mapreduce代码编程

吴裕雄--天生自然HADOOP操作实验学习笔记：hbase微博案例

吴裕雄--天生自然HADOOP操作实验学习笔记：hbase的shell应用v2.0

吴裕雄--天生自然HADOOP操作实验学习笔记：hadoop框架认识以及基本操作

吴裕雄--天生自然HADOOP学习笔记：基本环境配置

吴裕雄--天生自然Hadoop学习笔记：Hadoop简介

吴裕雄--天生自然HADOOP操作实验学习笔记：分布式及RPC通信简介

吴裕雄--天生自然HADOOP操作实验学习笔记：单节点伪分布式安装

吴裕雄--天生自然HADOOP操作实验学习笔记：使用hive操作hbase

吴裕雄--天生自然HADOOP操作实验学习笔记：pig简介

吴裕雄--天生自然HADOOP操作实验学习笔记：ETL案例

吴裕雄--天生自然HADOOP操作实验学习笔记：Wor的Count程序的编写

吴裕雄--天生自然HADOOP操作实验学习笔记：安装zookeeper集群