Spark-Bench 教程

本文原始地址：https://sitoi.cn/posts/19752.html

系统环境配置

操作系统：centos7

环境要求：安装 JDK, Hadoop, Spark，mvn 运行环境

步骤

安装测试工具
1. 安装 wikixmlj
2. 安装 SparkBench 基准测试组件
3. 单机环境安装方式
根据实际环境配置测试环境
1. 修改基本环境
2. 配置 Spark 运行参数部分
运行 Spark-Bench 测试
1. 机器学习测试案例
2. 图计算测试案例
3. SQL 查询测试案例
4. 流处理测试案例
5. 其他测试案例
查看测试结果

安装测试工具

所有步骤在 hdfs 账号下进行：

安装 wikixmlj

克隆项目：项目地址

git clone https://github.com/synhershko/wikixmlj.git

进入项目目录进行 mvn 编译：

cd wikixmlj

mvn package -Dmaven.test.skip=true

mvn install -Dmaven.test.skip=true

安装 SparkBench 基准测试组件

注： ubuntu 系统需要安装以下包:

sudo apt-get install libgfortran3

克隆项目：项目地址

git clone -b legacy https://github.com/CODAIT/spark-bench.git

进入项目目录进行构建：

cd spark-bench/

./bin/build-all.sh

单机环境安装方式

在其他机器上执行上述两步，将两个文件拷贝到需要测试的机器上的 hdfs 账号下

注： ubuntu 系统需要安装额外包

根据实际环境配置测试环境

进入到 spark-bench 目录下修改 conf 目录下的 env.sh

cd spark-bench/

vim conf/env.sh

修改基本环境

根据实际情况修改对应配置

master="<master_ip_address>"                   根据实际情况修改master

MC_LIST=""

HADOOP_HOME=<HADOOP_HOME>                      根据实际情况修改HADOOP_HOME

SPARK_HOME=<SPARK_HOME>                        根据实际情况修改SPARK_HOME

HDFS_URL="hdfs://${master}:9000"               根据实际情况修改端口号

DATA_HDFS="hdfs://${master}:9000/SparkBench"   根据实际情况修改端口号

配置 Spark 运行参数部分

修改conf目录下的env.sh

SPARK_EXECUTOR_MEMORY=4G                       根据实际情况修改

export SPARK_DRIVER_MEMORY=4g                  根据实际情况修改

export SPARK_EXECUTOR_INSTANCES=1              根据实际情况修改

export SPARK_EXECUTOR_CORES=1                  根据实际情况修改

运行 Spark-Bench 测试

测试案例	功能
机器学习测试案例	逻辑回归，支持向量机，矩阵分解
图计算测试案例	PageRank，SVD++，三角计数（Triangle Count）
SQL查询测试案例	Hive，RDDRelation
流处理测试案例	Twitter Tag ， Page View
其他测试案例	Kmeans，线性回归，决策树，最短路径，标签传播，连通图，强连通图

机器学习测试案例

进入到 spark-bench 目录下，在该目录下执行操作：

测试案例	Workload
逻辑回归	LogisticRegression
支持向量机	SVM
矩阵分解	MatrixFactorization

步骤：

修改配置参数
运行生成测试数据脚本
运行相应案例测试脚本

修改配置参数

<Workload> 根据测试案例表填写实际内容，下同:

vim <Workload>/conf/env.sh

运行生成测试数据脚本

./<Workload>/bin/gen_data.sh

运行相应案例测试脚本

./<Workload>/bin/run.sh

图计算测试案例

进入到 spark-bench 目录下，在该目录下执行操作：

测试案例	Workload
网页排名	PageRank
SVD++	SVDPlusPlus
三角计数	TriangleCount

步骤：

修改配置参数
运行生成测试数据脚本
运行相应案例测试脚本

修改配置参数

vim <Workload>/conf/env.sh

运行生成测试数据脚本

./<Workload>/bin/gen_data.sh

运行相应案例测试脚本

./<Workload>/bin/run.sh

SQL 查询测试案例

进入到 spark-bench 目录下，在该目录下执行操作：

测试案例	Workload
SQL查询	SQL

步骤：

修改配置参数
运行生成测试数据脚本
运行相应案例测试脚本

修改配置参数

vim /<Workload>/conf/env.sh

运行生成测试数据脚本

./<Workload>/bin/gen_data.sh

运行相应案例测试脚本

./<Workload>/bin/run.sh

在运行 SQL 查询案例时，默认是运行其中的 RDDRelation 案例，如果要想运行其中的 Hive 案例可以执行下面代码：

./<Workload>/bin/run.sh hive

流处理测试案例

进入到 spark-bench 目录下，在该目录下执行操作：

测试案例	Workload
流处理	Streaming

步骤：

修改配置参数
首先在一个终端中执行生成随机数据
然后再另一个终端中执行

修改配置参数

vim <Workload>/conf/env.sh

在运行流数据处理案例时，例如 TwitterTag，Streaming 逻辑回归

首先在一个终端中执行生成随机数据

在执行脚本时必须要指定你要运行案例名字的参数，如下：

./<Workload>/bin/gen_data.sh TwitterPopularTags

然后再另一个终端中执行

在执行脚本时必须要指定你要运行案例名字的参数，如下：

./<Workload>/bin/run.sh TwitterPopularTags

当然你也可以在 <Workload>/conf/env.sh 配置文件中指定你要运行的子案例的名称，通过修改 subApp=TwitterPopularTags

其他测试案例

进入到 spark-bench 目录下，在该目录下执行操作：

测试案例	Workload
Kmeans	Kmeans
线性回归	LinearRegression
决策树	DecisionTree
最短路径	ShortestPaths
标签传播	LabelPropagation
连通图	ConnectedComponent
强连通图	StronglyConnectedComponent
主成分分析	PCA

步骤：

修改配置参数
运行生成测试数据脚本
运行相应案例测试脚本

修改配置参数

vim <Workload>/conf/env.sh

运行生成测试数据脚本

./<Workload>/bin/gen_data.sh

运行相应案例测试脚本

./<Workload>/bin/run.sh

查看测试结果

在 spark-bench 目录下的 num 目录下可以查看到运行结果。

Spark-Bench 测试教程的更多相关文章

MyCat安装与测试教程超详细！
MyCat安装与测试教程超详细! MyCat基础知识一.什么是MYCAT? 1. 一个彻底开源的,面向企业应用开发的大数据库集群 2. 支持事务.ACID.可以替代MySQL的加强版数据库 3. ...
Kail Linux渗透测试教程之免杀Payload生成工具Veil
Kail Linux渗透测试教程之免杀Payload生成工具Veil 免杀Payload生成工具——Veil Kail Linux渗透测试教程之免杀Payload生成工具Veil,Veil是一款利用M ...
Kail Linux渗透测试教程之网络扫描和嗅探工具Nmap
Kail Linux渗透测试教程之网络扫描和嗅探工具Nmap 网络扫描和嗅探工具——Nmap Nmap也就网络映射器(Network Mapper),是一个免费开放的网络扫描和嗅探工具.该工具可以扫描 ...
Mac环境下RabbitMq安装与测试教程
RabbitMq安装与测试教程 Installing on Mac I. 安装 123456789 brew install rabbitmq ## 进入安装目录cd /usr/local/Cella ...
monkey测试===monkeyrunner测试教程（1）
1.安装测试环境 jdk 安装与配置 android sdk安装与配置 Python编辑器安装与配置以上安装请自行百度教程 Monkeyrunner使用方法 http://www.android-d ...
深度相机Astra Pro测试教程
最近在微信群内,很多群友在群友的推荐下,购买了Astra pro的深度相机,价格地道,物超所值!群友反馈积极,所以这里出一波简单的教程. 以下内容知识抛砖引玉,主要讲解windows下和Ubunt ...
Unity导出iOS真机测试教程
原地址:http://unity3d.9tech.cn/news/2014/0410/40177.html 学习了两天的Android开发,我感觉Android开发跟IOS开发和.NET平台下的开发 ...
iOS—最全的真机测试教程
准备开发者账号自从Xcode7 出来之后,一般的真机测试不需要开发者账号,也就不需要看这篇教程,只有app具有“推送”等功能的时候,要真机测试就必须要开发者账号和设置证书.苹果只是让你体验一下它的 ...
测试教程网.unittest教程.3. 实例: 测试弱密码
From: http://www.testclass.net/pyunit/test_example_1/ 背景考虑这样一个测试弱密码的实例,这个我们在pytest相关教程中也有过描述. 我们需要判 ...

随机推荐

安卓设备连接Mac的简单方法
mac设备是苹果出品的桌面系统,以高冷而闻名,不同于我们平常使用的windows系统,mac系统对软件硬件的兼容性很差,将iOS 设备(iPhone.iPad和iPod)连接至Mac是一件很简单的事, ...
System.getProperty("line.separator") 是什么意思?
在java中存在一些转义字符,比如"\n"为换行符,但是也有一些JDK自带的一些操作符比如 : System.getProperty("line.separator&q ...
记一次Pr中视频蜜汁卡顿往复和解决方法
目录问题换素材的起因灵异素材无端联想解决问题换素材的起因本来视频剪了一晚剪完了,导出一看,好家伙,糊到上世纪.原来素材的像素大小都没法看,这视频素材我是从别人U盘拷过来的,可他竟然是用 ...
prometheus、node_exporter、cAdvisor常用参数
本节将介绍一下我在使用过程中用到的promethues.node_exporter.cAdvisor的常用参数,做一个总结一.prometheus prometheus分为容器安装和二进制文件安装, ...
【linux】查看jar里面的配置文件
1.vim 文件.jar 2.光标到配置文件,然后回车 3.退出命令:q 也可以进行编辑,按i进入编辑,按:wq保存退出
一文让你彻底理解准确率，精准率，召回率，真正率，假正率，ROC/AUC
参考资料:https://zhuanlan.zhihu.com/p/46714763 ROC/AUC作为机器学习的评估指标非常重要,也是面试中经常出现的问题(80%都会问到).其实,理解它并不是非常难 ...
ElasticSearch 线程池类型分析之 ExecutorScalingQueue
ElasticSearch 线程池类型分析之 ExecutorScalingQueue 在ElasticSearch 线程池类型分析之SizeBlockingQueue这篇文章中分析了ES的fixed ...
Visual Studio 重命名项目名
1. 打开VS Studio,重命名项目 2. 重命名对应的项目文件夹,并重命名项目文件夹下的这两个文件名: 3. 用记事本打开解决方案,修改对应的项目名字和路径未完 ...... 点击访问原文(进 ...
c语言错题本
()malloc(sizeof()) 在stdlib.h包中
[终极巨坑]golang+vue开发日记【一】，环境搭建篇
写在前面这个golang+vue大部分的内容是基于bydmm(橙卡)大佬的视频学来的,我在这里只是做一下个人开发的笔记,就是图一个乐,毕竟我只是个应届毕业生,如果真的要学请:bydmm的b站空间. ...

Spark-Bench 测试教程

Spark-Bench 教程

系统环境配置

步骤

安装测试工具

安装 wikixmlj

安装 SparkBench 基准测试组件

单机环境安装方式

根据实际环境配置测试环境

修改基本环境

配置 Spark 运行参数部分

运行 Spark-Bench 测试

机器学习测试案例

修改配置参数

运行生成测试数据脚本

运行相应案例测试脚本

图计算测试案例

修改配置参数

运行生成测试数据脚本

运行相应案例测试脚本

SQL 查询测试案例

修改配置参数

运行生成测试数据脚本

运行相应案例测试脚本

流处理测试案例

修改配置参数

首先在一个终端中执行生成随机数据

然后再另一个终端中执行

其他测试案例

修改配置参数

运行生成测试数据脚本

运行相应案例测试脚本

查看测试结果

相关链接

Spark-Bench 测试教程的更多相关文章

随机推荐

热门专题