S2X环境搭建与示例运行

http://dbis.informatik.uni-freiburg.de/forschung/projekte/DiPoS/S2X.html

环境

依赖

根据 pom.xml 文件,S2X 主要有以下六个依赖包

结构

java文件名 引用包 功能
QueryExecutor.java log4j:一个打日志的包
spark:操作spark的包
jena:用于操作sparql的包
1. 将args交给 ArgumentParser 解析
2. 使用SparkFacade创建spark上下文
3. 使用SparkFacade加载 HDFS (实例层)文件
4. 处理查询语句
- 使用IntermediateResultsModel清理中间值
- 使用jena.query.QueryFactory解析并生成query对象、处理前缀、编译query
- 使用AlgebraTranslator从opRoot开始对query进行重写,并获得可执行序列
- 通过SparkOp.execute()开始执行顺序序列中元素
ArgumentParser.java cls:一个处理命令行的包
log4j:一个打日志的包
de.tf.uni.freiburg.sparkrdf.constants.Const:工程内另一个包
1. 解析命令行参数
2. 将参数传递至de.tf.uni.freiburg.sparkrdf.constants.Const中

环境搭建步骤

  1. 安装并配置好 jdk1.7jdk1.8

  2. 访问网站,下载并安装 Eclipse Kepler Package 并解压,建议选择 JavaEE 并使用国内镜像下载

  3. 配置 Maven 环境

  4. 配置scala环境

  5. 配置spark环境

    • 根据 pom.xml 中的信息,理论上应该下载基于 Scala 2.10Spark 1.2-CDH5.3.0版本,然而我并找不到。。暂时下载了spark-1.6.0-bin-hadoop2.6.tgz
    • 解压,并将 bin 目录加入 path
  6. 配置hadoop环境

    • 根据上一步,下载hadoop2.6.0
    • 解压,新建环境变量 HADOOP_HOME ,并填入解压目录(很关键)
    • 将 bin 目录加入 path
    • 开启 cmd,运行 spark-shell,若出现"java.lang.NullPointerException, not found: value sqlContext",请参考连接:https://blog.csdn.net/u011242657/article/details/53968135
    • 最后新建 cmd 窗口,运行 spark-shell,出现以下两句话,视为 spark 与 hadoop 环境配置成功,参考:Spark在Windows下的环境搭建
      • Spark context available as sc.
      • SQL context available as sqlContext.

关于 5、6 两步,官方推荐使用 Cloudera's Distribution of Hadoop CDH,我暂时也没有弄明白 CDH 是什么

运行项目

  1. 从 github 仓库 clone 项目

  2. 打开Eclipse Kepler,File->import->Existing Maven Project->选择仓库中src文件夹,一路确定,等待 Maven 自行下载所有包

  3. 准备好数据,我使用的是里海大学提供的可自动生成的数据集 LUBM1.nt 约包含 13 万条三元组数据。

  4. 如果是在windows上运行代码,需要修改几行代码:

    • 修改 args 参数

      • 由于在 Spark 上运行代码,需要将代码整理为 jar 包的形式,在测试时需要提前设置命令行参数,或者直接在 QueryExecutor.javamain 函数中第一行中修改 args 变量( -l 参数很关键 ):

        1. args=new String("-i c:/Users/chenyanji/Downloads/S2X_DATA/lubm1.nt " +
        2. "-mem 2g " +
        3. "-q c:/Users/chenyanji/Downloads/S2X_DATA/query3.new " +
        4. "-t c:/Users/chenyanji/Downloads/S2X_DATA/Record.txt " +
        5. "-p -l -jn chenyanjiTest").split(" ");
    • 修改 SparkFacade.java

      • 程序开始运行后,首先通过 SparkFacade.LoadGraph() 加载图,LoadGraph 需要先判断路径(父目录与参数目录进行拼接)下是否存在图(看起来使用的是相对父目录的路径),随后根据上一步的参数选择使用哪种方式读取图,这里将路径进行修改
      • 删去 fs.getHomeDirectory().toString()

运行结果:

  1. ...
  2. 18/10/23 10:00:43 INFO run.QueryExecutor: Started Graph loading
  3. 18/10/23 10:00:56 INFO run.QueryExecutor: Finished Graph Loading in 12958 ms
  4. 18/10/23 10:00:56 INFO run.QueryExecutor: Started query file: c:/Users/chenyanji/Downloads/S2X_DATA/query3.new
  5. 18/10/23 10:00:56 INFO run.QueryExecutor: Started BGP
  6. 18/10/23 10:01:05 INFO run.QueryExecutor: Finished BGP in 8713 ms
  7. 18/10/23 10:01:05 INFO run.QueryExecutor: Started Result
  8. 18/10/23 10:01:06 INFO run.QueryExecutor: Finished Result in 798 ms
  9. 18/10/23 10:01:06 INFO run.QueryExecutor: Started Projection
  10. 18/10/23 10:01:06 INFO run.QueryExecutor: Finished Projection in 6 ms
  11. 18/10/23 10:01:07 INFO run.QueryExecutor: Result count 6
  12. ?x
  13. <http://www.Department0.University0.edu/AssistantProfessor0/Publication4>
  14. ?x
  15. <http://www.Department0.University0.edu/AssistantProfessor0/Publication2>
  16. ?x
  17. <http://www.Department0.University0.edu/AssistantProfessor0/Publication0>
  18. ?x
  19. <http://www.Department0.University0.edu/AssistantProfessor0/Publication5>
  20. ?x
  21. <http://www.Department0.University0.edu/AssistantProfessor0/Publication1>
  22. ?x
  23. <http://www.Department0.University0.edu/AssistantProfessor0/Publication3>

待解决的问题

  1. -so 参数

    • GraphLoader 在加载图时,如果命令中存在 -so 参数,则最后将生成 verticeedge 信息对应的 object 文件,但是文件路径会有一个问题:操作系统中不能存在同名文件与文件夹,因此以本地模式运行代码时不能在参数中添加 -so

S2X环境搭建与示例运行的更多相关文章

  1. Appium(JAVA)Windows 7系统搭建及示例运行

    Appium(JAVA)Windows 7系统搭建及示例运行 分类: Appium 2014-11-14 17:44 4323人阅读 评论(2) 收藏 举报 1.搭建Android环境 http:// ...

  2. vue前端+java后端 vue + vuex + koa2开发环境搭建及示例开发

    vue + vuex + koa2开发环境搭建及示例开发 https://segmentfault.com/a/1190000012918518 vue前端+java后端 https://blog.c ...

  3. HHvm Apache 2.4 Nginx建站环境搭建方法安装运行WordPress博客

    HHvm Apache 2.4 Nginx建站环境搭建方法安装运行WordPress博客 VPS主机   2014年06月02日 17:20   评论»       文章目录 Debian上安装 Ce ...

  4. 【Java学习系列】第1课--Java环境搭建和demo运行

    本文地址 分享提纲: 1. java环境的搭建 2. java demo代码运行 3.参考文档 本人是PHP开发者,一直感觉Java才是程序的王道(应用广,科班出身),所以终于下决心跟一跟. 主要是给 ...

  5. RocketMQ4.5.1环境搭建及示例

    一.Windows环境搭建RocketMQ 1. 下载RocketMQ Binary压缩包,并解压缩,我的安装目录为E:\programs\rocketmq\rocketmq-all-4.5.1 2. ...

  6. react介绍、环境搭建、demo运行实例

    React官网:https://reactjs.org/docs/create-a-new-react-app.html cnpm网址:http://npm.taobao.org/ 1.react介绍 ...

  7. github上DQN代码的环境搭建,及运行(Human-Level Control through Deep Reinforcement Learning)conda配置

    最近师弟在做DQN的实验,由于是强化学习方面的东西,正好和我现在的研究方向一样于是我便帮忙跑了跑实验,于是就有了今天的这个内容. 首先在github上进行搜寻,如下图: 发现第一个星数最多,而且远高于 ...

  8. ionic —— 开发环境搭建并编译运行第一个APP

    其实类似的环境已经玩了很多次了,最开始玩还是微信刚刚出来,那会儿没有智能机.只好安装一个模拟器,却只是为了注册一个微信.想想也就是够了~ 前前后后折腾了很多次,可是每一次都给人不一样的感觉,也许是这个 ...

  9. Appium环境搭建——安装以及运行appium server失败点总结

    一.运行Appium失败:未安装.Net Framework 4.5 之前安装AppScan安全测试工具时,就要求.Net 4.5以上环境,我其中一台电脑的系统是Win7-32bit的,安装.Net ...

随机推荐

  1. mybatis隐藏不用的sql

    在mybatis的xml中,选中了不用的sql语句,使用ctrl + shift + / 隐去,,结果是 <where> <if test="dto.startTime ! ...

  2. Python用户名密码登录系统(MD5加密并存入文件,三次输入错误将被锁定)及对字符串进行凯撒密码加解密操作

    # -*- coding: gb2312 -*- #用户名密码登录系统(MD5加密并存入文件)及对字符串进行凯撒密码加解密操作 #作者:凯鲁嘎吉 - 博客园 http://www.cnblogs.co ...

  3. 使用CefSharp的一些需要注意的点

    程序关闭的时候一定要加上: CefSharp.Cef.Shutdown(); 因为关闭的时候,不将浏览器关闭的话,会阻塞主线程导致报错. 修复CefSharp浏览器组件中文输入的bug // brow ...

  4. 【夯实PHP基础】微信小程序开发 2017.02.06

    本文地址 分享提纲 1. 概述 2. 简易教程 1. 概述 1)[小程序是什么] 微信小程序是一种全新的连接用户与服务的方式,它可以在微信内被便捷地获取和传播,同时具有出色的使用体验. 2)[快速体验 ...

  5. Spring AOP的实现研究

    1. 背景 在前文Spring IOC容器创建bean过程浅析已经介绍了Spring IOC创建初始化bean的大致过程.现在对Spring的AOP实现机制进行研究分析. 2. 名词与概念 名词 概念 ...

  6. MyBatis Generator使用示例

    一.MBG介绍 MyBatis Generator(MBG)是一个Mybatis的代码生成器,它可以用来生成可以访问(多个)表的基础对象.MBG解决了对数据库操作有最大影响的一些简单的CRUD(插入, ...

  7. Linux基础第四课——文件操作

    文件的创建 touch sudo touch 文件1 文件2 文件3 #支持批量创建文件 sudo rm -f 文件1 文件2 文件3 #支持批量创建 也支持批量删除 echo '谁动谁输,对不起我输 ...

  8. Expires和Cache-Control的理解

    最近在学Nginx,学到有个地方式设置响应头信息,其中有两项是设置Expires和Cache-Control,来设置缓存时间,后来发现"并没有什么卵用",于是就搜了下资料,把整个思 ...

  9. MySql常用命令集Mysql常用命令4

    说明: 用中括号([])括起来的部分表示是可选的,用大括号({})括起来的部分是表示必须 从中选择其中的一个. 1 FROM子句 FROM 子句指定了Select语句中字段的来源.FROM子句后面是包 ...

  10. jmeter(三)SOAP/XML-RPC Request

    项目背景:公司的微信端H5界面新开发了会员注册功能,需要对其进行压力测试 项目目标:需要承受每分钟最少6000的压力 一.建立一个测试计划(test plan) 之前有说过,jmeter打开后会自动生 ...