Oracle Spatial分区应用研究之二:按县分区与按省分区对比测试报告
1、实验目的
在上一轮的实验中,oracle 11g r2版本下,在87县市实验数据的基础上,比较了分表与分区的效率,得出了分区+全局索引效率较高的结论(见上一篇博客)。不过我们尚未比较过不同的分区粒度有什么效率差异。这一轮的实验,着重于以下几个目的:
- 使实验场景更接近真实使用场景——使用oracle 12c,用更大的数据量进行实验。
- 对比分析按县分区与按省分区的查询效率。
- 继续比较本地空间索引与全局空间索引在不同算法下的查询效率。
2、实验数据
实验数据为全国2531个区县,要素总数为46982394。根据不同的数据组织+索引形式,形成了3个不同的实验主体:
- 按县分区+本地空间索引
- 按县分区+全局空间索引
- 按省分区+本地空间索引
3、实验方法
在1:500、1:2000、1:10000、1:25000、1:50000、1:100000比例尺下,随机从全国范围内选择3个样本范围,作为空间查询时的查询范围。将6*3个样本范围分别与3个实验主体进行空间查询运算,记录每次查询的耗时。
空间查询所用的算法仍然同于上一篇博客《Oracle Spatial分区应用研究之一:分表与分区性能对比》中介绍的、适用于分区的3种算法,即part_query、part_query2、part_query3。同时,本次实验中,还将通过并行框架对3种算法进行衍生,得到另外3种算法,标记为part_query_p、part_query2_p、part_query3_p。
因此,对每一个实验主体来说,在每一种比例尺样本下均需要用6种算法来进行查询运算。另外,因为算法执行有先后顺序,后执行的算法由于缓存的原因,会比先执行的算法有优势。为了尽量避免这种干扰,会将算法以不同的执行顺序进行两组实验。
4、实验结果
4.1 第一组实验结果
第一组实验,其算法执行顺序为:
Part_query→Part_query2→Part_query3→Part_query_p→Part_query2_p→Part_query3_p
执行结果如下图:
说明:表中蓝色区域为按县分区+本地空间索引在不同比例尺、不同算法下的查询效率;同理,红色区域代表按县分区+全局空间索引,绿色区域代表按省分区+本地空间索引。黄色斑块表示该行的最小值。
根据黄色斑块坐落的位置,可知:
- 在所有比例尺下,按省分区+本地空间索引效率最高,所有耗时最小的查询均发生在该区域。
- Part_query_p算法的查询效率最高,18个实验样本,耗时最小命中17次。
4.2 第二组实验结果
第二组实验,其算法执行顺序为:
Part_query_p→Part_query2_p→Part_query3_p→Part_query→Part_query2→Part_query3
执行结果如下图:
根据黄色斑块坐落的位置,可知:
- 在所有比例尺下,按省分区+本地空间索引效率最高,所有耗时最小的查询均发生在该区域。
- Part_query算法的查询效率最高,18个实验样本,耗时最小命中18次。
4.3 补充说明
两种实验,分别得出Part_query_p与Part_query算法效率最高的结论。这看似矛盾,实际上正是上文提到的,当算法执行有先后顺序时,会受到缓存的原因。那么对于Part_query_p与Part_query,谁的效率更高呢?
在两组实验中,Part_query_p与Part_query分别是最先执行的算法。分别从两组实验结果中取出Part_query_p与Part_query的实验数据,就可几乎完全排除缓存的影响。
两种算法,各命中9次。说明效率相当。但很明显的是,part_query在大比例尺下(大于1:25000)命中率较高;part_query_p在小比例尺下命中率较高。这与我们的认知一致,即在大任务作业时,并行才会体现优势。
5、实验结论
- Oracle 12c环境下,在要素量为四千万级别时,按省分区+本地空间索引效率较高。
- 采用按省分区+本地空间数据组织方式时,Part_query算法较为高效。
(未完待续)
Oracle Spatial分区应用研究之二:按县分区与按省分区对比测试报告的更多相关文章
- Oracle Spatial分区应用研究之七:同等分区粒度下全局索引优于分区索引的原因分析
1.实验结论 同等分区粒度下,使用分区空间索引进行空间查询,比使用全局空间索引进行查询,对数据字典表的访问次数更多.假设分区数为X,则大概多3X次访问.具体说明见6实验结论. 2.实验目的 在之前的测 ...
- Oracle Spatial分区应用研究之六:全局空间索引下按县分区与按省分区效率差异原因分析
1.实验结论 全局空间索引下,不同分区粒度之所有效率会有不同,差异并不在于SDO_FILTER操作本身,而在于对于数据字典表的访问次数上: 分区越多.表上的lob column越多,对数据字典表的访问 ...
- Oracle Spatial分区应用研究之三:县市省不同分区粒度的效率比较
在<Oracle Spatial分区应用研究之一:分区与分表查询性能对比>中已经说明:按县分区+全局空间索引效率要优于按县分区+本地空间索引,因此在该实验报告中,将不再考虑按县分区+本地空 ...
- Oracle Spatial分区应用研究之五:不同分区粒度+本地空间索引效率对比
1.实验目的 若使用本地空间索引,不同分区粒度将产生不同索引组织,其索引分区个数.大小.R-TREE树结构均不相同.那么,在什么分区粒度下的本地空间索引效率较高呢? 2实验数据 实验数据为全国2531 ...
- Oracle Spatial中的空间索引
转自cryolite原文 Oracle Spatial中的空间索引 Oracle Spatial可对空间数据进行R-tree索引,每个空间图层(Spatial Layer)的空间索引元信息都可以在US ...
- Oracle Spatial 中的弧段及弧相关拓扑错误
1.报告说明 此报告用于验证下列问题: ORACLE SPATIAL 0.05m的最小拓扑容差值是否可以被修改 原始数据通过ARCGIS入库数据精度是否有损失 修改ORACLE SPATIAL图层的最 ...
- Oracle Spatial中SDO_Geometry详细说明[转]
在ArcGIS中通过SDE存储空间数据到Oracle中有多种存储方式,分别有:二进制Long Raw .ESRI的ST_Geometry以及基于Oracle Spatial的SDO_Geometry等 ...
- 细说Oracle数据库与操作系统存储管理二三事
在上大学的时候,学习操作系统感觉特别枯燥,都是些条条框框的知识点,感觉和实际应用的关联不大.发现越是工作以后,在工作中越想深入了解,发现操作系统知识越发重要.在实践中结合理论还是不错的一种学习方法.自 ...
- Oracle数据库基础入门《二》Oracle内存结构
Oracle数据库基础入门<二>Oracle内存结构 Oracle 的内存由系统全局区(System Global Area,简称 SGA)和程序全局区(Program Global Ar ...
随机推荐
- python Thread 函数
构造方法: Thread(group=None, target=None, name=None, args=(), kwargs={}) group: 线程组,目前还没有实现,库引用中提示必须是No ...
- Alpha冲刺(10/10)——追光的人
1.队友信息 队员学号 队员博客 221600219 小墨 https://www.cnblogs.com/hengyumo/ 221600240 真·大能猫 https://www.cnblogs. ...
- 项目Alpha冲刺(团队)-第七天冲刺
格式描述 课程名称:软件工程1916|W(福州大学) 作业要求:项目Alpha冲刺(团队) 团队名称:为了交项目干杯 作业目标:描述第七天冲刺的项目进展.问题困难.心得体会 队员姓名与学号 队员学号 ...
- Dubbo源码分析:ProxyFactory
roxyFactory将对外开放的服务进行封装.这里使用到代理的方式.ProxyFactory接口有两个不同的实现类:JavassistProxyFactory和JdkProxyFactory.Jdk ...
- Windows 2008R2 安装PostgreSQL 11.6
前些天在CentOS 7.5 下安装了PostgreSQL 11.6.除了在无外网环境下需要另外配置之外,其他没有什么差别.今天主要写一下在Windows下面安装PostgreSQL的问题. 在官网看 ...
- 2019-2020-1 20199302《Linux内核原理与分析》第八周作业
一.上课学习笔记 1.shell作用:①运行程序 ②重定向(输入/输出重定向) ③可编程(写脚本) 执行一个c程序时,如果切进另一个进程,会进入该进程而切不回原进程,所以需要为调用的进程创一个子进程. ...
- rollup node.js 打包工具
最近在做一个提供给浏览器和node同时使用的js的url模板工具类,在用什么打包工具上纠结了一段时间,正好有一天在知乎上看到了关于rollup的介绍,在自己试了试之后,就决定用rollup.js来打包 ...
- 微信小程序音乐播放器组件
wxml <image bindtap="click" src="{{isPlay?'/images/':'/images/'}}"/> JS Pa ...
- GoCN每日新闻(2019-10-02)
GoCN每日新闻(2019-10-02) GoCN每日新闻(2019-10-02) 1. Golang中基于Gin和Casbin的web使用方式 https://dev.to/maxwellhertz ...
- 数据结构---公交线路提示系统(Java后台+excel表格+web前端)
系统大致流程: index.jsp输入站名(点击“出示站点信息”,跳转list.jsp读取表格):后台通过站名获得id:getIdbyname(String name)将id反馈至dijkstra( ...