一、前言

看到这个题目有人肯定会说这有什么可写的，最简单的我只要用文件系统一个个查找、打开就可以实现，再高级一点我可以提取出所有数据的元数据，做个元数据管理系统就可以实现查找功能，有必要用geotrellis用分布式吗？这不是杀鸡用牛刀吗？理论上是这样的，但是要看我们考虑问题的尺度，如果你只是一些简单的数据用传统方法当然好，省事、省时、简单、速度快，但是当我们将数据的量放大到一个区域乃至全球的时候恐怕事情就不是那么简单了，比如我们有了全球Landsat数据，如何查看某一地区此数据的情况，传统方法可能要自己先计算出此区域的Landsat的带号，然后再找到此数据并打开之。如果觉得这海不麻烦，那么当用户需要考察Landsat的云量或者NDVI的时候是不是又要用户自己打开数据并使用Arcgis等自行计算？是不是很麻烦，而本文介绍的方法是只需要用户输入有关此点的信息（带号或者点位信息），系统能够自动呈现此区域的数据（或者云量、NDVI等结果），这样是不是逼格立马上去了呢？

二、前台实现

此功能的前台也不可谓不复杂，但是难不倒我这个全栈工程师（请忽略此话），费了半天劲，基本实现了前台的功能。总体就是一个搜索框加一个按钮，然后发送搜索关键词到后台，后台返回数据列表，前台逐条展示之，单机每条数据的时候在地图中（地图框架采用leaflet）呈现此数据的情况，类似Google、百度。这里面我主要介绍以下知识点。

2.1 在地图中添加、删除标记

要给用户呈现数据情况，最重要的就是数据的空间范围，简单的说就是将四个（或多个）顶点逐一连成线在地图中显示出来。leaflet可以简单的使用如下语句实现该功能：

geoJsonOverlay = L.geoJson(geoJson);

geoJsonOverlay.addTo(map);

其中map为L.map('map')对象，geoJson就是想要添加的标记对象，此处用的是GeoJson，GeoJson简单来说就是将空间对象转成相应的json对象，便于交互、传输等。

再次查询或其他情形下可能又需要将上述的标记层去掉，这时候只需下述语句即可：

map.removeLayer(geoJsonOverlay);

2.2 空间数据的显示

当用户想要查看某个检索出来的数据情况的时候就需要将此数据显示到地图当中，后台暂且不表，如果用到瓦片技术那么显示在leaflet中的方式就是添加一层，同样移除数据就是删除该层。代码如下：

//add

WOLayer = new L.tileLayer(baseurl + '/{z}/{x}/{y}', {

    format: 'image/png',

    transparent: true,

    attribution: 'SJZX'

});

WOLayer.addTo(map);

map.lc.addOverlay(WOLayer, "Landsat");

//delete

map.lc.removeLayer(WOLayer);

map.removeLayer(WOLayer);

三、后台实现

后台牵涉到的东西较多，主要是数据检索、数据范围生成GeoJson、数据存放、数据处理、数据发送等。

3.1 数据检索

这块与传统方式相同，但是本文采用全文检索的方式，该内容涉及到的问题也比较多，会在后续另立新篇，详细介绍本系统全文检索以及空间检索的实现，总体上根据前台传入的关键词返回与之相关联的数据，相当于地理信息系统版的Google。

3.2 数据范围生成GeoJson

简单说来就是从元数据中读出数据的空间范围，将此范围生成GeoJson对象发送到前台。具体元数据信息可以通过上面的数据检索获取，此处假设已经取到了空间范围的WKT标记对象，剩下的工作就是将WKT转成GeoJson，代码如下：

import geotrellis.vector.io.json.Implicits._

val geom = WKT.read(wkt)

geom.toGeoJson

当然此处还需要考虑geometry对象的投影变换等问题，要考虑前台、后台以及数据等的投影方式，转换成自己需要的投影方式。

3.3 数据存放

这块是本系统的核心，面对如此大的数据量只有合理的数据存放方式才能实现快速响应。目前采用的方式是前面文章讲述过的将数据导入到Accumulo，这种方式的好处是请求数据快，但同时造成的一个问题是数据量大（相当于数据保存了2-3份，如果再考虑HDFS的备份特性，相当于6-9份），以上述Landsat为例，采用此种方式必须要将全球的Landsat数据都导入到Accumulo中，这个量是非常大的，如果有多套数据需要采用此种方式检索，那么这个数据量确实非常大，但是分布式框架本身就是为了解决大数据量的问题。目前也正在寻找折中的解决方案。

3.4 数据处理

比如Landsat数据我们可以实时计算用户查找区域的云量以及NDVI等并将之呈现给用户，这样用户能够对数据的质量有一个更加深刻的认识，而不需要用户再进行下载数据分析处理等。

3.5 数据发送

数据发送的目的是将上述处理好的数据或原始数据发送到前台，前台进行展示。此处需要注意的是要根据请求的范围对请求结果进行掩盖，因为用户感兴趣（查找）的是某一个或某几个数据，如果不加掩盖，前台获取到的仍然是全球的数据，这样就没有意义。单个瓦片的请求在前面的文章中已经讲过，这里重点讲一下掩盖操作。前台的区别就是在请求数据的时候要多发送一个请求范围，比如为用户检索数据时后台发送的数据空间范围GeoJson对象，后台首先根据请求的x、y、z取到对应的瓦片，然后判断此瓦片与GeoJson对象的空间关系，取出在范围内的数据，其他数据赋为无值，这样就可以得到掩盖后的瓦片，看似复杂其实Geotrellis已经为我们实现了该过程，只需要简单几行代码即可实现：

import geotrellis.vector.io.json.Implicits._

val extent = attributeStore.read[TileLayerMetadata[SpatialKey]](id, Fields.metadata).mapTransform(key)

val geom = geoJson.parseGeoJson[Geometry]

tile.mask(extent, geom)

其中attributeStore是Accumulo操作的实例，id为表示请求层的对象，key为表示请求瓦片的x、y，geoJson就是传入的空间范围对象，根据上述代码就能实现范围掩盖操作。

四、总结

本文简单为大家介绍了如何实现海量空间数据的搜索以及详情查看，有些部分会在后续详细介绍，本文仅为框架介绍。

Geotrellis系列文章链接地址http://www.cnblogs.com/shoufengwei/p/5619419.html

geotrellis使用（二十六）实现海量空间数据的搜索处理查看的更多相关文章

Bootstrap <基础二十六>进度条
Bootstrap 进度条.在本教程中,你将看到如何使用 Bootstrap 创建加载.重定向或动作状态的进度条. Bootstrap 进度条使用 CSS3 过渡和动画来获得该效果.Internet ...
Web 前端开发人员和设计师必读精华文章【系列二十六】
<Web 前端开发精华文章推荐>2014年第5期(总第26期)和大家见面了.梦想天空博客关注前端开发技术,分享各类能够提升网站用户体验的优秀 jQuery 插件,展示前沿的 HTML5 ...
二十六：Struts2 和 spring整合
二十六:Struts2 和 spring整合将项目名称为day29_02_struts2Spring下的scr目录下的Struts.xml文件拷贝到新项目的scr目录下在新项目的WebRoot-- ...
二十六、Jcreator使用初步
摘自http://blog.csdn.net/liujun13579/article/details/7751464 二十六.Jcreator使用初步 Jcreator是一个小巧灵活的Java开发工具 ...
WCF技术剖析之二十六:如何导出WCF服务的元数据(Metadata)[扩展篇]
原文:WCF技术剖析之二十六:如何导出WCF服务的元数据(Metadata)[扩展篇] 通过<实现篇>对WSDL元素和终结点三要素的之间的匹配关系的介绍,我们知道了WSDL的Binding ...
WCF技术剖析之二十六:如何导出WCF服务的元数据(Metadata)[实现篇]
原文:WCF技术剖析之二十六:如何导出WCF服务的元数据(Metadata)[实现篇] 元数据的导出就是实现从ServiceEndpoint对象向MetadataSet对象转换的过程,在WCF元数据框 ...
VMware vSphere 服务器虚拟化之二十六桌面虚拟化之View Persona Management
VMware vSphere 服务器虚拟化之二十六桌面虚拟化之View Persona Management 实验失败告终,启动VMware View Persona Management服务报10 ...
第一百二十六节，JavaScript，XPath操作xml节点
第一百二十六节,JavaScript,XPath操作xml节点学习要点: 1.IE中的XPath 2.W3C中的XPath 3.XPath跨浏览器兼容 XPath是一种节点查找手段,对比之前使用标准 ...
mysql进阶(二十六)MySQL 索引类型（初学者必看）
mysql进阶(二十六)MySQL 索引类型(初学者必看) 索引是快速搜索的关键.MySQL 索引的建立对于 MySQL 的高效运行是很重要的.下面介绍几种常见的 MySQL 索引类型. 在数 ...

随机推荐

LINUX篇，设置MYSQL远程访问实用版
每次设置root和远程访问都容易出现问题, 总结了个通用方法, 关键在于实用 step1: # mysql -u root mysql mysql> Grant all privileges o ...
Ubuntu下使用nvm
写在前面:刚写着写着博客就跨年了,希望新的一年大家万事如意,一切向"前"看! 安装 wget -qO- https://raw.githubusercontent.com/crea ...
ES6的一些常用特性
由于公司的前端业务全部基于ES6开发,于是给自己开个小灶补补ES6的一些常用特性.原来打算花两天学习ES6的,结果花了3天才勉强过了一遍阮老师的ES6标准入门(水好深,ES6没学好ES7又来了...) ...
基于改进人工蜂群算法的K均值聚类算法（附MATLAB版源代码）
其实一直以来也没有准备在园子里发这样的文章,相对来说,算法改进放在园子里还是会稍稍显得格格不入.但是最近邮箱收到的几封邮件让我觉得有必要通过我的博客把过去做过的东西分享出去更给更多需要的人.从论文刊登 ...
C# 对象实例化用json保存泛型类可以很方便的保存程序设置
用于永久化对象,什么程序都行,依赖NewtonSoft.用于json序列化和反序列化. using Newtonsoft.Json; using System; using System.Collec ...
使用github远程仓库
经过几天对github的研究,终于把自己想完成的给解决了,发现google真的有很多解释,但是很多也会出现一些bug,对于初学者真的很多烦恼,所以整理一份,能给初识github的你有所帮助一,首先, ...
网站里加入QQ在线客服
1.开启"QQ在线状态"服务 http://jingyan.baidu.com/article/b24f6c823425a586bfe5da1f.html http://www. ...
Oracle第一步
Oracle 启动数据库 Startup [NOMOUNT|MOUNT|OPEN|FORCE] [restrict] [pfile=filename] 启动实例,加载数据库,启动数据库 oRACLE关 ...
npm源切换
版权声明:欢迎转载,请附加转载来源:一路博客(http://www.16boke.com) 目录(?)[+] 安装使用列出可选的源切换增加源删除源测试速度许可项目主页我们介绍 ...
给缺少Python项目实战经验的人
我们在学习过程中最容易犯的一个错误就是:看的多动手的少,特别是对于一些项目的开发学习就更少了! 没有一个完整的项目开发过程,是不会对整个开发流程以及理论知识有牢固的认知的,对于怎样将所学的理论知识应用 ...

geotrellis使用（二十六）实现海量空间数据的搜索处理查看

目录