本文使用官方C# Driver,实现在MongoDB中存储,查询空间数据(矢量)

空间数据的存储
本例中,从一个矢量文件(shapefile格式)中读取矢量要素空间信息以及属性表,并写入到MongoDB中去,其中读取shapefile文件以及将空间信息转成json的功能通过Ogr库实现

  1. //打开MongoDB的Collection
  2. MongoDatabase db = server.GetDatabase("aa");
  3. MongoCollection colSheng = db.GetCollection("sheng");
  4. //使用Ogr库打开Shapefile文件
  5. DataSource ds = Ogr.Open(@"c:\temp\sheng.shp", 0);
  6. Layer lyr = ds.GetLayerByIndex(0);
  7. //读取要素数量和字段数量
  8. int feaCount = lyr.GetFeatureCount(0);
  9. int fieldCount = lyr.GetLayerDefn().GetFieldCount();
  10. //读取所有字段名
  11. List<string> fieldNames  =new List<string>();
  12. for (int i = 0; i < fieldCount; i++)
  13. {
  14. fieldNames.Add(lyr.GetLayerDefn().GetFieldDefn(i).GetName());
  15. }
  16. //循环将所有要素添加到MongoDB中
  17. for (int i = 0; i < feaCount; i++)
  18. {
  19. //使用Ogr库将矢量要素的空间信息转成Json格式
  20. Feature fea = lyr.GetFeature(i);
  21. Geometry geo = fea.GetGeometryRef();
  22. string json = geo.ExportToJson(null);
  23. BsonDocument doc = new BsonDocument();
  24. //将Json格式的空间信息存到Collection中
  25. //BsonValue bs = BsonValue.Create(json);                  //这种方法是不可以的,添加到库里之后无法使用空间查询语句查询
  26. BsonValue bs2 = BsonDocument.Parse(json);               //这种方法才是正确的
  27. //doc.Add(new BsonElement("geom", bs));
  28. doc.Add(new BsonElement("geo",bs2));
  29. //通过循环将所有字段的属性信息存入Collection中
  30. for (int j = 0; j < fieldCount; j++)
  31. {
  32. string tmpFieldVal = fea.GetFieldAsString(j);
  33. doc.Add(new BsonElement(fieldNames[j],tmpFieldVal));
  34. }
  35. var res  = colSheng.Insert<BsonDocument>(doc);
  36. }
 
然后,可以查看一下存储到MongoDB中的矢量数据是什么样的
在命令行中输入:
  1. > db.sheng.find().limit(1)
结果为
  1. { "_id" : ObjectId("5371bf4e1dbba31914224563"), "geo" : { "type" : "Polygon", "coordinates" : [ [ [ 89.8496, 14.093 ], [ 90.3933, 14.004 ], [ 90.2708, 13.4708 ], [ 89.7284, 13.5597 ], [ 89.8496, 14.093 ] ] ] }, "pyname" : "sx", "boxtype" : "inter", "date" : "2012/6/5 12:41:42" }
可以看到名称为geo的这个Field,里边存的就是矢量要素的坐标信息
 
空间查询与空间索引
可用的空间操作包括geointersect,geowithin,near等,参考http://docs.mongodb.org/manual/reference/operator/query-geospatial/
这里使用geointersect为例说明一下:

  1. //获取Collection
  2. MongoDatabase db = server.GetDatabase("aa");
  3. MongoCollection colSheng = db.GetCollection("sheng");
  4. //定义一个查询框或查询多边形
  5. var poly = GeoJson.Polygon<GeoJson2DCoordinates>(
  6. GeoJson.Position(100, 20),
  7. GeoJson.Position(110, 20),
  8. GeoJson.Position(110, 40),
  9. GeoJson.Position(100, 40),
  10. GeoJson.Position(100, 20));
  11. //以这个查询多边形为条件定义一条查询语句
  12. var queryFilter2 = Query.GeoIntersects("geo", poly);
  13. //进行查询,输出MongoCursor
  14. cur = colSheng.FindAs<BsonDocument>(queryFilter2).SetFields( "pyname", "date");
  15. //获取结果
  16. var res = cur.ToArray();
  17. for (int i = 0; i < res.Count(); i++)
  18. {
  19. BsonDocument tmpDoc = res.ElementAt(i);
  20. //do something you want
  21. }
关于空间索引,可参考http://docs.mongodb.org/manual/applications/geospatial-indexes/
这里不详细说了
 
空间查询运算的问题:
在使用GeoIntersect进行空间查询时,遇到了查询结果与ArcGIS不一致的情况,详细看了一下,像是MongoDB的一个BUG(目前使用的是2.6.0版本)
具体信息如下(在命令行中操作):
 
Collection中的坐标

  1. > db.test.find()
  2. { "_id" : ObjectId("535884771dbba31858ad2101"), "geo" : { "type" : "Polygon", "coordinates" : [ [ [ 96.722, 38.755 ], [ 97.3482, 38.6922 ], [ 97.1674, 38.0752 ], [ 96.5474, 38.1383 ], [ 96.722, 38.755 ] ] ] } }

使用的查询语句

  1. > db.test.find({ "geo" : { "$geoIntersects" : { "$geometry" : { "type" : "Polygon", "coordinates" : [[[91.0, 33.0], [102.0, 33.0], [102.0, 38.0], [91.0, 38.0], [91.0, 33.0]]] } } } })

查询结果:

  1. { "_id" : ObjectId("535884771dbba31858ad2101"), "geo" : { "type" : "Polygon", "coordinates" : [ [ [ 96.722, 38.755 ], [ 97.3482, 38.6922 ], [ 97.1674, 38.0752 ], [ 96.5474, 38.1383 ], [ 96.722, 38.755 ] ] ] } }

但可以看到,collection中只有一条记录,且该记录所有点的Y坐标均大于38.0,为什么查询结果里,这条记录与语句中的Box相交呢。。。很奇怪
因为有这样的问题,所以还不放心直接将空间查询用于实际应用,而是通过一种变通的方法进行简单的空间查询,测试后发现,可能是由于空间索引的问题,这种方式查询比自带的GeoIntersects方法要快

 
大致思路为:为每一条记录均生成一个最小外接矩形,得到其xmax,xmin,ymax,ymin四个边界值,用数值的形式保存至Collection中,每次进行空间查询时,首先通过最小外接矩形进行一次筛选,判断这些最小外接矩形与查询语句中多边形的最小外接矩形之间的关系,如果相交,那么进行第二步判断,通过Ogr组件判断实际的多边形是否相交,返回最后结果
首先是生成最小外接矩形的代码:

  1. //获取Collection
  2. MongoDatabase db = server.GetDatabase("aa");
  3. MongoCollection colsheng= db.GetCollection("sheng");
  4. //查询所有记录
  5. var cur = colsheng.FindAllAs<BsonDocument>();
  6. long totalCount = cur.Count();
  7. //遍历所有记录
  8. for (int i = 0; i <= totalCount/1000; i++)
  9. {
  10. if (i * 1000 >= totalCount) continue;
  11. int skip = i * 1000;
  12. var cur2 = cur.Clone<BsonDocument>().SetSkip(skip).SetLimit(1000);
  13. var lst = cur2.ToArray();
  14. for (int j = 0; j < lst.Count(); j++)
  15. {
  16. //获取一条记录对应的BsonDocument
  17. BsonDocument doc = lst[j];
  18. var id = doc["_id"];                    //该记录对应的ID
  19. BsonDocument geo = doc["geo"].ToBsonDocument();
  20. string geostr = geo[1].ToString();        //该记录对应空间信息的Json字符串
  21. List<double> coords = GetCoordLstFromString(geostr);        //解析Json串,获得所有点的坐标(这里子函数就省略了)
  22. double xmin = 181, xmax = -181, ymin = 91, ymax = -91;        //四个边界值,由于图层为经纬度,所以初值设为这些值
  23. //计算最大最小值
  24. for (int k = 0; k < coords.Count; k++)
  25. {
  26. if (k % 2 == 0)
  27. {
  28. if (coords[k] < xmin) xmin = coords[k];
  29. if (coords[k] > xmax) xmax = coords[k];
  30. }
  31. else
  32. {
  33. if (coords[k] < ymin) ymin = coords[k];
  34. if (coords[k] > ymax) ymax = coords[k];
  35. }
  36. }
  37. //将最大最小值写入Collection
  38. var tmpQuery = Query.EQ("_id", id);
  39. var tmpUpdate = MongoDB.Driver.Builders.Update.Set("xmax", xmax);
  40. var tmpres = col02c.Update(tmpQuery, tmpUpdate);
  41. tmpUpdate = MongoDB.Driver.Builders.Update.Set("xmin", xmin);
  42. tmpres = col02c.Update(tmpQuery, tmpUpdate);
  43. tmpUpdate = MongoDB.Driver.Builders.Update.Set("ymax", ymax);
  44. tmpres = col02c.Update(tmpQuery, tmpUpdate);
  45. tmpUpdate = MongoDB.Driver.Builders.Update.Set("ymin", ymin);
  46. tmpres = col02c.Update(tmpQuery, tmpUpdate);
  47. }
  48. }
 
然后是查询的代码:

  1. //获取Collection
  2. MongoDatabase db = server.GetDatabase("aa");
  3. MongoCollection colSheng = db.GetCollection("zy02c");
  4. //第一步,通过四边界筛选,
  5. var query = Query.And(Query.GT("xmax", 91.0), Query.LT("xmin", 102.0), Query.GT("ymax", 33.0), Query.LT("ymin", 38.0));
  6. var cur = colSheng.FindAs<BsonDocument>(query);
  7. //定义第二空间运算时的条件多边形(Ogr格式的定义)
  8. Geometry queryGeoLR = new Geometry(wkbGeometryType.wkbLinearRing);
  9. queryGeoLR.AddPoint(91.0, 33.0,0);
  10. queryGeoLR.AddPoint(102.0, 33.0,0);
  11. queryGeoLR.AddPoint(102.0, 38.0,0);
  12. queryGeoLR.AddPoint(91.0, 38.0,0);
  13. queryGeoLR.AddPoint(91.0, 33.0,0);
  14. Geometry queryGeo = new Geometry(wkbGeometryType.wkbPolygon);
  15. queryGeo.AddGeometry(queryGeoLR);
  16. //循环查询到的结果
  17. var lst = cur.ToArray();
  18. for (int i = lst.Length-1; i >=0; i--)
  19. {
  20. //获取当前记录对应的BsonDocument
  21. BsonDocument doc = lst[i];
  22. var id = doc["_id"];            //当前记录的ID
  23. BsonDocument geo = doc["geo"].ToBsonDocument();
  24. string geostr = geo[1].ToString();        //当前记录对应空间信息的Json字符串
  25. //通过Json串获取坐标值,并生成对应的Geometry对象
  26. List<double> coords = GetCoordLstFromString(geostr);
  27. Geometry resGeoLR = new Geometry(wkbGeometryType.wkbLinearRing);
  28. for (int j = 0; j < coords.Count / 2; j++)
  29. {
  30. resGeoLR.AddPoint_2D(coords[j], coords[j + 1]);
  31. }
  32. resGeoLR.AddPoint_2D(coords[0], coords[1]);
  33. Geometry resGeo = new Geometry(wkbGeometryType.wkbPolygon);
  34. resGeo.AddGeometry(resGeoLR);
  35. //判断是该Geometry与条件多边形是否相交
  36. if (resGeo.Intersects(queryGeo))
  37. {
  38. //do something
  39. }
  40. }

MongoDB中空间数据的存储和操作的更多相关文章

  1. MongoDB中数组类型相关的操作

    概述 在MongoDB的模式中,我们经常将一些数据存储到数组类型中,即我们常见的嵌套模式设计的一种实现方式.数组的这种设计实现方式在关系数据库中是没有或者说不常见的.所以,通过本文我们来梳理一下Mon ...

  2. 利用“海底捞算法”在MongoDB中优雅地存储一棵树

    目前常见的树形结构数据库存储方案有以下四种,但是在处理无限深度.海量数据的树结构时,都存在一些问题: 1)Adjacency List(邻接表):每个节点仅记录父节点主键.优点是简单,缺点是访问子树需 ...

  3. MongoDB地理空间数据存储及检索

    目录 1.存入地理数据 GeoJSON数据存入 1.Ponit 点数据 2.LineString 线数据(多段线) 3. Polygon 多边形数据 4.MultiPoint多点.MultiLineS ...

  4. 在MongoDB中使用JOIN操作

    SQL与NoSQL最大的不同之一就是不支持JOIN,在传统的数据库中,SQL JOIN子句允许你使用普通的字段,在两个或者是更多表中的组合表中的每行数据.例如,如果你有表books和publisher ...

  5. php操作mongodb中的ISODate格式日期

    mongodb 中数据记录的日期格式为"dateCreated" : ISODate("2011-12-20T07:22:50.836Z")经过翻阅php官网中 ...

  6. 【转载】MongoDB中的MapReduce 高级操作介绍

    转载自残缺的孤独 1.概述 MongoDB中的MapReduce相当于关系数据库中的group by.使用MapReduce要实现两个函数Map和Reduce函数.Map函数调用emit(key,va ...

  7. MongoDB中的映射,限制记录和记录拼排序 文档的插入查询更新删除操作

    映射 在 MongoDB 中,映射(Projection)指的是只选择文档中的必要数据,而非全部数据.如果文档有 5 个字段,而你只需要显示 3 个,则只需选择 3 个字段即可. find() 方法 ...

  8. Java POJO类直接存储在MongoDB中

    记录Java POJO类直接存储在MongoDB中的策略. maven: <dependency> <groupId>org.mongodb</groupId> & ...

  9. 爬取豆瓣电影TOP 250的电影存储到mongodb中

    爬取豆瓣电影TOP 250的电影存储到mongodb中 1.创建项目sp1 PS D:\scrapy> scrapy.exe startproject douban 2.创建一个爬虫 PS D: ...

随机推荐

  1. 【转载】Configure the max limit for concurrent TCP connections

    转载地址:http://smallvoid.com/article/winnt-tcpip-max-limit.html To keep the TCP/IP stack from taking al ...

  2. java中int和Integer对比的一些坑

    --------------------- 作者:狂飙的yellowcong 来源:CSDN 原文:https://blog.csdn.net/yelllowcong/article/details/ ...

  3. 利用GDI+处理图像,包括图像的的裁剪显示、转置、镜像、简单旋转、变形等。

    一.图像的裁剪显示:有时程序需要显示图像的一部分而不是全部.实例代码如下: CDC* pDC = GetDC(); Graphics graph(pDC->GetSafeHdc()); Imag ...

  4. codefirst数据迁移技术,在保留数据库数据下实现对模型的修改并映射到数据库

    一前言 这是我的处女作,写的不好的地方还望指出共同讨论.EF的数据访问方式有三种DbFirst,ModelFirst,还有本文要提到的CodeFirst 三者都是以ORM的方式建立.本人之前学习的.n ...

  5. AngularJs创建一个带参数的自定义方法

    学习这篇之前,先要从这篇<AngularJs创建自定义Service>http://www.cnblogs.com/insus/p/6773894.html 开始. 看看: app.con ...

  6. C# Enum枚举类型操作扩展类

    使用示例: using System.ComponentModel; namespace SchoolEnterpriseManageSys.Enum { /// <summary> // ...

  7. ssh连接卡在【To escape to local shell, press 'Ctrl+Alt+]'.】的解决方法

    一.现象 1.使用xshell连接远程主机的时候一直卡在To escape to local shell, press 'Ctrl+Alt+]'.,要等很久才能连上: Connecting to 19 ...

  8. Linux系统磁盘与分区管理(7)

    Linux最传统的磁盘文件系统(filesystem)使用的是EXT4格式,所以要了解文件系统就得要由认识EXT4开始,而文件系统是创建在硬盘上面的,因此我们得了解硬盘的物理组成才行,下面我们回来详细 ...

  9. CSS之浏览器默认样式问题

    今天自己写css样式时,其中用到了<ul>标签,设置了一系列效果后运行,发现位置与设置有出入.chrome上打开检查项,发现<ul>标签的styles底部多了以下一段: ul, ...

  10. D3.js的基础部分之选择集的处理 过滤器、选择集的顺序、each()和call()的应用(v3版本)

    选择集的处理 : 过滤器 有时候需要根据绑定数据对某选择集的元素进行过滤,例如某公司,只对id大于100的员工进行奖励.某学校只选拔身高超过170cm的学生等.类似这样的问题,需要根据条件获取选择集的 ...