本文整体思路:在Python中使用Geopandas库,依次读取shp文件的每一个面状要素,获取其空间边界信息并裁剪对应的栅格影像,计算所裁剪影像Value值的众数,将其设置为对应面状要素的NewTYPE值,所有要素属性值都改好之后保存为新的shp文件。

使用Python处理空间数据确实用的不多,所以一个星期以来一直深受这个程序的折磨,官方文档、博客、谷歌、百度、论文,能用的方法都给用了,但是进度还是很慢,特别是当看到这篇博客的时候。。。好气啊。。

不过幸亏头比较铁,虽败不馁,慢慢一步一步调试找问题,一个一个解决,终于啃下了这根硬骨头。(对写程序来说,调试真的是第一法宝啊!)

好吧进入正题。。。

Pandas是一款高性能的Python数据分析库,而Geopandas是由Shapely、Fiona、PyProj、matplotlib以及其他必须的库共同构建的Pandas地理空间扩展,它既可以处理空间数据、也可以处理属性数据。看到有些博客说在读取shp文件的时候用Geopandas库,而在编辑、导出的时候用pyshp比较好,其实不然,Geopandas也提供了功能完备的导出接口,而且使用特别方便,只不过需要注意一个小的细节问题,否则就会报错。Rasterio是基于GDAL库二次封装的主要用于空间栅格数据处理的Python库,本程序需要对栅格影像进行裁剪,因此也需要引用这个库。两个库的官方文档如下,参考的时候要注意版本问题,不同的版本有些接口可能已经改变。Geopandas参考文档Rasterio参考文档

我是Windows 10系统,在Python中安装Geopandas库比较麻烦,不能用pip命令直接安装,而需要先下载Anaconda再用conda命令安装,这部分网上有很多参考资料,就不多赘述了。但是安装完成之后发现它的一些依赖库不能使用,需要pip命令将其卸载之后,再通过此地址:python依赖库下载对应的依赖库并安装就可以使用了。

本程序完整的代码如下:

# -*- coding: utf-8 -*-
from geopandas import *;
import rasterio as rio;
import rasterio.mask; # 读入矢量和栅格文件
shpdatafile='D:/PythonConda/Data/ShpData.shp'
rasterfile='D:/PythonConda/Data/Raster.tif'
out_file='D:/PythonConda/Data/OutShpData'
shpdata=GeoDataFrame.from_file(shpdatafile)
rasterdata=rio.open(rasterfile) out_shpdata = shpdata.copy()
#投影变换,使矢量数据与栅格数据投影参数一致
shpdata=shpdata.to_crs(rasterdata.crs) for i in range(0, len(shpdata)):
# 获取矢量数据的features
geo = shpdata.geometry[i]
feature = [geo.__geo_interface__]
#通过feature裁剪栅格影像
out_image, out_transform = rio.mask.mask(rasterdata, feature, all_touched=True, crop=True, nodata=rasterdata.nodata)
#获取影像Value值,并转化为list
out_list = out_image.data.tolist()
#除去list中的Nodata值
out_list = out_list[0]
out_data = []
for k in range(len(out_list)):
for j in range(len(out_list[k])):
if out_list[k][j] >=0:
out_data.append(out_list[k][j])
#求数据中的众数
if len(out_data):
counts = np.bincount(out_data)
new_type = np.argmax(counts)
else:
new_type = None
#依据众数值更改feature的NewTYPE属性值
out_shpdata.NewTYPE[i] = new_type #将属性更改过的GeodataFrame导出为shp文件
out_shpdata.to_file(out_file)

需要注意的问题:

1)两个文件需要在同一坐标系下,需要将用于裁剪的shp数据进行投影变换,将其投影参数变为栅格数据的投影参数,由以下代码实现:

shpdata=shpdata.to_crs(rasterdata.crs)

其中crs表示数据的投影参数,to_crs为投影参数转换函数。

2)裁剪函数rasterio.mask.mask的参数问题,需要传入的矢量数据为GeoJSON数据,因此读入的每一个面状feature都需要用__geo_interface__函数进行格式转换,这一步可以通过调试来查看具体的数据格式是否正确;此函数有两个返回值,第一个记录裁剪栅格的数据值,第二个记录其坐标转换信息,一般用到第一个返回值比较多;裁剪得到的栅格形状其实是一个矩形,与feature的外接矩形区域一致,只是位于feature外部的像素值默认被设置为Nodata,当然这可以通过传入的参数进行设置。

3)获取到裁剪的栅格后,通过.data来获取其Value值,但此时还不能直接用于统计分析,需要将数据转化为List,函数如下:

out_list = out_image.data.tolist()

此时还需要调试来进一步确定out_list的数据内容,发现out_list[0]才是我们真正能用到的数据值。

4)获取众数的时候需要清除Nodata值的影响,因此用for循环把out_list中的非Nodata数据再组成一个新的List,用numpy的自带函数求其众数。因为所有的编辑并不能对shpdata源数据进行改变,所以需要构建一个shpdata的copy即out_shpdata,将求得的众数赋给out_shpdata的NewTYPE,编辑完成之后再将out_shpdata导出为完整的shp文件。

5)GeoDataFrame.to_file函数可以将out_shpdata直接导出为shp文件,仅需要传入一个路径参数即可,但需要注意由于shp文件包含.shp、.shx、.dbf和.prj,因此路径只能是一个文件夹,而不能具体到.shp。如下代码所示:

out_file='D:/PythonConda/Data/OutShpData'

最后将生成的数据在Arcmap中打开,设置显示的Labels后可以看到效果如下:

至此全部完成!

Python中使用面状矢量裁剪栅格影像,并依据Value值更改矢量属性的更多相关文章

  1. python中的is判断引用的对象是否一致,==判断值是否相等

    python中的is判断引用的对象是否一致,==判断值是否相等 a = 10 b = 20 list = [1,2,3,4,5] print(a in list) print(b not in lis ...

  2. GDAL 矢量裁剪栅格

    本节将介绍如何在Python中用GDAL实现根据矢量边界裁剪栅格数据. from osgeo import gdal, gdal_array import shapefile import numpy ...

  3. C#、Python中分别是怎么实现通过字符串获取实体类的值以及给实体类赋值

    一.引入 最近遇到一个项目里面的功能,在给实体类赋值的时候,由于赋值字段是动态生成的,所以如果用常用的方法(直接实体类的名称.字段名=要赋的值),将会生成很多无用的代码,所以找到了一个通过反射的赋值与 ...

  4. Python中AND-OR的用法

    学习Python中的lambda函数的时候,才发现原来Python中的AND和OR还可以有一些别的用法.Python中的布尔逻辑计算的结果并非返回布尔值,而是返回它们相互之间的某一个.文章的部分例子来 ...

  5. 3.python中的基本概念

    注释: 单行注释 # 多行注释 """ ''' 变量: 把程序运行中产生的值,暂时存储在内存,方便后面的程序调用. 变量命名的规则: 1.用数字.字母.下划线组成. 2. ...

  6. python中的这些坑,早看早避免。

    python中的这些坑,早看早避免. 说一说python中遇到的坑,躲坑看这一篇就够了 传递参数时候不要使用列表 def foo(num,age=[]): age.append(num) print( ...

  7. python中a,b=b,a原理

    python中 a , b = b , a 可以将  a  和  b  的值交换 >>> a = 1 >>> b = 2 >>> a , b = ...

  8. python中的null值

    在一个没有接口文档的自动化测试中,只能通过抓包及查日志查看发送的信息,其中有一个接口发送的信息如下: enable_snapshot": true, "new_size" ...

  9. python中的迭代器和生成器学习笔记总结

    生成器就是一个在行为上和迭代器非常类似的对象.   是个对象! 迭代,顾名思意就是不停的代换的意思,迭代是重复反馈过程的活动,其目的通常是为了逼近所需目标或结果.每一次对过程的重复称为一次“迭代”,而 ...

随机推荐

  1. R语言学习 第十一篇:日期和时间

    R语言的基础包中提供了三种基本类型用于处理日期和时间,Date用于处理日期,它不包括时间和时区信息:POSIXct/POSIXlt用于处理日期和时间,其中包括了日期.时间和时区信息.R内部在存储日期和 ...

  2. UE4学习心得:Scene Component蓝图的一个简单应用

    Scene Component是蓝图类中一个不怎么常用的分类(特别是对于新手而言),主要是其实现的功能可以在Actor类中用相同的方法实现,使其作用显得有点多余. 笔者在使用过这个类之后发现其作用更相 ...

  3. ArrayList源码分析超详细

    ArrayList源码分析超详解 想要分析下源码是件好事,但是如何去进行分析呢?以我的例子来说,我进行源码分析的过程如下几步: 找到类:利用 IDEA 找到所需要分析的类(ztrl+N查找ArraLi ...

  4. C语言出来多久了你知道吗?

    在20世纪80年代,为了避免不同开发者使用的C语言语法的差异,美国国家标准局为C语言开发了一套完整的美国国家标准语言文法,称为ANSI C,作为C语言的初始标准.. [1] 2011年12月8日,国际 ...

  5. 适合Python的5大练手项目, 你练了么?

    在练手项目的选择上,还存在疑问?不知道要从哪种项目先下手? 首先有两点建议: 最好不要写太应用的程序练手,要思考什么更像是知识,老只会写写爬虫是无用的,但是完全不写也不行. 对于练手的程序,要注意简化 ...

  6. 卸载重装Mysql

    卸载重装前请备份数据库 卸载 sudo apt autoremove --purge mysql-server-core-5.7 清理残留 sudo rm -r /var/lib/mysql* sud ...

  7. java 保留字段volatile、transient、native、synchronized

    1.volatile Java语言提供了一种稍弱的同步机制,即volatile变量,用来确保将变量的更新操作通知到其他线程.当把变量声明为volatile类型后,编译器与运行时都会注意到这个变量是共享 ...

  8. sniffer pro 使用方法

    一.捕获数据包前的准备工作 在默认情况下,sniffer将捕获其接入碰撞域中流经的所有数据包,但在某些场景下,有些数据包可能不是我们所需要的,为了快速定位网络问题所在,有必要对所要捕获的数据包作过滤. ...

  9. sql优化总结

    在项目前期目标是确保功能能够正常运行,但是随着时间的推移,数据的增加,逻辑的复杂,导致数据查询会越来越慢,这个时候我们首先想到的应该就是尽量优化sql. sql优化常见注意点: 1.对查询进行优化,应 ...

  10. C# Linq GroupBy 分组过滤求和

    var delOrderData = orderLogList.Where(x => (x.OlStatus == 0 && x.OlUpId == null)).GroupBy ...