本文介绍基于Python中ArcPy模块，实现Excel数据读取并生成矢量图层，同时进行IDW插值与批量掩膜的方法。

1 任务需求

首先，我们来明确一下本文所需实现的需求。

现有一个记录有北京市部分PM2.5浓度监测站点在2019年05月18日00时至23时（其中不含19时）等23个逐小时PM2.5浓度数据的Excel表格文件，我们需要将其中的数据依次读入一个包含北京市各PM2.5浓度监测站点的矢量点要素图层中；随后，基于这些站点导入的23个逐小时PM2.5浓度数据，逐小时对北京市PM2.5浓度加以反距离加权（IDW）方法的插值，即共绘制23幅插值图；最后，基于已有的北京市边界矢量数据，分别对这23幅插值图加以掩膜。

在这里，包含北京市各PM2.5浓度监测站点的矢量点要素图层是基于Python基于Excel生成矢量图层及属性表信息：ArcPy得到的，如下图所示。

其中，该矢量图层还包括属性表，属性表内容包括每一个站点的编号、地理位置与中文名称，如下图所示。

而记录有北京市部分PM2.5浓度监测站点在2019年05月18日00时至23时（其中不含19时）等23个逐小时PM2.5浓度数据的Excel表格文件则如下所示，其中包括各站点在23个整点时所监测到的PM2.5浓度。

2 代码实现

了解了需求后，我们就基于Python中的ArcPy模块，进行详细代码的撰写与介绍。

这里需要说明的是：在编写代码的时候，为了方便执行，所以希望代码后期可以在ArcMap中直接通过工具箱运行，即用到Python程序脚本新建工具箱与自定义工具的方法；因此，代码中对于一些需要初始定义的变量，都用到了arcpy.GetParameterAsText()函数。大家如果只是希望在IDLE中运行代码，那么直接对这些变量进行具体赋值即可。关于Python程序脚本新建工具箱与自定义工具，大家可以查看ArcMap将Python写的代码转为工具箱与自定义工具详细了解。

上面提到需要初始定义的变量一共有十个，其中arcpy.env.workspace参数表示当前工作空间，csv_path参数表示存储有北京市2019年05月18日00时至23时（其中不含19时）逐小时PM2.5浓度数据的.csv文件，shape_file_path参数表示站点信息矢量数据文件，boundary_file_path参数表示投影后北京市边界矢量数据文件，spatial_resolution参数表示IDW插值结果栅格图的像元大小，power参数表示IDW插值时所用距离的幂指数，look_point参数表示IDW插值时所用最邻近输入采样点数量的整数值，max_distance参数表示IDW插值时对最邻近输入采样点的限制距离，单位依据地图坐标系确定；idw_result_dir参数表示IDW插值结果图层保存路径，mask_result_dir参数表示IDW插值结果图层经掩膜后保存路径。

代码的整体思路为：首先利用pd.read_csv函数读取记录有北京市部分PM2.5浓度监测站点在2019年05月18日00时至23时（其中不含19时）等23个逐小时PM2.5浓度数据的Excel表格文件数据，随后在北京市各PM2.5浓度监测站点的矢量点要素图层的属性表中新建23个列，每一个列表示该监测站点在某一时刻的浓度数据（共有23个时刻，因此共有23个列）；其次，由于矢量要素图层中的部分站点在Excel文件中并没有数据，因此需要将这些站点从矢量要素图层中删除；最后，分别利用Idw函数与ExtractByMask函数进行IDW插值与掩膜。

具体代码如下。

# -*- coding: utf-8 -*-

# @author: ChuTianjia

import copy

import arcpy

import pandas as pd

from arcpy.sa import *

arcpy.env.workspace=arcpy.GetParameterAsText(0)

csv_path=arcpy.GetParameterAsText(1)

shape_file_path=arcpy.GetParameterAsText(2)

idw_result_dir=arcpy.GetParameterAsText(8)

boundary_file_path=arcpy.GetParameterAsText(3)

mask_result_dir=arcpy.GetParameterAsText(9)

spatial_resolution=arcpy.GetParameterAsText(4)

power=arcpy.GetParameterAsText(5)

look_point=arcpy.GetParameterAsText(6)

max_distance=arcpy.GetParameterAsText(7)

csv_data=pd.read_csv(csv_path,header=0,encoding="gbk")

column_name_list=list(csv_data)

hour_column=csv_data["hour"]

pm_25_list=[[0]*len(csv_data) for i in range(csv_data.shape[1]-3)]

for i in range(3,csv_data.shape[1]):

    for index,data in csv_data.iterrows():

        pm_25_list[i-3][index]=data[i]

field_list=["hour_00","hour_01","hour_02","hour_03","hour_04","hour_05",\

            "hour_06","hour_07","hour_08","hour_09","hour_10",\

            "hour_11","hour_12","hour_13","hour_14","hour_15",\

            "hour_16","hour_17","hour_18","hour_20",\

            "hour_21","hour_22","hour_23"]

field_list_use=copy.deepcopy(field_list)

field_list_use.insert(0,"Name")

# Update the columns in the attribute table

for i in range(len(field_list)):

    arcpy.AddField_management(shape_file_path,field_list[i],"SHORT")

delete_num=0

delete_name=[]

with arcpy.da.UpdateCursor(shape_file_path,field_list_use) as cursor:

    for row in cursor:

        for column_name in column_name_list:

            if column_name==row[0]:

                for i in range(len(csv_data[column_name])):

                    row[i+1]=csv_data[column_name][i]

                    cursor.updateRow(row)

        # Find stations that without any data

        if row[0] not in column_name_list:

            cursor.deleteRow()

            delete_num+=1

            delete_name.append(row[0])

arcpy.AddWarning("Delete {0} site(s) that do not contain any data, and the site(s) name is(are):".format(delete_num))

for i in delete_name:

    arcpy.AddMessage(i)

arcpy.AddMessage("\n")

# Perform IDW interpolation

arcpy.env.extent=boundary_file_path

for i in range(len(field_list)):

    idw_result=Idw(shape_file_path,field_list[i],spatial_resolution,power,RadiusVariable(look_point,max_distance))

    idw_result_path=idw_result_dir+"\\"+"BJ_"+field_list[i]+".tif"

    idw_result.save(idw_result_path)

    arcpy.AddMessage("{0} has completed IDW interpolation.".format(field_list[i]))

# Perform mask

tif_file_list=arcpy.ListRasters("BJ_hour_*","TIF")

for raster in tif_file_list:

    mask_result=ExtractByMask(raster,boundary_file_path)

    mask_result_path=mask_result_dir+"\\"+raster.strip(".tif")+"_Mask.tif"

    mask_result.save(mask_result_path)

    arcpy.AddMessage("{0} has been masked.".format(raster.strip(".tif")))

3 运行结果

执行上述代码，如果是在ArcMap中直接通过工具箱运行，则可以看到代码运行过程中出现的提示。

例如，下图所示提示可以知道有哪几个站点是没有数据、从而被剔除的。

下图则可以显示出目前代码的运行情况。

同时，在我们设定的结果文件夹中可以看到，23小时的插值图与掩膜图都将自动生成并保存在指定文件夹。

再来看看具体的图片长什么样子。

首先查看IDW插值结果图；我们以当日10时的插值结果图为例进行查看。可以看到其已对北京市边界矢量数据所包含的矩形范围完成了插值。

接下来，查看IDW插值结果图经过掩膜后的图像；我们同样以当日10时的插值、掩膜结果图为例进行查看。可以看到，经过掩膜操作后的图像已经完全符合北京市边界矢量数据的范围。

至此，大功告成。

Python基于Excel数据加以反距离加权空间插值并掩膜图层的更多相关文章

python 读取excel数据并将测试结果填入Excel
python 读取excel数据并将测试结果填入Excel 读取一个Excel中的一条数据用例,请求接口,然后返回结果并反填到excel中.过程中会生成请求回来的文本,当然还会生成一个xml文件.具体 ...
使用python将excel数据导入数据库
使用python将excel数据导入数据库因为需要对数据处理,将excel数据导入到数据库,记录一下过程. 使用到的库:xlrd 和 pymysql (如果需要写到excel可以使用xlwt) 直接 ...
利用python将excel数据解析成json格式
利用python将excel数据解析成json格式转成json方便项目中用post请求推送数据自定义数据,也方便测试: import xlrdimport jsonimport requests d ...
Python读取Excel数据并根据列名取值
一直想将自己接触到的东西梳理一遍,可就是迈不出第一步,希望从这篇总结开始不要再做行动的矮人了. 最近测试过程中需要用到python读取excel用例数据,于是去了解和学习了下xlrd库,这里只记录使用 ...
Python读取excel 数据
1.安装xlrd 2.官网通过官网来查看如何使用python读取Excel,python excel官网: http://www.python-excel.org/ 实例: (1)Excel内容把 ...
Python 读Excel数据
一.读取Excel数据的步骤及方式: 1.打开Excel文件 data = xlrd.open_workbook(r'D:\Interface_test\test_data\测试用例.xlsx') 2 ...
python 获取excel数据自动登陆
import xlrdimport timeimport unittestfrom selenium import webdriver class u8819(unittest.TestCase): ...
python读取excel数据并以第一行标题加内容组成字典格式返回
excel结构如图所示: 代码: import xlrd ''' 通用获取excel数据 @:param path excel文件路径 @:param sheet_name excel文件里面shee ...
python中excel数据分组处理
1.场景描述因文本相似性热度统计(python版)需求中要根据故障类型进行分组统计,需要对excel进行分组后再分词统计,简单记录下,有需要的朋友可以直接拿走,不客气! 2.解决方案采用panda ...
Python读取Excel数据
今天一同学给我发来一个Excel文件,让我帮他找一些信息,打开一开 8000多条数据.自己手工处理是不可能完成的的啦.作为一名程序员,当然要用程序来处理.处理生活中的问题当然是Python最为方便啦. ...

随机推荐

HAProxy端口资源耗尽的解决办法
项目背景系统使用HAProxy为mq和部分应用的负载均衡服务.近期,瞬时流量过大,导致出现连锁反应,HA开始波动. HAProxy版本:1.6.3 问题分析心跳检测大量失败,项目状态极不稳定.观察 ...
【Azure API 管理】APIM的容量指标（Capacity）数据异常高的情况记录
问题描述 APIM从标准版降级到基础版,在没有用户使用的情况,Capacity的指标平均显示在80%以上. 这是什么异常情况呢? 问题分析 APIM的容量指标(Capacity)是 API 管理实例中 ...
C++ //set/multiset 容器 //set不可以插入重复的数字 multiset可以插入重复的数字 //ste容器构造和赋值 //set大小和交换 //set 插入和删除 //set查找和统计 //set 和 multiset 区别 //pair 对组创建 //set存放自定义数据类型 //set内置数据进行排序
1 //set/multiset 容器 //set不可以插入重复的数字 multiset可以插入重复的数字 2 //ste容器构造和赋值 //set大小和交换 //set 插入和删除 3 //set查 ...
C++ 错误具有类型“const sort”的表达式会丢失一些 const-volatile 限定符以调用“bool sort::operator ()(int,int)” 如下：环境 vs2019 内容：set内置函数排序
C++ 错误具有类型"const sort"的表达式会丢失一些 const-volatile 限定符以调用"bool sort::operator ()(int,int ...
Linux 网络编程从入门到进阶学习指南
前言大家好,我是小康.在上一篇文章中,我们探讨了 Linux 系统编程的诸多基础构件,包括文件操作.进程管理和线程同步等,接下来,我们将视野扩展到网络世界.在这个新篇章里,我们要让应用跳出单机限制, ...
新版idea配置maven注意点！！
1. maven配置首先是按要求配置了maven,关闭所有项目->自定义->所有设置配置完成之后发现新建项目下方还是显示从官方源下载maven包装器,而且在项目中出现这个配置文件可以 ...
deepin平台安装debian的cao蛋时
我在deepin系统安装别的系统的时候,一直在boot界面无法进行下一步.困扰了我好几天,最后从电脑的左侧换成了电脑的右侧(usb)接口. 终于安装成功.你是......牛(deepin)
dubbo 泛化调用场景下，如何调用下游的泛型对象入参
dubbo泛化调用时,除了java原生的collection,map泛型对象,业务自定义的泛型对象是不支持泛化调用的,无法正确的填充下游数据对象.两种解法: 泛化调用的时候把泛型具体类型的全限定类路径 ...
编码ascii码，unicode码，utf-8编码
1. ASCII ASCII 只有127个字符,表示英文字母的大小写.数字和一些符号,但由于其他语言用ASCII 编码表示字节不够,例如:常用中文需要两个字节,且不能和ASCII冲突,中国定制了GB2 ...
专访｜3DCAT如何赋能Matterverse打造3A游戏画面的Sandbox
元宇宙概念自20世纪90年代创造,在21世纪经历20年快速塑形,终于在2021年进入元年,元宇宙概念爆发,受到政府.机构.企业以及网民的高度关注,资本市场一度高涨,相关投资赛道大热. 元宇宙第一股Ro ...

Python基于Excel数据加以反距离加权空间插值并掩膜图层

1 任务需求

2 代码实现

3 运行结果

Python基于Excel数据加以反距离加权空间插值并掩膜图层的更多相关文章

随机推荐

热门专题