Python——使用高德API获取指定城指定类别POI并实现XLSX文件合并

# 以下内容为原创，转载请注明出处
  1 import xlrd # 读xlsx

 import xlsxwriter # 写xlsx

 import urllib.request # url请求，Python3自带，Python2与3中urllib的区别见：http://blog.csdn.net/Jurbo/article/details/52313636

 import os # 创建output文件夹

 import glob # 获取文件夹下文件名称

 import time # 记录时间

 import json # 读取json格式文件

 # 本函数完成文件合并。单独保存是为了1.方便不同的用途；2.减少内存；3.在应用到其他网站时，可以断点续爬，降低中断风险

 def xlsx_merge(folder,header,filename):

     fileList = []

     for fileName in glob.glob(folder + "*.xlsx"):

         fileList.append(fileName)

     fileNum = len(fileList)

     matrix = [None] * fileNum

     for i in range(fileNum):

         fileName = fileList[i]

         workBook = xlrd.open_workbook(fileName)

         try:

             sheet = workBook.sheet_by_index(0)

         except Exception as e:

             print(e)

         nRows = sheet.nrows

         matrix[i] = [0]*(nRows - 1)

         nCols = sheet.ncols

         for m in range(nRows - 1):

             matrix[i][m] = [""]* nCols

         for j in range(1,nRows):

             for k in range(nCols):

                 matrix[i][j-1][k] = sheet.cell(j,k).value

     fileName = xlsxwriter.Workbook(folder + filename + ".xlsx")

     sheet = fileName.add_worksheet("merged")

     for i in range(len(header)):

         sheet.write(0,i,header[i])

     rowIndex = 1

     for fileIndex in range(fileNum):

         for j in range(len(matrix[fileIndex])):

             for colIndex in range (len(matrix[fileIndex][j])):

                 sheet.write(rowIndex,colIndex,matrix[fileIndex][j][colIndex])

             rowIndex += 1

     print("已完成%d个文件的合并"%fileNum)

     fileName.close()

 # 本函数完成获取POI

 def poi_by_adcode_poicode(folder,city_file = "city",poi_file = "poi",result_file = "result",merge_or_not = 1):

     '''要求：文件为XLSX格式表格。

             列表均在表格的第一页，且第一列为名称，第二列为编码。

             因为是创建目录，folder要求不为根目录。

             要求输入表在目录的input文件夹中，本函数将结果输出到目录下的output文件夹下

     '''

     city_file = city_file

     poi_file = poi_file

     result_file = result_file

     merge_or_not = merge_or_not

     header_full = ["id","name","type","typecode","biz_type","address","location","tel","pname","cityname","adname","rating","cost"]

     header = ["id","name","type","typecode","biz_type","address","location","tel","pname","cityname","adname"]

     offset = 25 # 实例设置每页展示10条POI（官方限定25条）

     output_folder = folder + "output/"

     # 创建输出路径

     if os.path.isdir(output_folder):

         pass

     else:

         os.makedirs(output_folder)

     # 读取列表

     city_sheet =  xlrd.open_workbook(folder+ "input/" + city_file + ".xlsx").sheet_by_index(0)

     poi_type_sheet = xlrd.open_workbook(folder+ "input/" + poi_file + ".xlsx").sheet_by_index(0)

     city_list =city_sheet.col_values(0)

     city_code_list = city_sheet.col_values(1)

     poi_type_list = poi_type_sheet.col_values(1)

     # 指示工作完成量

     total_work = (city_sheet.nrows - 1)  * (poi_type_sheet.nrows - 1)

     work_index = 1

     print(time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time())) + "：抓取开始！")

     for city_index in range(1,len(city_list)):

         for poi_type_index in range(1,len(poi_type_list)):

             workbook =xlsxwriter.Workbook(output_folder + str(city_list[city_index]) + str(poi_type_list[poi_type_index]) + ".xlsx") # 新建工作簿

             sheet = workbook.add_worksheet("result") # 新建“poiResult”的工作表

             for col_index in range(len(header_full)):

                 sheet.write(0,col_index,header_full[col_index]) # 写表头

             row_index = 1

             for page_index in range(1, 101):

                 try:

                     url = "http://restapi.amap.com/v3/place/text?&keywords=&types=" + str(poi_type_list[poi_type_index]) + "&city=" + city_code_list[city_index] + "&citylimit=true&offset=" + str(offset) + "&page="+ str(page_index) + "&key=你的key&extensions=all"

                     # 请求的结构化url地址如上，见：http://lbs.amap.com/api/webservice/guide/api/search/

                     data = json.load(urllib.request.urlopen(url))["pois"]

                     for i in range(offset):

                         for col_index in range(len(header)):

                             sheet.write(row_index, col_index, str(data[i][header[col_index]]))

                             sheet.write(row_index,len(header),str(data[i]["biz_ext"]["rating"]))

                             sheet.write(row_index,len(header) + 1,str(data[i]["biz_ext"]["cost"]))

                         row_index += 1

                 except Exception:                     break

             workbook.close()

             print(time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time())) + "：" + city_list[city_index] + " " + poi_type_list[poi_type_index] + " 已获取!进度：%.2f%%"  %(work_index / total_work *100))

             work_index += 1

     print(time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time())) + "：所有地区各类别POI获取完毕")

     if merge_or_not == 1:

         xlsx_merge(output_folder, header_full, result_file)

         print(time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time())) + "：已对文件进行合并！")

     else:

         print(time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time())) + "：未进行合并！")

     print(time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time())) + "：所有工作完成！")

 # 使用

 poi_by_adcode_poicode("E:/test/","city", "poi", "result", 1)

Python——使用高德API获取指定城指定类别POI并实现XLSX文件合并的更多相关文章

Python——使用高德API获取POI（以深圳南山医疗保健服务POI为例）
以下内容为原创,转载请注明出处. import xlwt #创建Excel,见代码行8,9,11,25,28:CMD下:运行pip install xlwt进行安装 import urllib.req ...
【poi】用POI新建一个xlsx文件【或者说将数据存入到xlsx中】/【将数据从xlsx中获取到项目中】
第一部分:写入xlsx中使用POI创建一个xlsx文件: 项目结构如下: 具体使用的POI中的 XSSFWorkbook xlsx对象 Sheet 工作簿对象 Row 行对象 Cell 单元格 ...
Python 操作Zabbix API 获取ERROR级别告警信息并打印
1.需求:有一个语音合成播报项目,要实时获取zabbix的ERROR级别以上告警信息,将该信息合成语音播报出去.(合成语音及播报已经完成) 2.现实:整理zabbix告警级别,将不太重要的告警放到ER ...
Azure DevOps Server: 使用Rest Api获取拉取请求Pull Request中的变更文件清单
需求: Azure DevOps Server 的拉取请求模块,为开发团队提供了强大而且灵活的代码评审功能.拉取请求中变更文件清单,对质量管理人员,是一个宝贵的材料.质量保障人员可以从代码清单中分析不 ...
js调用高德API获取所在当前城市
可以在js代码中直接调用API接口,获取所处当前城市信息,代码如下: <script type="text/javascript"> function getCurre ...
Python 操作Sonqube API 获取检测结果并打印
1.需求:每次Sonqube检查完毕后,需要登陆才能看到结果无法通过Jenkins发布后直接看到bug 及漏洞数量. 2.demo:发布后,可以将该项目的检测结果简单打印出来显示,后面还可以集成钉钉发 ...
高德地图API获取天气
1.建立行政区规划清单表 use edw; drop table if exists dim_prov_city_adcode; create table if not exists dim_prov ...
C/C++ Windows API——获取系统指定目录（转）
原文地址:C/C++ Windows API——获取系统指定目录经测试,在win10 VS2017中用wprintf()输出正常,SHGetSpecialFolderPath函数也正常运行但是用M ...
Python中使用高德API实现经纬度转地名
场景高德API提供给开发者们一些常用功能的接口,其中有一种叫地理/逆地理编码能实现地名查询经纬度和经纬度查地名. 实现高德API平台: https://lbs.amap.com/ 注册并登陆找 ...

随机推荐

阿里云OCR图片转换成文字识别调用
using Newtonsoft.Json; using System; using System.Collections.Generic; using System.Drawing; using S ...
禁用windows10自动更新
更换win10系统后经常会自动更新,每次关机前都会提示关机并更新选项,禁用window update后每隔几天还是会出现解决:同时禁用以下两项 Windows Update Medic Servic ...
一个简易的kmp教学并给出java实现
简单介绍一下问题给定source字符串,找出target字符串出现的首位例如 source 为“abddabddabc” target 为 “abddabc” 从第一位开始比较 |a b d ...
Web前端教程3-JavaScript教程
目录 1. JavaScript介绍 1.1. JS嵌入页面的方式 2. JS基本语法 2.1. 变量类型 2.2. 获取元素方法 2.3. 操作元素属性 2.4. innerHTML的使用 3. J ...
P1551 亲戚题解
标准并查集板子题没啥好说的,分明是白书上的(除了输入方式外一点都没改动) #include<cstdio> #include<iostream> using namespac ...
记录nodejs的writeHead
使用response.writeHead()时,如果第二个参数的值使用错误的字符时,会使整个页面被镶嵌在<pre></pre>中被传输过去. 例: response.write ...
通过java代码执行Linux命令查询声卡和显卡型号
package test; import java.io.BufferedReader; import java.io.InputStreamReader; public class ExcuteLi ...
git添加秘钥提示Key is already in use
种种原因,需要修改git账号的秘钥. 操作如下: 1.删除系统上.ssh下的known_hosts文件 (一般在这个路径下C:\Users\Administrator\.ssh)如果账号不是Admi ...
ubuntu linux 安装分区
挂载点/:主分区:安装系统和软件:大小为150G:分区格式为ext4: 挂载点/home:逻辑分区:相当于"我的文档":150G大小为硬盘剩下的; 分区格式ext4: swap:逻 ...
SVN和Git 介绍,区别,优缺点以及适用范围
SVN是Subversion的简称,是一个开放源代码的版本控制系统,支持大多数常见的操作系统.作为一个开源的版本控制系统,Subversion管理着随时间改变的数据.这些数据放置在一个中央资料档案库( ...

Python——使用高德API获取指定城指定类别POI并实现XLSX文件合并

Python——使用高德API获取指定城指定类别POI并实现XLSX文件合并的更多相关文章

随机推荐

热门专题