Python获取 bing 地图发布自己的 TMS 服务（二）解决海量瓦片存取问题

金字塔结构的瓦片数量有多大

以目前互联网常用的WebMecator为例

第一层：4幅256*256影像瓦片（JPG或PNG等）
第二层：42
第三层：43
依次类推
比如计算第1层至第18层的瓦片总数目(等比数列求和）91625968980个，大约916亿。存储空间估算在近百T。

瓦片直接存储在文件系统中的缺点

文件系统对文件数量、大小的限制
不易迁移、备份
等等

解决方案

这个问题本质上是对海量小数据的管理，很多互联网大厂都有比较成熟的方案，只需要根据具体情况进行选择调整即可。

单机存储

采用sqlite
存储在多个sqlite中，sqlite文件名保证了唯一性，与（row，column, level）一一对应。

（row，column, level）可以转为唯一数字，比如QuadKey，或者其他编码方式
sqlite移动与管理就比较方便。

注意sqlite单文件的大小不要太大。

集群存储

使用HDFS等网络化存储方案。

一个试验

# -*- coding: utf-8 -*-

"""下载区域影像

从第一层到指定层

多线程版

存储到sqlite中

"""

import requests

# python3的thread模块

import _thread

import random

import time

from random import random

import os.path

import QuadKey.quadkey as quadkey

import shutil

import secrets as secrets

import sqlite_util as dbutil

# 下载的最细层

tileZoom = 10

rootTileDir = "tiles_db"

# 分的db数量，采用质数

db_num = 1511

lat_min = -90

lat_max = 90

lon_min = -180

lon_max = 180

# MS doesn't want you hardcoding the URLs to the tile server. This request asks for the Aerial

# url template. Replace {quadkey}

response = requests.get("https://dev.virtualearth.net/REST/V1/Imagery/Metadata/Aerial?key=%s" % (secrets.bingKey))

# 返回结果

data = response.json()

print(data)

# grabs the data we need from the response.

# 例如：http://ecn.{subdomain}.tiles.virtualearth.net/tiles/a{quadkey}.jpeg?g=7786

tileUrlTemplate = data['resourceSets'][0]['resources'][0]['imageUrl']

# 例如：['t0', 't1', 't2', 't3']

imageDomains = data['resourceSets'][0]['resources'][0]['imageUrlSubdomains']

if (os.path.exists(rootTileDir) == False):

os.mkdir(rootTileDir)

bingTilesDir = os.path.join(rootTileDir, "bing")

if (os.path.exists(bingTilesDir) == False):

os.mkdir(bingTilesDir)

def get_tiles_by_pixel(tilePixel):

"""

下载该点之上的瓦片

:param lat:

:param lon:

:return:

"""

"""get pixel coordinates"""

# tilePixel = quadkey.TileSystem.geo_to_pixel((lat, lon), tileZoom)

# print(tilePixel)

pixel = tilePixel

geo = quadkey.TileSystem.pixel_to_geo(pixel, tileZoom)

# 计算四键

qk = quadkey.from_geo(geo, tileZoom)

# 四键

qkStr = str(qk)

#

qkArray = []

for index in range(tileZoom):

qkArray.append(qkStr[0:index + 1])

print(qkArray)

# 存放路径

for qk in qkArray:

# db位置

dbPath = "%s/%s.db" % (bingTilesDir, int(qk) % db_num )

print(dbPath)

if (os.path.exists(dbPath) == False):

# os.mkdir(dbPath)

dbutil.create_db(dbPath)

# 下载影像

if (dbutil.is_exists(dbPath, qk)):

# already downloaded

dbutil.save_images(dbPath, qk)

ok = 1

else:

print("下载中", end='')

url = tileUrlTemplate.replace("{subdomain}", imageDomains[0])

url = url.replace("{quadkey}", qk)

url = "%s&key=%s" % (url, secrets.bingKey)

response = requests.get(url, stream=True)

print(response)

dbutil.insert(dbPath, qk, response.content)

del response

# 强制睡一会，防止bing服务器限制

sleepTime = random() * 3

time.sleep(sleepTime)

# 左上为原点

tilePixelMax = quadkey.TileSystem.geo_to_pixel((lat_max, lon_max), tileZoom)

tilePixelMin = quadkey.TileSystem.geo_to_pixel((lat_min, lon_min), tileZoom)

print(tilePixelMax)

print(tilePixelMin)

tile_pixel_list = []

for x in range(tilePixelMin[0], tilePixelMax[0], 256):

for y in range(tilePixelMax[1], tilePixelMin[1], 246):

tile_pixel_list.append((x, y))

# 取决与服务器的硬件性能

thread_pause = 30

for i in range(len(tile_pixel_list)):

print("处理"+str(i))

_thread.start_new_thread(get_tiles_by_pixel,(tile_pixel_list[i],) )

if(i % thread_pause == (thread_pause-1)):

print("让正常运行的线程执行完，睡眠开始")

time.sleep(5)

print("睡眠结束")

# _thread.start_new_thread( get_tiles_by_pixel, ( ) )

print('下载完毕')

可以优化的点很多

修改线程使用方式
提高查询影像是否存在的效率
减少建立sqlite连接的次数

源码

更多的详情见小专栏文章：GIS之家小专栏

文章尾部提供源代码下载，对本专栏感兴趣的话，可以关注一波

Python获取 bing 地图发布自己的 TMS 服务（二）解决海量瓦片存取问题的更多相关文章

python获取bing地图发布自己的TMS服务（一）下载瓦片
部分结果 bing地图瓦片使用QuadKey作为命名方式. QuadKey简介如何计算quadkey 在给定level下,把行号tileY和列号tileX转换为2进制,然后行列交叉存储,再转换为4进 ...
geotrellis使用（三十一）使用geotrellis直接将GeoTiff发布为TMS服务
前言传统上我们需要先将Tiff中存储的影像等数据先切割成瓦片,而后再对外提供服务.这样的好处是服务器响应快,典型的用空间来换时间的操作.然而这样造成的问题是空间的巨大浪费,一般情况下均需要存储1-1 ...
geotrellis使用（三十二）大量GeoTiff文件实时发布TMS服务
前言在上一篇文章中我讲了如何直接将Geotiff文件发布为TMS服务,在其中只讲了单幅Geotiff的操作,其实单幅这种量级的数据对Geotrellis来说就是杀鸡焉用牛刀,Geotrellis针对 ...
获取bing每日图片
http://global.bing.com/HPImageArchive.aspx?format=xml&idx=0&n=1&mkt=en-US 其中idx表示倒数第几张图片 ...
使用Python获取Linux系统的各种信息
哪个Python版本? 当我提及Python,所指的就是CPython 2(准确的是2.7).我会显式提醒那些相同的代码在CPython 3 (3.3)上是不工作的,以及提供一份解释不同之处的备选代码 ...
获取bing图片并自动设置为电脑桌面背景（C++完整开源程序）
众所周知,bing搜索网站首页每日会更新一张图片,张张漂亮(额,也有一些不合我口味的),特别适合用来做电脑壁纸. 我们想要将bing网站背景图片设置为电脑桌面背景的通常做法是: 上网,搜索bing 找 ...
Python爬取地图瓦片
由于要在内网开发地图项目,不能访问在线的地图服务了,就想把地图瓦片下载下来,网上找了一些下载器都是需要注册及收费的,否则下载到的图都是打水印的,如下: 因为地图瓦片就是按照层级.行.列规则组织的一张张 ...
【开源程序（C++）】获取bing图片并自动设置为电脑桌面背景
众所周知,bing搜索网站首页每日会更新一张图片,张张漂亮(额,也有一些不合我口味的),特别适合用来做电脑壁纸. 我们想要将bing网站背景图片设置为电脑桌面背景的通常做法是: 上网,搜索bing 找 ...
python提取百度经验<标题,发布时间,平均流量,总流量,具体的链接>
之前想研究下怎么抓网页数据.然后就有了下面的练习了. 如有BUG.也纯属正常. 只是练习.请勿投入产品使用. #!/usr/bin/python # -*- coding: utf-8 -*- #Fi ...

随机推荐

html5 微信真机调试方法vConsole
html5 微信真机调试方法 vConsolehttps://blog.csdn.net/weixin_36934930/article/details/79870240
JVM 运行参数 & 代码监控
1.Java代码监控 JDK提供java.lang.management包, 其实就是基于JMX技术规范,提供一套完整的MBean,动态获取JVM的运行时数据,达到监控JVM性能的目的. packag ...
树莓派debian配置lamp[解决Apache不显示php网页]
Apache + MySql + Php． 1.安装Apache Apache可以用下面的命令来安装 sudo apt-get install apache2 Apache默认路径是/var/www/ ...
用c语言打印一个三角形
#define _CRT_SECURE_NO_WARNINGS#include<stdio.h>#include<string.h>#include<stdlib.h&g ...
Linux下编写-makefile-详细教程（跟我一起写-Makefile-Markdown整理版）
目录概述关于程序的编译和链接 Makefile 介绍 Makefile的规则一个演示例子 make是怎样工作的 makefile中使用变量让make自己主动推导另类风格的makefile 清 ...
VS 使用：新建项目
1.文件位置不放C盘
spark安装配置
一.下载解压二.配置 (假设已经配置了Java.Hadoop) 1.环境变量 2.spark配置进入spark安装目录,复制文件编辑spark-env.sh文件,在文件中添加如下信息(括号中路径 ...
mysql出现ERROR 1819 (HY000)的解决方法
ERROR 1819 (HY000): Your password does not satisfy the current policy requirements, 出现这个问题怎么办? 为了加强安 ...
Python 面向对象-上篇
概述面向过程:根据业务逻辑从上到下写垒代码函数式:将某功能代码封装到函数中,日后便无需重复编写,仅调用函数即可面向对象:对函数进行分类和封装,让开发“更快更好更强...” 面向过程编程最易被初学 ...
将 /u 转变为 utf-8 编码
将 /u 转变为 utf-8 编码 PHP实例: $result = {"errno":-1,"message":"\u8bbf\u95ee\u5fa ...