这个实在不好起名字。写这个还不是因为被渣度坑的不要不要的。为什么说他坑呢。参考一下这两个截图的txt文档:

文档资源下载地址:  http://lbsyun.baidu.com/index.php?title=open/dev-res

或  http://lbsyun.baidu.com/index.php?title=webapi/place-suggestion-api

不知道是否看出坑的地方在哪里(请参考官方示例 http://echarts.baidu.com/demo.html#map-polygon):

1.js格式的数据不做格式化。这个我勉强可以理解。但是百度地图的demo里面使用的数据可不是这样的。所以这份文件不处理就没*用。至于这个js处理的坑点晚些再说

2.看看右边那个文档。不只是百度,从主要渠道下载的全国行政区划明细列表,都是会对于行政单位加上行政级别——例如北京市,上海市。而不是北京,上海。

3.附上官方示例上的接口API内容:

不多吐槽了。槽点实在太多。

那么进入正题,老样子,先上代码。

代码中有段非re处理的部分,用re的话大概只能写成这样。因为sub模块替换时不支持通配。

完整代码如下:

  1. import re
  2.  
  3. f = open('D:\\Users\\50255\\Desktop\\maplist.txt', encoding='utf-8')
  4. txt = f.read()
  5.  
  6. # pattern = re.compile(r'"\w{2,6}"|\d+\W\d+\W\d+\W\d+')
  7. # result = re.findall(pattern, txt)
  8.  
  9. def test_split(txt, string):
  10. if type(txt) is not str:
  11. txt = ''.join(txt)
  12. txt = re.split(string, txt)
  13. txt = ''.join(txt)
  14. return txt
  15.  
  16. def test_replace(txt, r, f):
  17. if type(txt) is not str:
  18. txt = ''.join(txt)
  19. txt = re.sub(r, f, txt)
  20. txt = ''.join(txt)
  21. return txt
  22.  
  23. txt = test_replace(txt, r'{n:"', r'{"')
  24. txt = test_replace(txt, r',g:"', r',"')
  25. txt = test_replace(txt, r'\|.{1,2}"}', r'"}')
  26. txt = re.findall(r'{"\w+",.{1,30}\d\d"}', txt)
  27. txt = test_replace(txt, r'{"', r'"')
  28. txt = test_replace(txt, r'","', r'":[')
  29. txt = test_replace(txt, r'"}', r'],\n')
  30. txt = test_replace(txt, r'":', r'市":')
  31. txt = test_replace(txt, r'市市', r'市')
  32. txt = test_replace(txt, r'区市', r'区')
  33. txt = test_replace(txt, r'州市', r'州')
  34. _txt = list(txt)
  35. for i in range(len(_txt)):
  36. if _txt[i-1] == '"' and _txt[i+1] == '州':
  37. _txt[i+1] = '州市'
  38. txt = ''.join(_txt)
  39. print(txt)
  40.  
  41. h = open('D:\\Users\\50255\\Desktop\\maplist2.txt', mode='w', encoding='utf-8')
  42. h.write(txt)

 

因为只是用了一次。所以没有对上面那一堆replace的效率优化。优化的部分只有截图那一块,那个效率实在有点看不下去。

通过内容可以看出需要替换掉的部分。而且为了保证数据的正确处理。按以下步骤执行脚本:

0.初始化

1.去除需要的数据中的键值命名 --- n:  g:

2.去除数据中不知道代表什么分类的 |12

3.取出需要的,括号内的数据

4.将数据格式化为目标样式

5.给数据加上行政区划级别

6.对于特殊的城市名称进行处理

7.输出结果

----------------------------------

百度的这份文档,绝对是为了展现程序员的核心价值。

所以你不能用文本编辑器一次性解决这个问题。

百度地图点集文档使用python的re模块处理成json的相关写法的更多相关文章

  1. 百度地图api文档实现任意两点之间的最短路线规划

    两个点之间的路线是使用“Marker”点连接起来的,目前还没找到改变点颜色的方法,测试过使用setStyle没有效果. <html><head> <meta http-e ...

  2. 利用python将excel数据解析成json格式

    利用python将excel数据解析成json格式 转成json方便项目中用post请求推送数据自定义数据,也方便测试: import xlrdimport jsonimport requests d ...

  3. 必应地图api文档,微软必应地图web开发版详解,可以在国内使用国外地图

    最近,公司项目要求在页面中嵌入地图,需求还算简单,但是由于必须具备响应式(主要是pc和移动端),而且由于公司业务是全球性的,要支持国外地点搜索.考虑到百度,腾讯,高德等等国内地图无法显示国外数据,谷歌 ...

  4. [同步到 MaixPy3 文档] 使用 Python 编程入门开源硬件项目

    本文是给有一点 Python 基础但还想进一步深入的同学,有经验的开发者建议跳过. 前言 在写这篇案例系列的时候 junhuanchen 期望能够引导用户如何成为专业的开发者,不是只会调用代码就好,所 ...

  5. Silverlight类百度文库在线文档阅读器

    百度文库阅读器是基于Flash的,用Silverlight其实也可以做. 我实现的在线阅读器可以应用于内网文档发布,在线阅览审批等.没有过多的堆积功能,专注于核心功能.主要有以下特性: 1. 基于XP ...

  6. Silverlight类百度文库在线文档阅读器(转)

    百度文库阅读器是基于Flash的,用Silverlight其实也可以做. 我实现的在线阅读器可以应用于内网文档发布,在线阅览审批等.没有过多的堆积功能,专注于核心功能.主要有以下特性: 1. 基于XP ...

  7. word文档的python解析

    主要两块,第一个是文件类型的转换,第二个是用docx包去对word文档中的table进行parse 1. 文件格式装换 因为很多各种各样的原因,至今还有一些word文档是doc的格式存的,对于这种,如 ...

  8. 地图API文档

    目录 腾讯地图API 2 1.API概览... 2 1.1 WebService API(官网注明是beta版本,可能不稳定,慎用):... 2 1.2 URL API:... 2 1.3 静态图AP ...

  9. C# 读取ini文件 百度问问学习文档

    C# 读取ini文件 10 有多个section,现想读取整个ini文件和指定section下所有内容 补充: 发布答案可以,请对准题目啊,我不要指定节点的内容,我知道!我要的是读取指定区域的内容,假 ...

随机推荐

  1. ANDROID基础ACTIVITY篇之Activity的加载模式

    在这之前首先让我们先了解一下什么是Task Task,简单的说,就是一组以栈的模式聚集在一起的Activity组件集合.它们有潜在的前后驱关联,新加入的Activity组件,位于栈顶,并仅有在栈顶的A ...

  2. window下安装Apache+PHP

    本地系统为windows 10,Apache选择httpd-2.4.25-x64-vc14-r1,PHP选择php7.1_x64线程安全版. 1.安装Apache 将apache解压到c:/serve ...

  3. 自己动手修改Robotium代码(上)

    Robotium作为Android自动化测试框架,还有许多不完善的地方,也不能满足测试人员的所有要求.那么,本文以四个实际中碰到的问题为例,介绍改动Robotium源码的过程. public bool ...

  4. 【YFMemoryLeakDetector】人人都能理解的 iOS 内存泄露检测工具类

    背景 即使到今天,iOS 应用的内存泄露检测,仍然是一个很重要的主题.我在一年前,项目中随手写过一个简单的工具类,当时的确解决了大问题.视图和控制器相关的内存泄露,几乎都不存在了.后来想着一直就那个工 ...

  5. 《用Java写一个通用的服务器程序》03 处理新socket

    在讲监听器时说过处理的新的socket要尽快返回,监听器调用的是ClientFactory的createPhysicalConnection方法,那么就来看这个方法: public boolean c ...

  6. test only

    Test TinyMCE only , Test Link

  7. scrapy初试水 day02(正则提取)

    1.处理方式 法一 通过HtmlXPathSelectorimport scrapyfrom scrapy.selector import HtmlXPathSelectorclass DmozSpi ...

  8. 实践作业1:测试管理工具实践 Day3

    1.Vertrigoserv启动后,首先要配置apache,则需要修改监听端口,不要出现端口冲突2.配置mysql,在mysql console中输入密码vertrigo3.在浏览器中输入http:/ ...

  9. 《Linux命令行与shell脚本编程大全》第二十六章 一些有意思的脚本

    26.1 发送消息 26.1.1 功能分析 1.确定系统中都有谁 $who 给出的信息包括用户名 用户所在终端 用户登入系统的时间 2.启用消息功能 用户可以禁止别人给我发消息,所以需要先检查一下是否 ...

  10. 微信公众平台创建自定义菜单的PHP代码

    授人以鱼不如授人以渔.在方倍工作室上问了一下,创建自定义菜单的代码多少钱,一张口就一百,好吧,那我就给你们一人省一百块钱吧,你们说该如何谢谢我?事先说明一下啊,你的PHP版本要高于4.0.2才支持cU ...