一、初识正则表达式

正则表达式 是一个特殊的字符序列,一个字符串是否与我们所设定的这样的字符序列,相匹配

快速检索文本、实现替换文本的操作

json(xml) 轻量级 web 数据交换格式

  1. import re
  2.  
  3. a='C|C++|Java|C#||Python|Javascript'
  4.  
  5. r= re.findall('Python',a)
  6. print(r)
  7.  
  8. if len(r) > 0:
  9. print('字符串中包含Python')
  10. else:
  11. print('No')
  12.  
  13. ['Python']
  14. 字符串中包含Python

二、元字符与普通字符

  1. import re
  2.  
  3. a='C0C++7Java8C#9Python6Javascript'
  4.  
  5. r= re.findall('\d',a)
  6. print(r)
  7.  
  8. b=''
  9. for x in a:
  10. try:
  11. int(x)
  12. b +=x+','
  13. except :
  14. pass
  15.  
  16. print(b)
  17.  
  18. 结果:
  19. ['', '', '', '', '']
  20. 0,7,8,9,6,
'Python' 普通字符 '\d' 元字符
 

三、字符集

  1. import re
  2.  
  3. #找出中间一个字符不是C 和F的 单词
  4. s = 'abc, acc, adc, aec, afc, ahc'
  5.  
  6. r = re.findall('a[^cf]c', s) #[a-z] [cf]
  7. print(r)
  8.  
  9. 结果:
  10. ['abc', 'adc', 'aec', 'ahc']

四、概括字符集

  1. #\d 数字 \D 字母
  2. #\w 数字和字母 =[a-zA-Z0-9_] \W
  3. #\s 空白字符 \S
  4. a='python 11\t11java&678p\nh\rp'
  5.  
  6. r = re.findall('\s', a)
  7. print(r)
  8.  
  9. 结果:
  10. [' ', '\t', '\n', '\r']

五、数量词

  1. a='python 1111java&678php'
  2.  
  3. r = re.findall('[a-z]{3,6}', a)
  4. print(r)
  5.  
  6. 结果:
  7. ['python', 'java', 'php']

六、贪婪与非贪婪

  1. a='python 1111java&678php'
  2.  
  3. r = re.findall('[a-z]{3,6}?', a)
  4. #贪婪 与 非贪婪 ?
  5.  
  6. print(r)
  7.  
  8. 结果:
  9. ['pyt', 'hon', 'jav', 'php']

七、匹配0次1次或者无限多次

  1. # * 匹配0次或者无限多次
  2. # + 匹配1次或者无限多次
  3. # ? 匹配0次或者1次
  4.  
  5. a='pytho0python1pythonn2pythonw'
  6.  
  7. r = re.findall('python*', a)
  8.  
  9. print(r)
  10.  
  11. 结果:
  12. ['pytho', 'python', 'pythonn', 'python']

八、边界匹配符

  1. qq = ''
  2. # 4~8
  3. r = re.findall('^\d{4,8}$', qq)
  4. print(r)
  5.  
  6. a = ''
  7. # 4~8 ^规则$ ^开头 $结尾
  8. e = re.findall('^\d{4,8}$', a)
  9. print(e)
  10.  
  11. 结果:
  12. ['']
  13. []

九、组

  1. # () 组
  2.  
  3. a = 'pythonpythonpythonpythonpython'
  4. #
  5. r = re.findall('(python){3}', a)
  6. print(r)
  7.  
  8. 结果:
  9. ['python'] 代表存在一组(pythonpythonpython 这样的数据

十、匹配模式参数

  1. # I | S 忽略大小写 | 匹配所有字符
  2.  
  3. lanuage = 'PythonC#\nJavaPHP'
  4.  
  5. r = re.findall('c#.{1}', lanuage,re.I | re.S)
  6.  
  7. print(r)
  8.  
  9. 结果:
  10. ['C#\n']

十一、re.sub正则替换

搜索替换

  1. def convert(value):
  2. matched = value.group()
  3. # print(value) <_sre.SRE_Match object; span=(6, 8), match='C#'>
  4. return '!!'+matched+'!!'
  5.  
  6. lanuage = 'PythonC#JavaC#PHPC#'
  7.  
  8. # r = re.sub('C#', 'GO', lanuage, 1) 返回结果: PythonGOJavaC#PHPC#
  9. # s=lanuage.replace('C#', 'GO')
  10. r = re.sub('C#', convert, lanuage) #传入参数
  11. print(r)
  12.  
  13. 结果:
  14. Python!!C#!!Java!!C#!!PHP!!C#!!

十二、把函数作为参数传递

  1. def convert(value):
  2. matched = value.group() #拿到对象的值
  3. # print(value) <_sre.SRE_Match object; span=(6, 8), match='C#'>
  4. if int(matched) >=6 :
  5. return ''
  6. else:
  7. return ''
  8.  
  9. lanuage = 'A8C3721D86'
  10.  
  11. r = re.sub('\d', convert, lanuage)
  12. print(r)
  13.  
  14. #
  15. A9C0900D99

十三、search与match函数

  1. s = 'A8C3721D86'
  2. # None 从开头开始匹配 假如没有找到相应的匹配结果 返回None 只匹配一次
  3. r = re.match('\d', s)
  4. print(r) #None
  5.  
  6. #搜索这个字符串 一旦找到第一个满足匹配的结果就返回 只匹配一次
  7. r1 = re.search('\d', s)
  8. print(r1) #<_sre.SRE_Match object; span=(1, 2), match='8'>
  9. print(r1.group()) #
  10. print(r1.span()) # (1, 2)
  11.  
  12. r2 = re.findall('\d', s)
  13. print(r2) #['8', '3', '7', '2', '1', '8', '6']

十四、group分组

  1. #提取life 和python 之间的值
  2. s = 'life is short,i use python'
  3. #None
  4. r = re.search('life.*python', s)
  5. print(r.group()) #life is short,i use python group(组号)
  6.  
  7. r = re.search('life(.*)python', s)
  8. print(r.group(0)) #life is short,i use python group(组号)
  9. print(r.group(1)) # is short,i use
  10.  
  11. #group(0) 一种特殊情况 匹配正则表达式完整的结果
  12.  
  13. r = re.findall('life(.*)python', s)
  14. print(r) #[' is short,i use ']
  1. s = 'life is short,i use python, i love python'
  2.  
  3. r = re.search('life(.*)python(.*)python', s)
  4. print(r.group(0)) # life is short,i use python, i love python
  5. print(r.group(1)) # is short,i use
  6. print(r.group(2)) # , i love
  7.  
  8. print(r.group(0,1,2)) #('life is short,i use python, i love python', ' is short,i use ', ', i love ')
  9.  
  10. print(r.groups()) # (' is short,i use ', ', i love ')

十五、一些关于学习正则的建议

  1. #\d 数字 \D 字母
  2. #\w 数字和字母 =[a-zA-Z0-9_] \W
  3. #\s 空白字符 \S
  4. # . 匹配除了换行符\n之外其他所有字符
  5. # * 匹配0次或者无限多次
  6. # + 匹配1次或者无限多次
  7. # ? 匹配0次或者1次
  8. # () 组
  9. # I | S 忽略大小写 | 匹配所有字符

python :爬虫,数据处理

十六、理解JSON

JSON  是一种轻量级的数据交换格式

字符串是JSON的表现形式

符合 JSON 格式的字符串叫做 JSON 字符串

{"name":"qiyue"}

JSON VS XML

优势:

跨语言交换数据

易于阅读

易于解析

网络传输效率高

十七、反序列化

  1. import json
  2.  
  3. # JSON object array
  4. json_str = '{"name":"qiyue","age":18}'
  5. s = json.loads(json_str)
  6.  
  7. # dict
  8. #反序列化
  9. s = json.loads(json_str) #load() 把json 的数据类型 转换为我们自己语言的数据类型
  10. print(type(s)) #<class 'dict'>
  11. print(s) #{'name': 'qiyue', 'age': 18}
  12. print(s['name']) # qiyue
  13.  
  14. json_str = '[{"name":"qiyue","age":18},{"name":"qiyue","age":18}]'
  15. s = json.loads(json_str)
  16. print(type(s)) # <class 'list'>
  17. print(s) # [{'name': 'qiyue', 'age': 18}, {'name': 'qiyue', 'age': 18}]
  1. JSON Python
  2. object dict
  3. array list
  4. string str
  5. number int
  6. number float
  7. true True
  8. false False
  9. null None

十八、序列化

  1. #序列化 为json
  2.  
  3. student = [
  4. {"name":"qiyue","age":18, 'flag':False},
  5. {"name":"python","age":18}
  6. ]
  7.  
  8. json_str = json.dumps(student)
  9. print(type(json_str)) # <class 'str'>
  10. print(json_str) #[{"name": "qiyue", "age": 18, "flag": false}, {"name": "python", "age": 18}]

十九、小谈JSON、JSON对象与JSON字符串

JSON 是一种轻量级的数据交换格式

JSON对象 局限于语言

JSON字符串

JSON 有自己的数据类型

虽然它和JavaScript  的数据类型有些相似 但是他们不是一种语言

ECMASCRIPT一个标准  JavaScript   ActionScription  JSON 实现标准的一种方案

REST 服务

Python(八) 正则表达式与JSON的更多相关文章

  1. Python的正则表达式与JSON

    Python的正则表达式需要导入re模块 菜鸟教程:http://www.runoob.com/python/python-reg-expressions.html 官方文档:https://docs ...

  2. python 历险记(六)— python 对正则表达式的使用(上篇)

    目录 引言 什么是正则表达式? 正则表达式有什么用? 正则表达式的语法及使用实例 正则表达式语法有哪些? 这些正则到底该怎么用? 小结 参考文档 系列文章列表 引言 刚接触正则表达式,我也曾被它们天书 ...

  3. Python语言中对于json数据的编解码——Usage of json a Python standard library

    一.概述 1.1 关于JSON数据格式 JSON (JavaScript Object Notation), specified by RFC 7159 (which obsoletes RFC 46 ...

  4. [python] 常用正则表达式爬取网页信息及分析HTML标签总结【转】

    [python] 常用正则表达式爬取网页信息及分析HTML标签总结 转http://blog.csdn.net/Eastmount/article/details/51082253 标签: pytho ...

  5. Python 进阶 - 正则表达式

    1. 正则表达式基础 1.1. 简单介绍 正则表达式并不是Python的一部分.正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如str自带的方法,但功能十 ...

  6. python study - 正则表达式

    第 7 章 正则表达式 7.1. 概览 7.2. 个案研究:街道地址 7.3. 个案研究:罗马字母 7.3.1. 校验千位数 7.3.2. 校验百位数 7.4. 使用 {n,m} 语法 7.4.1. ...

  7. python使用正则表达式文本替换

    2D客户端编程从某种意义上来讲就是素材组织,所以,图片素材组织经常需要批量处理,python一定是最佳选择,不管是win/linux/mac都有一个简单的运行环境 举两个应用场景: 如果不是在某个文件 ...

  8. python的正则表达式 re

    python的正则表达式 re 本模块提供了和Perl里的正则表达式类似的功能,不关是正则表达式本身还是被搜索的字符串,都可以是Unicode字符,这点不用担心,python会处理地和Ascii字符一 ...

  9. Python之正则表达式(re模块)

    本节内容 re模块介绍 使用re模块的步骤 re模块简单应用示例 关于匹配对象的说明 说说正则表达式字符串前的r前缀 re模块综合应用实例 正则表达式(Regluar Expressions)又称规则 ...

随机推荐

  1. Object-C,数组NSArray

    晚上回来,写了2个iOS应用程序. 就是在界面中,展示标签.一种是手动构造界面,然后绑定事件.另外一种是,使用自带的界面作为容器,但是手动向里面放其它界面元素. 书中的观点是,使用图形化界面,构造界面 ...

  2. 题解 洛谷 P3376 【【模板】网络最大流】

    本人很弱,只会Dinic.EK与Ford-Fulkerson...(正在学习ISAP...) 这里讲Dinic... Dinic:与Ford-Fulkerson和的思路相似(话说好像最大流求解都差不多 ...

  3. shell的通俗理解

    (引自:https://zhidao.baidu.com/question/557066905.html) [一] shell的含义: 首先shell的英文含义是“壳”: 它是相对于内核来说的,因为它 ...

  4. 通过案例快速学会Picasso图片缓存库

    picasso是Square公司开源的一个Android图形缓存库,官网地址http://square.github.io/picasso/,可以实现图片下载和缓存功能.        下载地址:ht ...

  5. 黑马程序猿-----Java之你不得不知道的排序

    ------<a href="http://www.itheima.com" target="blank">Java培训.Android培训.iOS ...

  6. python Flask 学前班

    0.Flask简单介绍     Flask是一个用Python编写的轻量级的Web应用框架.本文第一部分将简单解说Flask的安装,接着展示一个Flask的样例,第一个样例非常easy但也存在缺陷-- ...

  7. hdoj--5562--Clarke and food(模拟)

    Clarke and food Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/65536 K (Java/Others) ...

  8. 23.STL容器小结

  9. spring boot 集成 mybatis,数据库为mysql

    导入mven工程即可运行,方法不描述了,具体见 https://github.com/davidwang456/spring-boot-mybatis-demo

  10. CUDA笔记13

    在新的环境上用CUTIL的时候,出现了问题.无法解析的外部符号 __imp_cutCheckCmdLineFlag 问题描述: kernel.cu.obj : error LNK2019: 无法解析的 ...