python正则二
在python中,我们可以使用re模块来使用正则表达式。
正则表达式使用\对特殊字符进行转义,因为python本身也是用\作为转义,所以在使用正则的时候会出现这样的情况,'python\\.org',有两个斜杠,为了避免出现这种情况,我们可以使用如下方法:
r'python\.org'
re模块一些常用的方法。
findall
以列表形式返回所有匹配的字符串,如果没有匹配的就返回一个空列表。
还可以指定字符串的开始位置和结束位置。
import re
string = "abcd2135asdfasfd3425"
re = re.compile(r'\d+')
result1 = re.findall(string)
result2 = re.findall(string,0,8) # 指定起始位置,从第一个字符到第八个字符,所以最后的数字不会匹配上
print(result1)
print(result2) 结果:
['', '']
['']
search
只要找到一个匹配结果就返回,也可以指定起始位置。
import re
string = "abcd2135asdfasfd3425"
re = re.compile(r'\d+')
result1 = re.search(string)
result2 = re.search(string,0,6) # 指定起始位置,匹配从第1个字符到第6个字符中的数字
print(result1.group())
print(result2.group()) 结果:
2135
21
match
不指定起始位置,默认匹配字符串的头部。如果没有匹配上返回None。
import re
string = "abcd2135asdfasfd3425"
re = re.compile(r'\d+')
result1 = re.match(string)
result2 = re.match(string,2,6) # 从c开始匹配,又因为match是默认匹配字符串头部,而头部是c不是数字
result3 = re.match(string,4,6) # 从2开始匹配
print(result1)
print(result2)
print(result3.group()) 结果:
None
None
21
在线正则表达式匹配网站:https://regex101.com/ 我们可以在这里进行正则表达式的调试。
如上图,首先我们选择python,其次把目标字符串放入TEST STRING下面,然后在REGULAR EXPRESSION处写正则表达式进行匹配,如果匹配上了,下面的匹配上的字符串会实时改变颜色。
练习:
匹配下面这个html里面的skuid和skuimgurl两部分内容。
import re
import requests url = "http://qwd.jd.com/fcgi-bin/qwd_searchitem_ex?skuid=26878432382%7C1658610413%7C26222795271%7C25168000024%7C11731514723%7C26348513019%7C20000220615%7C4813030%7C25965247088%7C5327182%7C19588651151%7C1780924%7C15495544751%7C10114188069%7C27036535156%7C10123099847%7C26016197600%7C10503200866%7C16675691362%7C15904713681" session = requests.session()
r = session.get(url)
html = r.text reg = re.compile(r"\"skuid\":\"(\d+)\",\s+\"\S+\s+\"skuurl\"\S+\s+\"skuimgurl\":\"(\S+)\",") # 这里是正则部分
result = reg.findall(html) # 因为我们要找到该网页中的所有的匹配的结果,所以用findall
print(result)
返回的结果如下:
[('', 'https://img11.360buyimg.com/n7/jfs/t18226/169/1318243724/390477/5b0718ff/5ac44edcNa350dbd9.jpg'),
('', 'https://img11.360buyimg.com/n7/jfs/t17461/138/1837663326/68820/5f8da5cd/5ad9b1e2N42bce837.jpg'),...........]
上面的正则部分还可以写成如下格式:
\"skuid\":\"*(\d+)\"\S\s+\"\w+\":\".*?\"skuimgurl\":\"(.*?.jpg)
在正则表达式中常用的元字符有如下:
\ 转义字符
\s 匹配空白字符
\S 匹配非空白字符
\w 匹配包括下划线的任何单词字符
\W 匹配非单词字符
\d 匹配数字
| 代表左右表达式任意匹配一个
^ 匹配字符串开始
$ 匹配字符串结尾
python正则二的更多相关文章
- python 正则,常用正则表达式大全
Nginx访问日志匹配 re.compile #re.compile 规则解释,改规则必须从前面开始匹配一个一个写到后面,前面一个修改后面全部错误.特殊标准结束为符号为空或者双引号: 改符号开始 从 ...
- 认识python正则模块re
python正则模块re python中re中内置匹配.搜索.替换方法见博客---python附录-re.py模块源码(含re官方文档链接) 正则的应用是处理一些字符串,phthon的博文python ...
- Python正则式的基本用法
Python正则式的基本用法 1.1基本规则 1.2重复 1.2.1最小匹配与精确匹配 1.3前向界定与后向界定 1.4组的基本知识 2.re模块的基本函数 2.1使用compile加速 2.2 ma ...
- python 正则使用笔记
python正则使用笔记 def remove_br(content): """去除两边换行符""" content = content.r ...
- Python正则处理多行日志一例
正则表达式基础知识请参阅<正则表达式基础知识>,本文使用正则表达式来匹配多行日志并从中解析出相应的信息. 假设现在有这样的SQL日志: SELECT * FROM open_app WHE ...
- Python正则匹配字母大小写不敏感在读xml中的应用
需要解决的问题:要匹配字符串,字符串中字母的大小写不确定,如何匹配? 问题出现之前是使用字符串比较的方式,比如要匹配'abc',则用语句: if s == 'abc':#s为需要匹配的字符串 prin ...
- Python 基础 二
Python 基础 二 今天对昨天学习的Python基础知识进行总结,学而不思则惘,思而不学则殆! 一.先对昨天学习的三大循环的使用情况进行总结: 1.while循环的本质就是让计算机在满足某一条件的 ...
- 初学Python(二)——数组
初学Python(二)——数组 初学Python,主要整理一些学习到的知识点,这次是数组. # -*- coding:utf-8 -*- list = [2.0,3.0,4.0] #计算list长度 ...
- Python学习二:词典基础详解
作者:NiceCui 本文谢绝转载,如需转载需征得作者本人同意,谢谢. 本文链接:http://www.cnblogs.com/NiceCui/p/7862377.html 邮箱:moyi@moyib ...
随机推荐
- java并发编程(8)原子变量和非阻塞的同步机制
原子变量和非阻塞的同步机制 一.锁的劣势 1.在多线程下:锁的挂起和恢复等过程存在着很大的开销(及时现代的jvm会判断何时使用挂起,何时自旋等待) 2.volatile:轻量级别的同步机制,但是不能用 ...
- RabbitMQ---5、qos内存溢出+prefetch消息堵塞问题
1.prefetch消息堵塞问题 mq是实现代码扩展的有利手段,个人喜欢用概念来学习新知识,介绍堵塞问题的之前,先来段概念的学习. ConnectionFactory:创建connection的工厂类 ...
- nvm安装最新稳定版node
安装当前最新的稳定版. nvm install stable
- linux服务器上部署jdk+tomcat+rocketmq+redis-cluster
通常我们拿到一组干净的linux服务器,需要初始化安装一些基础软件,这里一站式介绍部署jdk+tomcat+rocketmq+redis-cluster 前言:如果要在多台服务器上安装,在一台服务器上 ...
- Win10环境下Redis和Redis desktop manager 安装
1.Redis的下载地址: https://github.com/MicrosoftArchive/redis/releases/download/win-3.2.100/Redis-x64-3.2. ...
- csharp:search and Compare string
/// <summary> /// 涂聚文 /// 2011 捷为工作室 /// 缔友计算机信息技术有限公司 /// </summary> /// <param name ...
- 远景平台开发者上线,专业API免费使用
远景平台开发者上线,欢迎大伙围观使用. 在开发者中心你可以做什么? 1.管理你的应用,通过APPKEY获取在线API.使用云中的数据和地图. 2.学习API的使用,包含API参考和部分例子(目前例子很 ...
- numpy数组属性查看及断言
numpy数组属性查看:类型.尺寸.形状.维度 import numpy as np a1 = np.array([1,2,3,4],dtype=np.complex128) print(a1) ...
- 插入外置网卡端口顺序混乱--linux系统
本文皆是作者工作学习中的理解或感悟,欢迎大家提出问题,一起讨论!! 一.问题提出 一般的主板上都带有两个网卡接口,linux系统启动后一般命名为eth0,eth1,当然如果我们不对eth0与eth1进 ...
- 线性表的Java实现--链式存储(双向链表)
有了单向链表的基础,双向链表的实现就容易多了. 双向链表的一般情况: 增加节点: 删除节点: 双向链表的Java实现: package com.liuhao.algorithm; publi ...