常用正则表达式RE（慕课网_Meshare

import re

str1 = 'imooc python'

# str1.find('l1')          输出：      -1

# str1.find('imooc')                  0

# str1.startswith('imooc')            True

pa = re.compile(r'imooc')             #加个r 代表是个原字符串

# pa = re.compile('imooc\n')          \n会转译成一个换行符

# type: _sre.SRE_Pattern

pa.match(str1)

ma = pa.match(str1)

# ma.span()                           (0, 5)

# ma.group()                          'imooc'

# ma.string                             'imooc python'

# ma.re                                 re.compile(r'imooc', re.UNICODE)

pa1 = re.compile(r'_')

ma1 = pa1.match('_value')

# ma1.group                          <function SRE_Match.group>

# pa                                 re.compile(r'imooc', re.UNICODE)

ma = pa.match('imooc python')

# ma.group()                         'imooc'

# pa = pa.match('imoOc python', re.I)

# type(pa)                           NoneType

pa = re.compile(r'(imooc)', re.I)    #组    大写的i

ma = pa.match(str1)

# ma.group()                           'imooc'

# ma.groups()                          ('imooc',)

# ma = re.match(r'imooc', str1)

# ma                                    <_sre.SRE_Match object; span=(0, 5), match='imooc'>

# ma.group()                            'imooc'

语法

# . 匹配任意字符 除了\n

# ma = re.match(r'a', 'a')

# ma.group()                            'a'

# ma = re.match(r'.', 'b')

# ma.group()                            'b'

# ma = re.match(r'.', '0')

# ma.group()                            '0'

# ma = re.match(r'{.}', '{a}')

# ma.group()                           '{a}'

# ma = re.match(r'{..}', '{a0}')

# ma.group()                           '{a0}'

# [...] 匹配字符集

# ma = re.match(r'{[abc]}', '{a}')

# ma.group()                             '{a}'

# ma = re.match(r'{[abc]}', '{d}')

# ma.group()                             AttributeError: 'NoneType' object has no attribute 'group'

# ma = re.match(r'{[a-z]}', '{d}')

# ma.group()                             '{d}'

# ma = re.match(r'{[a-zA-Z]}', '{D}')

# ma.group()                             '{D}'

# ma = re.match(r'{[a-zA-Z0-9]}', '{9}')

# ma.group()                             '{9}'

# ma = re.match(r'{[\w]}', '{0}')

# ma.group()                             '{0}'

# ma = re.match(r'{[\w]}', '{ }')

# ma.group()    AttributeError: 'NoneType' object has no attribute 'group'

# ma = re.match(r'{[\W]}', '{ }')

# ma.group()                            '{ }'

# ma = re.match(r'{[[\w]]}', '[0]')

# ma.group()                            AttributeError:

# ma = re.match(r'\[[\w]\]', '[0]') 要加转译字符

# ma.group()                            '[0]'

import re

# ma = re.match(r'[A-Z][a-z]', 'Aa')

# ma.group()                            'Aa'

# ma = re.match(r'[A-Z][a-z]*', 'A')

# ma.group()                             'A'

# ma = re.match(r'[A-Z][a-z]*', 'AdsfafeadcxAe') 如果出现数字是匹配不上的

# ma.group()                             'Adsfafeadcx'

# _ = 10

# _                                             10

# ma = re.match(r'[0-9]?[0-9]', '90')

# ma.group()                              '90'

# ma = re.match(r'[0-9]?[0-9]', '9')

# ma.group()                               '9'

# ma = re.match(r'[0-9]?[0-9]', '09')

# ma.group()                              '09'

# ma = re.match(r'[a-zA-Z0-9]{6}', 'abc123')

# ma.group()                              'abc123'

# ma = re.match(r'[a-zA-Z0-9]', 'abc123')

# ma.group()                              'a'

# ma = re.match(r'[a-zA-Z0-9]{6}', 'abc123__')

# ma.group()                             'abc123'

# ma = re.match(r'[a-zA-Z0-9]{6}@163.com', 'abc123@163.com')

# ma.group()                             'abc123@163.com'

# ma = re.match(r'[a-zA-Z0-9]{6, 10}@163.com', 'imoocedu@163.com')

# ma.group()                             AttributeError: 'NoneType' object has no attribute 'group'

# ma = re.match(r'[0-9][a-z]*?', '1bc')

# ma.group()                            '1'

# ma = re.match(r'[a-zA-Z0-9]+?', '1bc')

# ma.group()                            '1'

# ma = re.match(r'\Aimooc[\w]', 'imoocpython') 边界匹配

# ma.group()                            'imoocp'

# ma = re.match(r'abc|d', 'abc')

# ma.group()                            'abc'

# ma = re.match(r'[1-9]?\d$', '9')

# ma.group()                            '9'

# ma = re.match(r'[1-9]?\d|100$', '100')

# ma.group()                            '10'

# ma = re.match(r'[1-9]?\d|100$', '99')

# ma.group()                            '99'

# ma = re.match(r'[1-9]?\d|100$', '9')

# ma.group()                            '9'

# ma = re.match(r'[\w]{4, 6}@(163|126).com', 'imooc@163.com')

# ma.group()                            AttributeError: 'NoneType' object has no attribute 'group'

# ma = re.match(r'[\w]{4, 6}@(163|126).com', 'imooc@126.com')

# ma.group()                            AttributeError: 'NoneType' object has no attribute 'group'

# ma = re.match(r'<[\w]+>', '<book>')

# ma.group()                           '<book>'

# ma = re.match(r'<([\w]+>)', '<book>')

# ma.group()                          '<book>'

# ma = re.match(r'<([\w]+>)\1', '<book>')

# ma.group()                          AttributeError: 'NoneType' object has no attribute 'group'

# ma = re.match(r'<([\w]+>)\1', '<book>book>')

# ma.group()                          '<book>book>'

# ma = re.match(r'<([\w]>)[\w]+</\1', '<book>python</book>')

# ma.group()                          AttributeError: 'NoneType' object has no attribute 'group'

# ma = re.match(r'<(?P<mark>[\w]>)[\w]+</(?P=mark)', '<book>python</book>')

# ma.group()                          AttributeError: 'NoneType' object has no attribute 'group'

import re

str1 = 'imooc videonum = 100'

# str1.find('100')                     # 17

info = re.search(r'\d+', str1)

# info # <_sre.SRE_Match object; span=(17, 20), match='100'>

str1 = 'imooc videonum = 10000'

# info.group()                         # '100'

str2 = 'c++=100, java=90, python=80'

info = re.findall(r'\d+', str2)

# info                                        ['100', '90', '80']

# sum([int(x) for x in info])         270

str3 = 'imooc videonum = 10000'

info = re.sub(r'\d+', '1001', str3)

# info                                        'imooc videonum = 1001'

def add1(match):

val = match.group()

num = int(val) + 1

return str(num)

# re.sub(r'\d+', add1, str3)       'imooc videonum = 10001'

str4 = 'imooc:c c++ java python'

#不能仅仅使用空格分割

re.split(r':| ', str4)                      #['imooc', 'c', 'c++', 'java', 'python']

# str4 = 'imooc:c c++ java python,c#'

# re.split(r':| |,', str4)                ['imooc', 'c', 'c++', 'java', 'python', 'c#']

常用正则表达式RE（慕课网_Meshare_huang）的更多相关文章

慕课网：剑指Java面试-Offer直通车视频课程
慕课网:剑指Java面试-Offer直通车视频课程,一共有10个章节. 目录结构如下: 目录:/2020036-慕课网:剑指Java面试-Offer直通车 [6G] ┣━━第10章 Java常用类库与 ...
JavaScript入门--慕课网学习笔记
JAVASCRIPT—(慕课网)入门篇我们来看看如何写入JS代码?你只需一步操作,使用<script>标签在HTML网页中插入JavaScript代码.注意, <script&g ...
java网络爬虫----------简单抓取慕课网首页数据
© 版权声明:本文为博主原创文章,转载请注明出处一.分析 1.目标:抓取慕课网首页推荐课程的名称和描述信息 2.分析:浏览器F12分析得到,推荐课程的名称都放在class="course- ...
[python] 常用正则表达式爬取网页信息及分析HTML标签总结【转】
[python] 常用正则表达式爬取网页信息及分析HTML标签总结转http://blog.csdn.net/Eastmount/article/details/51082253 标签: pytho ...
常用正则表达式-copy
匹配中文:[\u4e00-\u9fa5] 英文字母:[a-zA-Z] 数字:[0-9] 匹配中文,英文字母和数字及_: ^[\u4e00-\u9fa5_a-zA-Z0-9]+$ 同时判断输入长度:[\ ...
PHP常用正则表达式汇总 [复制链接]
PHP常用正则表达式汇总 [复制链接] 上一主题下一主题离线我是小猪头法师发帖 539 加关注发消息只看楼主倒序阅读使用道具楼主发表于: 2011-06-22 更多 ...
慕课网-安卓工程师初养成-4-7 Java循环语句之 while
来源: http://www.imooc.com/code/1420 生活中,有些时候为了完成任务,需要重复的进行某些动作.如参加 10000 米长跑,需要绕 400 米的赛道反复的跑 25 圈.在 ...
Python爬虫之爬取慕课网课程评分
BS是什么? BeautifulSoup是一个基于标签的文本解析工具.可以根据标签提取想要的内容,很适合处理html和xml这类语言文本.如果你希望了解更多关于BS的介绍和用法,请看Beautiful ...
RegExp正则表达式规则以及常用正则表达式
html,body { font-family: "SF UI Display", ".PingFang SC", "PingFang SC" ...

随机推荐

KMP算法：next和nextval值计算
KMP算法的next和nextval值计算先看看next数据值的求解方法例:下标从1开始(若题中给定下标为0开始,把所有值-1即可) next数组的求解方法:根据前一个字符next,一直循环找到第 ...
dedecms发布文章排序按发布时间,不是更新时间
织梦DEDECMS5.7这个版本存在一个问题,修改文章的同时也修改了文章的发布时间,这种情况下,如果我们调用最新文章时使用按"发布日期排序",就会打乱原来我们网站上的文章的顺序. ...
Linux中的防火墙(Netfilter、Iptables、Firewalld)
目录 Netfilter Iptables iptables做本地端口转发 Firewalld Netfilter Netfilter是Linux 2.4内核引入的全新的包过滤引擎,位于Linux内核 ...
Python中的Pexpect模块的简单使用
Pexpect 是一个用来启动子程序并对其进行自动控制的 Python 模块. Pexpect 可以用来和像 ssh.ftp.passwd.telnet 等命令行程序进行自动交互.以下所有代码都是在K ...
UVA11549计算器谜题
题意: 有一个计算机只能保留数字的前n位,你有一个数字k(k<=9),反复平方后在计算机上显示的最大数字是多少. 思路: 显然这个题目是有循环节的,为什么有循环节?首先 ...
mimikatz的使用
mimikatz mimikatz是法国人Gentil Kiwi编写的一款Windows平台下的神器,它具备很多功能,其中最主要的功能是直接从 lsass.exe 进程里获取处于active状态账号的 ...
【JavaScript】Leetcode每日一题-最大整除子集
[JavaScript]Leetcode每日一题-最大整除子集 [题目描述] 给你一个由无重复正整数组成的集合 nums ,请你找出并返回其中最大的整除子集 answer ,子集中每一元素对(an ...
修复火狐主页被篡改成hao123的办法
1:问题描述: 网上下载了某绿色小工具使用,火狐浏览器的主页被篡改为 https://www.hao123.com/?tn=96895497_hao_pg,网上找了很多主页修复工具包括火狐的解决方法以 ...
检查dtd和Xschema文件限制下的xml文件是否符合的Java文件
先来xml文件: 1 <?xml version="1.0" encoding="utf-8"?> 2 <!DOCTYPE orders SY ...
排坑·ASCII码为160的空格（nbsp）
阅文时长 | 2.83分钟字数统计 | 1345.2字符『排坑·ASCII码为160的空格(nbsp)』编写人 | SCscHero 编写时间 | Wednesday, September 9, ...

常用正则表达式RE（慕课网_Meshare_huang）

常用正则表达式RE（慕课网_Meshare_huang）的更多相关文章

随机推荐

热门专题