在线正则表达式测试 http://tool.oschina.net/regex/ 常见匹配模式 模式 描述 \w 匹配字母数字及下划线 \W 匹配非字母数字下划线 \s 匹配任意空白字符,等价于 [\t\n\r\f]. \S 匹配任意非空字符 \d 匹配任意数字,等价于 [0-9] \D 匹配任意非数字 \A 匹配字符串开始 \Z 匹配字符串结束,如果是存在换行,只匹配到换行前的结束字符串 \z 匹配字符串结束 \G 匹配最后匹配完成的位置 \n 匹配一个换行符 \t 匹配一个制表符 ^ 匹配字…
原文来自:https://www.cnblogs.com/0bug/p/8893677.html 什么是Urllib? Python内置的HTTP请求库 urllib.request          请求模块 urllib.error              异常处理模块 urllib.parse             url解析模块 urllib.robotparser    robots.txt解析模块 相比Python的变化 Python2中的urllib2在Python3中被统一移…
PyQuery 是 Python 仿照 jQuery 的严格实现.语法与 jQuery 几乎完全相同. 官方文档:http://pyquery.readthedocs.io/ 安装 1 pip install pyquery 初始化 字符串初始化 1 2 3 4 5 6 7 8 9 10 11 12 13 14 html = ''' <div>     <ul>          <li class="item-0">first item</l…
xpath简介 1.xpath使用路径表达式在xml和html中进行导航 2.xpath包含标准函数库 3.xpath是一个w3c的标准 xpath节点关系 1.父节点 2.子节点 3.同胞节点 4.先辈节点 5.后代节点 xpath语法 表达式 s说明 article  选取所有article元素的子节点 /article  选取根元素article article/a 选取所有属于article的子元素a的元素 //div  选取所有div子元素(不论出现在文档任何地方) /article/…
python正则表达式之re模块其他方法 1:search(pattern,string,flags=0) 在一个字符串中查找匹配 2:findall(pattern,string,flags=0) 找到匹配,返回所有匹配部分的列表 In [1]: import re In [2]: str1 = 'imoooc videonum = 1000' In [3]: str1.find(') Out[3]: 18 In [4]: info = re.search(r'\d+',str1) In [5…
1.正则表达式初探 用比较经典的例子,查找一段文本中的手机号码.比如对于文本"我现在用的电话是188-8888-8888,之前那个186-6666-6666已经不用了",我们想获取其中的手机号码信息,用正则表达式可以这么做呢? 正则表达式,简称为 regex,是文本模式的描述方法.例如, \d 是一个正则表达式,表示一位数字字符,即任何一位 0 到 9 的数字 .Python 使用正则表达式\d\d\d-\d\d\d\d-\d\d\d\d,来匹配3 个数字.一个短横线.4 个数字.一个…
正则表达式 正则表达式与python的关系 # 正则表达式不是Python独有的,它是一门独立的技术,所有的编程语言都可以使用正则 # 但要在python中使用正则表达式,就必须依赖于python内置的re 模块 验证手机号是否合法的小案例 while True: phone_number = input('please input your phone number : ') if len(phone_number) == 11 \ and phone_number.isdigit() \ '…
京东的注册页面,打开页面我们就看到这些要求输入个人信息的提示.假如我们随意的在手机号码这一栏输入一个11111111111,它会提示我们格式有误.这个功能是怎么实现的呢?假如现在你用python写一段代码,类似: phone_number = input('please input your phone number : ') 你怎么判断这个phone_number是合法的呢? 根据手机号码一共11位并且是只以13.14.15.18开头的数字这些特点,我们用python写了如下代码: while…
摘录 python核心编程 python的re模块允许多线程共享一个已编译的正则表达式对象,也支持命名子组.下表是常见的正则表达式属性: 函数/方法 描述 仅仅是re模块函数 compile(pattern,flags=0) 使用任何可选的标记来编译正则表达式的模式 ,然后返回一个正则表达式对象 re模块函数和正则表达式对象的方法 match(pattern,string,flags=0) 尝试使用带有可选标记的正则表达式的模式来匹配字符串,成功则返回匹配的对象,失败则返回None search…
Python中通过re模块实现了正则表达式的功能.re模块提供了一些根据正则表达式进行查找.替换.分隔字符串的函数.本文主要介绍正则表达式先关内容以及re模块中常用的函数和函数常用场景. 正则表达式基本语法 正则表达式就是使用预先定义好的特定字符以及这些特定字符的组成字符串的匹配表达式,然后利用表达式去匹配或提取字符串.因此,我们首先需要熟悉正则表达式中的特定字符以及它们的含义.用法.下面将正则表达式中的特殊字符分类介绍. 基本字符介绍 (1). 点号,表示匹配除换行"\n"外的任意1…