re模块,正则
1 re是什么
 正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方法。
 就是用来描述一类事物的规则。就是一些带有特殊含义的符号或者符号的组合.
    作用
  对字符串进行过滤
        在一堆字符串中找到你所关心的内容
        你就需要告诉计算机你的过滤规则是什么样 
  通过什么方式来告诉计算机 就通过正则表达式
2 学习正则表达式 各种符号所表示的含义  使用 re.findall(正则关系式,字符串)
    re模块的内部实现 不是python 而是调用了c库
 常用匹配模式(元字符)   取出的字符以列表的形式储存起来
  \w 字母数字下划线    \W非字母数字下划线  与前面相反
  \s 所有不可见字符    \S 可见字符
  \d 所有数字          \D所有非数字
  \A或^ 匹配字符串开头 \Z或$ 匹配字符串的结尾
  .  除了\n以外任意一个字符  当re.DOTALL被指定是可以匹配任意字符
 重复匹配
  匹配重复字符   *  +  ? {}
  * 左边的那个字符出现0次或无穷次
  + 左边的那个字符出现1次或无穷次
  ? 左边的那个字符出现0次或1次
  {m,n} 左边的字符出现最少m次 最多n次
   {0,1}相当于?  
   {0,}相当于*
   {1,}相当于+
   {m} 左边的字符必须出现m次
  贪婪匹配  .* .+ 会匹配任意长度任意的字符,会一直匹配到不满足条件为止
  非贪婪批评 .*?  .+?  用问号来阻止贪婪匹配(匹配最少满足条件的字符数)
 分组
  () 用于给正则表达式分组(group),不会改变原来的表达式逻辑意义(有没有括号之影响输出结果)
           效果 优先取出括号内的内容
     了解 括号内前面再加上 ?:  可以取消括号中的优先级
 范围匹配
  [] 字符集合 表示括号内的任意的一个符号  
   [.....]    [a-z] a~z中任意一个字符
   [^....]    [^0-9] 除了0-9之外的任意字符
  | 或 的意思 
   print(re.findall("0|1|2","1982asasa")) 取出后面字符中的0,1或2
3 re模块常用方法
    findall  ***** 返回一个列表   从左往右查找所有满足条件的字符  返回一个列表
    search   ***** 返回第一个匹配的字符串  结果封装为对象 span=(0, 5) 匹配的位置 match匹配的值
    match          匹配行首  返回值与search相同   re.match('w','w er ty')相当于re.search('^w','w er ty')
                 对于search  match 匹配的结果通过group来获取
    compile  将正则表达式 封装为一个正则对象 好处是可以重复使用这个表达式
 
subprocess模块
        sub       子
        process  进程
    什么是进程
        正在进行中的程序   每当打开一个程序就会开启一个进程
        每个进程包含运行程序所需的所有资源
        正常情况下 不可以跨进程访问数据
        但是有些情况写就需要访问别的进程数据   提供一个叫做管道的对象 专门用于跨进程通讯
    作用:用于执行系统命令
    常用方法
        run     返回一个表示执行结果的对象
        call    返回的执行的状态码
    总结  subprocess的好处是可以获取指令的执行结果
          subprocess执行指令时 可以在子进程中 这样避免造成主进程卡死
   

day20re模块 正则表达式的更多相关文章

  1. Python中的re模块--正则表达式

    Python中的re模块--正则表达式 使用match从字符串开头匹配 以匹配国内手机号为例,通常手机号为11位,以1开头.大概是这样13509094747,(这个号码是我随便写的,请不要拨打),我们 ...

  2. 【Python开发】Python之re模块 —— 正则表达式操作

    Python之re模块 -- 正则表达式操作 这个模块提供了与 Perl 相似l的正则表达式匹配操作.Unicode字符串也同样适用. 正则表达式使用反斜杠" \ "来代表特殊形式 ...

  3. sys,os,模块-正则表达式

    # *__conding:utf-8__* """"我是注释""" sys,os模块 import sysimport os pr ...

  4. Python之re模块 —— 正则表达式操作

    这个模块提供了与 Perl 相似l的正则表达式匹配操作.Unicode字符串也同样适用. 正则表达式使用反斜杠" \ "来代表特殊形式或用作转义字符,这里跟Python的语法冲突, ...

  5. Python re模块 正则表达式

    1 简介 就其本质而言,正则表达式(或 RE)是一种小型的.高度专业化的编程语言,(在Python中)它内嵌在Python中,并通过 re 模块实现.正则表达式模式被编译成一系列的字节码,然后由用 C ...

  6. s14 第5天 时间模块 随机模块 String模块 shutil模块(文件操作) 文件压缩(zipfile和tarfile)shelve模块 XML模块 ConfigParser配置文件操作模块 hashlib散列模块 Subprocess模块(调用shell) logging模块 正则表达式模块 r字符串和转译

    时间模块 time datatime time.clock(2.7) time.process_time(3.3) 测量处理器运算时间,不包括sleep时间 time.altzone 返回与UTC时间 ...

  7. re 模块 正则表达式

    re模块(正则表达式)   一.什么是正则表达式 正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方法.或者说:正则就是用来描述一类事物的规则.(在Python中)它 ...

  8. Python3 re模块(正则表达式)

    一:什么是正则? 正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方法.或者说:正则就是用来描述一类事物的规则. (在Python中)它内嵌在Python中,并通过r ...

  9. re模块正则表达式

    regular expression / regex / RE 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配.Python 自1.5版本起增加了re 模块,它提供 ...

随机推荐

  1. 洛谷 4383 [八省联考2018]林克卡特树lct——树形DP+带权二分

    题目:https://www.luogu.org/problemnew/show/P4383 关于带权二分:https://www.cnblogs.com/flashhu/p/9480669.html ...

  2. RedHat6.5安装zookeeper集群

    版本号: Redhat6.5  zookeeper-3.4.6  JDK1.8 zookeeper下载 官网下载地址:https://mirrors.tuna.tsinghua.edu.cn/apac ...

  3. php+google/baidu翻译接口

    <?php /** * @link http://www.joinf.com * @copyright Copyright (C) 2017 joinf.com. All rights rese ...

  4. XE5开发Android程序调用电话相关功能(短信息和电话) [转]

    其实都可以通过intent和URI调用系统功能.Windows程序员可以理解成是ShellExecute.这个是万金油.可以有调用各种功能.后面会介绍. 1.短信息.很简单 方法a.不使用Intent ...

  5. 代码从Polyline读取到的坐标和属性对话框显示的不一样?

    属性窗口中查询的第一个点坐标: 程序输出的各个点坐标: 差这么多? 原来是坐标系的问题,程序查询到的是世界坐标,属性窗口中是当前ucs坐标 Document doc = Application.Doc ...

  6. 在IDEA中将SpringBoot项目打包成jar包的方法

    SpringBoot项目无需依赖tomcat容器(内含)就可以发布,现在将打包步骤记录一下: 1. 打包前确认项目可以正常运行,打开Project Structure 快捷键 Ctrl+Shift+A ...

  7. PHP 遍历文件夹下的文件以及子文件夹

    // 递归的方式实现function my_dir( $dir ){ if ( !is_dir($dir) ) { return 'not dir';die(); } $files = array() ...

  8. PAT 乙级 1049 数列的片段和(20) C++版

    1049. 数列的片段和(20) 时间限制 200 ms 内存限制 65536 kB 代码长度限制 8000 B 判题程序 Standard 作者 CAO, Peng 给定一个正数数列,我们可以从中截 ...

  9. 1126 Eulerian Path (25 分)

    1126 Eulerian Path (25 分) In graph theory, an Eulerian path is a path in a graph which visits every ...

  10. 1121 Damn Single (25 分)

    1121 Damn Single (25 分) "Damn Single (单身狗)" is the Chinese nickname for someone who is bei ...