Python正则表达式使用

参考资料:

Python正则表达式| 菜鸟教程

Python正则表达式详解 - 我当道士那儿些年 - 博客园

前言

由于遇到一个提取字符串某个子串的问题,刚开始使用了暴力方法求解,后面在舍友大佬帮助下,使用了正则表达式来提取,质量明显高了一档。详细的方法,以及详细的参数教程里都已叙述的非常详尽,这里主要介绍一下遇到问题以及解决问题的方案。

问题描述

  1. '''Obtaining JSON from switch...
  2. Done
  3. Control utility for runtime P4 table manipulation
  4. RuntimeCmd: dmac [implementation=None, mk=ethernet.dstAddr(exact, 48)]
  5. mcast_src_pruning [implementation=None, mk=standard_metadata.instance_type(exact, 32)]
  6. smac [implementation=None, mk=ethernet.srcAddr(exact, 48)]
  7. sad [implementation=None, mk=ethernet.srcAddr(exact, 48)]
  8. RuntimeCmd: '''

从上述字符串中提取出,dmacmcast_src_pruningsmacsad

问题解决

可以观察到需提取的字符串都有一个特点,都是介于RuntimeCmd,且后面都有跟着一个[xxx],所以我们也从这里入手。

下面给出具体代码以及具体的正则解释

  1. import re
  2. str = '''Obtaining JSON from switch...
  3. Done
  4. Control utility for runtime P4 table manipulation
  5. RuntimeCmd: dmac [implementation=None, mk=ethernet.dstAddr(exact, 48)]
  6. mcast_src_pruning [implementation=None, mk=standard_metadata.instance_type(exact, 32)]
  7. smac [implementation=None, mk=ethernet.srcAddr(exact, 48)]
  8. sad [implementation=None, mk=ethernet.srcAddr(exact, 48)]
  9. RuntimeCmd: '''
  10. # flag = 0
  11. # table_name = []
  12. # name = ''
  13. # for i in str:
  14. # if i == 'R':
  15. # flag = 1
  16. # print flag
  17. # elif i == ' ' and flag == 1:
  18. # flag = 2
  19. # print flag
  20. # elif flag == 2 and i != ' ':
  21. # name = name + i
  22. # print flag
  23. # elif flag == 2 and i == ' ':
  24. # table_name.append(name)
  25. # name = ''
  26. # flag = 3
  27. # print flag
  28. # elif flag == 3 and i == '\n':
  29. # flag = 2
  30. # print i
  31. # print table_name
  32. matchObj = re.findall('(\S+)(?=[\s]*\[.*\])', str, re.M | re.I)
  33. print matchObj

上面注释掉的代码为暴力解法,下列则为正则表达式求解,具体函数功能可查找参考文献,这里介绍正则表达式,即(\S+)(?=[\s]*\[.*\])这个串。

第一个()内部的数据则是所需提取的数据,\S表示非空字符,+表示非空字符至少出现一次,(?=)表示前向肯定界定符,表示之后所连着的语句是什么,\s表示空字符,[\s]*表示非空字符出现大于等于0次,由于[是特殊字符,所以需要加\进行转义,.表示任意字符,.+则表示任意语句,\]则与前面的[一样,需要进行转义。通过此正则表达式,则可成功提取出我们所需的数据。

  1. ['dmac','mcast_src_pruning','smac','sad']

为一个list对象,成功提取。

Python正则表达式使用的更多相关文章

  1. Python 正则表达式入门(中级篇)

    Python 正则表达式入门(中级篇) 初级篇链接:http://www.cnblogs.com/chuxiuhong/p/5885073.html 上一篇我们说在这一篇里,我们会介绍子表达式,向前向 ...

  2. Python正则表达式中的re.S

    title: Python正则表达式中的re.S date: 2014-12-21 09:55:54 categories: [Python] tags: [正则表达式,python] --- 在Py ...

  3. Python 正则表达式入门(初级篇)

    Python 正则表达式入门(初级篇) 本文主要为没有使用正则表达式经验的新手入门所写. 转载请写明出处 引子 首先说 正则表达式是什么? 正则表达式,又称正规表示式.正规表示法.正规表达式.规则表达 ...

  4. python正则表达式re

    Python正则表达式: re 正则表达式的元字符有. ^ $ * ? { [ ] | ( ).表示任意字符[]用来匹配一个指定的字符类别,所谓的字符类别就是你想匹配的一个字符集,对于字符集中的字符可 ...

  5. Python正则表达式详解

    我用双手成就你的梦想 python正则表达式 ^ 匹配开始 $ 匹配行尾 . 匹配出换行符以外的任何单个字符,使用-m选项允许其匹配换行符也是如此 [...] 匹配括号内任何当个字符(也有或的意思) ...

  6. 比较详细Python正则表达式操作指南(re使用)

    比较详细Python正则表达式操作指南(re使用) Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式.Python 1.5之前版本则是通过 regex 模块提供 E ...

  7. Python正则表达式学习摘要及资料

    摘要 在正则表达式中,如果直接给出字符,就是精确匹配. {m,n}? 对于前一个字符重复 m 到 n 次,并且取尽可能少的情况 在字符串'aaaaaa'中,a{2,4} 会匹配 4 个 a,但 a{2 ...

  8. python正则表达式 小例几则

    会用到的语法 正则字符 释义 举例 + 前面元素至少出现一次 ab+:ab.abbbb 等 * 前面元素出现0次或多次 ab*:a.ab.abb 等 ? 匹配前面的一次或0次 Ab?: A.Ab 等 ...

  9. Python 正则表达式-OK

    Python正则表达式入门 一. 正则表达式基础 1.1. 简单介绍 正则表达式并不是Python的一部分. 正则表达式是用于处理字符串的强大工具, 拥有自己独特的语法以及一个独立的处理引擎, 效率上 ...

  10. Python天天美味(15) - Python正则表达式操作指南(re使用)(转)

    http://www.cnblogs.com/coderzh/archive/2008/05/06/1185755.html 简介 Python 自1.5版本起增加了re 模块,它提供 Perl 风格 ...

随机推荐

  1. python第三十八课——面向对象(一)

    1.面向对象:(思想) 面向:看.关注.瞅 对象:个体.实体.实例.结果单词:object在python中一些皆对象 面向过程:(思想) 面向:看.关注.瞅 过程:经过.经历.从头到尾 使用一些生活中 ...

  2. Swift 并行编程现状和展望 - async/await 和参与者模式

    这篇文章不是针对当前版本 Swift 3 的,而是对预计于 2018 年发布的 Swift 5 的一些特性的猜想.如果两年后我还记得这篇文章,可能会回来更新一波.在此之前,请当作一篇对现代语言并行编程 ...

  3. snmpwalk,iptables

    -A RH-Firewall-1-INPUT -i lo -j ACCEPT -A INPUT -s 1.1.1.1 -p udp -d 2.2.2.2 --dport 161 -j ACCEPT - ...

  4. 汇编 for循环

    知识点: for循环生成代码1 for循环生成代码2 inc指令 一.一般情况下的for循环汇编代码分析 ;i<=;i++) { printf("%d,",i); } ...

  5. 51nod 小朋友的笑话

    链接 分析: 每次操作把以前没有出现这个数的设为1,有这个数的设为0.首先将当前区间设为1,考虑有set维护这个颜色出现的区间,然后把所有与当前区间相交的拿出来,修改为0. 复杂度?每次操作的线段只会 ...

  6. libgdx学习记录18——Box2d物理引擎

    libgdx封装了Box2D物理引擎,通过这个引擎能够模拟物理现实,使设计出的游戏更具有真实感. libgdx中,Box2d程序的大概过程: 1. 创建物理世界world,并设置重力加速度. 2. 创 ...

  7. Markdown 入门指南

    导语: Markdown是一种轻量级的标记语言,语法简单,学习成本不算太高,但确实可以让你专注于文字,不用太分心与排版等等. Markdown 官方文档 这里可以看到官方的Markdown语法规则: ...

  8. 设计模式 笔记 责任链模式 chain of responsibility

    //---------------------------15/04/25---------------------------- //Chain of responsibility 责任链----- ...

  9. flask-login 整合 pyjwt + json 简易flask框架

    现在很多框架都实现前后端分离,主要为了适应以下几个目的: 1,前后端的分离,可以使前端开发和后端开发更加分工明确,而不是后端还需要在视图模板中加入很多{% XXXX %}标签 2,是为了适应跨域调用或 ...

  10. [Direct2D开发] 从资源加载位图

    转载请注明出处:http://www.cnblogs.com/Ray1024 一.概述 Direct2D使用Windows图像处理组件 (WIC) 来加载位图.从文件加载位图的方法很简单,而且网上的教 ...