pyhton 核心编程正则表达式习题

方案一

import re

#1. 识别下列字符串：“bat,” “bit,” “but,” “hat,” “hit,” 或 “hut”

import re

def test1(self):

    bt = 'bit|bat|but|hat|hit|hut'

    m = re.search(bt,self)

    if m is not None:

        print(m.group())

    else:

        print('not match')

test1('bat')     # bat

test1('abatbit') # bat

#2.匹配用一个空格分隔的任意一对单词，比如，名和姓

def test2(self):

    bt='(.*)\s(.*)'

    m=re.match(bt,self)

    if m is not None:

        print('您的姓是:%s'%m.group(1))

        print('您的名是:%s'%m.group(2))

        print('all is:%s'%m.group(0))

    else:print ('not match')

test2('yao ming')

# 您的姓是:yao

# 您的名是:ming

# all is:yao ming

#3. 匹配用一个逗号和一个空格分开的一个单词和一个字母。例如，英文人名中的姓和名 的首字母

def test3(self):

    bt='(.*),(.*|.*\s.*)'

    m=re.match(bt,self)

    if m is not None:

        print('您的姓是:%s'%m.group(1))

        print('您的名是:%s'%m.group(2))

        print('all is:%s'%m.group(0))

    else:print ('not match')

test3('yao,ming ming')

# 您的姓是:yao

# 您的名是:ming ming

# all is:yao,ming ming

#4. 匹配所有合法的Python标识符

def test4(self):

    role='\w.*'

    m=re.match(role,self)

    if m is not None:

        print("%s是一个合格的标示符"%m.group())

    else:

        print '%s不是一个合格的标示符'%self

# test4()

#5.请根据您(读者)本地关于地址的格式写法匹配一个街道地址(你写出的正则表达式要

   尽可能通用以匹配任意数目的表示街道名字的单词，包括类型指示)。比如，美国的街道地址使用这

   样的格式：1180 Bordeaux Drive.使你写的正则表达式尽可能通用，要求能够匹配多个单词的街道

   名字，如：3120 De la Cruz Boulevard.

def test5(self):

    role = '(\d+\s?)+(\S+\s?)+'

    m = re.match(role, self)

    if m is not None:

        print("%s是一个街道名" % m.group())

    else:

        print('%s不是一个街道名' % self)

test5('3120 De la Cruz Boulevard')

#6.匹配简单的以“www.”开头，以“.com”作结尾的Web域名，例如：www.yahoo.com.

def test6():

    role='(^www)\.(\S+)\.?([com|end|cn|net])'

    inputstr=raw_input('输入需要检测的网址\n')

    m=re.match(role,inputstr)

    if m is not None:

        print("%s是一个网址"%m.group())

    else:

        print '%s不是一合格的网址'%inputstr

# test6()

#7.匹配全体Python整数的字符串表示形式的集合

#8. 匹配全体Python长整数的字符串表示形式的集合

#9. 匹配全体Python浮点数的字符串表示形式的集合

#10.匹配全体Python复数的字符串表示形式的集合

def test7_10():

    role7='\d+'

    role8='\d+[L]?'

    role9='\d+.\d+'

    role10='\d'

    inputstr7=raw_input('输入需要检测的整形数字\n')

    inputstr8=raw_input('输入需要检测的长整形数字\n')

    inputstr9=raw_input('输入需要检测的浮点数字\n')

    inputstr10=raw_input('输入需要检测的复数\n')

    m7=re.match(role7,inputstr7)

    m8=re.match(role8,inputstr8)

    m9=re.match(role9,inputstr9)

    m10=re.match(role10,inputstr10)

    if m7 is not None:

        print ('整形：%s'%m7.group())

    if m8 is not None:

        print ('长整形：%s'%m8.group())

    if m9 is not None:

        print ('浮点数：%s'%m9.group())

    if m10 is not None:

        print ('复数：%s'%m10.group())

# test7_10()

#11.匹配所有合法的电子邮件地址(先写出一个限制比较宽松的正则表达式，然后尽可能加 强限制条件，但要保证功能的正确性)。

def test11():

    role="[\w!#$%&'*+/=?^_`{|}~-]+(?:\.[\w!#$%&'*+/=?^_`{|}~-]+)*@(?:[\w](?:[\w-]*[\w])?\.)+[\w](?:[\w-]*[\w])?"

    inputstr=raw_input('输入需要检测的邮箱\n')

    m=re.match(role,inputstr);

    if m is not None:

        print'email is :%s'%m.group()

    else:

        print 'not a email'

# test11()

#12.匹配所有合法的 Web 网站地址(URLs)(先写出一个限制比较宽松的正则表达式，然后尽可能加强限制条件，但要保证功能的正确性)。

def test12():

    role="[a-zA-z]+://[^\s]*"

    inputstr=raw_input('输入需要检测的URL\n')

    m=re.match(role,inputstr);

    if m is not None:

        print'URL is :%s'%m.group()

    else:

        print 'not a URL'

# test12()

#13.type(). type()内建函数返回一个对象类型，此对象显示为 Python 的字符串形式

def test13():

    import re

    data="<type 'int'>"

    patt="<type\s'(\w+)'>"

    m=re.search(patt, data)

    if m is not None:

        print m.group(1)

# test13()

#14.正则表达式。在 15.2 小节里，我们给出一个匹配由一位或两位数字代表一月到九月的 字符串形式(“0?[1-9]”)。 请写出一个正则表达式    表示标准日历上其它的三个月(十月、十一月、 十二月)。

def test14():

    role="1[0-2]"

    m=re.match(role,'10')

    print m.group()

# test14()

#15.正则表达式。在15.2小节里，我们给出一个匹配信用卡卡号的模式：(“[0-9]{15,16}”).  但这个模式不允许用连字符号分割信用卡卡号中的数字。请写出一个允许使用连字符的正则表达式， 但要求连字符必须出现在正确的位置。例如，15位的信用卡卡号的格式是4-6-5,表示四个数字，一 个连字符，后面接六个数字、一个连字符，最后是五个数字。16位的信用卡卡号的格式是4-4-4-4， 数位不足时，添0补位。

def test15():

    role='([0-9]{4}-?[0-9]{6}-?[0-9]{5})|([0-9]{4}-?[0-9]{4}-?[0-9]{4}-[0-9]{4})'

    inputstr=raw_input('输入需要检测的信用卡号\n')

    m=re.match(role,inputstr);

    if m is not None:

        print'right :%s'%m.group()

    else:

        print 'not a card Number'

# test15()

#17.统计生成的redata.txt文件中，星期中的每一天出现的次数(或统计各月份出现的次 数)。

#18.通过检查每个输出行中整数字段部分的第一个整数是否和该行开头的时间戳相匹配来 验证redata.txt中的数据是否完好

#19. 提取出每行中完整的时间戳字段

#20.提取出每行中完整的电子邮件地址。

#21.只提取出时间戳字段中的月份。

#22.只提取出时间戳字段中的年份

#23.只提取出时间戳字段中的值(格式：HH:MM:SS)。

#24.只从电子邮件地址中提取出登录名和域名(包括主域名和顶级域名,二者连在一起)

#25.只从电子邮件地址中提取出登录名和域名(包括主域名和顶级域名，二者分别提取)。

def test17_25():

    role17='Jun'

    role19="\s(\d{1,2}):(\d{1,2}):(\d{1,2})\s"

    role20="[\w!#$%&'*+/=?^_`{|}~-]+(?:\.[\w!#$%&'*+/=?^_`{|}~-]+)*@(?:[\w](?:[\w-]*[\w])?\.)+[\w](?:[\w-]*[\w])?"

    role21="\s\w+\s"

    role22="\s[0-9]{4}"

    role23=""#和19有什么区别？

    role24="(\w+)@(\w+).(\w+)"

    role25="(\w+)@(\w+).(\w+)"

    f=open('redata.txt','r')

    count=0

    for eachLine in f.readlines():

        m=re.findall(role17, eachLine)

        count+=len(m)

        strTemp=str(eachLine)

        m19=re.search(role19,strTemp)

        print'19_______'

        print m19.group()

        m20=re.search(role20,strTemp)

        print'20_______'

        print m20.group()

        m21=re.search(role21,strTemp)

        print'21_______'

        print m21.group()

        m22=re.search(role22,strTemp)

        print'22_______'

        print m22.group()

        m24=re.search(role24,strTemp)

        m24temp=re.split('@',m24.group())

        m24real=m24temp[0]+m24temp[1]

        print'24_______'

        print m24real

    print 'the count of :%s is %d' %(role17,count)

    f.close()

# test17_25()

#26. 将每行中的电子邮件地址替换为你自己的电子邮件地址

def test26():

    role26="[\w!#$%&'*+/=?^_`{|}~-]+(?:\.[\w!#$%&'*+/=?^_`{|}~-]+)*@(?:[\w](?:[\w-]*[\w])?\.)+[\w](?:[\w-]*[\w])?"

    f=open('redata.txt','r')

    files=f.readlines()

    for eachfile in files:

        m26=re.search(role26,str(eachfile))

        print m26.group()

        m26_my=re.sub(role26,'swrite.126.com',str(eachfile))

        print m26_my

# test26()

#27.提取出时间戳中的月、日、年，并按照格式“月 日，年”显示出来，且每行仅遍 历一次

def test27():

    role="(\S+)\s(\d+)\s\d+:\d+:\d+\s(\d+)"

    f=open('redata.txt','r')

    files=f.readlines()

    for eachfile in files:

        m27=re.search(role,str(eachfile))

        try:

            print "%s-%s-%s" %(m27.group(1),m27.group(2),m27.group(3))

        except(AttributeError),djag:

            pass

# test27()

#28.区号(第一组的三个数字和它后面的连字符)是可选的，即，你写的正则表达式对 800-555-1212和555-1212都可以匹配

def test28():

    role="(\d{3}-)?\d{3}-\d{4}"

    m=re.match(role,'800-555-1212')

    print m.group()

    m2=re.match(role,'555-1212')

    print m2.group()

# test28()

#29.区号中可以包含圆括号或是连字符，而且它们是可选的，就是说你写的正则表达式可以 匹配800-555-1212, 或 555-1212, 或(800) 555-1212

def test29():

    role="\(?\d{3}\)?-?\d{3}-\d{4}" #目前第二条没匹配到555-1212

    m=re.match(role,'800-555-1212')

    print m.group()

    m2=re.match(role,'555-1212')

    if m2 is not None:

        print m2.group()

    else:

        print 'm2 not match'

    m3=re.match(role,'(800)555-1212')

    print m3.group()

test29()

第16题在这里

#coding=utf-8

#!/bin/env python

#16.修改脚本 gendata.py 的代码，使数据直接写入文件 redata.txt 中，而不是输出到屏 幕上。

from random import  randint,choice

from string import  lowercase

from sys import  maxint

from time import  ctime

doms=('com','edu','net','org','gov')

for i in range(randint(5,10)):

    dtint=randint(0,maxint-1)

    # print(dtint)

    dtstr=ctime(dtint)

    # print(dtstr)

    shorter=randint(4,7)

    # print(shorter)

    # print'_'*10

    em=''

    for j in range(shorter):

        em+=choice(lowercase)

        # print(em)

    # print '-'*10

    longer=randint(shorter,12)

    # print(longer)

    dn=''

    # print '-'*10

    for j in range(longer):

        dn+=choice(lowercase)

        # print(dn)

    str='%s::%s@%s.%s::%d-%d-%d'%(dtstr,em,dn,choice(doms),dtint,shorter,longer)

    file=open('redata.txt','a')

    #重定向输出到file

    print >>file,str

　　方案二

1.正则表达式： r"[bh][aiu]t"

2.正则表达式：r"\w+ \w+"

3.正则表达式：r"\w+, [\w]"

4.正则表达式：r"[A-Z_a-z][\w_]*"

5.正则表达式：r"\d+ [a-zA-z]+[a-zA-z ]*"

6.正则表达式：r"www\.\w+\.(com|edu|net)"

7-8.正则表达式：r"^-?(\d*)|(0[0-7]*)|(0[xX][0-9a-fA-F]+)$"

9.正则表达式：r"^\d+\.\d*$"

10.正则表达式：r"(\d+(\.\d*)?)?[\+-]?\d+j"

11.正则表达式：r"[a-zA-z][\w_]*@\w[\w-]*\.[a-zA-z]{2,}"    #假设邮件前缀可以包含字母、数字和下划线，且以字母开头

13.

# -*- coding: utf-8 -*-

import re

def gettype(val):

    typestr = str(type(val))

    mytype = re.match(r"", typestr).group(1)

    systype = type(val).__name__

    if mytype == systype:

        print u"类型是：", mytype

    else:

        print u"错误"

14.  r"1[0-2]"

15.  A. r"([0-9]{4}-?[0-9]{6}-?[0-9]{5})|(([0-9]{4}-?){4})"

      B.

def CheckCardNum(card_num):

    "检验卡号的有效性"

    import re

    if not isinstance(card_num, str): card_num = str(card_num)

    m = re.match(r"([0-9]{4}-?[0-9]{6}-?[0-9]{5})|(([0-9]{4}-?){4})", card_num)

    if m is not None:

        if '-' in card_num:

            card_num = card_num.replace('-','')

        sum = 0

        if len(card_num) == 15:

            for i, num in enumerate(card_num):

                num = int(num)

                if (i+1)%2:

                    sum += num

                else:

                    num=num*2 if num*2 < 9 else num*2-9

                    sum += num

        else:

            for i, num in enumerate(card_num):

                num = int(num)

                if (i+1)%2:

                    num=num*2 if num*2 < 9 else num*2-9

                    sum += num

                else:

                    sum += num

        if sum%10 == 0:

            print u"卡号输入正确"

    else:

        print u"请输入正确的卡号"

16.  

#!/usr/bin/env python

from random import randint, choice

from string import lowercase

from sys import maxint

from time import ctime

f = open(r"E:\code\Core Python Programming\15\redata.txt", 'w')

doms = ('com', 'edu', 'net', 'org', 'gov')

for i in range(randint(5, 10)):

    dtint = randint(0, maxint-1)

    dtstr = ctime(dtint)

    shorter = randint(4, 7)

    em = ''

    for j in range(shorter):

        em += choice(lowercase)

    longer = randint(shorter, 12)

    dn = ''

    for j in range(longer):

        dn += choice(lowercase)

    eachline = '%s::%s@%s.%s::%d-%d-%d' % (dtstr, em,

        dn, choice(doms), dtint, shorter, longer)  

    f.writelines(eachline+'\n')

f.close()

17.  

#!/usr/bin/env python

# -*- coding:utf-8 -*-

from random import randint, choice

from string import lowercase

from sys import maxint

from time import ctime

f = open(r"E:\code\Core Python Programming\15\redata.txt", 'w')

doms = ('com', 'edu', 'net', 'org', 'gov')

for i in range(randint(5, 10)):

    dtint = randint(0, maxint-1)

    dtstr = ctime(dtint)

    shorter = randint(4, 7)

    em = ''

    for j in range(shorter):

        em += choice(lowercase)

    longer = randint(shorter, 12)

    dn = ''

    for j in range(longer):

        dn += choice(lowercase)

    eachline = '%s::%s@%s.%s::%d-%d-%d' % (dtstr, em,

        dn, choice(doms), dtint, shorter, longer)   

    f.writelines(eachline+'\n')

f.close()

weekdays = ['Mon', 'Tue', 'Wed', 'Thu', 'Fri', 'Sat', 'Sun']

f = open(r"E:\code\Core Python Programming\15\redata.txt", 'r')

datas = f.readlines()

Montimes, Tuetimes, Thutimes, Wedtimes, Fritimes, Sattimes, Suntimes = 0, \

    0, 0, 0, 0, 0, 0

times = {'Mon': Montimes, 'Tue': Tuetimes, 'Wed': Wedtimes, 'Thu': Thutimes, \

         'Fri': Fritimes, 'Sat': Sattimes, 'Sun': Suntimes}

for data in datas:

    for weekday in times:

        if weekday in data:

            times[weekday] += 1

            break

for weekday in weekdays:

    print u"%s 出现的次数时：%d" % (weekday, times[weekday])

18.

#!/usr/bin/env python

# -*- coding: utf-8 -*-

from random import randint, choice

from string import lowercase

from sys import maxint

from time import ctime

import re

f = open(r"E:\code\Core Python Programming\15\redata.txt", 'w')

doms = ('com', 'edu', 'net', 'org', 'gov')

for i in range(randint(5, 10)):

    dtint = randint(0, maxint-1)

    dtstr = ctime(dtint)

    shorter = randint(4, 7)

    em = ''

    for j in range(shorter):

        em += choice(lowercase)

    longer = randint(shorter, 12)

    dn = ''

    for j in range(longer):

        dn += choice(lowercase)

    eachline = '%s::%s@%s.%s::%d-%d-%d' % (dtstr, em,

        dn, choice(doms), dtint, shorter, longer)  

    f.writelines(eachline+'\n')

f.close()

f = open(r"E:\code\Core Python Programming\15\redata.txt", 'r')

check = True

patt = r"([\w :]{24})[a-z@\.:]+(\d+).*"

flines = f.readlines()

for eachline in flines:

    datadtstr = re.match(patt, eachline).group(1)

    datadtint = re.match(patt, eachline).group(2)

    if datadtstr == ctime(int(datadtint)):

        continue

    else:

        check = False

        break

if check:

    print u"数据完好！"

else:

    print u"数据有误！"

19.  patt = r"[\w :]{24}"        re.search()

20.  patt = r"[a-z]*@[a-z\.]*"   re.search()

21.  patt = r"[A-za-z ]{4}([a-zA-Z]{3})"   (re.search(patt, string).group(1))

22.  patt = r"\d{4}:"    re.search(patt, string).group()[:4]

23.  patt = r"(\d{2}:){2}\d{2}"  re.search()

24-25.  patt = r"\b[a-z]+\b"   re.findall()

26.   

newlines = []

f = open(r"redata.txt", 'r')

for eachline in f.readlines():

    newline = re.sub(r'\b[a-z]+@[a-z\.]+', 'myemail@gmail.com', eachline)

    newlines.append(newline)

f.close()

f = open(r"redata.txt", 'w')

f.writelines(newlines)

27.

f = open(r"redata.txt", 'r')

for eachline in f.readlines():

    month_day = re.findall(r'\b[A-Z][a-z]{2}\b', eachline)

    month = month_day[1]

    day = month_day[0]

    year = re.search(r'(\d{4}):', eachline).group(1)

    print '%s %s, %s' % (month, day, year)

28.  patt = r"(\d{3}-)?\d{3}-\d{4}"

29.  patt = r"((\d{3}-)|(\(\d{3}\)))?\d{3}-\d{4}"

pyhton 核心编程正则表达式习题的更多相关文章

Pyhton核心编程-Chap2习题-DIY
在学Python,在看<Python核心编程>的pdf,做了Chap2的题目,答案为DIY # Filename: 2-11.py # Author: ChrisZZ mylist = [ ...
Python核心编程——正则表达式
本篇博客都是我认真读之后写的,有些地方和书上的语句一样…… 1.简介正则表达式为高级的文本模式匹配.抽取.与/或文本形式的搜索和替换功能提供了基础.简单地说,正则表达式(简称regex)是一些由字符 ...
python核心编程正则表达式练习题1-2匹配由单个空格分隔的任意单词对，也就是性和名
# 匹配由单个空格分隔的任意单词对,也就是姓和名 import re patt = '[A-Za-z]+ [A-Za-z]+' # 方法一 +加号操作符匹配它左边的正则表达式至少出现一次的情况 # p ...
Python核心编程正则表达式练习题1-1 识别后续的字符串:“bat”、“bit”、“but”、“hat”、“hit”或者“hut”
# 1-1 识别后续的字符串:“bat”.“bit”.“but”.“hat”.“hit”或者“hut”. import re # 正则表达式,|元字符表示选择“或” # character = 'ba ...
Python核心编程课后习题-第六章
1. 字符串, string模块中是否有一种字符串方法或者函数可以帮我鉴定一下一个字符串是否是另一个大字符串的一部分? str1 = 'abcdefghijklmnopqrstuv' print st ...
Python 核心编程课后习题第五章
2. 操作符. (a) 写一个函数, 计算并返回两个数的乘积. (b) 写一段代码调用这个函数, 并显示它的结果. def multi(a,b): return a * b result = mult ...
Python高级编程–正则表达式（习题）
原文:http://start2join.me/python-regex-answer-20141030/ ############################################## ...
python核心编程（第二版）习题
重新再看一遍python核心编程,把后面的习题都做一下.
正则表达式：re--python核心编程(3),chapter 1
最近听吴老的电台,收获颇多,给人映像最深的就是:学会编程和坚持学习:作为一名测试员,要从一名手工测试转化成测试开发或者资深的测试工程师,编码水平是必须具备的基本素质:吴老所说,撸1W到2W行代 ...

随机推荐

python之路——13
王二学习python的笔记以及记录,如有雷同,那也没事,欢迎交流,wx:wyb199594 复习 1.函数 1.函数的定义和调用 2.参数及传递顺序形参角度: 位置参数:*args:默认参数:**k ...
Django项目的创建
一. Django介绍 Python的WEB框架有Django.Tornado.Flask 等多种, Django相较与其他WEB框架其优势为: 大而全, 框架本身集成了ORM.模型绑定,.模板引擎, ...
[SQL]某数据库中查出包含字段名的所有表名
--利用SQL语句来查询字段所在的表 --从某数据库中查出包含字段名字段的所有表名 SELECT TABLE_NAME FROM INFORMATION_SCHEMA.COLUMNS WHERE ...
论气机之"左升右降"
生命现象源于气机的出入升降运动. “出入废则神机化灭,升降息则气立孤危.故非出入,则无以生长壮老已:非升降,则无以生长化收藏”(<素问·六微旨大论>),升降是气机主要的运动形式之一,是 ...
边缘触发(Edge Trigger)和条件触发(Level Trigger)
int select(int n, fd_set *rd_fds, fd_set *wr_fds, fd_set *ex_fds, struct timeval *timeout); sele ...
一个简单的gridlayout栗子
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
协程，greenlet，gevent
""" 协程 """ ''' 协程: 类似于一个可以暂停的函数,可以多次传入数据,可以多次返回数据协程是可交互的耗资源大小:进程 --& ...
asp.net 微信JsSDK
有时间再整理吧 using System; using System.Collections.Generic; using System.Linq; using System.Web; using S ...
国内+海外IDC资源合作
主营业务:服务器租用.托管.机柜大带宽.安全防御.云主机.海外专线.海外托管.CDN加速.站群资源覆盖: 华南:广东东莞.深圳.广州.湛江.福建厦门.泉州.福州华北:北京.天津.山东华东:江苏苏 ...
python_09 文件处理流程，文件操作方法
文件处理流程 1.打开文件,得到文件句柄并赋值给一个变量 2.通过句柄对文件进行操作 3.关闭文件 f=open('test.txt',encoding='gbk') data = f.read() ...

pyhton 核心编程 正则表达式习题

pyhton 核心编程 正则表达式习题的更多相关文章

随机推荐

热门专题

pyhton 核心编程正则表达式习题

pyhton 核心编程正则表达式习题的更多相关文章