python基础语法13 内置模块 subprocess,re模块,logging日志记录模块,防止导入模块时自动执行测试功能,包的理论

subprocess模块：

- 可以通过python代码给操作系统终端发送命令，
并且可以返回结果。

sub: 子 process: 进程

import subprocess

while True:

    # 1.让用户输入终端命令

    cmd_str = input('请输入终端命令:').strip()

    # Popen(cmd命令, shell=True,

    # stdout=subprocess.PIPE, stderr=subprocess.PIPE)

    # 调用Popen就会将用户的终端命令发送给本地操作系统的终端

    # 得到一个对象，对象中包含着正确或错误的结果。

    obj = subprocess.Popen(

        cmd_str, shell=True,

        stdout=subprocess.PIPE,

        stderr=subprocess.PIPE

    )

    success = obj.stdout.read().decode('gbk')

    if success:

        print(success, '正确的结果')

    error = obj.stderr.read().decode('gbk')

    if error:

        print(error, '错误的结果')

方法2

import subprocess

res = subprocess.getoutput('ipconfig')

print(res)  # 打印ip配置

re模块

- 1)什么是正则表达式与re模块？
　　- 正则表达式:
　　　　正则表达式是一门独立的技术, 任何语言都可以使用正则表达式，
　　　　正则表达式是由一堆特殊的字符组合而来的。
　　　　- 字符组
　　　　- 元字符
　　　　　　- 组合使用

　　- re模块:
　　　　在python中，若想使用正则表达式，必须通过re模块来实现。

- 2)为什么要使用正则？
　　比如要获取“一堆字符串”中的“某些字符”，
　　正则表达式可以帮我们过滤，并提取出想要的字符数据。

　　# 比如过滤并获取 “tank”
　　'wafawrjkwagfiu21knriut8ankjfdgau0q92ru20yrisana tank wyqfwqrqyr9q 9'

　　- 应用场景:
　　　　- 爬虫: re, BeautifulSoup4, Xpath, selector
　　　　- 数据分析过滤数据: re, pandas, numpy...
　　　　- 用户名与密码、手机认证：检测输入内容的合法性
　　　　　　- 用户名: na tank

- 3)如何使用？
　　import re

# re校验

import re

while True:

    phone_number = input('请输入手机号码：').strip()

    # 需求: 11位、开头13/14/15/19

    # 参数1: 正则表达式  ''

    # 参数2: 需要过滤的字符串

    # ^: 代表“开头”

    # $: 代表“结束”

    # |: 代表“或”

    # (13|14): 可以获取一个值，判断是否是13或14.

    # {1}: 需要获取1个值 限制数量

    # []: 分组限制取值范围

    # [0-9]: 限制只能获取0——9的某一个字符。

    if re.match('^(13|14|15|19)[0-9]{9}$', phone_number):   # $不加也行

        print('合法')

        break

    else:

        print('不合法')

'''

- 字符组:

  - [0-9] 可以匹配到一个0-9的字符

  - [9-0]: 报错, 必须从小到大

  - [a-z]: 从小写的a-z

  - [A-Z]: 从大写A-Z

  - [z-A]: 错误, 只能从小到大，根据ascii表来匹配大小。

  - [A-z]: 总大写的A到小写的z。

  注意: 顺序必须要按照ASCII码数值的顺序编写。

'''

import re

#

res = re.match('[A-Za-z0-9]{8}', 'Tank9527')

print(res)  # 获取一个

print(res.group())  # Tank9527

'''

- 元字符:

    *******根据博客的表格来记 （看一眼）

    https://images2015.cnblogs.com/blog/1036857/201705/1036857-20170529203214461-666088398.png

    - 组合使用

      - \w\W: 匹配字母数字下划线与非字母数字下划线，匹配所有。

      - \d\D: 无论是数字或者非数字都可以匹配。

      - \t: table

      - \n: 换行

      - \b: 匹配单词结尾，tank  jasonk

      - ^: startswith

            - '^'在外面使用: 表示开头。

            - [^]: 表示取反的意思。

      - $: endswith

      - ^$: 配合使用叫做精准匹配，如何限制一个字符串的长度或者内容。

      - |: 或。ab|abc如果第一个条件成立，则abc不会执行，怎么解决，针对这种情况把长的写在前面就好了，一定要将长的放在前面。

      - [^...]: 表示取反的意思。

      - [^ab]: 代表只去ab以外的字符。

      - [^a-z]: 取a-z以外的字符。

'''

# import re

'''

re模块三种比较重要的方法:

    - findall()： ----> []

        可以匹配 "所有字符" ，拿到返回的结果，返回的结果是一个列表。

        'awfwaghowiahioawhio'  # a

        ['a', 'a', 'a', 'a']

    - search()：----> obj ----> obj.group()

        'awfwaghowiahioawhio'  # a

        在匹配一个字符成功后，拿到结果后结束，不往后匹配。

        'a'

    - match()：----> obj ----> obj.group()

        'awfwaghowiahioawhio'  # a

        'a'

        'wfwaghowiahioawhio'  # a

         None

        从匹配字符的开头匹配,若开头不是想要的内容，则返回None。

'''

# import re

'''

re模块三种比较重要的方法:

    - findall()： ----> []

        可以匹配 "所有字符" ，拿到返回的结果，返回的结果是一个列表。

        'awfwaghowiahioawhio'  # a

        ['a', 'a', 'a', 'a']

    - search()：----> obj ----> obj.group()

        'awfwaghowiahioawhio'  # a

        在匹配一个字符成功后，拿到结果后结束，不往后匹配。

        'a'

    - match()：----> obj ----> obj.group()

        'awfwaghowiahioawhio'  # a

        'a'

        'wfwaghowiahioawhio'  # a

         None

        从匹配字符的开头匹配,若开头不是想要的内容，则返回None。

'''

import re

str1 = 'sean tank json'

# findall

res = re.findall('[a-z]{4}', str1)

print(res)  # ['sean', 'tank', 'json']

# search

res = re.search('[a-z]{4}', str1)

print(res)    # <_sre.SRE_Match object; span=(0, 4), match='sean'>

print(res.group())   # sean

# match

res = re.match('sean', str1)

print(res)     # <_sre.SRE_Match object; span=(0, 4), match='sean'>

if res:   #放置为空.group()报错

    print(res.group())    # sean

爬取豆瓣TOP250电影信息

　　第1页:
　　　　https://movie.douban.com/top250?start=0&filter=

　　...

　　第9页:
　　　　https://movie.douban.com/top250?start=200&filter=

　　第10页:
　　　　https://movie.douban.com/top250?start=225&filter=

爬蟲四部原理:
　　1.发送请求: requests
　　2.获取响应数据: 对方机器直接返回的
　　3.解析并提取想要的数据: re
　　4.保存提取后的数据: with open()

爬蟲三部曲:
　　1.发送请求
　　2.解析数据
　　3.保存数据

# 往10个链接发送请求获取响应数据
　　- requests模块 ---》请求库

import requests

import re

# 爬蟲三部曲:

# 1.发送请求

def get_page(url):

    response = requests.get(url)

    # response.content  # 获取二进制流数据，比如图片、视频、音频

    # response.text  # 获取响应文本，比如html代码

    return response

# 2.解析数据

# 伪代码:

# response = get_page('url地址')

# parser_page(response.text)

def parser_page(text):  # response.text

    # re.findall('正则表达式', '过滤的文本')

    res_list = re.findall(

        '<div class="item">.*?<a href="(.*?)">.*?<span class="title">(.*?)</span>.*?<span class="rating_num".*?>(.*?)</span>.*?<span>(.*?)人评价',

        text,

        re.S) # findall只能读一行，用re.S参数会选中全部内容

    for movie_tuple in res_list:

        # print(movie_tuple)

        yield movie_tuple

# 3.保存数据

# 伪代码:

# res_list = parser_page(text)

# save_data(res_list)

def save_data(res_list_iter):

    with open('douban.txt', 'a', encoding='utf-8') as f:

        for movie_tuple in res_list_iter:

            movie_url, movie_name, movie_point, movie_num = movie_tuple

            # 写入文件前的模样

            str1 = f'''

            电影地址: {movie_url}

            电影名字: {movie_name}

            电影评分: {movie_point}

            评价人数: {movie_num}

            '''

            f.write(str1)

# 获取10个链接

n = 0

for line in range(10):

    url = f'https://movie.douban.com/top250?start={n}&filter='

    n += 25

    print(url)

    response = get_page(url)

    res_list_iter = parser_page(response.text)

    # print(res_list_iter)

    save_data(res_list_iter)

logging模块

　　- 是用来记录日志的模块，一般记录用户在软件中的操作。
　　def get_logger(user_type):
　　　　# 1.加载log配置字典到logging模块的配置中
　　　　logging.config.dictConfig(LOGGING_DIC)

　　　　# 2.获取日志对象
　　　　logger = logging.getLogger(user_type)
　　　　return logger

　　logger = get_logger('user')
　　logger.info('日志消息')

# logging的配置信息

"""

logging配置

"""

import os

import logging.config

# 定义三种日志输出格式 开始

standard_format = '[%(asctime)s][%(threadName)s:%(thread)d][task_id:%(name)s][%(filename)s:%(lineno)d]' \

                  '[%(levelname)s][%(message)s]' #其中name为getlogger指定的名字

simple_format = '[%(levelname)s][%(asctime)s][%(filename)s:%(lineno)d]%(message)s'

id_simple_format = '[%(levelname)s][%(asctime)s] %(message)s'

# 定义日志输出格式 结束

# ****************注意1: log文件的目录

BASE_PATH = os.path.dirname(os.path.dirname(__file__))

logfile_dir = os.path.join(BASE_PATH, 'log')

# print(logfile_dir)

# ****************注意2: log文件名

logfile_name = 'user.log'

# 如果不存在定义的日志目录就创建一个

if not os.path.isdir(logfile_dir):

    os.mkdir(logfile_dir)

# log文件的全路径

logfile_path = os.path.join(logfile_dir, logfile_name)

# ****************注意3: log配置字典

LOGGING_DIC = {

    'version': 1,

    'disable_existing_loggers': False,

    'formatters': {

        'standard': {

            'format': standard_format

        },

        'simple': {

            'format': simple_format

        },

    },

    'filters': {},

    'handlers': {

        #打印到终端的日志

        'console': {

            'level': 'DEBUG',

            'class': 'logging.StreamHandler',  # 打印到屏幕

            'formatter': 'simple'

        },

        # 打印到文件的日志,收集info及以上的日志

        'default': {

            'level': 'DEBUG',

            'class': 'logging.handlers.RotatingFileHandler',  # 保存到文件

            'formatter': 'standard',

            'filename': logfile_path,  # 日志文件

            'maxBytes': 1024*1024*5,  # 日志大小 5M

            'backupCount': 5,

            'encoding': 'utf-8',  # 日志文件的编码，再也不用担心中文log乱码了

        },

    },

    'loggers': {

        #logging.getLogger(__name__)拿到的logger配置

        '': {

            'handlers': ['default', 'console'],  # 这里把上面定义的两个handler都加上，即log数据既写入文件又打印到屏幕

            'level': 'DEBUG',

            'propagate': True,  # 向上（更高level的logger）传递

        },

    },

}

# 注意4:

def get_logger(user_type):

    # 1.加载log配置字典到logging模块的配置中

    logging.config.dictConfig(LOGGING_DIC)

    # 2.获取日志对象

    # logger = logging.getLogger('user')

    # logger = logging.getLogger('bank')

    # logger = logging.getLogger('shop')

    logger = logging.getLogger(user_type)

    return logger

# logging.config.dictConfig(LOGGING_DIC)

# # 调用获取日志函数的到日志对象

# logger = logging.getLogger('user')

# 通过logger日志对象，调用内部的日志打印

logger = get_logger('user')

# '只要思想不滑坡，方法总比问题多!'就是需要记录的日志信息

logger.info('学习不要浮躁，一步一个脚印!')

# logger.info('只要思想不滑坡，方法总比问题多!')

防止导入模块时自动执行测试功能

# 被导入模块（test1.py）

def func():

    print('from test1.func...')

# func()

# __name__属于模块名称空间中的一个名字

# 当我们执行该模块时就会产生

print(__name__)  # 在当前文件中名字为:__main__   被导入时: 模块的名字

# 注意: 记住--》 main + 回车键

if __name__ == '__main__':

    # 在此处对功能进行测试

    print('在当前模块下执行测试功能...')

    func()

else:

    print('当前模块已被导入...')

# 导入模块

import test1

包的理论

- 夺命三问:
1.什么是包？
　　包是一个带有__init__.py的文件夹，包也可以被导入，
　　并且可以一并导入包下的所有模块。

2.为什么要使用包？
　　包可以帮我们管理模块，在包中有一个__init__.py, 由它来帮我们管理模块。

3.怎么使用包？
　　- import 包.模块名
　　　　包.模块.名字

　　- from 包 import 模块名

　　- from 包.模块名 import 模块中的名字

- 导入包时发生的事情:
　　1.当包被导入时，会以包中的__init__.py来产生一个名称空间。
　　2.然后执行__init__.py文件, 会将__init__.py中的所有名字添加到名称空间中。
　　3.接着会将包下所有的模块的名字加载到__init__.py产生的名称空间中。
　　4.导入的模块指向的名称空间其实就是__init__.py产生的名称空间中。

python基础语法13 内置模块 subprocess,re模块,logging日志记录模块,防止导入模块时自动执行测试功能,包的理论的更多相关文章

python基础语法12 内置模块 json,pickle,collections,openpyxl模块
json模块 json模块: 是一个序列化模块. json: 是一个 “第三方” 的特殊数据格式. 可以将python数据类型 ----> json数据格式 ----> 字符串 ----& ...
python基础语法11 内置模块time,datatime,random,os,sys,hashlib模块
time模块在python的三种时间表现形式: 1.时间戳: 给电脑看的. - 自1970-01-01 00:00:00到当前时间,按秒计算,计算了多少秒. 2.格式化时间(Format Strin ...
python学习第五讲,python基础语法之函数语法,与Import导入模块.
目录 python学习第五讲,python基础语法之函数语法,与Import导入模块. 一丶函数简介 1.函数语法定义 2.函数的调用 3.函数的文档注释 4.函数的参数 5.函数的形参跟实参 6.函 ...
尚学python课程---13、python基础语法
尚学python课程---13.python基础语法一.总结一句话总结: legend2系统使我能够快速掌握一门语法,特别有用 pass 语句:空语句:是为了保持程序结构的完整性 :作用:比如: ...
7.13 Python基础语法
Python基础语法编码: 默认情况下,Python 3 源码文件以 UTF-8 编码,所有字符串都是 unicode 字符串. 当然你也可以为源码文件指定不同的编码 python2.7中有两个函数 ...
【python基础语法】模块和包管理，文件的操作（第8天课堂笔记）
''' 模块和包管理模块和包的定义: 模块:模块是一个Python文件,以.py结尾,包含了Python对象定义和Python语句包:Python中的包就是一个包含__init__.py文件的目录 ...
Python基础语法题库
引言: 语法练习包括Python基础语法.数据类型.字符编码和简单文件操作等内容. 正文(参考答案附录在题目下方): 1.Python 里用来告知解释器跳过当前循环中的剩余语句,然后继续进行下一轮循环 ...
Python 基础语法(三)
Python 基础语法(三) --------------------------------------------接 Python 基础语法(二)------------------------- ...
Python 基础语法(四)
Python 基础语法(四) --------------------------------------------接 Python 基础语法(三)------------------------- ...

随机推荐

ps 简单使用 ----- 将图片静态图片制作成动图
1. 准备好你需要静态图片放到文件夹中 2.打开ps 软件将右上角切换为动感 3.观察下方时间轴点击加号将图片导入按住shift 选择图片 4.切换为帧格式选择循环 ...
python面试导航
python面试题库 python基础等待更新中函数等待更新中面向对象等待更新中高级编程等待更新中数据库等待更新中前端&django 等待更新中 crm 等待更新中 drf ...
docker系列之三：docker实际应用
以Docker为基础完成持续集成.自动交付.自动部署: 原理: RD推送代码到git 仓库或者svn等代码服务器上面,git服务器就会通过hook通知jenkins. jenkine 克隆git代码到 ...
Prometheus 监控linux服务器
Prometheus 监控linux服务器 node_exporter:用于*NIX系统监控,使用Go语言编写的收集器. 使用版本 node_exporter 0.17.0 相关文档使用文档:htt ...
Django ORM 数据库增删改查
Django ORM 数据库增删改查增 # 创建.增加数据(推荐) models.UserInfo.objects.create(username=') # 创建.增加数据 dic = {'} mo ...
用lambda表达式写分组查询的示例
需要完成的查询逻辑:查询A表中根据CertificateDelayApplyRecordId 分组,每条记录算8个课时,查询出每个CertificateDelayApplyRecordId已经学习了的 ...
Golang逃逸分析
Golang逃逸分析介绍逃逸分析的概念,go怎么开启逃逸分析的log. 以下资料来自互联网,有错误之处,请一定告之. sheepbao 2017.06.10 什么是逃逸分析 wiki上的定义 In ...
Mybatis 复习
概述 mybatis 是一个用java编写的持久层框架, 它封装了jdbc操作的很多细节,使开发者只需要关注sql语句本身,而无需关注注册驱动,创建连接等繁杂过程,它使用了ORM思想实现了结果集的封 ...
springMVC执行流程及架构
目录 springMVC简单执行流程 springMVC框架注解实现 springMVC简单执行流程 springMVC框架执行流程: 1.用户发送请求至前端控制器DispatcherServle ...
Mybatis源码解析(二) —— 加载 Configuration
Mybatis源码解析(二) -- 加载 Configuration 正如上文所看到的 Configuration 对象保存了所有Mybatis的配置信息,也就是说mybatis-config. ...

python基础语法13 内置模块 subprocess,re模块,logging日志记录模块,防止导入模块时自动执行测试功能,包的理论

python基础语法13 内置模块 subprocess,re模块,logging日志记录模块,防止导入模块时自动执行测试功能,包的理论的更多相关文章

随机推荐

热门专题