目录 一.collections模块 二.时间模块 也可以在我的个人博客上阅读 一.collections模块 1. Counter Counter是⼀个计数器,主要⽤统计字符的数量,之前如果我们要统计字符串的话要写如下算法: s = 'Wed Nov 14 08:58:45 CST 2018' dic = {} for c in s: dic[c] = dic.setdefault(c, 0) + 1 print(dic) # 结果: # {'W': 1, 'e': 1, 'd': 1, '…
摘抄自:https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/001432688314740a0aed473a39f47b09c8c7274c9ab6aee000 Get urllib的request模块可以非常方便地抓取URL内容,也就是发送一个GET请求到指定的页面,然后返回HTTP的响应: 例如,对豆瓣的一个URLhttps://api.douban.com/v2/book/2…
摘抄自:https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000/0014320023122880232500da9dc4a4486ad00426f081c15000 如果要编写一个搜索引擎,第一步是用爬虫把目标网站的页面抓下来,第二步就是解析该HTML页面,看看里面的内容到底是新闻.图片还是视频. 假设第一步已经完成了,第二步应该如何解析HTML呢? HTML本质上是XML的子集,但是…
一.模块.包 什么是模块? 模块实质上就是一个python文件,它是用来组织代码的,意思就是说把python代码写到里面,文件名就是模块的名称,test.py test就是模块名称. 什么是包? 包,package本质就是一个文件夹,和文件夹不一样的是它有一个__init__.py文件,包是从逻辑上来组织模块的,也就是说它是用来存放模块的,如果你想导入其他目录下的模块,那么这个目录必须是一个包才可以导入. 导入模块   1 2 3 4 5    import module #导入模块    fr…
字符串常用操作 7月19日,7月20日 ,7月22日,7月29日,8月29日,2月29日 首字母大写:a_str.capitalize() 统计字符串个数:a_str.count(“x”) 输出字符,不够的使用指定的字符补上,字符居中:a_str.center(50,”-“) 判断字符串以什么结尾:a_str.endwith(“xx”) 将字符串中的tab转换为指定数目的空格:a_str.expandtabs(tabsize=30) 查找指定字符串在字符串中的位置:a_str.find(“xx”…
import os print(os.getcwd())#取当前工作目录,绝对路径 print(os.chdir("../"))#更改当前目录,.代表当前目录,..代表上一级目录 print(os,getcwd())#获取当前工作目录 print(os.curdir)#当前目录,相对路径 print(os.pardir)#父目录,相对路径 print(os.mkdir("test1"))#在当前目录下创建文件夹 print(os.mkdir("c://te…
os模块: os.remove() 删除文件 os.unlink() 删除文件 os.rename() 重命名文件 os.listdir() 列出指定目录下所有文件 os.chdir() 改变当前工作目录 os.getcwd() 获取当前文件路径 os.mkdir() 新建目录 os.rmdir() 删除空目录(删除非空目录, 使用shutil.rmtree()) os.makedirs() 创建多级目录 os.removedirs() 删除多级目录 os.stat(file) 获取文件属性 o…
一.常用的字符串方法(一):(字符串是不能被修改的) 1)a.strip()   #默认去掉字符串两边的空格和换行符 a = ' 字符串 \n\n ' c = a.strip() a.lstrip() #默认去掉字符串左边的空格和换行符 a.rstrip() #默认去掉字符串右边的空格和换行符 #如果strip()方法指定一个开头或者结尾的值,那么去掉这两个值,前后有空格都不能去 words = 'today is a wonderful day' print(words.strip('day'…
说明: 1. open("index.html","w",encoding="utf-8"),open的第三个参数可以设置编码格式. 2. 代码作用是给每个文件夹新建一个index.html文件,显示文件夹里的所有图片. #!/usr/bin/python # -*- coding: utf-8 -*- import os pathMain = r"E:\manhua\mh" # print(path) for paths,…
Python内建函数 四舍五入: round() 绝对值: abs() >>> round(1.543,2) 保留两位小数,四舍五入为1.54 1.54 >>> round(1.546,2) 保留两位小数,四舍五入为1.55 1.55 >>> round(-1.536,2) -1.54 >>> abs(5) 5 >>> abs(-5) 绝对值为5 5 math 模块 >>> import math…