吴裕雄--天生自然python学习笔记:python 文件批量查找
在多个文本文件中查找
我们首先来学习文本文件的查找字符 。 我们通过 os.walk 扩大查找范围,
查找指定目录和子目录下的文件。
应用程序总览
读取 当 前目录及子目录下的所有 PY 和 txt 文本文件,搜索这些文件中是否包含
指定的字符“ shutil ”。

应用程序内容
import os cur_path=os.path.dirname(__file__) # 取得当前路径
sample_tree=os.walk(cur_path)
keyword="shutil" for dirname,subdir,files in sample_tree:
allfiles=[]
for file in files: # 取得所有 .py .txt 文件,存入 allfiles 列表中
ext=file.split('.')[-1]
if ext=="py" or ext=="txt":
allfiles.append(dirname +'/'+file) if len(allfiles)>0:
for file in allfiles: # 读取 allfiles 列表所有文件
try:
fp = open(file, "r", encoding = 'UTF-8')
article = fp.readlines()
fp.close
line=0
for row in article:
line+=1
if keyword in row:
print("在 {},第 {} 行找到{}。".format(file,line,keyword))
except:
print("{} 无法读取..." .format(file)) print("完成...")
在 Word 文件中查找指定字符
接着我们来学习在 Word 文件中查找指定 的 字符。 对以 docx 为后缀 的 文件进行
搜索 , 需要先安装 python-docx 包 :
安装完毕后导入 do cx 包 , 再用 docx.Document() 方法创建 docx 对象来读取指
定的 do c x 文件,每个 doc x 文件包含多个 paragraphs 段落 , 可通过 text 属性来读取
paragraph s 段落的内容 。
例如 : 读取“简介 .do cx ”文件并显示所有段落内容。
import docx
doc = docx.Document("简介.docx")
for p in doc.paragraphs:
print(p.text)
应用程序总览
读取当前目录及子目录下所有 docx 格式的 Word 文件,井在这些文件中查找是否
包含 “ 篮球 ” 字符。

import os,docx cur_path=os.path.dirname(__file__) # 取得当前路径
sample_tree=os.walk(cur_path) keyword="篮球"
print("查找字符串:{}" .format(keyword)) for dirname,subdir,files in sample_tree:
allfiles=[]
for file in files: # 取得所有.docx文件并存入 allfiles 列表中
ext=file.split('.')[-1]
if ext=="docx": # get *.docx to allfiles
allfiles.append(dirname +'/'+file) for file in allfiles:
print("正在查找{}文件...".format(file))
try:
doc = docx.Document(file)
line=0
for p in doc.paragraphs:
line+=1
if keyword in p.text:
print("...在第 {} 段文字中找到{}\n {}。".format(line,keyword,p.text))
except:
print("无法读取 {} 文件..." .format(file)) print("\n查找完毕...")
另 一种比较好的查找方式是在 Anaconda Prompt 窗口中 , 通过 python FindK.ey
Word3.py 命令行来执行查找字符的程序 。
例如:查找“ shutil ”字符 。

例如:查找“篮球”字符 。

注意 : Python 应用程序 FindK.eyWord3.py 的路 径中不能包含中文路径,即 D: \pythonex\ chl2 , 然后再在
Anaconda Prompt 窗口中进行执行 。 如下图:

import os,docx,sys if len(sys.argv) == 1:
keyword="shutil"
print("语法:python FindKeyWord3.py 查找字符串\n")
else:
keyword=sys.argv[1] #cur_path=os.path.dirname(__file__) # 取得当前路径
cur_path=os.getcwd()
sample_tree=os.walk(cur_path)
print(cur_path) for dirname,subdir,files in sample_tree:
allfiles=[]
for file in files: # 取得所有 .py .txt .docx文件,存入allfiles列表中
ext=file.split('.')[-1]
if ext=="py" or ext=="txt" or ext=="docx":
allfiles.append(dirname +'/'+file) if len(allfiles)>0:
for file in allfiles: # 读取 allfiles 列表所有文件
try:
if file.split('.')[-1]=="docx": # .docx
doc = docx.Document(file)
line=0
for p in doc.paragraphs:
line+=1
if keyword in p.text:
print("...在第 {} 段文字中找到{}\n {}。".format(line,keyword,p.text))
else: # .py or .txt
fp = open(file, "r", encoding = 'UTF-8')
article = fp.readlines()
fp.close
line=0
for row in article:
line+=1
if keyword in row:
print("在 {},第 {} 行找到 {} 。".format(file,line,keyword))
except:
print("{} 无法读取..." .format(file)) print("完成...")
吴裕雄--天生自然python学习笔记:python 文件批量查找的更多相关文章
- 吴裕雄--天生自然HADOOP学习笔记:hadoop集群实现PageRank算法实验报告
实验课程名称:大数据处理技术 实验项目名称:hadoop集群实现PageRank算法 实验类型:综合性 实验日期:2018年 6 月4日-6月14日 学生姓名 吴裕雄 学号 15210120331 班 ...
- 吴裕雄--天生自然MySQL学习笔记:MySQL UPDATE 更新
如果需要修改或更新 MySQL 中的数据,我们可以使用 SQL UPDATE 命令来操作. 语法 以下是 UPDATE 命令修改 MySQL 数据表数据的通用 SQL 语法: UPDATE table ...
- 吴裕雄--天生自然MySQL学习笔记:MySQL 插入数据
MySQL 表中使用 INSERT INTO SQL语句来插入数据. 可以通过 mysql> 命令提示窗口中向数据表中插入数据,或者通过PHP脚本来插入数据. 以下为向MySQL数据表插入数据通 ...
- 吴裕雄--天生自然MySQL学习笔记:MySQL简介
MySQL 是最流行的关系型数据库管理系统,在 WEB 应用方面 MySQL 是最好的 RDBMS(Relational Database Management System:关系数据库管理系统)应用 ...
- 吴裕雄--天生自然 oracle学习笔记:oracle理论学习详解及各种简单操作例子
1. 数据库的发展过程 层次模型 -->网状模型 -->关系模型 -->对象关系模型 2. 关于数据库的概念 DB:数据库(存储信息的仓库) DBMS:数据库管理系统(用于管理数据库 ...
- 吴裕雄--天生自然HADOOP学习笔记:基本环境配置
实验目的 学习安装Java 学习配置环境变量 学习设置免密码登陆的方法 掌握Linux环境下时间同步的配置 实验原理 1.Java的安装 java是大数据的黄金语言,这和java跨平台的特性是密不可分 ...
- 吴裕雄--天生自然HADOOP学习笔记:使用yum安装更新软件
实验目的 了解yum的原理及配置 学习软件的更新与安装 学习源代码编译安装 实验原理 1.编译安装 前面我们讲到了安装软件的方式,因为linux是开放源码的,我们可以直接获得源码,自己编译安装.例如: ...
- 吴裕雄--天生自然HADOOP学习笔记:Shell工具使用
实验目的 学习使用xshell工具连接Linux服务器 在连上的服务器中进入用户目录 熟悉简单的文件操作命令 实验原理 熟悉shell命令是熟悉使用linux环境进行开发的第一步,我们在linux的交 ...
- 吴裕雄--天生自然HTML学习笔记:HTML 布局
网页布局对改善网站的外观非常重要. 请慎重设计您的网页布局. <!DOCTYPE html> <html> <head> <meta charset=&qu ...
- 吴裕雄--天生自然MySQL学习笔记:MySQL 安装
所有平台的 MySQL 下载地址为: MySQL 下载:https://dev.mysql.com/downloads/mysql/ 注意:安装过程我们需要通过开启管理员权限来安装,否则会由于权限不足 ...
随机推荐
- C++ 一个exe的两个运行实例之间共享数据
#pragma data_seg("Shared") volatile int iNum = 0; #pragma data_seg() #pragma comment(linke ...
- unzip 小坑
unzip test.zip 直接将zip解压到当前目录下,保留test级目录. unzip test.war 直接将.war解压到当前目录,不保留test级目录,所以建议使用 unzip test. ...
- SpingBoot项目搭建(详细)
SpingBoot (原创:黑小子-余) springboot官网:->点击<- spring官网:->点击<- 一.SpringBoot简介 Spring Boot是由Piv ...
- EF Core开发模式之Code First
Code First顾名思义,代码为先.首先编写完相关的实体类及DbContext派生类,然后通过映射关系自动在数据库中完成数据库表的创建. 本例中创建一个班级和学生的管理,主要有班级类MyClass ...
- 【每日Scrum】第六天冲刺
一.计划会议内容 数据库仍然有问题,决定先绕过数据库,进行软件内容设计与界面ui美化. 二.任务看板 三.scrum讨论照片 四.产品的状态 无 五.任务燃尽图
- SQL基础教程(第2版)第6章 函数、谓词、CASE表达式:6-3 CASE表达式
● 虽然CASE表达式中的ELSE子句可以省略,但为了让SQL语句更加容易理解,还是希望大家不要省略. ● CASE表达式中的END不能省略. ● 使用CASE表达式能够将SELECT语句的结果进行组 ...
- PAT Advanced 1079 Total Sales of Supply Chain (25) [DFS,BFS,树的遍历]
题目 A supply chain is a network of retailers(零售商), distributors(经销商), and suppliers(供应商)– everyone in ...
- linux下ffmpeg环境搭建记录
1.Linux下安装yasm 官网下载:http://yasm.tortall.net/Download.html tar -zvxf yasm-1.3.0.tar.gz cd yasm-1.3.0/ ...
- Linux下常用的3种软件安装方式—rpm、yum、tar
一:Linux源码安装 1.解压源码包文件 源码包通常会使用tar工具归档然后使用gunzip或bzip2进行压缩,后缀格式会分别为.tar.gz与.tar.bz2,分别的解压方式: ...
- 基于libcurl的POST(http)
#include <stdio.h> #include <curl/curl.h> int main (void) { char *url="http://www.n ...