python 检索文件内容工具
公司内部需求一个工具检索目录下的文件在另外的目录中使用次数, 用来优化包体的大小。
此代码效率并不高效, 另添加对应的 后缀检索。 用python 实现比较快速, 另还有缺点是只支持 utf-8 格式内容。
各位用到的可以自己摘一下。
(本人习惯使用c\c++,目前发现这种脚本类的确实实现方便,接口齐全, 我能想到的接口, 真的全都有, 用python 写工具, 应该是一个调试起来还可以的过程)
代码如下:
#coding=utf-8 import os
import sys
import time #private:
def checkSuffix(strFileName, strCompareSuffix):
strPreFileName = ''
strFileSuffix = ''
bIsCheckOk = False
strArray = strFileName.split('.')
if len(strArray) > 1:
strPreFileName = strArray[0]
strFileSuffix = strArray[1]
#print(strFileSuffix)
#print(strCompareSuffix)
if strCompareSuffix == '*' or strFileSuffix == strCompareSuffix:
bIsCheckOk = True
return bIsCheckOk, strPreFileName def readFileName(file_dir):
for root, dirs, files in os.walk(file_dir):
return files,dirs, root
return '', '', '' def findString(pathFile, findKey):
#print("open pathFile:", pathFile)
fp = open(pathFile, "r", encoding='utf-8')
strr = fp.read()
if(strr.find(findKey) != -1):
return True
return False def startFind(files, dirs, root, findKey, strSuffix):
for fileName in files:
try:
bIsCheckOk, strPreFileName = checkSuffix(fileName, strSuffix)
if bIsCheckOk == False:
#print("fileName", fileName, " is not suffx :", strSuffix)
continue
if(findString(root + "\\" + fileName, findKey)):
return True, fileName
except Exception as err:
continue for jj in dirs:
fi, di, ro = readFileName(root + jj)
bIsFind, fileName = startFind(fi, di, ro, findKey, strSuffix)
if(bIsFind == True):
return bIsFind, fileName
return False, '' #public:
def findUse(dirPath, findKey, strSuffix):
files, dirs, root = readFileName(dirPath)
return startFind(files, dirs, root, findKey, strSuffix) def getDirsFiles(dirPath):
dirfiles = [];
for root, dirs, files in os.walk(dirPath):
dirfiles += files;
return dirfiles def writeResult(strFileName, strWriteSign, list):
fp = open(strFileName, 'a+')
fp.write(strWriteSign)
#fp.writelines(list)
for str in list:
fp.write(str)
fp.write('\n')
fp.close() if __name__ == '__main__':
"""
findDir = u"E:\\mmo2018001\\artist\\open\\ui\\free\\"
findAimDir = u"E:\\mmo2018001\\artist\\open\\effect\\"
findsuffix = "prefab" # 哪些要搜索的文件的后缀
findAimsuffix = "*" # 搜索那些后缀的文件
"""
bt = time.clock() # 记录时间 findDir = sys.argv[1]
findAimDir = sys.argv[2]
findsuffix = sys.argv[3]
findAimsuffix = sys.argv[4] thisPath = os.getcwd()
print("this path is ", thisPath)
print(findDir)
print(findAimDir)
print(findsuffix)
print(findAimsuffix) dirFiles = getDirsFiles(findAimDir)
useFiles = []
notUseFiles = []
nLen = len(dirFiles)
i = 0
for filesName in dirFiles : bIsCheckOk, strPreFileName = checkSuffix(filesName, findsuffix)
if bIsCheckOk == True:
isFind, fileName = findUse(findDir, strPreFileName, findAimsuffix)
#print("filesName:\t", filesName, " \nIsFind:\t\t", isFind)
if(isFind):
useFiles.append(filesName)
else:
notUseFiles.append(filesName)
i += 1
p = round(i * 100 / nLen)
duration = round(time.clock() - bt, 2)
remaining = round(duration * 100 / (0.01 + p) - duration, 2)
print("进度:{0}%,已耗时:{1}s,预计剩余时间:{2}s".format(p, duration, remaining), end="\r") writePath = thisPath + "\\Result.txt"
try:
os.remove(writePath)
except Exception as err:
print(err)
writeResult(writePath, "***************NotUseFiles:***************\n", notUseFiles)
writeResult(writePath, "***************UseFiles:***************\n", useFiles)
useTime = time.clock() - bt
print("已完成 总耗时:", useTime)
python 检索文件内容工具的更多相关文章
- Linux中利用grep命令如何检索文件内容详解
前言 Linux系统中搜索.查找文件中的内容,一般最常用的是grep命令,另外还有egrep命令,同时vi命令也支持文件内容检索.下面来一起看看Linux利用grep命令检索文件内容的详细介绍. 方法 ...
- Python 输出文件内容到网络端口
Python 输出文件内容到网络端口 $ cat mySocketTest.py import sys import time import socket if __name__ == "_ ...
- python 修改文件内容
python 修改文件内容 一.修改原文件方式 1 def alter(file,old_str,new_str): 2 """ 3 替换文件中的字符串 4 :param ...
- python实现文件搜索工具(简易版)
在python学习过程中有一次需要进行GUI 的绘制, 而在python中有自带的库tkinter可以用来简单的GUI编写,于是转而学习tkinter库的使用. 学以致用,现在试着编写一个简单的磁文件 ...
- Linux中通过grep命令检索文件内容和指定内容前后几行
原文链接: https://www.linuxidc.com/Linux/2017-11/148390.htm Linux系统中搜索.查找文件中的内容,一般最常用的是grep命令,另外还有egrep命 ...
- python改动文件内容,不须要read,write多个动作。
python 要改动文件内容,经常使用 是先read.后write , 再 rename.非常不爽. 比方:须要 把 yuv_dir ="../HD/" # &q ...
- python 修改文件内容3种方法
原文链接:https://www.cnblogs.com/wc-chan/p/8085452.html def alter(file,old_str,new_str): ""&qu ...
- python ini文件内容的读取
(1)新建一个项目,再次新建一个文件 test_cfg.ini (2)再次新建 get_test_cfg.py,用来读取/写入/更改 ini的文件内容 #!/usr/bin/env python # ...
- Python修改文件内容
工作中要写个脚本来修改文件的内容,然后就写了一个刷子: #coding:utf8 import os def modify_file(old_file, new_version, old_versio ...
随机推荐
- OpenJudge - 2977:生理周期
原题链接 总时间限制: 1000ms 内存限制: 65536kB 描述 人生来就有三个生理周期,分别为体力.感情和智力周期,它们的周期长度为23天.28天和33天.每一个周期中有一天是高峰.在高峰这天 ...
- Zookeeper实现服务注册/发现
what that? Zookeeper在分布式开发中使用频繁,但许多框架都对其进行了封装,初学者可能无法较好的理解其工作原理,该文章演示了使用Zookeeper实现服务注册,服务发现的简单demo, ...
- SpringCloud之Security
Spring Security是Spring提供的一个安全框架,提供认证和授权功能,最主要的是它提供了简单的使用方式,同时又有很高的灵活性,简单,灵活,强大. 我个人博客系统采用的权限框架就是Spri ...
- 使用PyQtGraph绘制数据滚动图形(3)
import pyqtgraph as pg import numpy as np from pyqtgraph.Qt import QtGui, QtCore app = pg.QtGui.QApp ...
- test for OCr
- EIGRP-9-弥散更新算法-拓扑表
弥散更新算法(DUAL)是一个收敛算法.它代替了其他距离矢量协议使用的Bellman-Ford 算法.路由环路.甚至是在协议完全收敛前出现的瞬时环路.都会对网络性能造成不良影响.为了防止环路的形成.D ...
- pycharm安装破解方法
1.pycharm专业版官方下载链接:http://www.jetbrains.com/pycharm/download/#section=windows正常下载并安装 2.从https://gith ...
- sql片段提取引用
sql片段 sql中可将重复的sql提取出来,使用时用include引用即可,最终达到sql重用的目的,如下: <!-- 传递pojo综合查询用户信息 --> <select id= ...
- 看到这些常见的android面试题,你慌了吗?
最近参加了一些Android工程师岗位的面试,总结了一些常见的考点,希望能帮到正在面试的你(答案还在整理中)! 1.Java调用函数传入实际参数时,是值传递还是引用传递? 2.单例模式的DCL方式,为 ...
- 读Linux高性能服务器编程-12章http服务器源码
title:用线程池实现的http服务器 从main函数看起 解析ip地址(点分制, 端口号) 设置忽略SIGPIPE信号 初始化线程池,池中创建了8个线程,每个线程对应一个work函数 初始化htt ...