Python，针对指定文件类型，过滤空行和注释，统计行数

参考网络上代码编辑而成，无技术含量，可自行定制：

目前亲测有效，若有待完善之处，还望指出！

强调：将此统计py脚本放置项目的根目录下执行即可。

1、遍历文件，递归遍历文件夹中的所有

def getFile(basedir):

    global filelists

    for parent,dirnames,filenames in os.walk(basedir):

        #for dirname in dirnames:

        #    getFile(os.path.join(parent,dirname)) #递归

        for filename in filenames:

            ext = filename.split('.')[-1]

            #只统计指定的文件类型，略过一些log和cache文件

            if ext in whitelist:

                filelists.append(os.path.join(parent,filename))

2、指定文件类型：项目的代码行数，故只考虑.py文件，当然也可在指定的文件类型列表whitelist中添加其他类型

# 指定想要统计的文件类型

whitelist = ['py']

3、过滤空行和注释，注意采用的读取文件模式为‘rb’

def countLine(fname):

    count = 0

    single_quotes_flag = False

    double_quotes_flag = False

    with open(fname, 'rb') as f:

        for file_line in f:

            file_line = file_line.strip()

            # print(file_line)

            # 空行

            if file_line == b'':

                pass

            # 注释 # 开头

            elif file_line.startswith(b'#'):

                pass

            # 注释 单引号 ''' 开头

            elif file_line.startswith(b"'''") and not single_quotes_flag:

                single_quotes_flag = True

            # 注释 中间 和 ''' 结尾

            elif single_quotes_flag == True:

                if file_line.endswith(b"'''"):

                    single_quotes_flag = False

            # 注释 双引号 """ 开头

            elif file_line.startswith(b'"""') and not double_quotes_flag:

                double_quotes_flag = True

            # 注释 中间 和 """  结尾

            elif double_quotes_flag == True:

                if (file_line.endswith(b'"""')):

                    double_quotes_flag = False

            # 代码

            else:

                count += 1

        print(fname + '----', count)

        # 单个文件行数

        # print(fname,'----count:',count)

        return count

完整源码：

#!/usr/bin/env python

# -*- coding: utf-8 -*-

# @Time    : 2018/05/10 21:50

# @Author  : MJay_Lee

# @File    : python统计行数.py

# @Contact : limengjiejj@hotmail.com

import os

import time

basedir = os.path.dirname(__file__)

filelists = []

# 指定想要统计的文件类型

whitelist = ['py']

#遍历文件, 递归遍历文件夹中的所有

def getFile(basedir):

    global filelists

    for parent,dirnames,filenames in os.walk(basedir):

        #for dirname in dirnames:

        #    getFile(os.path.join(parent,dirname)) #递归

        for filename in filenames:

            ext = filename.split('.')[-1]

            #只统计指定的文件类型，略过一些log和cache文件

            if ext in whitelist:

                filelists.append(os.path.join(parent,filename))

#统计一个文件的行数

def countLine(fname):

    count = 0

    single_quotes_flag = False

    double_quotes_flag = False

    with open(fname, 'rb') as f:

        for file_line in f:

            file_line = file_line.strip()

            # print(file_line)

            # 空行

            if file_line == b'':

                pass

            # 注释 # 开头

            elif file_line.startswith(b'#'):

                pass

            # 注释 单引号 ''' 开头

            elif file_line.startswith(b"'''") and not single_quotes_flag:

                single_quotes_flag = True

            # 注释 中间 和 ''' 结尾

            elif single_quotes_flag == True:

                if file_line.endswith(b"'''"):

                    single_quotes_flag = False

            # 注释 双引号 """ 开头

            elif file_line.startswith(b'"""') and not double_quotes_flag:

                double_quotes_flag = True

            # 注释 中间 和 """  结尾

            elif double_quotes_flag == True:

                if (file_line.endswith(b'"""')):

                    double_quotes_flag = False

            # 代码

            else:

                count += 1

        print(fname + '----', count)

        # 单个文件行数

        # print(fname,'----count:',count)

        return count

if __name__ == '__main__' :

    startTime = time.clock()

    getFile(basedir)

    totalline = 0

    for filelist in filelists:

        totalline = totalline + countLine(filelist)

    print('\033[43m total lines: \033[0m'.center(20,'-'),totalline)

    print('Done! Cost Time: %0.5f second' % (time.clock() - startTime))

测试对象样本，test.py：

#

'''

123

aa

哈哈

'''

"""

123

aa

哈哈

"""

code1

code2

结果为：2

Python，针对指定文件类型，过滤空行和注释，统计行数的更多相关文章

python 读取指定文件夹中的指定文件类型的文件名
import numpy as np import os path = 'F:\\wenjian'#指定文件所在路径 filetype ='.csv'#指定文件类型 def get_filename( ...
HTML input="file" 浏览时只显示指定文件类型 xls、xlsx、csv
html input="file" 浏览时只显示指定文件类型 xls.xlsx.csv <input id="fileSelect" type=" ...
<input type="file" />浏览时只显示指定文件类型
<input type="file" />浏览时只显示指定文件类型 <input type="file" accept="appli ...
findstr 只搜寻指定文件类型
Title:findstr 只搜寻指定文件类型 --2012-05-04 09:27 findstr /i /m /S /C:"关键字" *.php *.asp *.jsp
C# 获得目录下所有文件或指定文件类型文件(包含所有子文件夹)
public partial class FileGet { /// <summary> /// 私有变量 /// </summary> private static List ...
Apache 日志设置不记录指定文件类型的方法和日志轮
Apache日志精准的记录了Web访问的记录,但对于访问量很大的站来说,日志文件过大对于分析和保存很不方便.可以在http.conf(或虚拟主机设置文件httpd-vhosts.conf)中进行设置, ...
nginx不记录指定文件类型的日志
1.指定记录文件日志记录的内容. vim /usr/local/nginx/conf/nginx.conf如下部分: log_format dd '$remote_addr $http_x_forwa ...
nginx不记录指定文件类型日志
1.指定记录文件日志记录的内容. vim /usr/local/nginx/conf/nginx.conf如下部分: log_format dd '$remote_addr $http_x_forwa ...
python 将指定文件夹中的指定文件放入指定文件夹中
import os import shutil import re #获取指定文件中文件名 def get_filename(filetype): name =[] final_name_list = ...

随机推荐

Windows 环境下安装MongoDB
mongoDB下载地址 https://www.mongodb.org/ 在mongoDB官网下载windows版本的mongoDB后解压出来(本文以解压到D盘为例) 在解压出来的MongoDB文件夹 ...
Java基础11-数组
1.使用数组步骤: (1)声明数组 int[] a; (2)分配空间 a=new int[5]; (3)赋值 a[0]=1; int类型数组如果没有赋值,默认值为0,String类型数组默认为nul ...
关于花瓣网header条的思考
最近忙着俱乐部招新的事情,每一次培训都会给学员布置作业,但是作业积累在手上并没有长久的保存价值,于是萌生了一个创建俱乐部网站平台的想法.为了充当好PM这个角色,学习了Axure软件的用法,并且首次制作 ...
php错误等级
E_ALL - 所有的错误和警告(不包括 E_STRICT) E_ERROR - 致命性的运行时错误 E_WARNING - 运行时警告(非致命性错误) E_PARSE - 编译时解析错误 ...
使用Advanced Installer进行二次打包
使用Advanced Installer进行二次打包在上一篇使用InstallerShield打包VS程序中,我已经叙述过,为什么要进行二次打包的问题,在此我就不再赘述.本次长枪直入,说一说如何使用 ...
启动和停止GlassFish Server
您可以使用NetBeans IDE或命令行启动和停止GlassFish Server. 使用NetBeans IDE启动GlassFish Server 单击“服务”选项卡. 展开服务器. 右键单 ...
Sharepoint2010新建一个用户的方法
最近在做关于SharePoint的相关开发,在开发中需要用到测试用户进行相关权限的测试,所以就需要创建一个新的用户进行,但是在网上找了很久都没有找到关于创建一个新用户的资料,最后终于在http://w ...
弹性布局 Flexible Box
页面中任何一个元素都可以指定为弹性布局(Flex) 属性:display 取值: 1.flex 将块级元素变为弹性布局容器 2.inline-flex 将行内元素变为弹性布局容器兼容性 ...
JS的函数参数传递为值传递
function setAge(i) { alert(i);//24 i = 18; alert(i);//18,i的改变不会影响外面的age }; var age = 24; setAge(age) ...
Dynamics CRM用户创建后自动添加到团队报错
前两天在实现一项需求——用户创建后自动添加到一个叫做“全体员工”的团队的时候,遇到了一个奇怪的错误,CRM的错误日志只有一句简单的“Generic SQL error.”.一般遇到这个错误处理都非比较 ...

Python，针对指定文件类型，过滤空行和注释，统计行数

Python，针对指定文件类型，过滤空行和注释，统计行数的更多相关文章

随机推荐

热门专题