首先感谢czbk的老师,录制的视频,让我们有这么好的学习资料。……——

统计文件夹java文件的行数,首先想到的肯定是用递归的方法,因为文件夹下面可能包含文件夹,用递归的方法,代码容易写。(这和写简单的网络爬虫很像,一级页面下包含有二级页面的链接,二级页面又包含下一级的超链接)但是,用递归的方式有以下缺点:

  1. 如果文件夹层次很多,进而递归深度太大,容易栈溢出
  2. 用递归的方式,只能单线程执行,因为这一次的递归依赖于上一次的递归执行的结果

递归方式代码比较简单,如下:

public class LineCounterV1 {

    public static void main(String[] args) {
String path = "D:/wsc/eclipse/myeclipse-workspace/MyLineCount";
int count = getAllJavaFilesLineCount(new File(path));
System.out.println("总行数:" + count);
} /**
* 使用递归实现统计这个文件夹中(包含子孙文件夹中的)的所有.java文件的总行数
*
* @param dir
* 文件夹
* @return
*/
private static int getAllJavaFilesLineCount(File dir) {
int count = 0;
for (File file : dir.listFiles()) {
// 如果是.java文件,就统计行数
if (file.isFile() && file.getName().endsWith(".java")) {
count += FileUtils.getLineCount(file);
}
// 如果是文件夹,就递归调用
else if (file.isDirectory()) {
count += getAllJavaFilesLineCount(file);
}
}
return count;
}
}

其中,取得某个文件行数的代码如下:

public class FileUtils {

    /**
* 读取指定文件的内容,返回总行数
*
* @param file
* @return
*/
public static int getLineCount(File file) {
if (!file.isFile()) {
throw new IllegalArgumentException("请指定一个有效的文件对象!");
} try {
BufferedReader reader = new BufferedReader(new FileReader(file));
int count = 0;
while (reader.readLine() != null) {
count++;
}
reader.close();
return count;
} catch (Exception e) {
throw new RuntimeException(e);
}
}
}

------------------------------------------------------------------------------------------------------------------------------------------

第二种方法,使用任务队列的方法,这是个很实用的技巧,特记录学习。

任务队列底层是一种队列的数据结构,可以存放在内存中,也可以保存在数据库中(递归的过程中使用的数据只能放在内存中),另外,很多个工作线程组成所谓的任务处理器,可以多线程处理任务队列中的任务(和一般的生产者消费者模型不同,这里任务队列中的线程既是任务的消费者,也是任务的生产者--其中消费者对应的是统计某个文件夹下所有文件的代码行数,生产者对应的是如果某个文件夹下保护子文件夹则创建新的任务并加入到任务队列尾)。

任务队列涉及到的类有以下:

  • 任务,这里指的是统计某个文件夹下的所有java文件的代码总行数
  • 任务队列,提供取出队头任务和加入队尾任务的功能,这里底层使用的是LinkedList来模拟
  • 处理线程,取出任务队列中的队头任务,并执行这个任务(按照面向对象原则,执行任务方法应该封装在任务类中而不是线程类中,因为只有任务类最清楚如何具体执行这个任务)
  • 一个测试类,初始化时往任务队列中放入一个任务(即统计根文件夹这个目录下的代码行数),开启任务处理线程,等待2秒钟(视具体情况),输出统计结果

使用任务队列的好处有:

  1. 可以处理大数据量
  2. 借助数据库持久化任务队列,可以实现高可靠性-因为不依赖于内存,可以应对断电等情况
  3. 多线程处理,在数据量比较大时,速度快

Task.java

public class Task {

    // 最终统计的总行数的结果
private static int count = 0; // 待统计的文件夹
private File dir; public Task(File dir) {
this.dir = dir;
} /**
* 办理任务:
*
* 遍历本文件夹中的所有子文件和字文件夹:<br>
* a, 如果是.java文件,就统计行数。<br>
* b, 如果是文件夹,就作为新的任务放到任务队列尾。
*
*/
public void execute() {
System.out.println(Thread.currentThread() + " ---> 正在办理任务:" + dir.getPath()); for (File file : dir.listFiles()) {
// 如果是.java文件,就统计行数
if (file.isFile() && file.getName().endsWith(".java")) {
synchronized (Task.class) { // 注意同步问题
count += FileUtils.getLineCount(file);
}
}
// 如果是文件夹,就作为新的任务放到任务队列尾
else if (file.isDirectory()) {
Task task = new Task(file);
TaskQueue.addToTail(task);
}
}
} /**
* 获取最终统计的总行数
*
* @return
*/
public static int getCount() {
return count;
} }

TaskQueue.java

public class TaskQueue {

    private static LinkedList<Task> queue = new LinkedList<Task>();

    /**
* 把任务放到队列的尾巴上
*
* @param task
* @return
*/
// 注意同步问题
public static synchronized void addToTail(Task task) {
queue.addLast(task);
} /**
* 从队列的头上取出一个任务,如果没有任务了,就返回null.
*/
// 注意同步问题
public static synchronized Task removeHead() {
if (queue.size() > 0) {
return queue.removeFirst();
} else {
return null;
}
} }

Worker.java

public class Worker extends Thread {

    /**
* 工作线程: 不断的从任务队列中取出一个任务并执行这个任务。
*/
public void run() {
System.out.println("==> 新的线程启动了:" + this); while (true) {
try {
// 如果有任务就办理
Task task = TaskQueue.removeHead();
if (task != null) {
task.execute();
}
// 如果没有任务,就休息一会再去看有没有任务
else {
Thread.sleep(2);
}
} catch (InterruptedException e) {
throw new RuntimeException(e);
}
}
} }

测试类:

public class LineCounterV2 {

    public static void main(String[] args) throws Exception{
// 初始时只有一个任务(根目录)
String path = "D:/wsc/eclipse/myeclipse-workspace/MyLineCount";
Task task = new Task(new File(path));
TaskQueue.addToTail(task); // 开始多线程执行
int threadCount = 5;
for (int i = 0; i < threadCount; i++) {
new Worker().start();
} // 等待一会去看统计结果
Thread.sleep(2000);
int count = Task.getCount();
System.out.println("总行数:" + count); System.exit(0);
}
}

统计文件夹下java代码行数的小程序--主要是学习任务队列的思想的更多相关文章

  1. 使用python对文件夹里面所有代码行数进行统计。

    统计目录下所有的代码个数和总行数. # -*- coding: utf-8 -*- # @Author : ydf import json import os from pathlib import ...

  2. C++ 一个统计文件夹下所有代码文件行数的小工具

    // CodeLines.cpp : 定义控制台应用程序的入口点. // #include "stdafx.h" #include <Commdlg.h> #inclu ...

  3. java代码行数统计工具类

    package com.syl.demo.test; import java.io.*; /** * java代码行数统计工具类 * Created by 孙义朗 on 2017/11/17 0017 ...

  4. iOS 统计Xcode整个工程的代码行数

    小技巧5-iOS 统计Xcode整个工程的代码行数 1.打开终端 2.cd 空格 将工程的文件夹拖到终端上,回车,此时进入到工程的路径 此时已经进入到工程文件夹下 3.运行指令 a. find . - ...

  5. Linux 统计文件夹下文件个数及目录个数

    1. 统计文件夹下文件的个数 ls -l | grep "^-" | wc -l 2.统计文件夹下目录的个数 ls -l | grep "^d" | wc -l ...

  6. Linux上统计文件夹下文件个数以及目录个数

    对于linux终端用户而言,统计文件夹下文件的多少是经常要做的操作,于我而言,我会经常在谷歌搜索一个命令,“如何在linux统计文件夹的个数”,然后点击自己想要的答案,但是有时候不知道统计文件夹命令运 ...

  7. python (9)统计文件夹下的所有文件夹数目、统计文件夹下所有文件数目、遍历文件夹下的文件

    命令:os 用到的:os.walk   os.listdir 写的爬虫爬的数据,但是又不知道进行到哪了,于是就写了个脚本来统计文件的个数 #统计 /home/dir/ 下的文件夹个数 import o ...

  8. Linux统计文件夹下文件信息

    统计当前文件夹里面有多少文件,即统计文件个数 ls -l |grep "^-"|wc -l 统计当前文件夹里面有多少文件夹,即统计文件夹个数 ls -l |grep "^ ...

  9. linux 统计文件夹下文件,文件夹,所有个数

    统计某文件夹下文件的个数 ls -l |grep "^-"|wc -l 统计某文件夹下目录的个数 ls -l |grep "^d"|wc -l 统计文件夹下文件 ...

随机推荐

  1. as(C# 参考)

    原文地址:https://msdn.microsoft.com/zh-cn/library/cscsdfbt(v=vs.110).aspx 可以使用 as 运算符执行转换的某些类型在兼容之间的引用类型 ...

  2. 部门树形结构,使用Treeview控件显示部门

    部门树形结构.设计张部门表用于存储部门编码.名称.上级部门id,使用Treeview控件显示部门树,并实现部门增删改.移动.折叠等功能.特别提示,部门有层级关系,可用donetbar的adtree控件 ...

  3. Runner之记计账项目的典型用户分析

  4. 第四周 技术随笔psp

    本周psp 类型 内容 开始时间 结束 打断时间 净时间 写随笔 Scrum会议 23:46 00:27 0 41分

  5. Intellij IDEA 安装 Mybatis插件

    1.Ctrl+Alt+s

  6. css中的zoom

    CSS中zoom:1的作用兼容IE6.IE7.IE8浏览器,经常会遇到一些问题,可以使用zoom:1来解决,有如下作用:触发IE浏览器的haslayout解决ie下的浮动,margin重叠等一些问题. ...

  7. BestCoder Round #11 题解集合

    1001.Alice and Bob 签到题*1,只要x * 2 == n && y * 2 == m就满足条件. var m, n, x, y : int64; begin whil ...

  8. shell 下的$符合

    $n        $1 the first parameter,$2 the second...$#        The number of command-line parameters.$0  ...

  9. MyEclipse8.6 破解以及注册码

    建立JAVA工程文件.将以下Java代码拷贝至类中并执行即可. 注册码: register name: bobo9360013   Serial:oLR8ZC-855550-6065705698041 ...

  10. 在Excel中引用其他宏

    在excel的使用过程中,会用到一些自定义函数,可以使用宏轻松的实现这些功能,问题是必须使用“启用宏的excel”,这样用户每次打开时都要启用宏. 现用以按背景色计划为例,解决以上问题: 1.新建一个 ...