[改善Java代码]不同的列表选择不同的遍历方法

一.场景:

我们来看一个场景，统计一个省的各科高考科目考试的平均分.

当然使用数据库中的一个SQL语句就能求出平均值,不过这个不再我们的考虑之列,这里只考虑使用纯Java的方式来解决.(由于我的机器配置比较好,用80万的数据量有点小,各个统计结果不明显,不能更加显著的说明明问题...这里改为800万)

看代码:

 import java.util.ArrayList;

 import java.util.Iterator;

 import java.util.List;

 import java.util.Random;

 public class Client {

     public static void main(String[] args) {

         //学生数量,800万

         int stuNum = 800*10000;

         //List集合，记录所有学生的分数

         List<Integer> scores = new ArrayList<Integer>(stuNum);

         //写入分数

         for(int i=0;i<stuNum;i++){

             scores.add(new Random().nextInt(150));

         }

         //记录开始计算时间

         long start = System.currentTimeMillis();

         System.out.println("平均分是：" + average(scores));

         System.out.println("执行时间：" + (System.currentTimeMillis() -start) + "ms");

     }

     //计算平均数

     public static int average(List<Integer> list){

         int sum = 0;

         //遍历求和

         for(int i:list){

             sum +=i;

         }

         /*

         Java中的foreach()语法是iterator(迭代器)的变形用法,上面的foreach语法和下面的代码等价

         for(Iterator<Integer> i=list.iterator(); i.hasNext(); ){

             sum +=i.next();

         }

          */

         //除以人数，计算平均值

         return sum/list.size();

     }

 }

运行结果:

平均分是：74

执行时间：99ms

仅仅求一个平均值就花费了74毫秒，考虑其他诸如加权平均值、补充平均值等的话，花费时间肯定更长。我们仔细分析一下arverage方法，加号操作是最基本操作，没有可以优化，我们可以尝试对List遍历进行优化。

List的遍历还有另外一种形式，即通过下表方式来遍历，如下：

 import java.util.ArrayList;

 import java.util.Iterator;

 import java.util.List;

 import java.util.Random;

 public class Client {

     public static void main(String[] args) {

         //学生数量,800万

         int stuNum = 800*10000;

         //List集合，记录所有学生的分数

         List<Integer> scores = new ArrayList<Integer>(stuNum);

         //写入分数

         for(int i=0;i<stuNum;i++){

             scores.add(new Random().nextInt(150));

         }

         //记录开始计算时间

         long start = System.currentTimeMillis();

         System.out.println("平均分是：" + average(scores));

         System.out.println("执行时间：" + (System.currentTimeMillis() -start) + "ms");

     }

     //计算平均数

     public static int average(List<Integer> list){

         int sum = 0;

         //遍历求和

         for(int i = 0, size = list.size(); i < size; i++){

             sum += list.get(i);

         }

         //除以人数，计算平均值

         return sum/list.size();

     }

 }

运行结果如下:

平均分是：74

执行时间：58ms

执行时间大幅提升，性能提升65%。

为什么会有如此提升呢？我们知道foreacher与下面代码等价：

for(Iterator<Integer> i = list.iterator(); i.hasNext;){

    sum += i.next();

}

迭代器是23中设计模式的一种，提供一种方法访问一个容器对象中的各个元素，同时又无须暴露该对象的内部细节。也就是说对于ArrayList，需要先创建一个迭代器容器，然后屏蔽内部遍历细节，对外提供hasNext、next等方法。

问题是ArrayList实现了RandomAccess接口，表明元素之间本没有关系，为了使用迭代器就需要强制建立一种互相“知晓”的关系，比如上一个元素可以判断是否有下一个元素，以及下一个元素是什么等关系，这也就是通过foreach遍历耗时的原因。

Java为ArrayList类加上了RandomAccess接口,就是在告诉我们"ArrayList是随机存取的,采用下标方式遍历列表速度会更快".

但是为什么不把RadomAccess加到所有的List实现类上呢?

那是因为有些List实现类是不能随机存取的,而是有序存取的,比如LinkedList类,LinkedList也是一个列表,但是它实现了双向链表,每个数据节点中都有三个数据项:前节点的引用(Previous Node),本节点元素(Node Element),后继节点的引用(Next Node),这是数据结构的节本知识,也就是在LinkedList中的两个元素本来就是有关联的,我知道你的存在,你也知道我的存在.

综上对于LinkedList由分析讲述，元素之间已经有关联了，使用foreach也就是迭代器方式是不是更高呢？代码如下

 import java.util.LinkedList;

 import java.util.List;

 import java.util.Random;

 public class Client {

     public static void main(String[] args){

         //学生数量，80万

         int stuNum = 800 * 10000;

         //List集合，记录所有学生分数

         List<Integer> scores = new LinkedList<Integer>();   

         //写入分数

         for(int i = 0; i < stuNum; i++){

             scores.add(new Random().nextInt(150));

         }   

         //记录开始计算时间

         long start = System.currentTimeMillis();

         System.out.println("平均分是：" + average(scores));

         System.out.println("执行时间：" + (System.currentTimeMillis() - start) + "ms");

     }

     public static int average(List<Integer> list){

         int sum = 0;

         //foreach遍历求和

         for(int i : list){

             sum += i;

         }

         //除以人数，计算平均值

         return sum/list.size();

     }

 }

运行结果:

平均分是：74

执行时间：118ms

可能这个数据量不是很适合.....用八十万量的数据量LinkedList使用foreach的速度和ArrayList使用普通for循环的速度差不多.....

可以测试使用下标的方式遍历LinkedList中的元素:

其实不用测试,效率真的非常低,直接看源代码:

 public E get(int index){

     return entry(index).element;

 }

由entry方法查找指定下标的节点，然后返回其包含的元素，看entry方法：

 private Entry<E> entry(int index){

     //检查下标是否越界

     Entry<E> e = header;

     if(index < (size >> 1)){

         //如果下标小于中间值，则从头节点开始搜索

         for(int i = 0; i <= index; I++){

         e = e.next;

     }

     }else{

         //如果下标大于等于中间值，则从尾节点反向遍历

         for(int i = size; i > index; i++){

             e = e.previous;

         }

     }

     return e;

 }

程序会先判断输入的下标与中间值(size右移一位,也就是除以2了)的关系,小于中间值则从头开始正向搜索,大于中间值则从尾节点反向搜索,想想看,每一次的get方法都是一个遍历,"性能"两字从何说起呢!

明白了随机存取列表和有序存取列表的区别,average方法就必须重构,以便实现不同的列表采用不同的遍历方式.代码如下:

 import java.util.LinkedList;

 import java.util.List;

 import java.util.Random;

 import java.util.RandomAccess;

 public class Client {

     public static void main(String[] args) {

         // 学生数量,80万

         int stuNum = 80 * 10000;

         // List集合，记录所有学生的分数

         List<Integer> scores = new LinkedList<Integer>();

         // 写入分数

         for (int i = 0; i < stuNum; i++) {

             scores.add(new Random().nextInt(150));

         }

         // 记录开始计算时间

         long start = System.currentTimeMillis();

         System.out.println("平均分是：" + average(scores));

         System.out.println("执行时间：" + (System.currentTimeMillis() - start)

                 + "ms");

     }

     // 计算平均数

     public static int average(List<Integer> list) {

         int sum = 0;

         if (list instanceof RandomAccess) {

             //可以随机存取，则使用下标遍历

             for (int i = 0, size = list.size(); i < size; i++) {

                 sum += list.get(i);

             }

         } else {

             //有序存取，使用foreach方式

             for (int i : list) {

                 sum += i;

             }

         }

         // 除以人数，计算平均值

         return sum / list.size();

     }

 }

这样无论是随机存取列表还是有序列表,程序都可以提供快速的遍历.

列表遍历也不是那么简单的,适时选择最优的遍历方式,不要固化为一种.

[改善Java代码]不同的列表选择不同的遍历方法的更多相关文章

[改善Java代码]多种最值算法，适时选择
建议64:多种最值算法,适时选择. 对一批数据进行排序,然后找出其中的最大值或最小值,这是基本的数据结构知识.在Java中我们可以通过编写算法的方式,也可以通过数组先排序再取值的方式来实现.下面以求最 ...
[改善Java代码]asList方法产生的List对象不可更改
上一个建议之处了asList方法在转换基本类型数组时候存在的问题,在看下asList方法返回的列表有何特殊的地方.看代码: import java.util.Arrays; import java.u ...
[改善Java代码]注意Class类的特殊性
Java语言是先把Java源文件编译成后缀为class的字节码文件,然后再通过ClassLoader机制把这些类文件加载到内存中,最后生成实例执行的,这是Java处理的基本机制,但加载到内存中的数据是 ...
[改善Java代码]易变业务使用脚本语言编写
建议16: 易变业务使用脚本语言编写 Java世界一直在遭受着异种语言的入侵,比如PHP.Ruby.Groovy.JavaScript等,这些“入侵者”都有一个共同特征:全是同一类语言—脚本语言,它们 ...
[改善Java代码]警惕自增的陷阱
建议7: 警惕自增的陷阱老师就说:自增有两种形式,分别是i++和++i,i++表示的是先赋值后加1,++i是先加1后赋值,这样理解了很多年也没出现问题,直到遇到如下代码,我才怀疑我的理解是不是错了: ...
[改善Java代码]覆写变长方法也循规蹈矩
建议6:覆写变长方法也循规蹈矩在Java中,子类覆写父类中的方法很常见,这样做既可以修正Bug也可以提供扩展的业务功能支持,同时还符合开闭原则(Open-Closed Principle),我们来看 ...
[改善Java代码]不要在finally块中处理返回值
在finally代码块中处理返回值,这是在面试题中经常出现的题目.但是在项目中绝对不能再finally代码块中出现return语句,这是因为这种处理方式非常容易产生"误解",会严重 ...
将Java代码打包成jar文件转换为.exe可执行程序方法
做完学生管理系统后我想将代码打包成一个可执行程序,那样就可以直接点击在Windows下运行了,下面就跟大家分享下打包方法. 将Java的代码转换成 .exe 文件需要先把代码打包成 jar 文件然 ...
Java中关于 ArrayList 和 Map 的常用遍历方法 (学习笔记，便于以后查询)
一.学习ArrayList与Map时,关于常用遍历方法的记录如下: 二.附源码如下: package com.study.in.myself; import java.util.ArrayList; ...

随机推荐

现代程序设计——homework-07
1.写在前面不得不很惭愧地说,在看这些博客之前,我对C++的了解仅限于上过一门特别水的关于C++的公选课.一门只有五节课的专业选修课,写过一点点符合C++语法语法规则的类C程序,偶尔在论坛.博客中看 ...
snprintf 返回值
在平时写代码的过程中,我一个推荐带有n系列的字符串函数,如 strcat ->strncat sprintf->snprintf 我们有类似的一个函数 void dump_kid(std: ...
JNI调用测试
有需求使用JNI调用,籍着这个机会按照<Linux下测试Java的JNI(Java Native Interface)>上进行了下测试. 这篇文章记录得很清楚了,对原理未做深入的分析,希望 ...
【转】Objective-C代码注释和文档输出的工具和方法
http://blog.xcodev.com/blog/2013/11/01/code-comment-and-doc-gen-tools-for-objc/ 代码注释可以让代码更容易接受和使用,特别 ...
STC89c52RC 的EEPROM和AVR的EEPROM
二者的EEPROM不是一回事,AVR片内的EEPROM是独立于程序存储器的数据存储器,本身不能存储程序并运行,但现代MCU很多支持IAP,利用IAP技术可在程序存储空间实现数据存储即替代EEPROM, ...
jquery easyui的扩展验证
1.扩展通过$.extends($.fn.validatebox.defaults.rules,)扩展 $.extend( $.fn.validatebox.defaults.rules, { idc ...
ASP.NET Web Api返回对象类型为JSON还是XML
在Umbraco平台上开发过程中,我用WebApi返回JSON result给前端前端使用React调用这个web api来获取JSON result 我写的web api方法是返回JSON 类型的 ...
C#经典面试题 C# 中 Struct 与 Class 的区别，以及两者的适用场合
在一家公司面试时,第一个问题就是问到这个转载文章 http://www.cnblogs.com/waitrabbit/archive/2008/05/18/1202064.html 来解释此问题 ...
Spark 1.3.0 单机安装
一.试验环境: CentOS6.6 最小化安装:主机名spark-test,IP:10.10.10.26 OpenStack虚拟云主机. 注:安装流程:进入linux->安装JDK->安装 ...
Ext.tree.Panel Extjs 在表格中添加树结构，并实现节点移动功能
最近在用Extjs 做后台管理系统,真的非常好用.总结的东西分享一下. 先展示一下效果图好了,开始吧! 首先说一下我的创建结构: 一.构造内容这个函数中包括store的创建,treePanel的创 ...

[改善Java代码]不同的列表选择不同的遍历方法

[改善Java代码]不同的列表选择不同的遍历方法的更多相关文章

随机推荐

热门专题