题词

JDK,Java Development Kit。

首先,我们必须认识到,,JDK但,但设置Java只有基础类库。它是Sun通过基础类库开发,这是唯一的。JDK书写总结的类库。从技术含量来说,还是在一个层级上,它们都是须要被编译成字节码。在JRE中执行的。JDK编译后的结果就是jre/lib下的rt.jar。我们学习使用它的目的是加深对Java的理解,提高我们的Java编码水平。

本系列全部文章基于的JDK版本号都是1.7.16。

源代码下载地址:https://jdk7.java.net/source.html

本节内容

在本节中。简析java.util包所包括的工具类库。主要是集合相关的类库,其次还有正则、压缩解压、并发、日期时间等工具类。

本篇内容大致、简单的对于java.util包进行了一个描写叙述。以后会逐渐进行内容补充。本篇文章相当于一个占位符,所谓先有了骨架,才干逐渐丰满

集合类

基本情况



主要接口及其继承关系例如以下:

SortedSet  -->  Set --> Collection -->  Iterable

List  -->  Collection  -->  Iterable

SortedMap  -->  Map

经常使用类及其继承关系例如以下:

HashSet/LinkedHashSet  --> Set

TreeSet  -->  SortedSet  --> Set

ArrayList/LinkedList  -->  List

HashMap  -->  Map

TreeMap  -->  SortedMap  -->  Map

统一称谓:Collection分支的,我们称之为“聚集”。Map分支的,我们称之为“映射”。

Collection继承自Iterable,所以其下的类都能够用迭代器Iterator訪问,也能够用for(E e:es)形式訪问;Map能够用实现了其内部接口Entry的对象,作为一个元素。

Hashtable和HashMap,他们都实现了Map接口;Hashtable继承自古老的抽象类Dictionary。是线程安全的;HashMap继承自较新的抽象类AbstractMap,不是线程安全的。

HashMap同意null的键和值。而Hashtable不同意null的键和值,这是由于:

Hashtable有方法contains方法(推断是否存在值),假设同意的话。则不论key或者value为null,都会返回null,这easy误解。所以Hashtable就强制限制了,对于null 键和值。直接抛出NullPointerException;

HashMap没有contains方法。各自是containsKey()和containsValues()。

另外JDK5開始,对于线程安全的Map,有一种ConcurrentHashMap,高效,事实上现线程安全的过程中,没有使用synchronized。是一种分段的结构,并用CAS这样的无锁算法实现了线程安全。

Hash

Object类有两种方法来判断对象的标识:equals()和hashCode()。

一般来说。假设您忽略了当中一种,您必须同一时候忽略这两种,由于两者之间有必须维持的至关重要的关系。

特殊情况是依据equals() 方法,假设两个对象是相等的。它们必须有同样的hashCode()值,Object源代码中对此有要求。虽然这通常不是真的。

http://blog.sina.com.cn/s/blog_5dc351100101l57b.html

http://fhuan123.iteye.com/blog/1452275

关于HashMap的源代码分析,能够參考:http://github.thinkingbar.com/hashmap-analysis/

LinkedHashMap,重写了HashMap的迭代器、AddEntry、Entry等几个方法和类,用一个双向链表存储元素增加的顺序。这能够依照訪问顺序排序,近期訪问的元素(get/put),会被放在链表的末尾,这是LRU算法(Least Recenty Used)。近期最少使用算法。

ArrayList和LinkedList

关于ArrayList和LinkedList,ArrayList是基于数组的,这样的方式将对象放在连续的位置中,读取快,可是容量不足时须要进行数组扩容,性能减少,插入和删除也慢;LinkedList是基于链表的,插入和删除都快,可是查找麻烦,不能依照索引查找。所以说。对于构造一个队列是用ArrayList或者LinkedList,是依据性能和方便来考虑的,比方LinkedList有removeLast(),ArrayList仅仅能remove(index),用LinkedList构造一个Queue的代码演演示样例如以下:

class Queue {
private LinkedList<String> llt;
public Queue() {
llt = new LinkedList<String>();
}
public void add(String s) {
llt.add(s);
}
public String get() {
return llt.removeLast(); //队列
//return llt.removeFirst(); //堆栈
}
public boolean isNull() {
return llt.isEmpty();
}
}

ConcurrentModificationException

import java.util.*;
import java.util.Map.Entry;
class Test
{
public static void main(String[] args) throws Exception {
HashMap<String,Integer> mTemp = new HashMap<String,Integer>();
mTemp.put("test1",1);
Iterator<Entry<String,Integer>> iTemp = mTemp.entrySet().iterator();
//下面这行代码会引发java.util.ConcurrentModificationException,
//由于对聚集创建迭代器之后。进行遍历或者改动操作时。假设遇到期望的改动计数器和实际的改动计数器不一样的情况(modCount != expectedModCount)
//就会报这个Exception,乐观锁的思想
//mTemp.put("test2",2);
while(iTemp.hasNext()) {
System.out.println(iTemp.next().getKey());
} //for循环,写法更简单一些,在编译后,还是会被转换为迭代器
for(Entry<String,Integer> e : mTemp.entrySet()) {
System.out.println(e.getKey());
} ArrayList<string> al = new ArrayList<string>();
al.add("test");
for(String s : al) {
Integer i = Integer.reverse((new java.util.Random().nextInt(100)));
al.add(i.toString()); //这行代码也会报ConcurrentModificationException
}
}
}

对于这样的情况,能够使用java.util.concurrent包中的相关类,比方CopyOnWriteArrayList,就不会报这个异常了。由于CopyOnWriteArrayList类最大的特点就是。在对事实上例进行改动操作(add/remove等)会新建一个数据并改动。改动完成之后,再将原来的引用指向新的数组。

这样,改动过程没有改动原来的数组,也就没有了ConcurrentModificationException错误。

我们能够參考CopyOnWriteArrayList的源代码:

    /**
* Appends the specified element to the end of this list.
*
* @param e element to be appended to this list
* @return <tt>true</tt> (as specified by {@link Collection#add})
*/
public boolean add(E e) {
final ReentrantLock lock = this.lock;
lock.lock();
try {
Object[] elements = getArray();
int len = elements.length;
Object[] newElements = Arrays.copyOf(elements, len + 1);
newElements[len] = e;
setArray(newElements);
return true;
} finally {
lock.unlock();
}
}

ConcurrentModificationException。表明:我正读取的内容被改动掉了,你是否须要又一次遍历?或是做其他处理?这就是fast-fail(高速失败机制)的含义。

尽管这仅仅是在一个线程之内,并非多线程的,我们相同也能够这样理解fast-fail:

Fail-fast是并发中乐观(optimistic)策略的详细应用。它同意线程自由竞争,但在出现冲突的情况下如果你能应对,即你能推断出问题何在,而且给出解决的方法;

悲观(pessimistic)策略就正好相反。它总是预先设置足够的限制,一般是採用锁(lock),来保证程序进行过程中的无错,付出的代价是其他线程的等待开销。

高速失败机制主要目的在于使iterator遍历数组的线程能及时发现其它线程对Map的改动(如put、remove、clear等)。因 此。fast-fail并不能保证全部情况下的多线程并发错误,仅仅能保护iterator遍历过程中的iterator.next()与写并发.

TreeSet和Collections.sort

TreeSet是基于TreeMap的实现。底层数据结构是“红黑树”。数据增加时已经排好顺序,存取及查找性能不如HashSet。Collections.sort是先把List转换成数组,再利用“归并排序”算法进行排序,归并排序是一种稳定排序。

关于TreeMap的文章:

http://zh.wikipedia.org/wiki/%E7%BA%A2%E9%BB%91%E6%A0%91

http://www.cnblogs.com/fornever/archive/2011/12/02/2270692.html

http://shmilyaw-hotmail-com.iteye.com/blog/1836431

http://www.ibm.com/developerworks/cn/java/j-lo-tree/index.html

http://blog.csdn.net/chenhuajie123/article/details/11951777

对这两种排序算法的性能比較例如以下(24核、64G内存,RHEL6.2):

在数据已经基本排好顺序的情况下,排序元素数目。在某个段内(大约是2万-20万)。TreeSet更高效;其它数目下Collections.sort更高效;

在数据随机性较强的情况下,排序元素数目,在1万之内。相差不大。Collections.sort性能略高。在1万之外,80万之内。TreeSet性能明显高于Collections.sort。80万之外。Collection.sort性能更高。java.util.concurrent.ConcurrentSkipListSet这样的基于“跳表”的线程安全的可排序类,在30万之内,性能高于Collection.sort。30万之外。性能低于Collection.sort,ConcurrentSkipListSet的排序性能总是低于TreeSet。

ConcurrentSkipListSet有一个平衡的树形索引机构没有的优点,就是在并发环境下其表现非常好。

这里能够想象,在没有了解SkipList这样的数据结构之前。假设要在并发环境下构造基于排序的索引结构,那么也就红黑树是一种比較好的选择了,可是它的平衡操作要求对整个树形结构的锁定,因此在并发环境下性能和伸缩性并不好。

代码演演示样例如以下:

import java.util.TreeSet;
import java.util.ArrayList;
import java.util.Comparator;
import java.util.Collections;
import java.util.Arrays;
import java.util.ListIterator;
import java.util.Random;
import java.util.Iterator; class Test {
public static void main(String[] args) { final int LEN = 300000; final int SEED = 100000;
Random r = new Random(); System.out.println("---------------------------"); long b = System.currentTimeMillis();
TreeSet<Temp> ts = new TreeSet<Temp>(new Comparator<Temp>(){
public int compare(Temp t1,Temp t2) {return t1.id-t2.id;}
});
for(int i=0;i<LEN;i++) {
ts.add(new Temp(r.nextInt(SEED)));
} System.out.println(System.currentTimeMillis() - b); ArrayList<Temp> aTemp = new ArrayList<Temp>();
Iterator<Temp> it = ts.iterator();
while(it.hasNext()) {
aTemp.add(it.next());
} System.out.println(System.currentTimeMillis() - b); System.out.println("---------------------------"); b = System.currentTimeMillis();
ArrayList<Temp> al = new ArrayList<Temp>();
for(int i=0;i<LEN;i++) {
al.add(new Temp(r.nextInt(SEED)));
}
//split to the real excution unit
/*
Collections.sort(al,new Comparator<Temp>() {
public int compare(Temp t1,Temp t2) {return t1.id-t2.id;}
});*/
Temp[] a = new Temp[al.size()];
al.toArray(a);
System.out.println(System.currentTimeMillis() - b);
Arrays.sort(a,new Comparator<Temp>() {
public int compare(Temp t1,Temp t2) {return t1.id-t2.id;}
});
System.out.println(System.currentTimeMillis() - b);
ListIterator<Temp> li = al.listIterator();
for(int i=0;i<a.length;i++) {
li.next();
li.set(a[i]);
}
System.out.println(System.currentTimeMillis() - b);
}
} class Temp {
public Temp(int id) {this.id = id;}
public int id;
}

一个错误验证:

增减进行过一个错误验证。发现对一个对象使用TreeSet排序,和使用相同数据Entry<String,Double>进行排序比較,性能非常差。開始以为JDK对Entry做过优化。static/final之类。后来把对象也改成final,里面元素也改成final。发现性能依然非常差。全然不能解释,感觉无法理解。

后来,发现是两段代码不一致,使用Entry进行排序的代码有bug,导致排序的数据非常少。所以显得性能好。。。。

所以。无端的臆測还是不要的,建立在JDK深入理解的基础上就好。

另外一个排序思路

比方,取出Top 20,也不一定要所有排序,能够仅仅取前20个,经验证。小数据量时,性能也是很高,大数据未验证。代码大致例如以下:

int n = 0;
double minScore = 100; //Top20中最小的积分
String minKey = ""; //最小值所在的Key
Map<String,Double> skuTop = new HashMap<String,Double>();
Set<String> styles = new HashSet<String>(); //过滤同款 for(String sku :tempSkuViewSkus.get(goodsUser.getKey())) {
boolean filter = false;
filter = filterSameStyle(sku,styles);
if(filter) continue; //过滤不成功,直接continue
Set<String> userSet = goodsUserView.get(sku);
if(userSet == null || userSet.size() == 0) continue;
//这一步,积分的计算,是最耗时的操作(性能瓶颈所在)
double score = mathTools.getJaccardSimilar(goodsUser.getValue(), userSet);
//前20个直接进入Map
if(n++ < ConstMongo.maxRecomNum) {
skuTop.put(sku, score);
if(score < minScore) {
minScore = score;
minKey = sku;
}
continue;
}
if(score <= minScore) continue;
//替换最小值
skuTop.remove(minKey);
skuTop.put(sku, score);
minScore = score;
minKey = sku;
for(Entry<String,Double> e : skuTop.entrySet()) {
if(e.getValue() < minScore) {
minScore = e.getValue();
minKey = e.getKey();
}
}
}

正則表達式

import java.util.regex.Matcher;
import java.util.regex.Pattern; public class Hello { public static void main(String[] args)
{
Pattern pattern = Pattern.compile("正則表達式");
//Pattern pattern = Pattern.compile("Hello,正則表達式\\s[\\S]+");
Matcher matcher = pattern.matcher("正則表達式 Hello,正則表達式 World");
//替换第一个符合正则的数据
System.out.println(matcher.replaceFirst("Java"));
}
}

经常使用的开发语言都支持正則表達式,可是其对于正则支持的程度是不一样的。

Js正则:http://msdn.microsoft.com/zh-cn/library/ae5bf541(VS.80).aspx

Python正则:http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html

Java正则:

http://www.blogjava.net/xzclog/archive/2006/09/19/70603.html

http://www.cnblogs.com/android-html5/archive/2012/06/02/2533924.html

并发相关类

例如以下章节的内容有简单使用演示:http://blog.csdn.net/puma_dong/article/details/37597261#t5

压缩解压类

例如以下章节的内容有简单使用演示:http://blog.csdn.net/puma_dong/article/details/23018555#t20

其他工具

计时器、日期、时间、货币

JDK的帧--java.util包装工具库的更多相关文章

  1. 细说Java主流日志工具库

    概述 在项目开发中,为了跟踪代码的运行情况,常常要使用日志来记录信息. 在Java世界,有很多的日志工具库来实现日志功能,避免了我们重复造轮子. 我们先来逐一了解一下主流日志工具. java.util ...

  2. Java主流日志工具库

    在项目开发中,为了跟踪代码的运行情况,常常要使用日志来记录信息.在Java世界,有很多的日志工具库来实现日志功能,避免了我们重复造轮子.我们先来逐一了解一下主流日志工具. 1.java.util.lo ...

  3. JDK Tools - jinfo: Java 配置信息工具

    jinfo 是 JDK 自带的配置信息工具,可以查看.设置 Java 进程的参数配置. 命令格式 jinfo [ option ] pidjinfo [ option ] executable cor ...

  4. java.util.Properties工具类

    import java.io.FileNotFoundException; import java.io.FileWriter; import java.io.IOException; import ...

  5. 使用java.util.Properties工具制作自定义访问配置文件信息

    import ch.qos.logback.classic.Logger; import org.slf4j.LoggerFactory; import java.io.IOException; im ...

  6. 几款Java常用基础工具库

    通用工具类(字符串.时间格式化.BeanUtils.IO) 1. commons-lang3库 1.1. org.apache.commons.lang3.StringUtils类 日常代码中,我们经 ...

  7. java.util.UUID工具类

    生成数据表的主键Id会用到此工具类 /** * <获取主鍵> * <获取32位UUID> * @return * @see [类.类#方法.类#成员] */ public st ...

  8. Java中的日志——Java.util.logging、log4j、commons-logging

    Java中给项目程序添加log主要有三种方式,一使用JDK中的java.util.logging包,一种是log4j,一种是commons-logging.其中log4j和commons-loggin ...

  9. 并发之java.util.concurrent.atomic原子操作类包

    15.JDK1.8的Java.util.concurrent.atomic包小结 14.Java中Atomic包的原理和分析 13.java.util.concurrent.atomic原子操作类包 ...

随机推荐

  1. javaweb学习总结(四十三)——Filter高级开发

    在filter中可以得到代表用户请求和响应的request.response对象,因此在编程中可以使用Decorator(装饰器)模式对request.response对象进行包装,再把包装对象传给目 ...

  2. Java Vector 类

    Vector类实现了一个动态数组.和ArrayList和相似,但是两者是不同的: Vector是同步访问的. Vector包含了许多传统的方法,这些方法不属于集合框架. Vector主要用在事先不知道 ...

  3. input checkbox问题和li里面包含checkbox

    <input type="checkbox" id="checkbox1"/> $("input#checkbox1").cli ...

  4. 关于数组和List之间相互转换的方法

    1.List转换成为数组:返回数组的运行时类型.如果列表能放入指定的数组.否则,将根据指定数组.如果指定的数组的元素比列表的多),那么会将存储列表元素的数组. 返回:包含列表元素的list.add(& ...

  5. bzoj2259

    这道题很不错,首先读入方式有一种跳跃的既视感:读入Si之后,我们可以直接往后跳Si,可以想到最短路,设序列为a[],我们设n+1是终点如果i+a[i]<=n+1 那么i-->i+a[i] ...

  6. phpcms v9会员中心文件上传漏洞

    漏洞版本: phpcms v9 漏洞描述: PHPCMS V9采用OOP(面向对象)方式自主开发的框架.框架易扩展,稳定且具有超强大负载能力. phpcms v9会员中心上传头像处可未经过充分过滤,攻 ...

  7. Win32下 Qt与Lua交互使用(一):配置Qt下Lua运行环境

    偶然间看到Lua这种脚本语言,有点兴趣,简单学习了一下. 发现Lua与C++之间可以实现非常强的交互性.Lua中可以使用C++中的函数,C++中也可以使用Lua中的函数.由此可以引发出很多奇思妙想了. ...

  8. 去除浏览器下jquey easyui datagrid、combotree 缓存问题

    在页面脚本中加入以下内容即可: $.ajaxSetup ({   cache: false //关闭AJAX相应的缓存 });

  9. Log4net创建日志及简单扩展

    转:http://blog.csdn.net/CHENFEIYANG2009/article/details/5397342 1.概述 log4net是.Net下一个非常优秀的开源日志记录组件.log ...

  10. Tdxtreelist 行变色

    ACanvas.Font.Color := clRed;   //如果有加印的  变颜色