并发编程 12—— 任务取消与关闭 之 shutdownNow 的局限性
Java并发编程实践 目录
并发编程 04—— 闭锁CountDownLatch 与 栅栏CyclicBarrier
并发编程 06—— CompletionService : Executor 和 BlockingQueue
并发编程 10—— 任务取消 之 关闭 ExecutorService
并发编程 12—— 任务取消与关闭 之 shutdownNow 的局限性
并发编程 13—— 线程池的使用 之 配置ThreadPoolExecutor 和 饱和策略
第1 部分 问题引入
当通过 shutdownNow 来强行关闭 ExecutorService 时,它会尝试取消正在执行的任务,并返回所有已提交但尚未开始的任务,从而将这些任务写入日志或者保存起来以便之后进行处理。
然而,我们无法通过常规方法来找出哪些任务已经开始但尚未结束。这意味着这我们无法在关闭过程中知道正在执行的任务的状态,除非任务本身会执行某种检查。要知道哪些任务还没有完成,你不仅需要知道哪些任务还没有开始,而且还需知道当 Executor 关闭时哪些任务正在执行。
第2 部分 实例
在下面程序 TrackingExecutor 中给出了如何在关闭过程中判断正在执行的任务。通过封装 ExecutorService 并使得execute 记录哪些任务是在关闭后取消的,TrackingExecutor 可以找出哪些任务已经开始但还没有正常完成。在 Executor 结束后,getCancelledTasks 返回被取消的任务清单。
/**
* 7.21 在 ExecutorService 中跟踪在关闭之后取消的任务
* @ClassName: TrackingExecutor
* @author xingle
* @date 2014-11-12 下午8:39:33
*/
public class TrackingExecutor extends AbstractExecutorService{
private final ExecutorService exec;
private final Set<Runnable> tasksCancelledAtShutdown = Collections
.synchronizedSet(new HashSet<Runnable>()); public TrackingExecutor(ExecutorService exec){
this.exec = exec;
} public List<Runnable> getCancelledTasks(){
if(!exec.isTerminated())
throw new IllegalStateException();
return new ArrayList<Runnable>(tasksCancelledAtShutdown);
} /**
*
* @Description: TODO
* @param command
* @author xingle
* @data 2014-11-13 上午9:06:56
*/
@Override
public void execute(final Runnable runnable) {
exec.execute(new Runnable() { @Override
public void run() {
try{
runnable.run();
}finally{
if(isShutdown() && Thread.currentThread().isInterrupted())
tasksCancelledAtShutdown.add(runnable);
}
}
});
} /**
* 下面将ExecutorService 的其他方法委托给 exec
*/ /**
*
* @Description: TODO
* @author xingle
* @data 2014-11-13 上午9:06:56
*/
@Override
public void shutdown() {
exec.shutdown();
} /**
*
* @Description: TODO
* @return
* @author xingle
* @data 2014-11-13 上午9:06:56
*/
@Override
public List<Runnable> shutdownNow() {
return exec.shutdownNow();
} /**
*
* @Description: TODO
* @return
* @author xingle
* @data 2014-11-13 上午9:06:56
*/
@Override
public boolean isShutdown() {
return exec.isShutdown();
} /**
*
* @Description: TODO
* @return
* @author xingle
* @data 2014-11-13 上午9:06:56
*/
@Override
public boolean isTerminated() {
return exec.isTerminated();
} /**
*
* @Description: TODO
* @param timeout
* @param unit
* @return
* @throws InterruptedException
* @author xingle
* @data 2014-11-13 上午9:06:56
*/
@Override
public boolean awaitTermination(long timeout, TimeUnit unit)
throws InterruptedException {
return exec.awaitTermination(timeout, unit);
} }
在程序 WebCrawler 中给出了 TrackingExecutor 的用法。网页爬虫程序的工作通常是无穷尽的,因此当爬虫程序必须关闭时,我们通常希望保持它的状态,以便稍后重启动。CrawlTask 提供了一个 getPage 方法,该方法能找出正在处理的页面。当爬虫程序关闭时,无论是还没有开始的任务,还是那些被取消的任务,都将记录他们的URL,因此当爬虫程序程序启动时,就可以将这些URL 的页面抓取任务加入到任务队列中。
/**
* 7.22 使用TrackingExecutorService 来保存未完成的任务以备后续执行
* @ClassName: WebCrawler
* TODO
* @author xingle
* @date 2014-11-13 上午9:17:54
*/
public abstract class WebCrawler {
private volatile TrackingExecutor exec;
@GuardedBy("this")
public final Set<URL> urlsToCrawl = new HashSet<URL>(); private final ConcurrentMap<URL, Boolean> seen = new ConcurrentHashMap<URL, Boolean>();
private static final long TIMEOUT = 500;
private static final TimeUnit UNIT = TimeUnit.MICROSECONDS; public WebCrawler(URL startUrl){
urlsToCrawl.add(startUrl);
} public synchronized void start(){
exec = new TrackingExecutor(Executors.newCachedThreadPool());
for (URL url: urlsToCrawl)
submitCrawlTask(url);
urlsToCrawl.clear();
} /**
* 提交爬虫任务
* @param url
* @author xingle
* @data 2014-11-13 上午9:46:01
*/
private void submitCrawlTask(URL url) {
exec.execute(new CrawlTask(url));
} protected abstract List<URL> processPage(URL url); /**
* 保存未完成的
* @param urlsToCrawl
* @author xingle
* @data 2014-11-13 上午10:10:07
*/
private void saveUncrawled(List<Runnable> uncrawled) {
for (Runnable task:uncrawled){
URL url = ((CrawlTask)task).getPage();
System.out.println("保存未完成的URL:"+url);
urlsToCrawl.add(url);
} } //爬虫任务
private class CrawlTask implements Runnable{
private final URL url; CrawlTask(URL url){
this.url = url;
} private int count = 1; boolean alreadyCrawled() {
return seen.putIfAbsent(url, true) != null;
} void markUncrawled() {
seen.remove(url);
System.out.printf("marking %s uncrawled%n", url);
} @Override
public void run() {
for (URL link :processPage(url)){
if(Thread.currentThread().isInterrupted())
return;
System.out.println("提交的爬虫url:"+link);
submitCrawlTask(link);
}
} public URL getPage(){
return url;
}
} public synchronized void stop() throws InterruptedException{
try {
saveUncrawled(exec.shutdownNow());
if (exec.awaitTermination(100, UNIT)){
saveUncrawled(exec.getCancelledTasks());
} } finally {
exec = null;
}
}
}
测试程序:
public class WebCrawler_Main { public static void main(String[] args) throws MalformedURLException{
WebCrawler webc = new WebCrawler(new URL("http://site.baidu.com/")) { @Override
protected List<URL> processPage(URL url) {
//获取该url下所有的链接
//这里省略了该功能
List<URL> url2 = new ArrayList<URL>();
try {
url2.add(new URL("http://www.cnblogs.com/xingele0917/"));
//url2.add(new URL("http://www.zhihu.com/"));
} catch (MalformedURLException e) {
e.printStackTrace();
}
return url2; } }; webc.start();
try {
Thread.sleep(10);
webc.stop();
} catch (InterruptedException e) {
e.printStackTrace();
}
} }
执行结果:
并发编程 12—— 任务取消与关闭 之 shutdownNow 的局限性的更多相关文章
- 并发编程 10—— 任务取消 之 关闭 ExecutorService
Java并发编程实践 目录 并发编程 01—— ThreadLocal 并发编程 02—— ConcurrentHashMap 并发编程 03—— 阻塞队列和生产者-消费者模式 并发编程 04—— 闭 ...
- java并发编程-12个原子类
背景 多线程更新变量的值,可能得不到预期的值,当然增加syncronized关键字可以解决线程并发的问题. 这里提供另外一种解决问题的方案,即位于 java.util.concurrent.atomi ...
- 多线程高并发编程(12) -- 阻塞算法实现ArrayBlockingQueue源码分析(1)
一.前言 前文探究了非阻塞算法的实现ConcurrentLinkedQueue安全队列,也说明了阻塞算法实现的两种方式,使用一把锁(出队和入队同一把锁ArrayBlockingQueue)和两把锁(出 ...
- JUC 并发编程--12, 使用AtomicInteger 实现一把锁(排队自旋锁), 代码演示
前面 使用自旋锁实现了一把锁,(请看 第5篇) volatile 三大特性: 可见性, 不保证原子性, 禁止指令重排 为了解决 volatile不保证原子性的问题, 引入了原子类, AtomicInt ...
- 并发编程 01—— ThreadLocal
Java并发编程实践 目录 并发编程 01—— ThreadLocal 并发编程 02—— ConcurrentHashMap 并发编程 03—— 阻塞队列和生产者-消费者模式 并发编程 04—— 闭 ...
- 并发编程 20—— AbstractQueuedSynchronizer 深入分析
Java并发编程实践 目录 并发编程 01—— ThreadLocal 并发编程 02—— ConcurrentHashMap 并发编程 03—— 阻塞队列和生产者-消费者模式 并发编程 04—— 闭 ...
- 并发编程 02—— ConcurrentHashMap
Java并发编程实践 目录 并发编程 01—— ThreadLocal 并发编程 02—— ConcurrentHashMap 并发编程 03—— 阻塞队列和生产者-消费者模式 并发编程 04—— 闭 ...
- 并发编程 04——闭锁CountDownLatch 与 栅栏CyclicBarrier
Java并发编程实践 目录 并发编程 01—— ThreadLocal 并发编程 02—— ConcurrentHashMap 并发编程 03—— 阻塞队列和生产者-消费者模式 并发编程 04—— 闭 ...
- 并发编程 05—— Callable和Future
Java并发编程实践 目录 并发编程 01—— ThreadLocal 并发编程 02—— ConcurrentHashMap 并发编程 03—— 阻塞队列和生产者-消费者模式 并发编程 04—— 闭 ...
随机推荐
- Web前端开发规范文档
Web前端开发规范文档 规范目的: 使开发流程更加规范化. 通用规范: TAB键用两个空格代替(windos下tab键占四个空格,linux下TAB键占八个空格). CSS样式属性或者JAVASCRI ...
- 微信的redirect_uri参数错误原因分析
我们可以根据微信的开发者文档 http://mp.weixin.qq.com/wiki/17/c0f37d5704f0b64713d5d2c37b468d75.html 网页授权获取用户验证这一章来 ...
- 简介AngularJS中使用factory和service的方法
AngularJS支持使用服务的体系结构“关注点分离”的概念.服务是JavaScript函数,并负责只做一个特定的任务.这也使得他们即维护和测试的单独实体.控制器,过滤器可以调用它们作为需求的基础.服 ...
- asp检测数字类型函数
'**************************************************'函数ID:0014[检测ID是否为数字类型]'函数名:JCID'作 用:检测ID是否为数字类型' ...
- JetBrains WebStorm 安装破解问题
1.选择用户名验证码注册,进入地址:http://15.idea.lanyus.com/ 然后输入用户名,提交便会生成验证码,注册成功, 2.选择License server,输入以下地址: http ...
- Servlet-cookies机制
通过cookies,可以保存用户的使用习惯,优化用户体验,同时能减轻服务端压力.下面说下在Servlet中cookies机制的使用 就用保存用户登录数据来举例子: 打开网页的处理Servlet: pa ...
- this的面面观
http://www.cnblogs.com/Wayou/p/all-this.html <JavaScript语言精粹> 全局this 浏览器宿主的全局环境中, function f(x ...
- 前端开发面试题JS
1.介绍js的基本数据类型. Undefined.Null.Boolean.Number.String. ECMAScript 2015 新增:Symbol(创建后独一无二且不可变的数据类型 ) 2. ...
- 用代码来理解 C#委托与事件
C#中委托是什么?事件是委托吗? 1.委托是讲方法作为参数代入另一个方法中, 委托可以理解为指向一个函数的引用. class Program { public delegate void Delega ...
- iOS开发中的内存分配(堆和栈)
进程的内存分区 所有进程(执行的程序)都必须占用一定数量的内存,它或是用来存放从磁盘载入的程序代码,或是存放取自用户输入的数据等等.不过进程对这些内存的管理方式因内存用途不一而不尽相同,有些内存是事先 ...