第1 部分问题引入

　　当通过 shutdownNow 来强行关闭 ExecutorService 时，它会尝试取消正在执行的任务，并返回所有已提交但尚未开始的任务，从而将这些任务写入日志或者保存起来以便之后进行处理。

　　然而，我们无法通过常规方法来找出哪些任务已经开始但尚未结束。这意味着这我们无法在关闭过程中知道正在执行的任务的状态，除非任务本身会执行某种检查。要知道哪些任务还没有完成，你不仅需要知道哪些任务还没有开始，而且还需知道当 Executor 关闭时哪些任务正在执行。

第2 部分实例

　　在下面程序 TrackingExecutor 中给出了如何在关闭过程中判断正在执行的任务。通过封装 ExecutorService 并使得execute 记录哪些任务是在关闭后取消的，TrackingExecutor 可以找出哪些任务已经开始但还没有正常完成。在 Executor 结束后，getCancelledTasks 返回被取消的任务清单。

 /**

  * 7.21 在 ExecutorService 中跟踪在关闭之后取消的任务

  * @ClassName: TrackingExecutor

  * @author xingle

  * @date 2014-11-12 下午8:39:33

  */

 public class TrackingExecutor extends AbstractExecutorService{

     private final ExecutorService exec;

     private final Set<Runnable> tasksCancelledAtShutdown = Collections

             .synchronizedSet(new HashSet<Runnable>());

     public TrackingExecutor(ExecutorService exec){

         this.exec = exec;

     }

     public List<Runnable> getCancelledTasks(){

         if(!exec.isTerminated())

             throw new IllegalStateException();

         return new ArrayList<Runnable>(tasksCancelledAtShutdown);

     }

     /**

      *

      * @Description: TODO

      * @param command

      * @author xingle

      * @data 2014-11-13 上午9:06:56

      */

     @Override

     public void execute(final Runnable runnable) {

         exec.execute(new Runnable() {

             @Override

             public void run() {

                 try{

                     runnable.run();

                 }finally{

                     if(isShutdown() && Thread.currentThread().isInterrupted())

                         tasksCancelledAtShutdown.add(runnable);

                 }

             }

         });

     }

     /**

      * 下面将ExecutorService 的其他方法委托给 exec

      */

     /**

      *

      * @Description: TODO

      * @author xingle

      * @data 2014-11-13 上午9:06:56

      */

     @Override

     public void shutdown() {

         exec.shutdown();

     }

     /**

      *

      * @Description: TODO

      * @return

      * @author xingle

      * @data 2014-11-13 上午9:06:56

      */

     @Override

     public List<Runnable> shutdownNow() {

         return exec.shutdownNow();

     }

     /**

      *

      * @Description: TODO

      * @return

      * @author xingle

      * @data 2014-11-13 上午9:06:56

      */

     @Override

     public boolean isShutdown() {

         return exec.isShutdown();

     }

     /**

      *

      * @Description: TODO

      * @return

      * @author xingle

      * @data 2014-11-13 上午9:06:56

      */

     @Override

     public boolean isTerminated() {

         return exec.isTerminated();

     }

     /**

      *

      * @Description: TODO

      * @param timeout

      * @param unit

      * @return

      * @throws InterruptedException

      * @author xingle

      * @data 2014-11-13 上午9:06:56

      */

     @Override

     public boolean awaitTermination(long timeout, TimeUnit unit)

             throws InterruptedException {

         return exec.awaitTermination(timeout, unit);

     }

 }

　　在程序 WebCrawler 中给出了 TrackingExecutor 的用法。网页爬虫程序的工作通常是无穷尽的，因此当爬虫程序必须关闭时，我们通常希望保持它的状态，以便稍后重启动。CrawlTask 提供了一个 getPage 方法，该方法能找出正在处理的页面。当爬虫程序关闭时，无论是还没有开始的任务，还是那些被取消的任务，都将记录他们的URL，因此当爬虫程序程序启动时，就可以将这些URL 的页面抓取任务加入到任务队列中。

 /**

  * 7.22 使用TrackingExecutorService 来保存未完成的任务以备后续执行

  * @ClassName: WebCrawler

  * TODO

  * @author xingle

  * @date 2014-11-13 上午9:17:54

  */

 public abstract class WebCrawler {

     private volatile TrackingExecutor exec;

     @GuardedBy("this")

     public final Set<URL> urlsToCrawl = new HashSet<URL>();

     private final ConcurrentMap<URL, Boolean> seen = new ConcurrentHashMap<URL, Boolean>();

     private static final long TIMEOUT = 500;

     private static final TimeUnit UNIT = TimeUnit.MICROSECONDS;

     public WebCrawler(URL startUrl){

         urlsToCrawl.add(startUrl);

     }

     public synchronized void start(){

         exec = new TrackingExecutor(Executors.newCachedThreadPool());

         for (URL url: urlsToCrawl)

             submitCrawlTask(url);

         urlsToCrawl.clear();

     }

     /**

      * 提交爬虫任务

      * @param url

      * @author xingle

      * @data 2014-11-13 上午9:46:01

      */

     private void submitCrawlTask(URL url) {

         exec.execute(new CrawlTask(url));

     }

     protected abstract List<URL> processPage(URL url);

     /**

      * 保存未完成的

      * @param urlsToCrawl

      * @author xingle

      * @data 2014-11-13 上午10:10:07

      */

     private void saveUncrawled(List<Runnable> uncrawled) {

         for (Runnable task:uncrawled){

             URL url = ((CrawlTask)task).getPage();

             System.out.println("保存未完成的URL："+url);

             urlsToCrawl.add(url);

         }

     }

     //爬虫任务

     private class CrawlTask implements Runnable{

         private final URL url;

         CrawlTask(URL url){

             this.url = url;

         }

         private int count = 1;

         boolean alreadyCrawled() {

             return seen.putIfAbsent(url, true) != null;

         }

         void markUncrawled() {

             seen.remove(url);

             System.out.printf("marking %s uncrawled%n", url);

         }

         @Override

         public void run() {

             for (URL link :processPage(url)){

                 if(Thread.currentThread().isInterrupted())

                     return;

                 System.out.println("提交的爬虫url:"+link);

                 submitCrawlTask(link);

             }

         }

         public URL getPage(){

             return url;

         }

     }

     public synchronized void stop() throws InterruptedException{

         try {

             saveUncrawled(exec.shutdownNow());

             if (exec.awaitTermination(100, UNIT)){

                 saveUncrawled(exec.getCancelledTasks());

             }

         } finally {

             exec = null;

         }

     }

 }

测试程序：

 public class WebCrawler_Main {

     public static void main(String[] args) throws MalformedURLException{

         WebCrawler webc = new WebCrawler(new URL("http://site.baidu.com/")) {

             @Override

             protected List<URL> processPage(URL url) {

                 //获取该url下所有的链接

                 //这里省略了该功能

                 List<URL> url2 = new ArrayList<URL>();

                 try {

                     url2.add(new URL("http://www.cnblogs.com/xingele0917/"));

                     //url2.add(new URL("http://www.zhihu.com/"));

                 } catch (MalformedURLException e) {

                     e.printStackTrace();

                 }

                 return url2;

             }

         };

         webc.start();

         try {

             Thread.sleep(10);

             webc.stop();

         } catch (InterruptedException e) {

             e.printStackTrace();

         }

     }

 }

执行结果：

并发编程 12—— 任务取消与关闭之 shutdownNow 的局限性的更多相关文章

并发编程 10—— 任务取消之关闭 ExecutorService
Java并发编程实践目录并发编程 01—— ThreadLocal 并发编程 02—— ConcurrentHashMap 并发编程 03—— 阻塞队列和生产者-消费者模式并发编程 04—— 闭 ...
java并发编程-12个原子类
背景多线程更新变量的值,可能得不到预期的值,当然增加syncronized关键字可以解决线程并发的问题. 这里提供另外一种解决问题的方案,即位于 java.util.concurrent.atomi ...
多线程高并发编程(12) -- 阻塞算法实现ArrayBlockingQueue源码分析（1）
一.前言前文探究了非阻塞算法的实现ConcurrentLinkedQueue安全队列,也说明了阻塞算法实现的两种方式,使用一把锁(出队和入队同一把锁ArrayBlockingQueue)和两把锁(出 ...
JUC 并发编程--12, 使用AtomicInteger 实现一把锁(排队自旋锁), 代码演示
前面使用自旋锁实现了一把锁,(请看第5篇) volatile 三大特性: 可见性, 不保证原子性, 禁止指令重排为了解决 volatile不保证原子性的问题, 引入了原子类, AtomicInt ...
并发编程 01—— ThreadLocal
Java并发编程实践目录并发编程 01—— ThreadLocal 并发编程 02—— ConcurrentHashMap 并发编程 03—— 阻塞队列和生产者-消费者模式并发编程 04—— 闭 ...
并发编程 20—— AbstractQueuedSynchronizer 深入分析
Java并发编程实践目录并发编程 01—— ThreadLocal 并发编程 02—— ConcurrentHashMap 并发编程 03—— 阻塞队列和生产者-消费者模式并发编程 04—— 闭 ...
并发编程 02—— ConcurrentHashMap
Java并发编程实践目录并发编程 01—— ThreadLocal 并发编程 02—— ConcurrentHashMap 并发编程 03—— 阻塞队列和生产者-消费者模式并发编程 04—— 闭 ...
并发编程 04——闭锁CountDownLatch 与栅栏CyclicBarrier
Java并发编程实践目录并发编程 01—— ThreadLocal 并发编程 02—— ConcurrentHashMap 并发编程 03—— 阻塞队列和生产者-消费者模式并发编程 04—— 闭 ...
并发编程 05—— Callable和Future
Java并发编程实践目录并发编程 01—— ThreadLocal 并发编程 02—— ConcurrentHashMap 并发编程 03—— 阻塞队列和生产者-消费者模式并发编程 04—— 闭 ...

随机推荐

request.get request.GET……
发现他们是不同的. 报错: AttributeError at /add/ 'WSGIRequest' object has no attribute 'get' Request Method: GE ...
W3cshool之JavaScript基础
1. JavaScript 对大小写敏感名为 "myfunction"的函数和名为 "myFunction" 的函数是两个不同的函数,同样,变量 & ...
全网扫描扫描10000端口后的优化脚本&域名列表指定端口的批量测试
方法一: #coding=utf-8 import urllib2 import threading from time import ctime,sleep print "Start-Ti ...
window.event
e = e || window.event是我们在做事件处理时候区分IE和其他浏览器事件对象时常用的写法.但是这行兼容性代码有没有必要出现在所有的事件句柄中呢?标准事件调用方式需要这行代码吗?下边我们 ...
matlab中imresize
matlab中函数imresize简介: 函数功能:该函数用于对图像做缩放处理. 调用格式: B = imresize(A, m) 返回的图像B的长宽是图像A的长宽的m倍,即缩放图像. m大于1, 则 ...
如何使用Android Studio开发/调试Android源码
本文是以源码中development/tools/idegen/README作为指导文档. 环境: Ubuntu 14.10,openJdk 1.7,Android Studio 1.0.2,andr ...
企业信息系统——SCM
供应链是供应商.制造商.仓库.配送中心和渠道商等构成的物流网络.同一个企业可能构成这个网络的不同组成节点,但更多的情况下是由不同的企业构成这个网络中的不同节点.例如,在某条供应链中,某个企业可能即在制 ...
SQL2005中的事务与锁定（九）- 转载
------------------------------------------------------------------------ -- Author : HappyFlyStone - ...
【转】PowerShell入门（六）：远程操作
转至:http://www.cnblogs.com/ceachy/archive/2013/02/20/PowerShell_Remoting.html PowerShell远程操作是远程管理的基础, ...
获取token，绑定微信号，自定义菜单，事件响应demo
摘要: 这个demo包含了获取token,绑定微信号,设置自定义菜单,响应文本和事件这个教程的基础篇和提升篇都看完了,总感觉有点隔靴挠痒的感觉,讲的东西我都懂,没有吸收多少新鲜的知识.貌似还没有我这 ...

并发编程 12—— 任务取消与关闭 之 shutdownNow 的局限性

第1 部分 问题引入

第2 部分 实例

并发编程 12—— 任务取消与关闭 之 shutdownNow 的局限性的更多相关文章

随机推荐

热门专题

并发编程 12—— 任务取消与关闭之 shutdownNow 的局限性

第1 部分问题引入

第2 部分实例

并发编程 12—— 任务取消与关闭之 shutdownNow 的局限性的更多相关文章