【转向Javascript系列】深入理解Web Worker

本文首发在alloyteam团队博客，链接地址http://www.alloyteam.com/2015/11/deep-in-web-worker/

上一篇文章《从setTimeout说事件循环模型》从setTimeout入手，探讨了Javascript的事件循环模型。有别于Java/C#等编程语言，Javascript运行在一个单线程环境中，对setTimeout/setInterval、ajax和dom事件的异步处理是依赖事件循环实现的。作为一个转向Javascript的开发人员，很自然的产生一个疑问，如何实现Javascript多线程编程呢？随着学习的深入，我了解到HTML5 Web Worker，本文将分析Web Worker为Javascript带来了什么，同时带大家看看worker模型在其他语言的应用。

1.Web Worker是什么

Web Worker 是HTML5标准的一部分，这一规范定义了一套 API，它允许一段JavaScript程序运行在主线程之外的另外一个线程中。Web Worker 规范中定义了两类工作线程，分别是专用线程Dedicated Worker和共享线程 Shared Worker，其中，Dedicated Worker只能为一个页面所使用，而Shared Worker则可以被多个页面所共享，本文示例为专用线程Dedicated Worker。

1.1 API快速上手

使用Dedicated Worker的主页面代码main.js

var worker = new Worker("task.js");

worker.postMessage(

        {

            id:1,

            msg:'Hello World'

        }

);

worker.onmessage=function(message){

    var data = message.data;

    console.log(JSON.stringify(data));

    worker.terminate();

};

worker.onerror=function(error){

    console.log(error.filename,error.lineno,error.message);

}

Dedicated Worker所执行的代码task.js

onmessage = function(message){

    var data=message.data;

    data.msg = 'Hi from task.js';

    postMessage(data);

}

在main.js代码中，首先通过调用构造函数，传入了worker脚本文件名，新建了一个worker对象，在我的理解中，这一对象是新创建的工作线程在主线程的引用。随后调用worker.postMessage()方法，与新创建的工作线程通信，这里传入了一个json对象。随后分别定义了worker对象的onmessage事件和onerror事件的回调处理函数，当woker线程返回数据时，onmessage回调函数执行，数据封装在message参数的data属性中，调用 worker 的 terminate()方法可以终止worker线程的运行；当worker线程执行出错时，onerror回调函数执行，error参数中封装了错误对象的文件名、出错行号和具体错误信息。

在task.js代码中，定义了onmessage事件处理函数，由主线程传入的数据，封装在message对象的data属性中，数据处理完成后，通过postMessage方法完成与主线程通信。在工作线程代码中，onmessage事件和postMessage方法在其全局作用域可以访问。

1.2 worker线程执行流程

通过查阅资料，webKit加载并执行worker线程的流程如下图所示

1) worker线程的创建的是异步的

代码执行到"var worker = new Worker(task.js')“时，在内核中构造WebCore::JSWorker对象（JSBbindings层）以及对应的WebCore::Worker对象（WebCore模块)，根据初始化的url地址"task.js"发起异步加载的流程；主线程代码不会阻塞在这里等待worker线程去加载、执行指定的脚本文件，而是会立即向下继续执行后面代码。

2) postMessage消息交互由内核调度

main.js中，在创建woker线程后，立即调用了postMessage方法传递了数据，在worker线程还没创建完成时，main.js中发出的消息，会先存储在一个临时消息队列中，当异步创建worker线程完成，临时消息队列中的消息数据复制到woker对应的WorkerRunLoop的消息队列中，worker线程开始处理消息。在经过一轮消息来回后，继续通信时，这个时候因为worker线程已经创建，所以消息会直接添加到WorkerRunLoop的消息队列中；

1.3 worker线程数据通讯方式

主线程与子线程数据通信方式有多种，通信内容，可以是文本，也可以是对象。需要注意的是，这种通信是拷贝关系，即是传值而不是地址，子线程对通信内容的修改，不会影响到主线程。事实上，浏览器内部的运行机制是，先将通信内容串行化，然后把串行化后的字符串发给子线程，后者再将它还原。

主线程与子线程之间也可以交换二进制数据，比如File、Blob、ArrayBuffer等对象，也可以在线程之间发送。但是，用拷贝方式发送二进制数据，会造成性能问题。比如，主线程向子线程发送一个50MB文件，默认情况下浏览器会生成一个原文件的拷贝。为了解决这个问题，JavaScript允许主线程把二进制数据直接转移给子线程，转移后主线程无法再使用这些数据，这是为了防止出现多个线程同时修改数据的问题，这种转移数据的方法，叫做Transferable Objects。

// Create a 32MB "file" and fill it.

var uInt8Array = new Uint8Array(1024*1024*32); // 32MB

for (var i = 0; i < uInt8Array .length; ++i) {

    uInt8Array[i] = i;

}

worker.postMessage(uInt8Array.buffer, [uInt8Array.buffer]);

1.4 API进阶

在worker线程中，可以获得下列对象

1) navigator对象

2) location对象，只读

3) XMLHttpRequest对象

4) setTimeout/setInterval方法

5) Application Cache

6) 通过importScripts()方法加载其他脚本

7) 创建新的Web Worker

worker线程不能获得下列对象

1) DOM对象

2) window对象

3) document对象

4) parent对象

上述的规范，限制了在worker线程中获得主线程页面相关对象的能力，所以在worker线程中，不能进行dom元素的更新。

2. 似曾相识worker模型

我在学习Web Worker过程中，总有一种似曾相似的感觉。在以往的学习经验中，了解过Java Swing GUI库中的Swing Worker，我们可以看看worker模型在Swing中的应用。

2.1 Swing事件分发模型

同Winform/WPF等其他GUI库一样，Swing是一个基于事件队列的单线程编程模型。Swing将GUI请求放入一个事件队列EventQueue 中等待执行，EventQueue的派发机制由单独的一个线程管理，这个线程称为事件派发线程（EventDispatchThread），负责GUI组件的绘制和更新。这一事件分发模型如下图所示：

Swing单线程模型的一个问题是，如果在“事件派发线程”上执行的运算太多，那么GUI界面就会停住，系统响应和运算就会非常缓慢。

既然事件派发线程是为了处理GUI事件而设的，那么，我们只应该把GUI事件处理相关的代码，放在事件派发线程中执行。其他与界面无关的代码，应该放在Java其他的线程中执行。这样，我们在Swing的事件处理中，仍然使用Swing的单线程编程模型，而其他业务操作均使用多线程编程模型，这就可以大大提高Swing程序的响应和运行速度，充分运用Java多线程编程的优势。

2.2 Swing Worker

Java SE 6提供了javax.swing.SwingWorker类，Swing Worker 设计用于需要在后台线程中运行长时间运行任务的情况，并可在完成后或者在处理过程中向 UI 提供更新。

假定我们在UI界面点击一次下载按钮，在按钮的事件处理函数中，需要去加载一张Icon图片，图片加载完成后，将icon在UI界面展示出来。

SwingWorker testWorker = new SwingWorker<Icon , Void>(){

      @Override

       protected Icon doInBackground() throws Exception {

        Icon icon = retrieveImage(strImageUrl);

            return icon;

       }   

       protected void done(){

            Icon icon= get();

            lblImage.setIcon(icon); //lblImage可通过构造函数传入

      }

}

testWorker.execute();

上述代码中，我们在按钮的事件处理函数中，创建了一个swingworker实例对象。调用构造函数时，指定第一个泛型参数为Icon，这是一个自定义类型，这里代表一个Icon图片对象。指定这一泛型参数，是为了指定doInBackground()方法的返回值，并在done()方法中获取。

doInBackground方法作为工作线程的一部分执行，它负责完成线程的基本任务，并以返回值来作为线程的执行结果。在doInBackground方法完成之后，SwingWorker调用done方法。如果任务需要在完成后，使用工作线程执行结果来更新GUI组件或者做些清理工作，可覆盖done方法来完成它们。使用SwingWorker的get方法可以获取doInBackground方法的结果，done方法是调用get方法的最好地方，因为此时已知道线程任务完成了，SwingWorker在EDT上激活done方法，因此可以在此方法内安全地和任何GUI组件交互。execute方法是异步执行，它立即返回到调用者。在execute方法执行后，EDT立即继续执行。

2.3 WebWorker vs SwingWorker

Swing Worker还有一些其他的方法，这里不再讨论。我们可以结合Web Worker，对比看看两者异同。

两者编程模型相同，都是在主线程中，将耗时工作交由工作线程去异步的完成，从而避免主线程的阻塞。

两者线程通信机制不同，Web Worker线程通信限制严格，仅能通过postMessage方法通信，而且参数传递均为值传递，没有引用传递；Swing Worker参数传递灵活，上述事例中，testWorker的doInBackground方法直接引用了strImageUrl变量，不过这一方式并不推荐，而是应当定义一个新类继承自SwingWorker，并在构造函数中传入imgUrl变量，然后在实例化worker线程中传入变量。

两者对UI界面的更新限制不同，Web Worker禁止在worker线程中操作dom元素，所以不能在worker中更新UI；Swing Worker允许在done方法中更新UI，这里并没有违背Swing的事件分发模型，因为最终还是在EDT上激活的done方法，依然遵循着事件分发模型。

3. Web Worker带来了什么

最后来总结Web Worker为javascript带来了什么，学习过程中，看到一些文章认为Web Worker为Javascript带来了多线程编程能力，我不认可这种观点。

3.1 Web Worker带来后台计算能力

Web Worker自身是由webkit多线程实现，但它并没有为Javasctipt语言带来多线程编程特性，我们现在仍然不能在Javascript代码中创建并管理一个线程，或者主动控制线程间的同步与锁等特性。

在我看来，Web Worker是worker编程模型在浏览器端Javascript语言中的应用。浏览器的运行时,同其他GUI程序类似，核心逻辑像是下面这个无限循环:

while(true){

    1 更新数据和对象状态

    2 渲染可视化UI

}

在Web Worker之前，Javascript执行引擎只能在一个单线程环境中完成这两项任务。而在其他典型GUI框架，如前文Swing库中，早已引入了Swing Worker来解决大量计算对UI渲染的阻塞问题。Web Worker的引入，是借鉴了worker编程模型，给单线程的Javascript带来了后台计算的能力。

3.2 Web Worker典型应用场景

既然Web Worker为浏览器端Javascript带来了后台计算能力，我们便可利用这一能力，将无限循环中第一项“更新数据和对象状态”的耗时部分交由Web Worker执行，提升页面性能。

部分典型的应用场景如下

1）使用专用线程进行数学运算

Web Worker最简单的应用就是用来做后台计算，而这种计算并不会中断前台用户的操作

2）图像处理

通过使用从<canvas>或者<video>元素中获取的数据，可以把图像分割成几个不同的区域并且把它们推送给并行的不同Workers来做计算

3）大量数据的检索

当需要在调用 ajax后处理大量的数据，如果处理这些数据所需的时间长短非常重要，可以在Web Worker中来做这些，避免冻结UI线程。

4）背景数据分析

由于在使用Web Worker的时候，我们有更多潜在的CPU可用时间，我们现在可以考虑一下JavaScript中的新应用场景。例如，我们可以想像在不影响UI体验的情况下实时处理用户输入。利用这样一种可能，我们可以想像一个像Word（Office Web Apps 套装）一样的应用：当用户打字时后台在词典中进行查找，帮助用户自动纠错等等。

参考文章

1.The Basics of Web Workers

http://www.html5rocks.com/en/tutorials/workers/basics/

2. 深入 HTML5 Web Worker 应用实践：多线程编程

http://www.ibm.com/developerworks/cn/web/1112_sunch_webworker/index.html

3. JavaScript 工作线程实现方式

http://www.ibm.com/developerworks/cn/web/1105_chengfu_jsworker/index.html

4.HTML5 与 ”性工能“障碍

http://fins.iteye.com/blog/1747321

5.Web Worker在WebKit中的实现机制

http://blog.csdn.net/codigger/article/details/40581343

6. SwingWorker的用法

http://blog.csdn.net/vking_wang/article/details/8994882

【转向Javascript系列】深入理解Web Worker的更多相关文章

【转向Javascript系列】深入理解Generators
随着Javascript语言的发展,ES6规范为我们带来了许多新的内容,其中生成器Generators是一项重要的特性.利用这一特性,我们可以简化迭代器的创建,更加令人兴奋的,是Generators允 ...
深入理解JavaScript系列+ 深入理解javascript之执行上下文
http://www.cnblogs.com/TomXu/archive/2011/12/15/2288411.html http://blog.csdn.net/hi_kevin/article/d ...
【转向Javascript系列】从setTimeout说事件循环模型
本文首发在alloyteam团队博客,链接地址http://www.alloyteam.com/2015/10/turning-to-javascript-series-from-settimeout ...
深入理解JavaScript系列（1）：编写高质量JavaScript代码的基本要点
深入理解JavaScript系列(1):编写高质量JavaScript代码的基本要点 2011-12-28 23:00 by 汤姆大叔, 139489 阅读, 119 评论, 收藏, 编辑才华横溢的 ...
深入理解JavaScript系列（结局篇）
介绍最近几个月忙得实在是不可开交,终于把<深入理解JavaScript系列>的最后两篇“补全”了,所谓的全是不准确的,因为很多内容都没有写呢,比如高性能.Ajax安全.DOM详解.Jav ...
深入理解JavaScript系列（31）：设计模式之代理模式
介绍代理,顾名思义就是帮助别人做事,GoF对代理模式的定义如下: 代理模式(Proxy),为其他对象提供一种代理以控制对这个对象的访问. 代理模式使得代理对象控制具体对象的引用.代理几乎可以是任何对 ...
深入理解JavaScript系列（24）：JavaScript与DOM（下）
介绍上一章我们介绍了JavaScript的基本内容和DOM对象的各个方面,包括如何访问node节点.本章我们将讲解如何通过DOM操作元素并且讨论浏览器事件模型. 本文参考:http://net.tu ...
深入理解JavaScript系列（20）：《你真懂JavaScript吗？》答案详解
介绍昨天发的<大叔手记(19):你真懂JavaScript吗?>里面的5个题目,有很多回答,发现强人还是很多的,很多人都全部答对了. 今天我们来对这5个题目详细分析一下,希望对大家有所帮 ...
深入理解JavaScript系列（2）：揭秘命名函数表达式
前言网上还没用发现有人对命名函数表达式进去重复深入的讨论,正因为如此,网上出现了各种各样的误解,本文将从原理和实践两个方面来探讨JavaScript关于命名函数表达式的优缺点. 简单的说,命名函数表 ...

随机推荐

oracle批量插入数据
有一次开发一个功能,须要导入别人提供的几万条数据, 数据在一个*.sql文件里,大概有8万条数据 insert into testtable(id,name) values(1,'1') ---- ...
JavaScript编程：使用DOM操作样式表
6.使用DOM操作样式表: 操纵元素的Style样式属性: background-color:style.backgroundColor color:style.col ...
使用hadoop ecipse插件须要注意的问题
1.关于run on hadoop的问题: 在未用hadoop eclipse插件前,我以为通过hadoop eclipse 插件不但能够管理hdfs,还能够自己主动打包程序.并帮我自己主动设置Con ...
jquery ajax局部加载方法介绍
[导读] 在jquery中实现ajax加载的方法有很多种,不像以前的js的ajax只有那一种,下面我们介绍jquery ajax实现局部加载方法总结,有需要了解的朋友可参考.例代码如下复制代码 $ ...
Hook任务栏时钟窗口（原理其实很简单，就是注入DLL到时钟窗口进程(explorer.exe)）
用过一些日历软件的小伙伴应该都知道它们都实现了在时钟窗口上的Hook,也就是屏蔽了系统原有的功能,实现自己的功能某日历软件Hook时钟窗口后的效果经过一番研究,发现原理其实很简单,就是注入DLL到 ...
Tair是一个高性能，分布式，可扩展，高可靠的key/value结构存储系统（转）
Tair是一个高性能,分布式,可扩展,高可靠的key/value结构存储系统! Tair专为小文件优化,并提供简单易用的接口(类似Map)Tair支持Java和C版本的客户端 Tair is a di ...
C++中的对象指针
指向对象的指针在建立对象的时候,变异系统会给每一个对象分配一定的存储空间,以存放其成员. 对象空间的起始地址就是对象的指针.可以定义一个指针变量,用来存放对象的指针. 一个简单的示例1.1: #in ...
android中Logcat的深层理解
Android的开发也能够归类为嵌入式设备的开发.即便不是嵌入式开发,依旧要注意对内存和处理的使用.养成一个好的习惯对自己的帮助是非常大的. 在Log的源代码中能够看到这种凝视: The order ...
一个跨平台的 C++ 内存泄漏检测器
2004 年 3 月 01 日内存泄漏对于C/C++程序员来说也可以算作是个永恒的话题了吧.在Windows下,MFC的一个很有用的功能就是能在程序运行结束时报告是否发生了内存泄漏.在Linux下, ...
Oracle heap 表的主键 dump 分析
1. 创建heap 表: create table t1 (id char(10) primary key,a1 char(10),a2 char(10),a3 char(10)); SQL> ...

【转向Javascript系列】深入理解Web Worker

【转向Javascript系列】深入理解Web Worker的更多相关文章

随机推荐

热门专题