Angular 1 深度解析：脏数据检查与 angular 性能优化

TL;DR

脏检查是一种模型到视图的数据映射机制，由 $apply 或 $digest 触发。
脏检查的范围是整个页面，不受区域或组件划分影响
使用尽量简单的绑定表达式提升脏检查执行速度
尽量减少页面上绑定表达式的个数（单次绑定和ng-if）
给 ng-repeat 添加 track by 让 angular 复用已有元素

什么是脏数据检查（Dirty checking）

Angular 是一个 MVVM 前端框架，提供了双向数据绑定。所谓双向数据绑定（Two-way data binding）就是页面元素变化会触发 View-model 中对应数据改变，反过来 View-model 中数据变化也会引发所绑定的 UI 元素数据更新。操作数据就等同于操作 UI。

看似简单，其实水很深。UI 元素变化引发 Model 中数据变化这个通过绑定对应 DOM 事件（例如 input 或 change）可以简单的实现；然而反过来就不是那么容易。

比如有如下代码：

<p ng-bind="content1"></p>

<p ng-bind="content2"></p>

<button ng-click="onClick()">Click Me</button>

用户点击了 button，angular 执行了一个叫 onClick 的方法。这个 onClick 的方法体对于 angular 来说是黑盒，它到底做了什么不知道。可能改了 $scope.content1 的值，可能改了 $scope.content2 的值，也可能两个值都改了，也可能都没改。

那么 angular 到底应该怎样得知 onClick() 这段代码后是否应该刷新 UI，应该更新哪个 DOM 元素？

angular 必须去挨个检查这些元素对应绑定表达式的值是否有被改变。这就是脏数据检查的由来（脏数据检查以下简称脏检查）。

脏检查如何被触发

angular 会在可能触发 UI 变更的时候进行脏检查：这句话并不准确。实际上，脏检查是 $digest](https://docs.angularjs.org/api/ng/type/$rootScope.Scope#$digest) 执行的，另一个更常用的用于触发脏检查的函数 [$apply 其实就是 $digest 的一个简单封装（还做了一些抓异常的工作）。

通常写代码时我们无需主动调用 $apply 或 $digest 是因为 angular 在外部对我们的回调函数做了包装。例如常用的 ng-click，这是一个指令（Directive），内部实现则类似于

DOM.addEventListener('click', function ($scope) {

  $scope.$apply(() => userCode());

});

可以看到：ng-click 帮我们做了 $apply 这个操作。类似的不只是这些事件回调函数，还有 $http、$timeout 等。我听很多人抱怨说 angular 这个库太大了什么都管，其实你可以不用它自带的这些服务（Service），只要你记得手工调用 $scope.$apply。

脏检查的范围

前面说到：angular 会对所有绑定到 UI 上的表达式做脏检查。其实，在 angular 实现内部，所有绑定表达式都被转换为 $scope.$watch()。每个 $watch 记录了上一次表达式的值。有 ng-bind="a" 即有 $scope.$watch('a', callback)，而 $scope.$watch 可不会管被 watch 的表达式是否跟触发脏检查的事件有关。

例如：

<div ng-show="false">

  <span id="span1" ng-bind="content"></span>

</div>

<span id="span2" ng-bind="content"></span>

<button ng-click="">TEST</button>

问：点击 TEST 这个按钮时会触发脏检查吗？触发几次？

首先：ng-click="" 什么都没有做。angular 会因为这个事件回调函数什么都没做就不进行脏检查吗？不会。

然后：#span1 被隐藏掉了，会检查绑定在它上面的表达式吗？尽管用户看不到，但是 $scope.$watch('content', callback) 还在。就算你直接把这个 span 元素干掉，只要 watch 表达式还在，要检查的还会检查。

再次：重复的表达式会重复检查吗？会。

最后：别忘了 ng-show="false"。可能是因为 angular 的开发人员认为这种绑定常量的情况并不多见，所以 $watch 并没有识别所监视的表达式是否是常量。常量依旧会重复检查。

所以：

答：触发三次。一次 false，一次 content，一次 content

所以说一个绑定表达式只要放在当前 DOM 树里就会被监视，不管它是否可见，不管它是否被放在另一个 Tab 里，更不管它是否与用户操作相关。

另外，就算在不同 Controller 里构造的 $scope 也会互相影响，别忘了 angular 还有全局的 $rootScope，你还可以 $scope.$emit。angular 无法保证你绝对不会在一个 controller 里更改另一个 controller 生成的 scope，包括自定义指令（Directive）生成的 scope 和 Angular 1.5 里新引入的组件（Component）。

所以说不要怀疑用户在输入表单时 angular 会不会监听页面左边导航栏的变化。

脏检查与运行效率

脏检查慢吗？

说实话脏检查效率是不高，但是也谈不上有多慢。简单的数字或字符串比较能有多慢呢？十几个表达式的脏检查可以直接忽略不计；上百个也可以接受；成百上千个就有很大问题了。绑定大量表达式时请注意所绑定的表达式效率。建议注意一下几点：

表达式（以及表达式所调用的函数）中少写太过复杂的逻辑
不要连接太长的 filter（往往 filter 里都会遍历并且生成新数组）
不要访问 DOM 元素。

使用单次绑定减少绑定表达式数量

单次绑定（One-time binding 是 Angular 1.3 就引入的一种特殊的表达式，它以 :: 开头，当脏检查发现这种表达式的值不为 undefined 时就认为此表达式已经稳定，并取消对此表达式的监视。这是一种行之有效的减少绑定表达式数量的方法，与 ng-repeat 连用效果更佳（下文会提到），但过度使用也容易引发 bug。

善用 `ng-if` 减少绑定表达式的数量

如果你认为 ng-if 就是另一种用于隐藏、显示 DOM 元素的方法你就大错特错了。

ng-if 不仅可以减少 DOM 树中元素的数量（而非像 ng-hide 那样仅仅只是加个 display: none），每一个 ng-if 拥有自己的 scope，ng-if 下面的 $watch 表达式都是注册在 ng-if 自己 scope 中。当 ng-if 变为 false，ng-if 下的 scope 被销毁，注册在这个 scope 里的绑定表达式也就随之销毁了。

考虑这种 Tab 选项卡实现：

<ul>

  <li ng-class="{ selected: selectedTab === 1 }">Tab 1 title</li>

  <li ng-class="{ selected: selectedTab === 1 }">Tab 2 title</li>

  <li ng-class="{ selected: selectedTab === 1 }">Tab 3 title</li>

  <li ng-class="{ selected: selectedTab === 1 }">Tab 4 title</li>

</ul>

<div ng-show="selectedTab === 1">[[Tab 1 body...]]</div>

<div ng-show="selectedTab === 2">[[Tab 2 body...]]</div>

<div ng-show="selectedTab === 3">[[Tab 3 body...]]</div>

<div ng-show="selectedTab === 4">[[Tab 4 body...]]</div>

对于这种会反复隐藏、显示的元素，通常人们第一反应都是使用 ng-show 或 ng-hide 简单的用 display: none 把元素设置为不可见。

然而入上文所说，肉眼不可见不代表不会跑脏检查。如果将 ng-show 替换为 ng-if 或 ng-switch-when

<div ng-if="selectedTab === 1">[[Tab 1 body...]]</div>

<div ng-if="selectedTab === 2">[[Tab 2 body...]]</div>

<div ng-if="selectedTab === 3">[[Tab 3 body...]]</div>

<div ng-if="selectedTab === 4">[[Tab 4 body...]]</div>

有如下优点：

首先 DOM 树中的元素个数显著减少至四分之一，降低内存占用
其次 $watch 表达式也减少至四分之一，提升脏检查循环的速度
如果这个 tab 下面有 controller（例如每个 tab 都被封装为一个组件），那么仅当这个 tab 被选中时该 controller 才会执行，可以减少各页面的互相干扰
如果 controller 中调用接口获取数据，那么仅当对应 tab 被选中时才会加载，避免网络拥挤

当然也有缺点：

DOM 重建本身费时间
如果 tab 下有 controller，那么每次该 tab 被选中时 controller 都会被执行
如果在 controller 里面调接口获取数据，那么每次该 tab 被选中时都会重新加载

各位读者自己取舍。

当脏检查遇上数组

ng-repeat！这就更有（e）趣（xin）了。通常的绑定只是去监听一个值的变化（绑定对象也是绑定到对象里的某个成员），而 ng-repeat 却要监视一整个数组对象的变化。例如有：

<ul ng-init="array = [

  { value: 1 },

  { value: 2 },

  { value: 3 },

  { value: 4 },

]">

  <li ng-repeat="item in array" ng-bind="item.value"></li>

</ul>

会生成 4 个 li 元素

没有问题。如果我添加一个按钮如下：

<button ng-click="array.shift()">删除第一个元素</button>

请考虑：当用户点击这个按钮会发生什么？

我们一步一步分析。开始的时候，angular 记录了 array 的初始状态为：

[

  { "value": 1 },

  { "value": 2 },

  { "value": 3 },

  { "value": 4 }

]

当用户点击按钮后，数组的第一个元素被删除了，array 变为：

[

  { "value": 2 },

  { "value": 3 },

  { "value": 4 }

]

两者比较：

array.length = 4 => array.length = 3
array[0].value = 1 => array[0].value = 2
array[1].value = 2 => array[1].value = 3
array[2].value = 3 => array[2].value = 4
array[3].value = 4 => array[3].value = undefined （array[4] 为 undefined，则 undefined.value 为 undefined，见 Angular 表达式的说明）

如同你所见：angular 经过比较，看到的是：

数组长度减少了 1
数组第 1 个元素的 value 被改为 2
数组第 2 个元素的 value 被改为 3
数组第 3 个元素的 value 被改为 4

反应到 DOM 元素上就是：

第 1 个 li 内容改为 2
第 2 个 li 内容改为 3
第 3 个 li 内容改为 4
第 4 个 li 删掉

可以看到，删除一个元素导致了整个 ul 序列的刷新。要知道 DOM 操作要比 JS 变量操作要慢得多，类似这样的无用操作最好能想办法避免。

那么问题出在哪里呢？用户删除了数组的第一个元素，导致了整个数组元素前移；然而 angular 没法得知用户做了这样一个删除操作，只能傻傻的按下标一个一个比。

那么只要引入一种机制来标记数组的每一项就好了吧。于是 angular 引入了 track by

详解 track by

用来标记数组元素的一定是数组里类似 ID 的某个值。这个值一定要符合以下这两个特点。

不能重复。ID 重复了什么鬼
值一定要简单。ID 是用于比较相等的，有时候由于算法不同可能还要比较大小，处于速度考虑不能太复杂。

基于这两个特点。如果用户没有给 ng-repeat 指定 track by 的表达式，则默认为内置函数 $id。$id 会检查 item 中有没有一个名为 $$hashKey` 的成员。如有，返回其值；如没有，则生成一个新的唯一值写入。这就是数组中那个奇怪的 `$$hashKey 成员来历，默认值是 "object:X"（你问我为什么是个字符串而不是数字？我怎么知道。。。）

还是前面的问题，引入 track by 后再来看。因为没有指定 track by，则默认为 $id(item)，实际为 $$hashKey。

<ul ng-init="array = [

  { value: 1 },

  { value: 2 },

  { value: 3 },

  { value: 4 },

]">

  <li ng-repeat="item in array track by $id(item)" ng-bind="item.value"></li>

</ul>

开始的时候，$id(item) 给数组中所有项创建了 $$hashKey

这时 angular 记录了 array 的初始状态为：

[

  { "value": 1, "$$hashKey": "object:1" },

  { "value": 2, "$$hashKey": "object:2" },

  { "value": 3, "$$hashKey": "object:3" },

  { "value": 4, "$$hashKey": "object:4" }

]

当用户点击按钮后，数组的第一个元素被删除了，array 变为：

[

  { "value": 2, "$$hashKey": "object:2" },

  { "value": 3, "$$hashKey": "object:3" },

  { "value": 4, "$$hashKey": "object:4" }

]

先比较 track by 的元素，这里为 $id(item)，即 $$hashKey

"object:1" => "object:2"
"object:2" => "object:3"
"object:3" => "object:4"
"object:4" => undefined

两者对不上，说明数组被做了增删元素或者移动元素的操作。将其规整

"object:1" => undefined
"object:2" => "object:2"
"object:3" => "object:3"
"object:4" => "object:4"

那么显然，第一个元素被删除了。再比较剩余的元素

array[0].value = 2 => array[0].value = 2
array[1].value = 3 => array[1].value = 3
array[2].value = 4 => array[2].value = 4

结论是：

原数组第一个元素被删除
其他没变

angular 通过将新旧数组的 track by 元素做 diff 猜测用户的行为，最大可能的减少 DOM 树的操作，这就是 track by 的用处。

默认 track by 的坑

So far so good! 然而需求某天有变，程序员小哥决定用 filter 给数组做 map 后再渲染。

<ul ng-init="array = [

  { value: 1 },

  { value: 2 },

  { value: 3 },

  { value: 4 },

]">

  <li ng-repeat="item in array | myMap" ng-bind="item.value"></li>

</ul>

map 定义如下：

xxModule.filter('map', function () {

  return arr => arr.map(item => ({ value: item.value + 1 }));

});

ng-repeat 执行时先计算表达式 array | myMap 的值：

arrayForNgRepeat = [

  { value: 2 },

  { value: 3 },

  { value: 4 },

  { value: 5 },

]

注意数组 arrayForNgRepeat 和原来的数组 array 不是同一个引用，因为 filter 里的 map 操作生成了一个新数组，每一项都是新对象，跟原数组无关。

ng-repeat 时，angular 发现用户没有指定 track by，按照默认逻辑，使用 $id(item) 作为 track by，添加 $$hashKey

arrayForNgRepeat = [

  { value: 2, "$$hashKey": "object:1" },

  { value: 3, "$$hashKey": "object:2" },

  { value: 4, "$$hashKey": "object:3" },

  { value: 5, "$$hashKey": "object:4" },

]

生成 DOM：

这里请再次注意：数组 arrayForNgRepeat 与原始数组 array 没有任何关系，数组本身是不同的引用，数组里的每一项也是不同引用。修改新数组的成员不会影响到原来的数组。

这时 array 的值：

array = [

  { value: 1 },

  { value: 2 },

  { value: 3 },

  { value: 4 },

]

这时用户的某个无关操作触发了脏检查。针对 ng-repeat 表达式，首先计算 array | myMap 的值：

newArrayForNgRepeat = [

  { value: 2 },

  { value: 3 },

  { value: 4 },

  { value: 5 },

]

先比较 track by 的元素。用户没有指定，默认为 $id(item)。

$id 发现数组中有一些元素没有 $$hashKey`，则给它们填充新 `$$hashKey，结果为

newArrayForNgRepeat = [

  { value: 2, "$$hashKey": "object:5" },

  { value: 3, "$$hashKey": "object:6" },

  { value: 4, "$$hashKey": "object:7" },

  { value: 5, "$$hashKey": "object:8" },

]

这时两边的 track by 的实际结果为

"object:1" => "object:5"
"object:2" => "object:6"
"object:3" => "object:7"
"object:4" => "object:8"

两者对不上，说明数组被做了增删元素或者移动元素的操作。将其规整

"object:1" => undefined
"object:2" => undefined
"object:3" => undefined
"object:4" => undefined
undefined => "object:5"
undefined => "object:6"
undefined => "object:7"
undefined => "object:8"

结论是：

原数组全部 4 个元素被删除
新添加了 4 个元素

于是 angular 把原来所有 li 删除，再创建 4 个新的 li 元素，填充它们的 textContent，放到 ul 里

如果怀疑我说的话，请自己在浏览器里测试。你可以清楚的看到调试工具里 DOM 树的闪烁

`track by` 与性能

不恰当的 ng-repeat 会造成 DOM 树反复重新构造，拖慢浏览器响应速度，造成页面闪烁。除了上面这种比较极端的情况，如果一个列表频繁拉取 Server 端数据自刷新的话也一定要手工添加 track by，因为接口给前端的数据是不可能包含 $$hashKey 这种东西的，于是结果就造成列表频繁的重建。

其实不必考虑那么多，总之加上没坏处，至少可以避免 angular 生成 $$hashKey 这种奇奇怪怪的东西。所以

请给 ng-repeat 手工添加 track by！

重要的事情再说一遍

请给 ng-repeat 手工添加 track by！

通常列表都是请求接口从数据库中读取返回的。通常数据库中的记录都有一个 id 字段做主键，那么这时使用 id 作为 track by 的字段是最佳选择。如果没有，可以选择一些业务字段但是确保不会重复的。例如一个连表头都是动态生成的表格，表头就可以使用其字段名作为 track by 的字段（对象的 key 是不会重复的）。

如果真的找不到用于 track by 的字段，让 angular 自动生成 $$hashKey 也不是不可以，但是切记检查有没有出现 DOM 元素不断重刷的现象，除了仔细看调试工具的 DOM 树是否闪烁之外，给列表中的元素添加一个特别的标记（比如 style="background: red"），也是一个行之有效的方法（如果这个标记被意外清除，说明原来的 DOM 元素被删除了）。

除非真的没办法，不推荐使用 $index 作为 track by 的字段。

`track by` 与单次绑定连用

track by 只是让 angular 复用已有 DOM 元素。数组每个子元素内部绑定表达式的脏检查还是免不了的。然而对于实际应用场景，往往是数组整体改变（例如分页），数组每一项通常却不会单独变化。这时就可以通过使用单次绑定大量减少 $watch 表达式的数量。例如

<li ng-repeat="item in array track by item.id">

  <div>a: <span ng-bind="::item.a"></span></div>

  <div>b: <span ng-bind="::item.b"></span></div>

  <div>c: <span ng-bind="::item.c"></span></div>

  <div>d: <span ng-bind="::item.d"></span></div>

  <div>e: <span ng-bind="::item.e"></span></div>

</li>

除非 track by 字段改变造成的 DOM 树重建，item.a 等一旦显示在页面上后就不会再被监视。

如果每行有 5 个绑定表达式，每页显示 20 条记录，通过这种方法每页就可以减少 5 * 20 = 100 个绑定表达式的监视。

注意：如果在 ng-repeat 内部使用的单次绑定，就一定不要用 track by $index。否则用户切换下一页页面也不会更新。

使用分页减少绑定个数

这个就不多说了。能后端分页的就后端分页；接口不支持分页的也要前端分页；前端分页时可以简单的写个 filter 用 Array.prototype.slice 实现。

能直接减少数组中项的个数就不要在 ng-repeat 中每项上写 ng-show 或 ng-if

写在最后的话

脏检查这个东西，其实在三大主流前端框架中或多或少都有涉及。React 每次生成新的 Virtual DOM，与旧 Virtual DOM 的 diff 操作本来就可以看做一次脏检查。Vue 从相对彻底的抛弃了脏检查机制，使用 Property 主动触发 UI 更新，但是 Vue 仍然不能抛弃 track by 这个东西。

既然脏检查在三大主流框架里或多或少都有所保留，为什么唯独 Angular 的性能被广为诟病呢？其实还是说在 Angular 1 的机制下，脏检查的执行范围过大以及频率太过频繁了。Angular 1.5 从 Angular 2+ 引入了组件（Component）的概念，然而形似而神非，其实只是一个特殊的 Directive 马甲而已，并不能将脏检查的执行范围限制在各个组件之内，所以并不能本质的改变 Angular 1 脏检查机制效率低下的现状。

也许 Angular 1 终将被淘汰。但 Angular 作为前端第一个 MVVM 框架，着实引发了前端框架更新换代的热潮。百足之虫死而不僵，不管怎么样我还得继续维护停留在电脑里的 Angular 1 项目。不过也许老板哪天大发慈悲给我们用 Vue 重构整个项目的时间，将来的事情谁知道呢？