Tensoflw.js - 02 - 模型与内存管理（易懂）

参考 W3Cschool 文档：https://www.w3cschool.cn/tensorflowjs/

本文主要翻译一些英文注释，添加通俗的注释，记录新手使用遇到的小问题，去除不必要的部分，帮助新手快速入门

上一篇介绍了，Tensorflow.js 的安装，张量与变量的表示方法、创建和输出

Tensoflw.js - 01 - 安装与入门（中文注释）

本篇介绍模型与内存管理

Tensorflow.js 模型：

1.在 Tensorflow.js 中，一个模型就是一个给定一些输入将会产生特定的输出的函数。简单来说，一个模型就是一个函数，只是它完成了特定的任务

2.在 TensorFlow.js 中有两种方式来创建模型：

一种是通过操作（ops）来直接完成模型本身所做的工作
另外一种就是通过高级API tf.model 来创建一个模型，显然第二种是更容易的

第一种创建模型的方法：

提示：可能有小伙伴没有看上一篇，可以直接使用在线引入：

<script src="https://cdn.jsdelivr.net/npm/@tensorflow/tfjs@0.13.2"> </script>

<script>

//直接将代码拷贝到有引入 Tensorflow.js 的 html 中即可

//提示：输出的值都是打印在浏览器开发者工具的控制台，而不是页面上

//定义一个函数进行对输入参数的一系列操作

function predict(input) {

  // y = a * x ^ 2 + b * x + c

  // More on tf.tidy in the next section

  return tf.tidy(() => {

    const x = tf.scalar(input);

    const ax2 = a.mul(x.square());

    const bx = b.mul(x);

    const y = ax2.add(bx).add(c);

    return y;

  });

}

//上一篇介绍的 tf.scalar（零维）

const a = tf.scalar(2);

const b = tf.scalar(4);

const c = tf.scalar(8);

const result = predict(2);

result.print() 

</script>

如上所示，我们定义的 predict 函数就是一个模型，对于给定的输入，我们就可以得到预测的输出。注意：所有的数字都需要经过 tf.scalar() 张量处理

第二种创建模型的方法：

用 TensorFlow.js 中的 tf.model 方法（这里的 model 并不是真正可以调用的方法，而是一个总称，比如实际上可以调用的是 tf.sequential 模型），这在深度学习中是非常流行的概念。下面的代码就创建了 tf.sequential 模型：

<script>

//直接将代码拷贝到有引入 Tensorflow.js 的 html 中即可

//提示：输出的值都是打印在浏览器开发者工具的控制台，而不是页面上

const model = tf.sequential();

model.add(

  tf.layers.simpleRNN({

    units: 20,

    recurrentInitializer: 'GlorotNormal',

    inputShape: [80, 4]

  })

);

const optimizer = tf.train.sgd(LEARNING_RATE);

model.compile({optimizer, loss: 'categoricalCrossentropy'});

model.fit({x: data, y: labels)});

</script>

Tensorflow.js 内存管理

因为 TensorFlow.js 使用了GPU来加速数学运算，因此当 tensorflow 处理张量和变量时就有必要来管理 GPU 内存。在 TensorFlow.js 中，我们可以通过 dispose 和 tf.tidy 这两种方法来管理内存

dispose

您可以在张量或变量上调用dispose来清除它并释放其GPU内存：

<script>

//直接将代码拷贝到有引入 Tensorflow.js 的 html 中即可

//提示：输出的值都是打印在浏览器开发者工具的控制台，而不是页面上

const x = tf.tensor2d([[0.0, 2.0], [4.0, 6.0]]);

const x_squared = x.square();

x.dispose();

x_squared.dispose();

</script>

tf.tidy

进行大量的张量操作时使用dispose可能会很麻烦。 TensorFlow.js提供了另一个函数tf.tidy，它对JavaScript中的常规范围起到类似的作用，不同的是它针对GPU支持的张量

tf.tidy执行一个函数并清除所有创建的中间张量，释放它们的GPU内存。它不清除内部函数的返回值

<script>

//直接将代码拷贝到有引入 Tensorflow.js 的 html 中即可

//提示：输出的值都是打印在浏览器开发者工具的控制台，而不是页面上

const average = tf.tidy(() => {

  const y = tf.tensor1d([1.0, 2.0, 3.0, 4.0]);

  const z = tf.ones([4]);

  return y.sub(z).square().mean();

});

average.print()

</script>

使用 tf.tidy 将有助于防止应用程序中的内存泄漏。它也可以用来更谨慎地控制内存何时回收

两个重要的注意事项：

传递给 tf.tidy 的函数应该是同步的，并且不会返回 Promise。我们建议在 tf.tidy 内不要有更新 UI 或在发出远程请求的代码

tf.tidy 不会清理变量。变量通常持续到机器学习模型的整个生命周期，因此TensorFlow.js 不会清理它们，即使它们是在 tidy 中创建的。不过，您可以手动调用dispose处理它们