From:https://jovianlin.io/cat-crossentropy-vs-sparse-cat-crossentropy/ categorical_crossentropy 和 sparse_categorical_crossentropy 的区别在哪? 如果你的 targets 是 one-hot 编码,用 categorical_crossentropy one-hot 编码:[0, 0, 1], [1, 0, 0], [0, 1, 0] 如果你的 tagets 是 数字编…
1.tf.where https://blog.csdn.net/ustbbsy/article/details/79564828 2.tf.less   tf.less(x,y,name=None)   返回bool型tensor,返回逐元素x<y比较的结果 3.tf.gather   根据索引值,将对应tensor的元素提取出来,组成新的tensor   https://blog.csdn.net/Cyiano/article/details/76087747 4.tf.train.expo…
所属分类:Keras Keras后端 什么是"后端" Keras是一个模型级的库,提供了快速构建深度学习网络的模块.Keras并不处理如张量乘法.卷积等底层操作.这些操作依赖于某种特定的.优化良好的张量操作库.Keras依赖于处理张量的库就称为"后端引擎".Keras提供了三种后端引擎Theano/Tensorflow/CNTK,并将其函数统一封装,使得用户可以以同一个接口调用不同后端引擎的函数 Theano是一个开源的符号主义张量操作框架,由蒙特利尔大学LISA/…
总结 机器学习(machine learning)是人工智能的一个特殊子领域,其目标是仅靠观察训练数据来自动开发程序[即模型(model)].将数据转换为程序的这个过程叫作学习(learning) 深度学习(deep learning)是机器学习的众多分支之一,它的模型是一长串几何函数,一个接一个地作用在数据上.这些运算被组织成模块,叫作层(layer).深度学习模型通常都是层的堆叠,或者更通俗地说,是层组成的图.这些层由权重(weight)来参数化,权重是在训练过程中需要学习的参数.模型的知识…
keras构造神经网络,非常之方便!以后就它了.本文给出了三个例子,都是普通的神经网络 例一.离散输出,单标签.多分类 例二.图像识别,单标签.多分类.没有用到卷积神经网络(CNN) 例三.时序预测,单标签.多分类.(LSTM) 说明 keras对于神经网络给出的流程图,非常容易理解. 图片来源:https://www.jianshu.com/p/6c08f4ceab4c [重点]训练神经网络围绕以下对象:  1. 层,用于合并成网络(或模型)  2. 输入数据和相应的目标  3. 损失函数, …
本节构建一个网络,将路透社新闻划分为46个互斥的主题,也就是46分类 案例2:新闻分类(多分类问题) 1. 加载数据集 from keras.datasets import reuters (train_data, train_labels), (test_data, test_labels) = reuters.load_data(num_words=10000) 将数据限定在10000个最常见出现的单词,8982个训练样本和2264个测试样本 len(train_data) 8982 len…
本节提示: 1.DL的核心构建 2.Keras的简单介绍 3.搭建DL机器训练环境 4.使用DL模型解决基础问题 3.1 DL的基本构建:layer layer的定义:以1个或多个tensor作为输入,并且运算出来1个或者多个tensor作为输出的数据处理模型. from keras import modelsfrom keras import laytersmodel = models.Sequentail()model.add(layers.Dense(32,input_shape=(784…
深度学习基础 Python 的 Keras 库来学习手写数字分类,将手写数字的灰度图像(28 像素 ×28 像素)划分到 10 个类别 中(0~9) 神经网络的核心组件是层(layer),它是一种数据处理模块,它从输入数据中提取表示,紧接着的一个例子中,将含有两个Dense 层,它们是密集连接(也叫全连接)的神经层,最后是一个10路的softmax层,它将返回一个由 10 个概率值(总和为 1)组成的数组.每个概率值表示当前数字图像属于 10 个数字类别中某一个的概率 损失函数(loss fun…
Reuters数据集下载速度慢,可以在我的repo库中找到下载,下载后放到~/.keras/datasets/目录下,即可正常运行. 构建神经网络将路透社新闻分类,一共有46个类别.因为有多个类别,属于多分类问题,而每条数据只属于一个类别,所以是单标签多分类问题:如果每条数据可以被分到多个类别中,那问题则属于多标签多分类问题. 完整代码 欢迎Fork.Star 路透社数据集 Reuters数据集发布在1986年,一系列短新闻及对应话题的数据集:是文本分类问题最常用的小数据集.和IMDB.MNIS…
用keras搭好模型架构之后的下一步,就是执行编译操作.在编译时,经常需要指定三个参数 loss optimizer metrics 这三个参数有两类选择: 使用字符串 使用标识符,如keras.losses,keras.optimizers,metrics包下面的函数 例如: sgd = SGD(lr=0.01, decay=1e-6, momentum=0.9, nesterov=True) model.compile(loss='categorical_crossentropy', opt…