【CS231N】2、多类SVM

天涯惟笑 2024-11-08 20:17:36 原文

一、疑问

1. assignments1

linear_svm.py文件的函数 svm_loss_naive中，使用循环的方式实现梯度计算
linear_svm.py文件的函数 svm_loss_vectorized中，梯度的向量化实现

SVM的损失函数在某个数据点上的计算：

$L_i=\displaystyle\sum_{j\not =y_i}[max(0,w^T_jx_i-w^T_{y_i}x_i+\Delta)]$

对函数进行微分，比如对 $w_{y_i}$ 进行微分得到：

$\displaystyle\nabla_{w_{y_i}}L_i=-(\sum_{j\not=y_i}1(w^T_jx_i-w^T_{y_i}x_i+\Delta>0))x_i$

在代码实现的时候，只需要计算没有满足边界值的分类的数量（因此对损失函数产生了贡献），然后乘以 $x_i$ 就是梯度了。注意，这个梯度只是对应正确分类的W的行向量的梯度，那些 $j\not =y_i$ 行的梯度是：

$\displaystyle\nabla_{w_j}L_i=1(w^T_jx_i-w^T_{y_i}x_i+\Delta>0)x_i$

二、知识点

1. 数据集划分

训练集：训练模型用；
验证集：用以最优参数的调试选择；
测试集：测定训练好的模型的表现情况；
开发集：在实际开发中，训练集往往包含很多数据，为了节省计算时间，往往使用训练集的一小部分子集，用作模型的训练。

2. 梯度检查

数值梯度和解析梯度的值有时候在某个维度会相差较多。这是因为数值梯度的计算采用的是用前后2个很小的随机尺度（比如0.00001）进行计算，当loss不可导的时候，两者会出现差异。**

3.损失函数

SVM只关心正确分类的得分与错误分类的得分至少要高于边界值，若不满足，便计算相应的损失值。
折叶损失：\(max(0, -)\)函数。
平方折叶损失：\(max(0, -)^2\)**。更强烈得惩罚过界的边界值。在某些数据集会工作得更好，可以通过交叉验证来决定使用哪个损失计算函数。
由于max操作，损失函数中存在一些不可导点（kinks），这些点使得损失函数不可微，因为在这些不可导点，梯度是没有定义的。但是次梯度依然存在且常常被使用。

4. 设置Delta

超参数delta和\(\lambda\)一起控制损失函数中数据损失和正则化损失之间的权衡。但是对于通过缩小或扩大权重矩阵的值，改变不同分类值之间的差异，因此，在一定程序上改变delta是没有意义的。真正的权衡是通过正则化强度来控制权重能够变大到何种程度。

5. 在初始形式中进行初始化

损失函数的最优化的始终在非限制初始形式下进行。很多这些损失函数从技术上来说是不可微的（比如当 $x=y$ 时， $max(x,y)$ 函数就不可微分），但是在实际操作中并不存在问题，因为通常可以使用次梯度。

【CS231N】2、多类SVM的更多相关文章

多类 SVM 的损失函数及其梯度计算
CS231n Convolutional Neural Networks for Visual Recognition -- optimization 1. 多类 SVM 的损失函数(Multicla ...
cs231n --- 1：线性svm与softmax
cs231n:线性svm与softmax 参数信息: 权重 W:(D,C) 训练集 X:(N,D),标签 y:(N,1) 偏置量bias b:(C,1) N:训练样本数: D:样本Xi 的特征维度, ...
cs231n线性分类器作业 svm代码 softmax
CS231n之线性分类器斯坦福CS231n项目实战(二):线性支持向量机SVM CS231n 2016 通关第三章-SVM与Softmax cs231n:assignment1——Q3: Impl ...
CS231n 2016 通关第三章-SVM 作业分析
作业内容,完成作业便可熟悉如下内容: cell 1 设置绘图默认参数 # Run some setup code for this notebook. import random import nu ...
【cs231n作业笔记】二：SVM分类器
可以参考:cs231n assignment1 SVM 完整代码 231n作业多类 SVM 的损失函数及其梯度计算(最好)https://blog.csdn.net/NODIECANFLY/ar ...
cs231n笔记（二）最优化方法
回顾上一节中,介绍了图像分类任务中的两个要点: 假设函数.该函数将原始图像像素映射为分类评分值. 损失函数.该函数根据分类评分和训练集图像数据实际分类的一致性,衡量某个具体参数集的质量好坏. 现在介绍 ...
cs231n笔记（一）线性分类器
Liner classifier 线性分类器用作图像分类主要有两部分组成:一个是假设函数, 它是原始图像数据到类别的映射.另一个是损失函数,该方法可转化为一个最优化问题,在最优化过程中,将通过更新假设 ...
CS231n官方笔记授权翻译总集篇发布
CS231n简介 CS231n的全称是CS231n: Convolutional Neural Networks for Visual Recognition,即面向视觉识别的卷积神经网络.该课程是斯 ...
CS231n课程笔记翻译4：最优化笔记
译者注:本文智能单元首发,译自斯坦福CS231n课程笔记Optimization Note,课程教师Andrej Karpathy授权翻译.本篇教程由杜客翻译完成,堃堃和李艺颖进行校对修改.译文含公式 ...

随机推荐

文本处理三剑客之 sed
sed:文本流编辑器主要是对文件的快速增删改查,查询功能中最常用的是过滤,取行 sed [选项] [sed内置命令字符] [输入文件] Options: -n:取消默认的sed输出,常与sed内置命 ...
Scala的高级特性
高阶函数概念 Scala混合了面向对象和函数式的特性,我们通常将可以作为参数传递到方法中的表达式叫做函数.在函数式编程语言中,函数是“头等公民”,高阶函数包含:作为值的函数.匿名函数.闭包.柯里化等 ...
@ModelAttribute三个作用：
@ModelAttribute具有如下三个作用: ①绑定请求参数到命令对象:放在功能处理方法的入参上时,用于将多个请求参数绑定到一个命令对象,从而简化绑定流程,而且自动暴露为模型数据用于视图页面展示时 ...
PyQt5 笔记（03）：弹出窗口大全
本文实现了PyQt5个各种弹出窗口:输入框.消息框.文件对话框.颜色对话框.字体对话框.自定义对话框其中,为了实现自定义对话框的返回值,使用了信号/槽本文基于 windows 7 + python ...
2 CRM 讲师与学生，highcharts应用
一.讲师与学生简介 1 初始化 course_record,studyrecord, 2 考勤 3 录入成绩 4 显示成绩 ajax 查询 5 上传作业(os模块) 6 下载作业二. 初始化 ,st ...
CodeForces 593D Happy Tree Party [LCA+并查集]
题意:给一棵树,每条边有一个权值,给两种操作,第一种是询问y向下整除从a到b的最短路径中每条边的权值后y的值,第二种是改变某条边的权值. 思路:y的最大值为1e18,最多除大于等于2的数不超过60次即 ...
Unity3d之Hash&Slash学习笔记(一）--角色属性类的构架
角色属性类的构架角色属性类有8个类,继承关系如下图: 每个类的具体作用见之后的随笔
underscore.js 分析6 map函数
作用:通过转换函数(iteratee迭代器)映射列表中的每个值产生价值的新数组.iteratee传递三个参数:value,然后是迭代 index. _.map([1, 2, 3], function( ...
pycharm字体放大缩小设置
放大设置 File —> settings—> Keymap —>在搜寻框中输入:increase —> Increase Font Size(双击) —> 在弹出的对话 ...
PersistentAliasAttribute & CalculatedAttribute & CalculatedPersistentAliasAttribute
一,PersistentAliasAttribute-[XPO提供] Indicates that a property is not persistent and its value is calc ...