assignment1SVM的一些经验

def svm_loss_vectorized(W, X, y, reg):

  """

  Structured SVM loss function, vectorized implementation.

  Inputs and outputs are the same as svm_loss_naive.

  """

  loss = 0.0e0

  dW = np.zeros(W.shape,dtype='float64') # initialize the gradient as zero

  #############################################################################

  # TODO:                                                                     #

  # Implement a vectorized version of the structured SVM loss, storing the    #

  # result in loss.                                                           #

  #############################################################################

  pass

  #############################################################################

  #                             END OF YOUR CODE                              #

  #############################################################################

  num_train = X.shape[0]

  score = np.dot(X, W)

  loss_matrix = np.maximum(0, score - score[np.arange(num_train), np.array(y)].reshape(-1, 1) + 1)

  loss_matrix[np.arange(num_train), np.array(y)] = 0

  loss = np.sum(loss_matrix)

  loss /= num_train

  loss += 0.5 * reg * np.sum(W * W)

  #############################################################################

  # TODO:                                                                     #

  # Implement a vectorized version of the gradient for the structured SVM     #

  # loss, storing the result in dW.                                           #

  #                                                                           #

  # Hint: Instead of computing the gradient from scratch, it may be easier    #

  # to reuse some of the intermediate values that you used to compute the     #

  # loss.                                                                     #

  #############################################################################

  num_classes = W.shape[1]

  coeff_mat = np.zeros((num_train, num_classes))

  coeff_mat[loss_matrix > 0] = 1

  coeff_mat[range(num_train), list(y)] = 0

  coeff_mat[range(num_train), list(y)] = -np.sum(coeff_mat, axis=1)

  dW = (X.T).dot(coeff_mat)

  dW /= num_train

  dW += reg * W

  #############################################################################

  #                             END OF YOUR CODE                              #

  #############################################################################

  return loss, dW

这里面，有一句很难理解：

  loss_matrix = np.maximum(0, score - score[np.arange(num_train), np.array(y)].reshape(-1, 1) + 1)
当时看了很久，后来想通了，我们拆开来看，就不会很难了。

score[np.arange(num_train), np.array(y)]是从分数中，把正确的分数提取出来。下图中，那个小红框，就表示当前正确的分类对应的分数。提取出来之后，就是N*1维的矩阵

score - score[np.arange(num_train), np.array(y)].reshape(-1, 1)这个减法虽然维度不匹配，但是有boardcasting技术，后面的矩阵会自动列复制到维度N*C

  num_classes = W.shape[1]

  coeff_mat = np.zeros((num_train, num_classes))

  coeff_mat[loss_matrix > 0] = 1

  coeff_mat[range(num_train), list(y)] = 0

  coeff_mat[range(num_train), list(y)] = -np.sum(coeff_mat, axis=1)

  dW = (X.T).dot(coeff_mat)

  dW /= num_train

  dW += reg * W

  dW = (X.T).dot(coeff_mat) 这里dW 的计算，使用向量计算。用一个取值的coeff_mat矩阵来确定取哪些x加入。看懂循环是如何操作的，就明白了这个这里取巧的从X.T来实现循环，时间倍数16倍。

中间有几次，发现loss老是益处报错，后来才发现应该是learning rate 太大了，把-5改成-6，就可以了。原因是这里没有学习速率衰减优化策略

assignment1SVM的一些经验的更多相关文章

移动硬盘不能识别的常见7种解决方案 ~ By 逆天经验
服务器汇总:http://www.cnblogs.com/dunitian/p/4822808.html#iis 服务器异常: http://www.cnblogs.com/dunitian/p/45 ...
【原创经验分享】WCF之消息队列
最近都在鼓捣这个WCF,因为看到说WCF比WebService功能要强大许多,另外也看了一些公司的招聘信息,貌似一些中.高级的程序员招聘,都有提及到WCF这一块,所以,自己也关心关心一下,虽然目前工作 ...
iOS架构一个中型普通App的一些经验总结
这一版比较完善的的App终于提交审核了.有时间写写自己的一些经验的总结了.自己主导的从0到比较成型的app到目前来说也只有两个,但是其中的很多东西都是大同小异.基本上是想到了什么就写什么,感觉写的不到 ...
从史上八大MySQL事故中学到的经验
本文列举了史上八大MySQL宕机事件原因.影响以及人们从中学到的经验,文中用地震级数来类比宕机事件的严重性和后果,排在最严重层级前两位的是由于亚马逊AWS宕机故障(相当于地震十级和九级). 一.Per ...
CentOS上 Mono 3.2.8运行ASP.NET MVC4经验
周一到周三,折腾了两天半的时间,经历几次周折,在小蝶惊鸿的鼎力帮助下,终于在Mono 3.2.8上运行成功MVC4.在此总结经验如下: 系统平台的版本: CentOS 6.5 Mono 3.2.8 J ...
【腾讯Bugly经验分享】程序员的成长离不开哪些软技能？
本文来自于腾讯bugly开发者社区,非经作者同意,请勿转载,原文地址:http://dev.qq.com/topic/57ce8068d4d44a246f72baf2 Dev Club 是一个交流移动 ...
CI Weekly #6 | 再谈 Docker / CI / CD 实践经验
CI Weekly 围绕『软件工程效率提升』进行一系列技术内容分享,包括国内外持续集成.持续交付,持续部署.自动化测试. DevOps 等实践教程.工具与资源,以及一些工程师文化相关的程序员 Ti ...
C#异常处理经验(原则与方法)
本文是异常处理经验性的文章,其实跟C#关系也不大.比较适合刚刚熟悉异常语法,而缺乏实战的读者.当然,经验老练的读者也可指出不足.给予意见.补充说明,一起完善文章,分享更多知识与经验. 1 ...
【原创经验分享】JQuery（Ajax）调用WCF服务
最近在学习这个WCF,由于刚开始学不久,发现网上的一些WCF教程都比较简单,感觉功能跟WebService没什么特别大的区别,但是看网上的介绍,就说WCF比WebService牛逼多少多少,反正我刚 ...

随机推荐

关于pycharm 打不开某些文件夹和文件打不开的问题
在使用pycharm的时候遇到了一个情况, 下载了一个文件,自己修改了文件夹名称后再打开文件夹里的py文件, 打不开了,pycharm没有反应, 百度了一下,没有类似的问题,觉得应该是个个例... 然 ...
Google JavaScript样式指南
Google JavaScript样式指南目录 1简介 1.1术语说明 1.2指南说明 2源文件基础知识 2.1文件名 2.2文件编码:UTF-8 2.3特殊字符 3源文件结构 3.1许可或版权 ...
JavaScript中==和===的区别（面试题目）
==用于一般比较,===用于严格比较;==在比较的时候可以转换数据类型,===严格比较,只要类型不匹配就返回flase. 举例说明: "1" == true; //true 类型不 ...
JVM知识（一）：基础原理
学过java知识和技术人,都应该听说过jvm,jvm一直是java知识里面晋级阶段的重要部分,如果想要在java技术领域更深入一步,jvm是必须需要明白的知识点. 本篇来讲解jvm的基础原理,先来熟悉 ...
Oracle EBS PO 接收事务处理查不到对应的数据
1. 有一种情况是采购订单的借记账户不对不匹配OU 2. 有可能是因为接口表卡住了 PENDING状态的把对应的数据删除掉即可 3. 接收时发生异常那个,丢失了接收头,rcv_shipment_h ...
只能在堆上生成的对象 VS. 只能在栈上生成的对象
1. 只能在堆上即禁止在栈上生成.如何实现? 当对象建立在栈上面时,是由编译器分配内存空间的,调用构造函数来构造栈对象.如果类的析构函数是私有的,则编译器不会在栈空间上为类对象分配内存. 所以,只需 ...
远程监视jboss应用java内存的配置
前言因为最近一个项目部署在客户那边运行一个月左右就会出现java内存溢出的问题,为了时时监控java内存的情况需要,需要远程查看服务器上java内存的一些情况.在公司模拟部署了远程监视linux下项 ...
ffemp语音转码
分享一款windows上很不错的程序员专业转码软件 ffemp 首先先下载ffemp转码软件 https://pan.baidu.com/s/10BoahyWJlI9e-_rB_yCiLA 下载之 ...
[翻译] CHTCollectionViewWaterfallLayout
CHTCollectionViewWaterfallLayout https://github.com/chiahsien/CHTCollectionViewWaterfallLayout CHTCo ...
oracle 复制表结构复制表数据 sql 语句
1. 复制表结构及其数据: create table table_name_new as select * from table_name_old 2. 只复制表结构: create table ta ...

assignment1SVM的一些经验

assignment1SVM的一些经验的更多相关文章

随机推荐

热门专题