在网易云课堂上学习计算机视觉经典课程cs231n,觉得有必要做个笔记,因为自己的记性比较差,留待以后查看。

每一堂课都对应一个学习笔记,下面就开始第一堂课。

这堂课主要是回顾了计算机视觉的起源及其后来的发展,有助于学者理清计算机视觉的研究主题和发展脉络。

首先介绍了计算机视觉的相关领域,因为它不仅仅关乎计算机科学,还涉及生物,物理,工程等等学科,是一门综合性很强的学科。

接着从物种大爆炸讲起

推测生物有了视觉后极大地扩张了活动区域,带来了生物的蓬勃发展。

接着讲计算机视觉在近现代的发展,这里省略,直接跳到近些年有重要意义的学术成果。

2001年Viola&Jones推出人脸识别算法haar检测器

1999年David Lowe推出sift特征算法

2005年和2009年分别出现HOG特征算法和DPM算法

除了算法上的改进,数据规模的增大也是推动计算机视觉发展的主因,甚至到了深度学习时代,是各种数据集推动着算法的演化。

以下分别是PASCAL VOC和ImageNet,PASCAL 包含20类物体,而ImageNet则有惊人的22000类物体,图片数量达到1千4百万张。

那么计算机视觉究竟要解决哪些问题,比较重要的几个问题包括图像分类,

目标识别,图像描述,图像分割,场景理解等,其中,场景理解可以说是终极目标,

自然也是最具挑战性的问题。

回到这门课本身,CNN对于计算机视觉有何帮助,可以说进入人工智能时代,CNN就是解决计算机视觉的全部。不过CNN的出现可是有些年头了,早在1998年,Lecun就成功地利用CNN来识别邮政数字了,不过直到2012年Alexnet的出现引发了这一潮流。下面左图就是二者的网络结构,可以看出并没有大的改变,所以不得不归功于今时今日计算机的性能和数据集的出现。右图是在ImageNet数据集上的历年冠军,从2012年往后,基本就是CNN的天下了。

最后是一些基本要求吧,python,线性代数,微积分,还有CS229(机器学习)的基本知识,都要掌握。

cs231n学习笔记(一)计算机视觉及其发展史的更多相关文章

  1. 【转】cs231n学习笔记-CNN-目标检测、定位、分割

    原文链接:http://blog.csdn.net/myarrow/article/details/51878004 1. 基本概念 1)CNN:Convolutional Neural Networ ...

  2. CS231n学习笔记-图像分类笔记(上篇)

    原文地址:智能单元 图像分类:所谓图像分类问题,就是已有固定的分类标签集合,然后对于输入的图像按照标签类别,将其打上标签. 下面先介绍一下一个简单的图像如何利用计算机进行分类: 例子:以下图为例,图像 ...

  3. CS231n学习笔记-图像分类笔记(下篇)

    原文地址:智能单元 K-Nearest Neighbor分类器 大家可能注意到了,为什么只用最相似的一张图片的标签来作为测试图像的标签呢?这不是很奇怪吗!是的,使用K-Nearest Neighbor ...

  4. cs231n学习笔记(二)图像分类

    图像分类可说是计算机视觉中的基础任务同时也是核心任务,做好分类可为检测,分割等高阶任务打好基础. 本节课主要讲了两个内容,K近邻和线性分类器,都是以猫的分类为例. 一. K近邻 以猫的分类为例,一张含 ...

  5. 斯坦福CS231n学习--初识

    课程主页:CS231n: Convolutional Neural Networks for Visual Recognition 关注其:Course Project主页 视频学习:云课堂 斯坦福C ...

  6. Python学习笔记—Python基础1 介绍、发展史、安装、基本语法

    第一周学习笔记: 一.Python介绍      1.Python的创始人为吉多·范罗苏姆.1989年的圣诞节期间,吉多·范罗苏姆为了在阿姆斯特丹打发时间,决心开发一个新的脚本解释程序,作为ABC语言 ...

  7. 【cs231n】神经网络学习笔记3

    + mu) * v # 位置更新变了形式 对于NAG(Nesterov's Accelerated Momentum)的来源和数学公式推导,我们推荐以下的拓展阅读: Yoshua Bengio的Adv ...

  8. 【cs231n】神经网络学习笔记1

    神经网络推荐博客: 深度学习概述 神经网络基础之逻辑回归 神经网络基础之Python与向量化 浅层神经网络 深层神经网络 前言 首先声明,以下内容绝大部分转自知乎智能单元,他们将官方学习笔记进行了很专 ...

  9. CS231n课程笔记翻译9:卷积神经网络笔记

    译者注:本文翻译自斯坦福CS231n课程笔记ConvNet notes,由课程教师Andrej Karpathy授权进行翻译.本篇教程由杜客和猴子翻译完成,堃堃和李艺颖进行校对修改. 原文如下 内容列 ...

随机推荐

  1. C# 缓存工厂类

    描 述:缓存工厂类 /// <summary> /// 描 述:缓存工厂类 /// </summary> public class CacheFactory { /// < ...

  2. C++练习 | 创建并倒序输出不带头结点的链表

    #include <iostream> #include <cstdio> #include <stdlib.h> #include <stack> u ...

  3. sizeof 用于返回一个对象或者类型所占据的内存数

    整数类型 sizeof(int); 4字节or8字节 函数 sizeof(函数); 函数返回值类型占据的字节数 字符数组 char c[] = "abc"; sizeof(c); ...

  4. python class用法

    创建一个名为 Restaurant 的类,其方法 __init__() 设置两个属性: name 和 type  1.创建一个名为 describe_restaurant() 的方法,前者打印前述两项 ...

  5. Docker安装(yum方式 centos7)

    yum install -y yum-utils device-mapper-persistent-data lvm2   yum-config-manager --add-repo http://m ...

  6. MongoDB 数据类型查询 — $type使用

    MongoDB 使用过程中经常需要根据字段的类型来查询数据, 而MongoDB中查询字段类型是通过$type操作符来实现. $type使用法语: db.集合名.find({$type:类型值}); / ...

  7. Spring框架中用到的设计模式(转)

    主要参考这篇文章 http://blog.didispace.com/spring-design-partern/

  8. python列表学习

    #创建列表,通过[]来创建列表my_list=[] #创建了一个空列表#print(my_list,type(my_list)) #列表追存储的数据,我们称为元素#一个列表中可以存储多个元素,也可以在 ...

  9. 关于LP64,ILP64,LLP64,ILP32,LP32字长(数据)模型

    太长不看: 1.32位Windows和类Unix使用ILP32字长模型,64位Windows使用ILP64模型,64位类Unix使用LP64字长模型. 2.根据1,long在32位和64位Window ...

  10. linux——高级文本处理命令之wc、cut、sort

    1.  wc :Word Count 命令的功能为统计指定文件中的字节数.字数.行数,并将统计结果显示输出 1.1 命令格式: wc [选项]文件... 1.2 命令参数: -c 统计字节数. -l  ...