摘要:

大白话解释字典学习,分享第五个月的学习过程,人生感悟,最后是自问自答。

目录:

1.字典学习(Dictionary Learning,DL)

2.学习过程

3.自问自答

内容:

1.字典学习(Dictionary Learning,DL)

——如果把“0”,“1”看做是字典中的“字”,万事万物皆可用字典表示。

对于汉字来说,只含“0”,“1”字典就显得过于简单,《康熙字典》47035个汉字又臃肿了些,《现代汉语常用字表》就3500个汉字似乎刚刚好,这样我们就能把随便一篇文章表示成3500个元素组成的向量a。当然了,这个向量大部分元素可能都是0,我们把向量a叫做文章的稀疏表达。

然而在现实生活中,除了各种语言的字典,也没听说过其它字典了。但是我们开篇就夸下了海口,万事万物皆可用字典表示,现在来了一批图片X,怎么学它们的字典D(Dictionary)呢?这就是所谓的字典学习,也可以叫做稀疏表达。

我们只知道图片X,字典D和稀疏表达A是未知的,这时候我们可以使用KSVD算法交替求解A和D,即固定D求A,固定A逐列更新D,直到D不改变。

字典学习是一个比较容易理解的思想,通常要和其他的一些方法结合,应用在不同的场景,如多任务、多目标、多步学习等。值得注意的是,我阅读的几篇文章都不止学习一个字典,即既要学习共享字典,又要学习独立字典,充分发掘源域S和目标域T组合之间的关系(如S-S, S-T, T-T),再结合现在比较流行的深度学习会取得比较好的实验效果。

2.学习过程

这个月主要就在看老师给的文章,并在组会的时候做了汇报,说实话,看论文对我来说不容易,在汇报的过程中被问到一些细节的东西解释不清,有些东西只有自己亲身经历过才会明白。至此我论文阅读分有了更深刻的理解。首先是语言关,论文是用英文写的,首先得把论文读顺,其中涉及的专有名词得翻译得当。其次是理解思想和实验设置。最后是公式推导、优化求解和代码实现。除此以外,论文思想方法的由来,论文写作团队的最新进展也是需要了解的。

最近导师让我们了解一下对抗域适应和部分迁移学习相关的内容,我选了这篇 [Partial Adversarial Domain Adaptation-eccv18],希望能在学期末组会的时候能对这篇文章和涉及的知识点有系统深入地认识。最起码要比这次组会的表现强!

3.自问自答

Q1:如何有系统的学习一个新方向?

A1:首先,找到这个方向的国内的学术带头人。然后,找到他学生的硕博论文,一般来说硕博论文会比较系统的介绍这个方向,对于阅读和理解外文资料有很大的帮助。

Q2:如何面对论文中看不懂的公式?

A2:如果数学基础薄弱,就尽可能地尝试去了解公式的物理意义,最起码每一个符号的含义要了如指掌。最好挑选一篇附有代码的文章去实践,听说,只要代码理解了,文章以及公式自然就理解了。

Q3:arXiv是干嘛的?

A3:读音如archive(档案),英 [ˈɑ:kaɪv],美 [ˈɑrkaɪv]。为了防止自己的idea在论文被收录前被别人剽窃,我们会将预稿上传到arxiv作为预收录,因此这就是个可以证明论文原创性(上传时间戳)的文档收录网站。由于arXiv上的文章多半都会投稿到学术期刊,作者对文章多半保持严谨态度(文章质量良莠不齐,如果是初学者,最好请老师帮忙看一下)。

Q4:第一次开组会讲论文是什么体验?

A4:卡壳严重,被问到公式的时候讲不清楚。老师说,读一篇论文不是说简单读一读就完事了,要把论文变成自己的东西,以后见到了才能想得起来,用得起来。我相信有很多人和我一样,既想追求广度,又想追求深度,但是经过这5个月的探索,我认为需要把一样东西学精。

学习人工智能的第五个月[字典学习[Dictionary Learning,DL]]的更多相关文章

  1. 学习人工智能的第六个月[深度学习[Deep Learning,DL]]

    这个月阅读了论文[Partial Adversarial Domain Adaptation-eccv18],文章着眼于源域标签空间包含目标域标签空间的场景,在域对抗神经网络的基础上提出了部分对抗域适 ...

  2. python学习笔记:第五天( 字典)

    Python3 字典 字典是另一种可变容器模型,且可存储任意类型对象. 字典的每个键值(key=>value)对用冒号(:)分割,每个对之间用逗号(,)分割,整个字典包括在花括号({})中 ,格 ...

  3. Dictionary Learning(字典学习、稀疏表示以及其他)

    第一部分 字典学习以及稀疏表示的概要 字典学习(Dictionary Learning)和稀疏表示(Sparse Representation)在学术界的正式称谓应该是稀疏字典学习(Sparse Di ...

  4. 字典学习(Dictionary Learning)

    0 - 背景 0.0 - 为什么需要字典学习? 这里引用这个博客的一段话,我觉得可以很好的解释这个问题. 回答这个问题实际上就是要回答“稀疏字典学习 ”中的字典是怎么来的.做一个比喻,句子是人类社会最 ...

  5. 我的MYSQL学习心得(十五) 日志

    我的MYSQL学习心得(十五) 日志 我的MYSQL学习心得(一) 简单语法 我的MYSQL学习心得(二) 数据类型宽度 我的MYSQL学习心得(三) 查看字段长度 我的MYSQL学习心得(四) 数据 ...

  6. 别人的的MYSQL学习心得(十五) 日志

    我的MYSQL学习心得(十五) 日志 我的MYSQL学习心得(一) 简单语法 我的MYSQL学习心得(二) 数据类型宽度 我的MYSQL学习心得(三) 查看字段长度 我的MYSQL学习心得(四) 数据 ...

  7. python3.4学习笔记(二十五) Python 调用mysql redis实例代码

    python3.4学习笔记(二十五) Python 调用mysql redis实例代码 #coding: utf-8 __author__ = 'zdz8207' #python2.7 import ...

  8. 我想立刻辞职,然后闭关学习编程语言,我给自己3个月时间学习C语言!这样行的通吗

    文章背景,回答提问:我想立刻辞职,然后闭关学习编程语言,我给自己3个月时间学习C语言!这样行的通吗? 我的建议是这样:1. 不要辞职.首先说,你对整个开发没有一个简单的了解,或一个系统的入门学习.换句 ...

  9. 20145330第五周《Java学习笔记》

    20145330第五周<Java学习笔记> 这一周又是紧张的一周. 语法与继承架构 Java中所有错误都会打包为对象可以尝试try.catch代表错误的对象后做一些处理. 使用try.ca ...

随机推荐

  1. svg了解一下

    工作需求,要用svg动态生成思维导图.我的天,这是我的短板. 但是没办法,需求在这,硬着头皮上吧. 本来想偷懒,看看网上有没有现成的可以copy的,逛了一圈发现没有. 这个过程种发现了D3.Three ...

  2. redis的安装和启动linux环境

    启动客户端连接redis服务,redis-cli -p(端口) -h(登录的服务的ip地址);不添加任何参数和选项直接使用redis-cli将会默认登录6379,默认使用ip 127.0.0.1#re ...

  3. java 后台返回文件流到浏览器

    package com.springbootblog.controller; import io.swagger.annotations.ApiImplicitParam;import io.swag ...

  4. SmallMQ发布

    最近一直学习,主要处理java的分布式,MQ,RPC,通信,数据库,缓存等方向. 一般现在的MQ都是企业级的,庞大,功能齐全.最主要是代码量大,对于我们这些小程序员而言,太大,修改困难,修复更加困难, ...

  5. Sass 基础(六)

    join() 函数 join()函数是将两个列表连接合并成一个列表. >>join(10px 20px, 30px 40px) (10px 20px 20px 40px) >> ...

  6. Easyui多个下拉框联动效果

    好久没写前端了,以前在做多级联动的时候,用的是easyui的tree结构,但是需要一次性全部加载,不是按需加载,性能不好,退而求其之,用多个下拉框做 eayui的combobox  有onSelect ...

  7. 并查集(union-find sets)

    一.并查集及其优化 - 并查集:由若干不相交集合组成,是一种简单但是很好用的数据结构,拥有优越的时空复杂性,一般用于处理一些不相交集合的查询和合并问题. - 三种操作: 1.Make_Set(x) 初 ...

  8. substr在oracle和mysql中的应用和区别

    Oracle: 书写格式: (1)Select  substr(字段名(string) , 起始位置(int) , 截取长度(int)) 示例: selectsubstr('123456',0,3)a ...

  9. /etc/fstab开机自动挂载设备配置

    第一列:设备名字(路径?) 第二列:设备挂载路径(挂载到的位置) 第三列:分区格式 第四列:文件系统参数(?) 第五列:是否自动dump备份 0   不要    1   定期    2  不定期 第六 ...

  10. (转)阿里巴巴Druid数据源及使用

    原文链接:https://blog.csdn.net/yanguo110/article/details/68944659 第一部分:数据源的集中比较. 目前常用的数据源主要有c3p0.dbcp.pr ...