逐步会更新阅读过的AutoML文献(其实是NAS),以及自己的一些思考

  1. Progressive Neural Architecture Search,2018ECCV的文章;

  目的是:Speed up NAS by proposing an alternative algorithm (Progressive Search),

  具体方法:采取Learning transferable architectures for scalable image recognition中相似的搜索空间,也就是block->cell->network;采用simple to complex的搜索策略,

                                        网络结构

                                        Cell结构

                                        Block结构

为了减少搜索空间,采用的搜索算法如下:

                                         搜索算法

  个人评论:采用了进化算法的思想,以及训练一个预测器,来预测网络性能,但是具体怎么预测并没有说明。

  2.Efficient Neural Architecture Search via Parameter Sharing,大名鼎鼎的ENAS,采用权重共享的方法,2018CVPR的文章

  目的是:Improve the efficiencyo of NAS to eschew training each child model from scratch to convergence,也就是减少每个子模型训练到收敛的时间。

  IDEAS是:让每个子模型都共享一套权重;在一个超网络下,构建很多的子网络

  3.Transfer NAS: Knowledge Transfer between Search Spaces with Transformer Agents,2019ICML的workshop,私以为可以结合第1篇进行修改。

  目的是:针对不同搜索空间需要重新搜索的问题,提出了一个支持联合学习和快速迁移先验知识的基于transformer的多搜索空间和任务的agent,用于搜索空间迁移

  4. EAT-NAS: Elastic Architecture Transfer for Accelerating Large-scale Neural Architecture Search,可以算是地平线出品

  目的是:更好地把小数据的网络结构迁移到大数据上,因为目前很少有直接在ImageNet上搜索网络结构的工作,一般是在小数据集(CIFAR10)上训练好,然后直接迁移到ImageNet上,但这样

不能保证迁移后的网络性能。

  具体方法:在CIFAR10上搜索得到一个最优网络后,作为种子结构传给ImageNet;首先使用进化算法进行basic architecture的搜索(best model on the samll dataset),然后作为种子进行large dataset的初始化,这使得larget dataset的搜索更快速并且方向更正确

  5. Multinomial Distribution Learning for Effective Neural Architecture Search,2019ICCV的文章,主要是刷新搜索时间和网络精度,在搜索算法上进行革新;作者知乎ID风车车,从机械到计算机视觉,非常励志,是我学习的榜样,而且今年才研一已经至少两篇顶会了!还有一篇Dynamic Distribution Pruning for Efficient Network Architecture Search

  目的是:把网络结构选择转换成一个多项式分布学习问题,主要是假设每个模型在训练阶段的性能排名都是相同的,即好的一开始就好,差的一开始就差

  6. Evaluating the Search Phase of Neural Architecture Search,很有批判性的一篇文章,主要是为了搞清楚NAS算法背后的运行情况

  首先证明了随机搜索的平均性能比目前的NAS方法要好,其次是NAS算法的排名和结果并不能代表真正的网络结构性能;权重共享策略会影响网络的训练,从而影响搜索过程的有效性。具体来说权重共享打乱了按照真实训练每个网络结构得到的排名

  7. On Network Design Spaces for Visual Recognition,对设计空间进行了探索,主要是发现设计空间之间的差异,依次来解释模型的性能,作为一个case应用在了NAS上,因为NAS专注于在一个搜索空间找到最佳网络,而这篇论文关注搜索空间(设计空间)本身,得出了一个结论,最近的NAS方法很大程度上忽略了设计空间上的差异;通过对五个NAS方法的搜索空间的分析,论文认为随着NAS的发展,搜索得到的网络精度的提高可能一部分受益于搜索空间的改进,比如DARTS的搜索空间最优,而NASNet则最差;论文也将DARTS、NASNet搜索空间和ResNeXt作了对比,发现DARTS和ResNeXt差不多,而NASNet依旧是最差的。

  结论是:搜索空间的设计其实很重要,未来应该要出现一些设计搜索空间的工作,无论是手工方法还是数据驱动方法

AutoML文献阅读的更多相关文章

  1. 文献阅读笔记——group sparsity and geometry constrained dictionary

    周五实验室有同学报告了ICCV2013的一篇论文group sparsity and geometry constrained dictionary learning for action recog ...

  2. 文献阅读 | The single-cell transcriptional landscape of mammalian organogenesis | 器官形成 | 单细胞转录组

    The single-cell transcriptional landscape of mammalian organogenesis 老板已经提了无数遍的文章,确实很nb,这个工作是之前我们无法想 ...

  3. 空间插值文献阅读(Geostatistical approaches for incorporating elevation into the spatial interpolation of rainfall)

    空间插值技术应用必读论文---P. Goovaerts, Geostatistical approaches for incorporating elevation into the spatial ...

  4. 文献阅读方法 & 如何阅读英文文献 - 施一公(转)

    附: 如何看懂英文文献?(好) 看需求,分层次 如何总结和整理学术文献? Mendeley & Everything 如何在pdf文献上做笔记?福晰阅读器 自己感悟: 一篇专业文献通常会有几页 ...

  5. phd文献阅读日志-博一上学期

    为了记住并提醒自己阅读文献,进行了记录(这些论文都是我看过理解的),论文一直在更新中. 博一上学期: 1.week 6,2017.10.16 2014-Automatic Semantic Model ...

  6. RTCM32编解码中的一些概念及相关文献阅读

    1. IODC和 IODE ——  导航电文相关.iode/iodc是在GPS系统的ICD2中定义的参数,iode指星历数据事件,iodc指星钟数据事件. IOD 是 issue of data ,数 ...

  7. 文献阅读报告 - Social BiGAT + Cycle GAN

    原文文献 Social BiGAT : Kosaraju V, Sadeghian A, Martín-Martín R, et al. Social-BiGAT: Multimodal Trajec ...

  8. 文献阅读报告 - Social Ways: Learning Multi-Modal Distributions of Pedestrian Trajectories with GANs

    文献引用 Amirian J, Hayet J B, Pettre J. Social Ways: Learning Multi-Modal Distributions of Pedestrian T ...

  9. 文献阅读 - MonoLoco与关于Camera Matrix的笔记

    目录 概览 HighLights Camera Intrinsic Matrix 笔记 Intrinsic Matrix Task-Error - 不确定性任务下确界的计算 输出假设的Laplace分 ...

随机推荐

  1. Codeforces Gym 100814C Connecting Graph 树剖并查集/LCA并查集

    初始的时候有一个只有n个点的图(n <= 1e5), 现在进行m( m <= 1e5 )次操作 每次操作要么添加一条无向边, 要么询问之前结点u和v最早在哪一次操作的时候连通了 /* * ...

  2. js时间转时间戳

    转换成时间戳 new Date('2018-10-11 14:28:47'.replace(/-/g, '/')).getTime() //1539239327000

  3. 【LuoguP5280】[ZJOI2019] 线段树

    题目链接 题目描述 略 Sol 显然不能直接暴力模拟. 观察这个东西本质在干什么,就是某一次操作可能进行可能不进行,然后求所有情况下被标记节点总数. 这个显然可以转化为概率问题,每次有二分之一的概率进 ...

  4. HYSBZ-4033-树上染色(树上DP)

    链接: https://vjudge.net/problem/HYSBZ-4033 题意: 有一棵点数为N的树,树边有边权.给你一个在0~N之内的正整数K,你要在这棵树中选择K个点,将其染成黑色,并 ...

  5. 对js数组去重的研究

    1.利用es5 let arr = [1, 2, 3, 4, 5, 6, 7, 1, 2, 3] const unique=arr=>{ return Array.from(new Set(ar ...

  6. node.js入门学习(三)--npm

    一.npm介绍 1)npm:node package manager是node.js默认的以js编写的软件包管理系统 官网:www.npmjs.com 文档:docs.npmjs.com 2)提到np ...

  7. BZOJ 3294: [Cqoi2011]放棋子 计数 + 容斥 + 组合

    比较头疼的计数题. 我们发现,放置一个棋子会使得该棋子所在的1个行和1个列都只能放同种棋子. 定义状态 $f_{i,j,k}$ 表示目前已使用了 $i$ 个行,$j$ 个列,并放置了前 $k$ 种棋子 ...

  8. ICPC — International Collegiate Programming Contest Asia Regional Contest, Yokohama, 2018–12–09 题解

    目录 注意!!此题解存在大量假算法,请各位巨佬明辨! Problem A Digits Are Not Just Characters 题面 题意 思路 代码 Problem B Arithmetic ...

  9. linux文件重定向

    1:标准输出:2:错误输出 1,exec启动一个新的shell将STDOUT文件描述符重定向到文件 #!/bin/shecho "test exec..."exec > ou ...

  10. 大数据笔记(三十二)——SparkStreaming集成Kafka与Flume

    三.集成:数据源 1.Apache Kafka:一种高吞吐量的分布式发布订阅消息系统 (1) (*)消息的类型 Topic:主题(相当于:广播) Queue:队列(相当于:点对点) (*)常见的消息系 ...