【转载】 如何看待 2019 年 CS PhD 现扎堆申请且大部分为 AI 方向?未来几年 AI 泡沫会破裂吗?
原贴地址:
https://www.zhihu.com/question/316135639
作为一个 AI 方向的在读博士生,实在是过的蛮闹心,无意中逛知乎发现了这个帖子,发现很适合现在的自己,于是转载到这里,以作收藏。
----------------------------------------------------------------------------
今年刚渡过了 CS PhD 的申请狂潮(本人是14级的学生),顺便回答一下吧。
我在中国科大计算机本科期间,学生工作做的很多,认得不少13,14,15,16,17届的学生(包括少年班和物理学院),了解一些他们的一些想法。中国科大是PhD申请大户之一,因此申请倾向和数据都还算可以参考的风向标;此外计算机和信息学院本身没有特别偏重AI,因此相关的改变就直接反应了AI这几年发展带来的冲击力。13届学生是第一批开始感受到AI发展带来影响的学生,不过当时由于大数据、VR、IoT这些宣传得还挺火,13届申请方向还是挺多样性的,并没有出现全员AI的情况。到了14级,AI开始成为比较热门的方向,这在各种场合都有反映,港中文到我们这里宣传的时候也特地请了MMLab的教授(特别是科大校友),MSRA招联培生的宣讲中也越来越多的谈及Deep learning。这些很大程度上是因为14年deep learning完成了很多里程碑式的事件。不过由于科大课程设置和科研团队没有特别偏AI,导致申请AI方向的人没有预想的多。15级学生已经完全感受到了AI的冲击,几乎每个学生都知道deep learning或者相关的学术词汇,我们编译原理的老师曾经吐槽说“15级没有一个做system的了,都想搞AI”;不过到了申请季,大家都意识到AI方向竞争过于激烈,科大学生多数又不愿申请排名50开外的学校,大家反而选择避开AI的锋芒,而事实证明这个选择是理智的,今年申请AI方向确实竞争过度,而且就算不申请AI方向,CS PhD申请也够受了。2018年,科大又搞了人工智能试点学院以及大数据学院,不少学生(16级)因为当时热门就选了这个方向,现在因为发现这个方向竞争过度激烈而感到焦虑,我很担心学生间发生内卷。这些现象表明AI热潮来得如此之快,以至于大家还没有准备就已经饱和了,至少是CS PhD申请上是如此。
另外我还要谈谈在北京一家人工智能公司的经历。我在那里认得不少学生,相当大一部分来自清北,上交和华科(很多北京本科生来兼职以获取人工智能经验)。实习的一段时间内,我强烈地感受到novelty(创意,新颖性)和work(有效性)之间的矛盾。学术领域非常看中novelty,而deep learning又很容易挖坑出novelty,这也导致相当容易发论文。然而公司在试图把这些novelty用到实际中的时候,却发现几乎很难在实际中有成效。真正有效的是数据量,数据的清洁度,以及deep learning中非常少的大家都熟知的一些算法,以及满足这些算法和数据的系统平台。这是deep learning非常尴尬的一点,这也迫使很多人最终变成调参工程师。然而即便如此,大家还是愿意使用deep learning,很大一部分原因是有的时候它的实际效果确实好,而且虽然要调参,但是大家总是能够在会议发表之前调好参数,相比之下你可能无论如何调整SVM的kernel也达不到CNN的效果。另外一个常见的误解是deep learning就意味着高算力,这个不算完全正确。msra参加过ImageNet多年的成员透露说,当年的经典算法最后输了甚至很多是因为没有跑完,毕竟很多经典算法不做近似的情况下需要对整个ImageNet进行SVD,即使当今的算力也远远达不到。而进行mini-batch和分布式训练的时候,deep learning方法体现出了巨大的优势,既是算力/资源上的(想想你显卡的内存才多大,数据又有多大)也是结果上的,甚至过大的batch对deep learning反而不利。deep learning的这些奇怪性质让公司和学术界又爱又恨,既让大量的人投入研究,又觉得万一是死路一条心里一寒。
再谈谈就业的情况。这里特别说一下美国加州,因为我去访问过所以特别了解,而且我感觉国内AI圈的就业环境也在渐渐步加州地区的后尘。相比CS PhD而言,CS Master其实焦虑得多,首先是PhD数量远远少于Master(比如加州大学系统公开数据中Master数量大约是PhD的10倍)。我去参观USC的时候(对于科大而言是 CS Master 著名保底校),得到了很多非常有趣的反馈。比如他们的deep learning课程评分非常低,上课效果极差,作业难以批改,助教很少反馈,大作业非常随便,评分非常玄学,很多人都不来上课,而且即使他们来了教室门外走廊也可能站不下,但是选课的waiting list最多竟达到了大几百人,选课的主体几乎包含学校所有学院的学生(包括一些怎么也不相干的方向)。大家为什么选课呢?就是为了简历上写一句“我学过deep learning,因此我觉得我可以申请AI方向的工作”。这个现象让部分USC的 CS Master非常焦虑。由此可见AI造成巨大危机的一点是其入门门槛实在是太低了,各个领域都想分一杯羹,使得其在应用领域迅速脱离CS的指导,日益玄学化和调参化,这样一但出现致命的问题,CS界的人也没有办法救回它。而且另外一个严重问题是大量CS外的人的涌入导致工程质量遭到了很大挑战,某USC的同学向我哭诉其同组同学竟然完全不懂OOP就写大工程,最后abcd满天飞,现在出了bug要调整结构快把人逼疯了。最终AI到实际应用还是一个工程问题,然而现在硅谷充满了刷deep learning课和leetcode然后直接到公司的情况,这让AI的落地和就业模式充满了不确定因素,就怕出现重大事故城门失火殃及池鱼,最后大家不信任AI直接导致AI的研究投资断裂,进入寒冬。有趣的事,USC的Web课评价要高很多,竞争也少的多,而且上的大多是CS Master,通过了解其中不少人在赌下面AI会先在招工作方面凉凉。滑稽的是,他们不久前才收到USC本科某课程的教务通知,本科有个课程waiting list才十几,讲师就抱怨“TOOOOO LONG”了。
然而让我现在放弃AI是不可能的,因为按照行话来说,现在这里“low-hanging fruits”太多了,太多有趣的问题没有解决了,作为真的想要做研究的人很难说服自己放弃这个领域。这好像20世纪初的量子论一样,把p=hv倒一下都可能拿一个诺奖。量子论的研究高峰经历了数十年,彻底改变了人们对基础理论的认知,虽然很多相关工具(泊松括号,哈密顿量,对易子,线性代数)很多年前就被人研究过了。而深度学习为代表的从2012年以来才过了7年而已,谁都不知道未来50年会怎么样。AI的风险很多在于它太接近应用,导致人们常常高估近期的成果,而低估长久的发展。作为CS PhD而言,其实不希望这个领域过于热门的,这个虽然会带来很多资金,但是也造成了很多风险。然而现在火了是事实,所以更重要的是想好下面的大方向是什么。个人赌的是AI-system,这也是UW(TQ Chen等)和UCB(RISELab + BAIR)今年新有的方向(可能之前也有,但是我没有听说过)。当然了,看申请情况,考虑到这点的似乎不是我一个人,AI-sys的pool推测竞争异常激烈,初筛后剩下的人中录取率应该不足5%(仅仅是周边了解推测,我没有委员会的数据)。此外,尽量做自己喜欢的方向吧,我曾经差点和我的同学一起申请清华的HPC方向去了,这个领域一直不温不火,但是一想到一些很有趣的没有做的事情,心里还是很高兴的,从来无需担心这个领域的起起伏伏。
PS:本文其实也间接提示AI-system也非常可能是一个PhD申请的“刚发展就饱和”的领域,现在我也不得不承认CS PhD申请是有点内卷了(体现在你刚想到一个方向时发现别人也就都想到了)。
PS: PS: 此外,不管哪个领域,都可以在上升期做科研,在平稳期做业务,在饱和期做教育,显然Andrew Ng是个明白人。
链接:https://www.zhihu.com/question/316135639/answer/626310136
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
-----------------------------------------------------------------------------------------
【转载】 如何看待 2019 年 CS PhD 现扎堆申请且大部分为 AI 方向?未来几年 AI 泡沫会破裂吗?的更多相关文章
- 转载:用Dreamweave cs 5.5+PhoneGap+Jquery Mobile搭建移动开发
转载地址:http://blog.csdn.net/haha_mingg/article/details/7900221 移动设备应用开发有多难,只要学会HTML5+Javascript就可以.用Dr ...
- iOS --转载2018苹果$299美元企业级开发者账号申请攻略
前言篇 现在苹果企业级开发者账号申请十分严格,大部分企业都无法申请下来,本人尝试过多次申请,现将一些审核技巧分享出来,希望能帮到你们通过申请,需要帮助请看本文最后 2018年6月7号申请成功案例 ...
- 腾讯2019年暑期实习生招聘在线笔试技术研究和数据分析方向第二题(python)
def printindex(n,arr): # n = int(input()) # arr = list(map(int,input().split(' '))) li1=[] li2=[] fo ...
- 【转载】JVM系列二:GC策略&内存申请、对象衰老
JVM里的GC(Garbage Collection)的算法有很多种,如标记清除收集器,压缩收集器,分代收集器等等,详见HotSpot VM GC 的种类 现在比较常用的是分代收集(generatio ...
- (转载)基于React与Vue后,移动开源项目Weex如何定义未来
https://www.ctolib.com/topics-106347.html vuejs+ts+webpack2框架的项目实践 https://mp.weixin.qq.com/s/p2Uc9I ...
- 【转载】“宇宙最强” IDE,Visual Studio 2019 正式发布
转载请注明出处:葡萄城官网,葡萄城为开发者提供专业的开发工具.解决方案和服务,赋能开发者. 本文由葡萄城翻译并发布 今天凌晨Visual Studio 2019已经正式发布,现在已经可以下载了.使用V ...
- “宇宙最强” IDE,Visual Studio 2019 正式发布
转载请注明出处:葡萄城官网,葡萄城为开发者提供专业的开发工具.解决方案和服务,赋能开发者. 本文由葡萄城翻译并发布 今天凌晨Visual Studio 2019已经正式发布,现在已经可以下载了.使用V ...
- 阿里巴巴TXD前端小报 - 2019年3月刊
原文:前端小报 - 201903月刊 Fundebug经授权转载,版权归原作者所有. [Alibaba-TXD 前端小报]- 热门前端技术快报,聚焦业界新视界:不知不觉 2019 年已经过去了 1/4 ...
- [翻译] 使用 Visual Studio 2019 来提高每个开发人员的工作效率
[翻译] 使用 Visual Studio 2019 来提高每个开发人员的工作效率 原文: Making every developer more productive with Visual Stu ...
随机推荐
- 26. Remove Duplicates from Sorted Array C++ 删除排序数组中的重复项
https://leetcode.com/problems/remove-duplicates-from-sorted-array/ 双指针,注意初始时左右指针指向首元素! class Solutio ...
- git设置远程同步分支
git push --set-upstream origin yourBranchName
- PReLU
PReLU全名Parametric Rectified Linear Unit. PReLU-nets在ImageNet 2012分类数据集top-5上取得了4.94%的错误率,首次超越了人工分类的错 ...
- EventBus简单封装
前言 以前每个页面与每个页面业务逻辑传递让你不知所措,一个又一个接口回调,让你晕头转向,一个又一个参数让你混乱不堪.EventBus一个耦合度低的让你害怕的框架. 什么是EventBus EventB ...
- Maven常见jar包依赖
<!-- servlet --> <dependency> <groupId>javax.servlet</groupId> <artifactI ...
- tomcat vue webpack vue-router 404
社区已经有结局方案了, http://blog.csdn.net/hayre/article/details/70145513
- SpringMVC中文乱码的解决办法
中文乱码分类: (1)按照请求分类: GET请求乱码 POST请求乱码 (2)按照乱码位置分类 从前台传到后台的数据乱码(存储到数据库中的数据乱码) 从后台传到前台的数据乱码(显示在页面的数据乱码) ...
- mybatis 无法自动补全,没有获得dtd文件
由于网络原因,eclipse无法下载到http://mybatis.org/dtd/mybatis-3-mapper.dtd,导致eclipse的编辑器无法自动补全标签. 解决办法:将dtd文件下载到 ...
- 四:(之五)Dockerfile语法梳理和实践
*5.Dockerfile语法梳理和实践 5.1 尽量使用官方的image作为base image 5.2 metadata:指明作者 版本 描述 5.3 每一条run都能形成一个分层,避免无用分层应 ...
- MyEclipse复制js文件乱码
MyEclipse复制js文件乱码 右击js文件: