【转载】 如何看待 2019 年 CS PhD 现扎堆申请且大部分为 AI 方向?未来几年 AI 泡沫会破裂吗?
原贴地址:
https://www.zhihu.com/question/316135639
作为一个 AI 方向的在读博士生,实在是过的蛮闹心,无意中逛知乎发现了这个帖子,发现很适合现在的自己,于是转载到这里,以作收藏。
----------------------------------------------------------------------------
今年刚渡过了 CS PhD 的申请狂潮(本人是14级的学生),顺便回答一下吧。
我在中国科大计算机本科期间,学生工作做的很多,认得不少13,14,15,16,17届的学生(包括少年班和物理学院),了解一些他们的一些想法。中国科大是PhD申请大户之一,因此申请倾向和数据都还算可以参考的风向标;此外计算机和信息学院本身没有特别偏重AI,因此相关的改变就直接反应了AI这几年发展带来的冲击力。13届学生是第一批开始感受到AI发展带来影响的学生,不过当时由于大数据、VR、IoT这些宣传得还挺火,13届申请方向还是挺多样性的,并没有出现全员AI的情况。到了14级,AI开始成为比较热门的方向,这在各种场合都有反映,港中文到我们这里宣传的时候也特地请了MMLab的教授(特别是科大校友),MSRA招联培生的宣讲中也越来越多的谈及Deep learning。这些很大程度上是因为14年deep learning完成了很多里程碑式的事件。不过由于科大课程设置和科研团队没有特别偏AI,导致申请AI方向的人没有预想的多。15级学生已经完全感受到了AI的冲击,几乎每个学生都知道deep learning或者相关的学术词汇,我们编译原理的老师曾经吐槽说“15级没有一个做system的了,都想搞AI”;不过到了申请季,大家都意识到AI方向竞争过于激烈,科大学生多数又不愿申请排名50开外的学校,大家反而选择避开AI的锋芒,而事实证明这个选择是理智的,今年申请AI方向确实竞争过度,而且就算不申请AI方向,CS PhD申请也够受了。2018年,科大又搞了人工智能试点学院以及大数据学院,不少学生(16级)因为当时热门就选了这个方向,现在因为发现这个方向竞争过度激烈而感到焦虑,我很担心学生间发生内卷。这些现象表明AI热潮来得如此之快,以至于大家还没有准备就已经饱和了,至少是CS PhD申请上是如此。
另外我还要谈谈在北京一家人工智能公司的经历。我在那里认得不少学生,相当大一部分来自清北,上交和华科(很多北京本科生来兼职以获取人工智能经验)。实习的一段时间内,我强烈地感受到novelty(创意,新颖性)和work(有效性)之间的矛盾。学术领域非常看中novelty,而deep learning又很容易挖坑出novelty,这也导致相当容易发论文。然而公司在试图把这些novelty用到实际中的时候,却发现几乎很难在实际中有成效。真正有效的是数据量,数据的清洁度,以及deep learning中非常少的大家都熟知的一些算法,以及满足这些算法和数据的系统平台。这是deep learning非常尴尬的一点,这也迫使很多人最终变成调参工程师。然而即便如此,大家还是愿意使用deep learning,很大一部分原因是有的时候它的实际效果确实好,而且虽然要调参,但是大家总是能够在会议发表之前调好参数,相比之下你可能无论如何调整SVM的kernel也达不到CNN的效果。另外一个常见的误解是deep learning就意味着高算力,这个不算完全正确。msra参加过ImageNet多年的成员透露说,当年的经典算法最后输了甚至很多是因为没有跑完,毕竟很多经典算法不做近似的情况下需要对整个ImageNet进行SVD,即使当今的算力也远远达不到。而进行mini-batch和分布式训练的时候,deep learning方法体现出了巨大的优势,既是算力/资源上的(想想你显卡的内存才多大,数据又有多大)也是结果上的,甚至过大的batch对deep learning反而不利。deep learning的这些奇怪性质让公司和学术界又爱又恨,既让大量的人投入研究,又觉得万一是死路一条心里一寒。
再谈谈就业的情况。这里特别说一下美国加州,因为我去访问过所以特别了解,而且我感觉国内AI圈的就业环境也在渐渐步加州地区的后尘。相比CS PhD而言,CS Master其实焦虑得多,首先是PhD数量远远少于Master(比如加州大学系统公开数据中Master数量大约是PhD的10倍)。我去参观USC的时候(对于科大而言是 CS Master 著名保底校),得到了很多非常有趣的反馈。比如他们的deep learning课程评分非常低,上课效果极差,作业难以批改,助教很少反馈,大作业非常随便,评分非常玄学,很多人都不来上课,而且即使他们来了教室门外走廊也可能站不下,但是选课的waiting list最多竟达到了大几百人,选课的主体几乎包含学校所有学院的学生(包括一些怎么也不相干的方向)。大家为什么选课呢?就是为了简历上写一句“我学过deep learning,因此我觉得我可以申请AI方向的工作”。这个现象让部分USC的 CS Master非常焦虑。由此可见AI造成巨大危机的一点是其入门门槛实在是太低了,各个领域都想分一杯羹,使得其在应用领域迅速脱离CS的指导,日益玄学化和调参化,这样一但出现致命的问题,CS界的人也没有办法救回它。而且另外一个严重问题是大量CS外的人的涌入导致工程质量遭到了很大挑战,某USC的同学向我哭诉其同组同学竟然完全不懂OOP就写大工程,最后abcd满天飞,现在出了bug要调整结构快把人逼疯了。最终AI到实际应用还是一个工程问题,然而现在硅谷充满了刷deep learning课和leetcode然后直接到公司的情况,这让AI的落地和就业模式充满了不确定因素,就怕出现重大事故城门失火殃及池鱼,最后大家不信任AI直接导致AI的研究投资断裂,进入寒冬。有趣的事,USC的Web课评价要高很多,竞争也少的多,而且上的大多是CS Master,通过了解其中不少人在赌下面AI会先在招工作方面凉凉。滑稽的是,他们不久前才收到USC本科某课程的教务通知,本科有个课程waiting list才十几,讲师就抱怨“TOOOOO LONG”了。
然而让我现在放弃AI是不可能的,因为按照行话来说,现在这里“low-hanging fruits”太多了,太多有趣的问题没有解决了,作为真的想要做研究的人很难说服自己放弃这个领域。这好像20世纪初的量子论一样,把p=hv倒一下都可能拿一个诺奖。量子论的研究高峰经历了数十年,彻底改变了人们对基础理论的认知,虽然很多相关工具(泊松括号,哈密顿量,对易子,线性代数)很多年前就被人研究过了。而深度学习为代表的从2012年以来才过了7年而已,谁都不知道未来50年会怎么样。AI的风险很多在于它太接近应用,导致人们常常高估近期的成果,而低估长久的发展。作为CS PhD而言,其实不希望这个领域过于热门的,这个虽然会带来很多资金,但是也造成了很多风险。然而现在火了是事实,所以更重要的是想好下面的大方向是什么。个人赌的是AI-system,这也是UW(TQ Chen等)和UCB(RISELab + BAIR)今年新有的方向(可能之前也有,但是我没有听说过)。当然了,看申请情况,考虑到这点的似乎不是我一个人,AI-sys的pool推测竞争异常激烈,初筛后剩下的人中录取率应该不足5%(仅仅是周边了解推测,我没有委员会的数据)。此外,尽量做自己喜欢的方向吧,我曾经差点和我的同学一起申请清华的HPC方向去了,这个领域一直不温不火,但是一想到一些很有趣的没有做的事情,心里还是很高兴的,从来无需担心这个领域的起起伏伏。
PS:本文其实也间接提示AI-system也非常可能是一个PhD申请的“刚发展就饱和”的领域,现在我也不得不承认CS PhD申请是有点内卷了(体现在你刚想到一个方向时发现别人也就都想到了)。
PS: PS: 此外,不管哪个领域,都可以在上升期做科研,在平稳期做业务,在饱和期做教育,显然Andrew Ng是个明白人。
链接:https://www.zhihu.com/question/316135639/answer/626310136
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
-----------------------------------------------------------------------------------------
【转载】 如何看待 2019 年 CS PhD 现扎堆申请且大部分为 AI 方向?未来几年 AI 泡沫会破裂吗?的更多相关文章
- 转载:用Dreamweave cs 5.5+PhoneGap+Jquery Mobile搭建移动开发
转载地址:http://blog.csdn.net/haha_mingg/article/details/7900221 移动设备应用开发有多难,只要学会HTML5+Javascript就可以.用Dr ...
- iOS --转载2018苹果$299美元企业级开发者账号申请攻略
前言篇 现在苹果企业级开发者账号申请十分严格,大部分企业都无法申请下来,本人尝试过多次申请,现将一些审核技巧分享出来,希望能帮到你们通过申请,需要帮助请看本文最后 2018年6月7号申请成功案例 ...
- 腾讯2019年暑期实习生招聘在线笔试技术研究和数据分析方向第二题(python)
def printindex(n,arr): # n = int(input()) # arr = list(map(int,input().split(' '))) li1=[] li2=[] fo ...
- 【转载】JVM系列二:GC策略&内存申请、对象衰老
JVM里的GC(Garbage Collection)的算法有很多种,如标记清除收集器,压缩收集器,分代收集器等等,详见HotSpot VM GC 的种类 现在比较常用的是分代收集(generatio ...
- (转载)基于React与Vue后,移动开源项目Weex如何定义未来
https://www.ctolib.com/topics-106347.html vuejs+ts+webpack2框架的项目实践 https://mp.weixin.qq.com/s/p2Uc9I ...
- 【转载】“宇宙最强” IDE,Visual Studio 2019 正式发布
转载请注明出处:葡萄城官网,葡萄城为开发者提供专业的开发工具.解决方案和服务,赋能开发者. 本文由葡萄城翻译并发布 今天凌晨Visual Studio 2019已经正式发布,现在已经可以下载了.使用V ...
- “宇宙最强” IDE,Visual Studio 2019 正式发布
转载请注明出处:葡萄城官网,葡萄城为开发者提供专业的开发工具.解决方案和服务,赋能开发者. 本文由葡萄城翻译并发布 今天凌晨Visual Studio 2019已经正式发布,现在已经可以下载了.使用V ...
- 阿里巴巴TXD前端小报 - 2019年3月刊
原文:前端小报 - 201903月刊 Fundebug经授权转载,版权归原作者所有. [Alibaba-TXD 前端小报]- 热门前端技术快报,聚焦业界新视界:不知不觉 2019 年已经过去了 1/4 ...
- [翻译] 使用 Visual Studio 2019 来提高每个开发人员的工作效率
[翻译] 使用 Visual Studio 2019 来提高每个开发人员的工作效率 原文: Making every developer more productive with Visual Stu ...
随机推荐
- Echarts 简单报表系列四:雷达图
代码如下: <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF ...
- Oracle物理DG自动切换——Dataguard Broker配置
1.前言部分 1.1 导读 各位技术爱好者,看完本文后,你可以掌握如下的技能: ① Data Guard Broker 的配置 ② Fast-Start Failover 的配置 ③ Oracle D ...
- Oracle12c CDB架构图
- List.contains()与自动拆箱
最近项目引入sonarQube这种代码静态检查的东东,以前没有人力和精力review,现在只要扫描一下项目,就发现很多有趣的地方. 有这么一段代码: List<Long> list = L ...
- swagger注释@API详细说明
swagger是当前最好用的Restful API文档生成的开源项目,通过swagger-spring项目实现了springMVC框架的无缝集成功能,方便生成restful风格的接口文档, 同时,s ...
- 普通01背包问题(dp)
有n个物品,重量和价值分别为wi和vi,从这些物品中挑选出重量不超过W的物品,求所有挑选方案中物品价值总和的最大值 限制条件: 1 <= n <= 100; 1 <= wi,vi & ...
- POJ 3436 ACM Computer Factory 最大流,拆点 难度:1
题目 http://poj.org/problem?id=3436 题意 有一条生产线,生产的产品共有p个(p<=10)零件,生产线上共有n台(n<=50)机器,每台机器可以每小时加工Qi ...
- AdminLTE 文档
一个基于 bootstrap 的轻量级后台模板,这个前端界面个人感觉很清爽,对于一个大后端的我来说,可以减少较多的时间去承担前端的工作但又必须去独立去完成一个后台系统开发的任务,并且,文档还算比较齐全 ...
- 双向链表--首页大小不一卡片排序 --- react --- js
1.4中类型(grid_type)的卡片:1:大方块:2:竖长块:3:横长块:4:小方块 var order = 0; // 创建链表 function List(head) { this.head ...
- python之路 ---计算机硬件基础
计算机(computer)俗称电脑,是现代一种用于高速计算的电子计算机器,可以进行数值计算,又可以进行逻辑计算,还具有存储记忆功能.是能够按照程序运行,自动.高速处理海量数据的现代化智能电子设备.一个 ...