机器学习的盛宴:NIPS 2015
作者:微软亚洲研究院实习生:林添
冰雪王国的浪漫 机器学习的盛宴
NIPS(Advances in Neural Information Processing
Systems,神经信息处理系统进展大会)是每年12月由NIPS基金会主办的机器学习和神经计算领域的顶级会议,它由连接学派(connectionist)神经网络的学者于1987年在加拿大创办,后来随着影响力逐步扩大,也曾移师美洲、欧洲等地举办。每年大会都吸引了机器学习、人工智能、统计等领域的众多国际专家地参与。近年来,在工业界和科学界,神经网络构建的深度学习方法取得了很多突破性的进展,在计算机视觉、语音识别、自然语言处理等领域也出现了大量的创新应用,NIPS在机器学习领域的学术影响力变得举足轻重。
本次NIPS大会在加拿大魁北克省的蒙特利尔举行。蒙特利尔位于五大湖和圣劳伦斯河河口,是加拿大仅次于多伦多的第二大城市,同时也是加拿大的经济之都,拥有发达的金融、电影、设计、航空产业。加拿大是是冰雪的王国,得益于此,蒙特利尔最受欢迎的运动便是冰球。这里还有很多繁华的地下城,即便是外面大雪纷飞,里面依然灯火通明。蒙特利尔更有众多欧洲与北美风格融合的建筑,吸引了众多好莱坞大片来这里取景。下图便是蒙特利尔神圣、典雅的圣母院大教堂,加拿大著名歌手席琳·迪翁的婚礼就是在此举行。
2015年的NIPS大会于12月7日至12月12日在蒙特利尔的国会会展中心举行。大会获得了包括微软在内的多家知名IT企业的大力赞助。今年共有3755名来自世界各地的研究人员注册并参加了会议,相比去年参会人数几乎翻倍。此次大会覆盖的内容除了机器学习和神经科学领域,还包括认知科学、心理学、计算机视觉、统计语言学和信息论等多个领域。
大会日程包括教程(tutorials)、大会会议(conference
sessions)、专题座谈会(symposia)和研讨会(workshops)四个部分。本次大会一共收到1838篇投稿,录用论文403篇,录取率为21.9%,论文淘汰的数量十分庞大。在这四百多篇论文中,论文方向极其多样化,其中占比最大为深度学习相关论文,占403篇录取论文中的11%,其次凸优化方向占了5%、统计学习理论占了3%。此次大会的论文展示环节主要包括口头报告(oral)、聚光灯(spot
light)和海报(poster)三种展示形式。NIPS是计算机领域少数坚持单轨制(single
track)的会议,这一制度这能让参会人员更加专注于会议报告本身,但也使得录取论文的展示时间相对有限。因此,仅有15篇论文获得了宝贵的20分钟口头报告的机会。同时,少量论文获得了5分钟时间的聚光灯展示,而剩余绝大部分的论文展示都是海报为主。
智慧激荡的论文 引人深思的讨论
本次会议由大会主席Terrence Sejnowski致开幕词,常任主席Corinna Cortes和Neil Lawrence介绍了本次会议的投稿、审议标准和论文录用等情况,这也揭开了NIPS2015的帷幕。本次大会的最佳论文奖颁给了“Competitive
Distribution Estimation: Why is Good-Turing Good”(http://papers.nips.cc/paper/5762-competitive-distribution-estimation-why-is-good-turing-good.pdf)和“FastConvergence
of Regularized Learning in Games”(http://papers.nips.cc/paper/5763-fast-convergence-of-regularized-learning-in-games.pdf)两篇论文。
“Competitive Distribution Estimation: Why is
Good-TuringGood”这篇论文属于统计学习的理论研究范畴,它对估计离散变量的分布律这一普遍问题,提出了基于Good-Turing估计量的两种改进方法,借助对先验的最优估计量,给出了针对任意分布律的近似最优的高效估计。论文不仅指出这两种方法可以快速收敛,同时还给出相应的理论分析。
“Fast Convergence of Regularized Learning in
Games”这篇论文属于博弈学习研究方向。博弈学习被广泛研究,而该文章中指出一类正则化的学习算法可以大大改进带问题本身有近期偏差(更倾向于近期的回报)的结果,它甚至可以被拓展到多玩家博弈的均衡问题。论文扩展了之前工作研究的二人零和博弈问题,指出在一类问题中如果每个玩家各自使用最优算法将达到更快收敛速度,大大拓展了原有理论对博弈的理解。
“Interactive Incremental Question
Answering”则获得了本届大会的突出展示奖。类似于微软亚洲研究院几年前推出的人立方系统,该展示系统能够根据用户给出的人物事实性描述和背景,去猜测出用户希望知道的人名。在展示系统中,用户可以给出几句英文的描述,而系统基于依赖树的递归神经网络,学习用户意图,在语料库中能够找到答案,给出精准的回答。这一系统在大会上大受好评。
除了获奖论文,大会上还有很多令人印象深刻的报告。“Interactive Control of
Diverse Complex Characters With Neural
Networks”(http://papers.nips.cc/paper/5764-interactive-control-of-diverse-complex-characters-with-neural-networks.pdf)文章则研究了如何借助递归神经网络作为运动控制器的问题。在不进行运动捕捉以及任务相关的特征设计的前提下,实现了让不同形态和动力系统机器人做出像游泳,飞行,双足、四足行走等运动。
“Sampling from Probabilistic Submodular
Models”(http://papers.nips.cc/paper/5744-sampling-from-probabilistic-submodular-models.pdf),这篇文章研究了一个有趣的采样方法。次模函数是经常出现在经济或计算机领域选址、覆盖、图像背景分割等问题中常见的函数,它描述了边际效益递减的一类特性。作者针对采样概率是次模函数的函数值问题,提出了基于吉布斯采样的方法,不仅保证多项式时间的复杂度,且具有很好的混合时间。
此外,在专题座谈会上,众多专家、学者们还在分会场中开展了有趣而深刻的对话和讨论。“我们周边的算法:机器学习的社会影响力”专题中关于机器人伦理的话题就很有意思。例如自动驾驶技术上就有一个两难问题(Tunnel
Problem)亟待解决:设想你坐在一辆自动驾驶的汽车上,沿着山路的单行线行驶,此时突然有个小孩闯入道路,来不及刹车的情况下,就会面临两难选择:是径直向前,可能直接撞死小孩;还是撞向山崖,可能掉下悬崖?换句话说,自动驾驶的汽车应如何反应?又由谁来决定汽车的决策方式?这一类问题的核心其实是,对于机器学习算法中存在的决策失败概率(风险),或者人类和机器的决策存在冲突时,我们该如何从法律、技术、道德等角度进行约束。
触手可及的未来 博采众长的前行
NIPS大会在展示了相关领域最新研究成果的同时,也预示了机器学习的未来的发展趋势。
首先是神经网络架构进一步复杂化。在图像、机器翻译等领域,越来越多的研究人员开始选择LSTM,利用不同的感知机、目标函数,卷积或者递归架构神经网络,在实际项目中实现更多有意思的应用。通过随机方法近似(stochastic
approximation)的算法也受到不少关注。
其次是自动推断和黑盒学习技术的发展。今年大会上出现了不少和自动推理技术相关的论文,即通过机器自动推断模型、预测结果。而工程领域的强劲需求也促生了更多可以快速迭代、低学习曲线的算法和系统,例如在本机大会上崭露头角的STAN、python-autograd等工具。
此外还有对概率推断的再审视。本次大会和研讨会中,出现了一些对于概率推断新认知的声音。正如同期发表在《科学》杂志上的论文(http://science.sciencemag.org/content/sci/350/6266/1332.full.pdf)所呈现的一样,相比深度学习对于大数据的需求,这种小样本甚至单个样本的模型都能得到不错的预测结果,也促使我们重新审视人类大脑的思维和认知方式。
对于我个人来说,这是我在NIPS上的第二篇论文。去年,我参与合作的以在线机器学习中组合问题的纯探索策略研究方向的论文有幸在NIPS的进行了口头报告。今年,在之前的基础上,我们深入研究,论文“Stochastic
Online Greedy Learning with Semi-bandit
Feedbacks”(https://papers.nips.cc/paper/5930-stochastic-online-greedy-learning-with-semi-bandit-feedbacks.pdf)被大会录用,并受邀于9号晚上7点至12点进行海报展示。这篇论文是与清华的李建老师以及微软亚洲研究院的陈卫老师合作,我们针对在线机器学习领域的组合学习策略研究,提出了一类新的模型,刻画了贪心的学习方法在解决老虎机问题(bandit)中应用。我们提出的模型能够借鉴贪心算法的优点,多次采样进行参数估计,求解该问题。
论文海报展示的过程也弥足珍贵,在国内,我们精心制作了2.4x1.2m的大幅海报,并进行了多次的展示演练。在现场展示过程中,我们获得了很多教授、研究员和同学的关注和驻足聆听。通过讲解自己的研究,回答听众们的问题,我将自己的成果分享给了在场的听众,同时,我也得到了很多同行们的建议与意见。通过与相关领域专家学者的深入交流,我也迸发出了更多的新想法,与会经历受益匪浅。
关于作者:林添,是微软亚洲研究院的一名实习生,也是清华大学高等研究院和微软亚洲研究院联合培养博士生,本科毕业于清华大学计算机科学实验班,主要研究方向为机器学习和社交网络分析,曾在ICML、NIPS、EC等发表多篇论文。
了解微软亚洲研究院实习生项目,欢迎关注“明日之星”实习生项目介绍。更多实习机会请见:http://www.msra.cn/zh-cn/jobs/interns/internopenings.aspx
下载微软研究院在此次大会所有论文:Deep learning, machine learning advancements
highlight Microsoft's research at NIPS 2015
推荐阅读
欢迎关注
微软亚洲研究院官方网站:http://www.msra.cn
微软亚洲研究院微博:http://t.sina.com.cn/msra
微软亚洲研究院微信:搜索“微软研究院“或扫描下方二维码:
机器学习的盛宴:NIPS 2015的更多相关文章
- 机器学习(Machine Learning)&深度学习(Deep Learning)资料(Chapter 2)
##机器学习(Machine Learning)&深度学习(Deep Learning)资料(Chapter 2)---#####注:机器学习资料[篇目一](https://github.co ...
- 大规模视觉识别挑战赛ILSVRC2015各团队结果和方法 Large Scale Visual Recognition Challenge 2015
Large Scale Visual Recognition Challenge 2015 (ILSVRC2015) Legend: Yellow background = winner in thi ...
- [干货]Kaggle热门 | 用一个框架解决所有机器学习难题
新智元推荐 来源:LinkedIn 作者:Abhishek Thakur 译者:弗格森 [新智元导读]本文是数据科学家Abhishek Thakur发表的Kaggle热门文章.作者总结了自己参加100 ...
- 【机器学习笔记】循环神经网络RNN
1. 从一个栗子开始 - Slot Filling 比如在一个订票系统上,我们的输入 "Arrive Taipei on November 2nd" 这样一个序列,我们设置几个槽位 ...
- 【深度学习Deep Learning】资料大全
最近在学深度学习相关的东西,在网上搜集到了一些不错的资料,现在汇总一下: Free Online Books by Yoshua Bengio, Ian Goodfellow and Aaron C ...
- Highway LSTM 学习笔记
Highway LSTM 学习笔记 zoerywzhou@gmail.com http://www.cnblogs.com/swje/ 作者:Zhouwan 2016-4-5 声明 1)该Dee ...
- 【资料总结】| Deep Reinforcement Learning 深度强化学习
在机器学习中,我们经常会分类为有监督学习和无监督学习,但是尝尝会忽略一个重要的分支,强化学习.有监督学习和无监督学习非常好去区分,学习的目标,有无标签等都是区分标准.如果说监督学习的目标是预测,那么强 ...
- FAIR开源Detectron:整合全部顶尖目标检测算法
昨天,Facebook AI 研究院(FAIR)开源了 Detectron,业内最佳水平的目标检测平台. 昨天,Facebook AI 研究院(FAIR)开源了 Detectron,业内最佳水平的目标 ...
- 深度学习论文翻译解析(四):Faster R-CNN: Down the rabbit hole of modern object detection
论文标题:Faster R-CNN: Down the rabbit hole of modern object detection 论文作者:Zhi Tian , Weilin Huang, Ton ...
随机推荐
- B-树与B+树 两者的区别
一个m阶的B树具有如下几个特征: 根结点至少有两个子女. 每个中间节点都包含k-1个元素和k个孩子,其中 m/2 <= k <= m 每一个叶子节点都包含k-1个元素,其中 m/2 < ...
- CSS知识点小结
在网页排版布局中比如文章列表标题排版,无论多少文字均不希望换行显示,需要强制在一行显示完内容.这就可以nobr标签来实现. 一.nobr语法 <nobr>内容</nobr> 不 ...
- maven仓库镜像、私服与jdk版本配置
--配置全局镜像,setting.xml <mirrors> <mirror> <id>alimaven</id> <name>aliyun ...
- 17.3.15---C语言详解FILE文件操作
FILE 是 C语言文件结构定义, 打开文件和文件操作要用到这类结构.可以看成变量类型,用于变量声明.这个是一种数据结构类型,用来表示一个文件的相关信息,如果定义了一个文件指针,就用这个指针来指向某个 ...
- 【ccf-csp201512-5】矩阵
click 试题编号: 201512-5 试题名称: 矩阵 时间限制: 1.0s 内存限制: 256.0MB 问题描述: 问题描述 创造一个世界只需要定义一个初状态和状态转移规则. 宏观世界的物体运动 ...
- jmeter 配置csv 登陆网站 报错
0 环境 系统环境:win7 1 正文 1 问题 创建csv 格式为utf-8后 jmeter csv配置好后 post请求登陆报错 2 解决 查看了一下报告 post请求里用户名乱码了 仔细一看网站 ...
- 常见字体图标库——font-awesome
1.简介 FontAwesome一种带有网页功能的象形文字语言,并收集在一个集合里.字库中有675个图标,只支持英文搜索,中文地址:http://www.fontawesome.com.cn/ 2.使 ...
- vue实现动态绑定class--(三目运算符)根据span数字内容改变其样式
一.根据span数字内容改变数字本身样式(两种样式) <template> //使用三目运算符,判断当span的val是否小于0给其不同的class名 <span class=&qu ...
- 68)PHP,cookie的详细属性和有效期
(1)cookie的有效期: 默认:会话周期结束(就是浏览器关闭),默认情况下,cookie会在浏览器关闭时失效,这种cookie是 临时cookie或者叫会话. 支持设置有效期,setcookie的 ...
- C#常用到的命令及常用控件的属性
Application.Exit()应用程序退退出 this.Close()当前窗口退出 int h = DateTime.Now.Hour; //获取当前时间的小时部分 int m = D ...