MIT(Deep Learning for Self-Driving Cars) CMU(Deep Reinforcement Learning and Control )

参考网址:

Deep Learning for Self-Driving Cars  --  6.S094

http://selfdrivingcars.mit.edu/

Deep Reinforcement Learning and Control  --  10703

https://katefvision.github.io/

Deep Learning for Self-Driving Cars ALL

课程视频和PPT:http://url.cn/45DIOnZ

开始学习机器人-知乎专栏-Top

MIT最新课程 ——九小时速成深度学习&自动驾驶汽车

CMU深度增强学习&控制

下面为机器翻译结果,请参考源链接地址。

----

6.S094:自驾车的深度学习

本课程通过建立自动驾驶汽车的应用主题,介绍深度学习的实践。它对初学者开放,是为那些刚接触机器学习的人设计的,但它也可以帮助现场的高级研究人员寻找深度学习方法及其应用的实用概述。

对班级感兴趣吗?这里有一些你可以做的事情:

  1. 在网站上注册一个帐户以保持最新。课程的材料是免费的,向公众开放。
  2. 按照DeepTrafficDeepTesla教程,签出DeepTraffic排行榜
  3. DeepTraffic游戏DeepTesla模拟模拟设计和评估神经网络。
  4. 观看下面的讲座和客座讲座。

课程资料:

  • 首次提供: 2017年冬季
  • 教练: Lex Fridman
  • 联系人: deepcars@mit.edu

讲座幻灯片和视频:

* 标记为红色的材料表示尚未激活但即将发生的链接。

客人说话:

从研究到现实:在公共道路上测试自驾车
麻省理工学院首席执行官,神经科学和研究科学家
自驾车,SLAM和深度学习
麻省理工学院教授
AI年龄的技术,政策和车辆安全
斯坦福大学教授
运动规划在复杂世界中的过去,现在和未来
麻省理工学院教授
我们只采用我们的信任:政策和自主业务
白宫总统创新研究员,科学技术政策办公室

十分感谢

本课程的支持由MIT-SUTD和丰田集体行动解决安全研究和教育计划的良好人士提供。比赛的奖品由我们的朋友和Udacity的自驾驾驶汽车工程师提供。如果没有麻省理工学院及其以外的聪明年轻人的伟大社区,也不可能有这样的机会。


----

深加固学习和控制 
2017年春季,CMU 10703

讲师: Katerina FragkiadakiRuslan Satakhutdinov
讲座: MW,3:00-4:20pm,Gates和Hillman中心4401 
办公时间:

  • 卡特琳娜:星期四1.30-2.30pm在8015盖茨和希尔曼中心
  • Russ:Friday 1.15-2.15pm,8017年Gates和Hillman中心

教学助理:

  • Devin Schwab:星期三2-3pm,NSH 4225
  • 李春良:周一1-2pm,GHC 8F开放学习区
  • Renato Negrinho:Wednesday 5-6pm,GHC 8213

通讯:广场是用于所有未来的公告,关于课程的一般问题,关于作业的澄清,学生问题彼此,关于材料的讨论,等等。我们强烈鼓励所有学生通过广场(链接)参与讨论,问问和回答问题。

类目标

  • 实施和实验现有的算法,用于学习控制策略指导强化,专家示范或自我试验。
  • 评估这些算法的样本复杂性,一般化和一般性。
  • 能够理解机器人学习领域的研究论文。
  • 试试你自己的一些想法/扩展。特别重视整合来自视觉或触觉感知的真实感觉信号,并探索从模拟学习与从真实体验学习之间的协同作用。

时间表

下面的时间表是暂定的,它将根据时间的限制和人们在课堂上的兴趣不断改变。阅读材料和讲义笔记将作为讲座进展添加。

日期 主题(幻灯片) 讲师 阅读
1/18 介绍 卡特琳娜 [1]
1/23 马尔科夫决策过程(MDP),POMDP 卡特琳娜 [SB,Ch 3]
1/25 解决已知的MDP:动态规划 卡特琳娜 [SB,Ch 4]
1/30 蒙特卡罗学习:价值函数(VF)估计和优化 Russ [SB,Ch 5]
2/1 时间差分学习:VF估计和优化,Q学习,SARSA Russ [SB,Ch 8]
2/2 OpenAI健身房 德文
2/6 规划与学习:Dyna,蒙特卡罗树搜索 卡特琳娜 [SB,Ch 8; 2]
2/8 VF近似,具有VF近似的MC,TD,具有VF近似的控制 Russ [SB,Ch 9]
2/13 VF近似,深度学习,Convnets,反向传播 Russ [GBC,Ch 6]
2/15 深度学习,Convnets,优化技巧 Russ [GBC,第9章]
2/20 深Q学习:双Q学习,重放记忆 Russ
2/22 策略梯度(1):REINFORCE,梯度估计的方差减少,演员 - 批评 Russ [GBC,第13章]
2/27 政策梯度(2),自然政策梯度,深层演员 - 评论家,TRPO Russ
3/1 仔细看看连续操作,变量自动编码器,多模态随机策略 Russ
3/6 勘探 卡特琳娜 [3,4]
3/8 模仿1 卡特琳娜 [5,6]
3/20 模仿2 卡特琳娜

资源

阅读

  1. [SB] Sutton&Barto,增强学习:介绍
  2. [GBC] Goodfellow,Bengio&Courville,深度学习
  1. Smith&Gasser,The Development of Embodied Cognition:Six Lessons from Babies
  2. Silver,Huang等人,Mastering the Game of Go with Deep Neural Networks and Tree Search
  3. Houthooft等人,VIME:Variational Information Maximizing Exploration
  4. Stadie等人,Incentivizing Exploration In Reinforcement Learning With Deep Predictive Models
  5. Bagnell,模仿的邀请
  6. Ho&Ermon,Generative Adversarial Imitation Learning

一般参考

在线课程

作业和评分

请使用NIPS样式文件在LaTeX中编写所有作业。(sty文件tex示例

课程成绩是作业的加权平均值(60%)和开放式最终项目(40%)。

先决条件

本课程假定学生熟悉钢筋学习,数值优化和机器学习。MLD中建议的相关课程包括机器学习简介,10807深度学习课程,10725凸优化或这些课程的在线等效版本。关于机器学习和神经网络的介绍材料,参见:

不太熟悉钢筋学习的学生可以从Sutton&Barto的第一章和Dave Silver的课程的第一课开始热身。

反馈

非常感谢您的 反馈。随意保持匿名,但总是试图有礼貌。

深度学习国外课程资料(Deep Learning for Self-Driving Cars)+(Deep Reinforcement Learning and Control )的更多相关文章

  1. 『深度应用』NLP机器翻译深度学习实战课程·零(基础概念)

    0.前言 深度学习用的有一年多了,最近开始NLP自然处理方面的研发.刚好趁着这个机会写一系列NLP机器翻译深度学习实战课程. 本系列课程将从原理讲解与数据处理深入到如何动手实践与应用部署,将包括以下内 ...

  2. 【PyTorch】深度学习与PyTorch资料链接整理

    欢迎来到我的博客! 以下链接均是日常学习,偶然得之,并加以收集整理,感兴趣的朋友可以多多访问和学习.如果以下内容对你有所帮助,不妨转载和分享.(Update on 5,November,2019) 1 ...

  3. 『深度应用』NLP机器翻译深度学习实战课程·壹(RNN base)

    深度学习用的有一年多了,最近开始NLP自然处理方面的研发.刚好趁着这个机会写一系列NLP机器翻译深度学习实战课程. 本系列课程将从原理讲解与数据处理深入到如何动手实践与应用部署,将包括以下内容:(更新 ...

  4. 深度学习笔记之关于总结、展望、参考文献和Deep Learning学习资源(五)

    不多说,直接上干货! 十.总结与展望 1)Deep learning总结 深度学习是关于自动学习要建模的数据的潜在(隐含)分布的多层(复杂)表达的算法.换句话来说,深度学习算法自动的提取分类需要的低层 ...

  5. 深度学习基础 Probabilistic Graphical Models | Statistical and Algorithmic Foundations of Deep Learning

    目录 Probabilistic Graphical Models Statistical and Algorithmic Foundations of Deep Learning 01 An ove ...

  6. 吴恩达《深度学习》-第三门课 结构化机器学习项目(Structuring Machine Learning Projects)-第一周 机器学习(ML)策略(1)(ML strategy(1))-课程笔记

    第一周 机器学习(ML)策略(1)(ML strategy(1)) 1.1 为什么是 ML 策略?(Why ML Strategy?) 希望在这门课程中,可以教给一些策略,一些分析机器学习问题的方法, ...

  7. 吴恩达《深度学习》-课后测验-第一门课 (Neural Networks and Deep Learning)-Week 3 - Shallow Neural Networks(第三周测验 - 浅层神 经网络)

    Week 3 Quiz - Shallow Neural Networks(第三周测验 - 浅层神经网络) \1. Which of the following are true? (Check al ...

  8. 【deep learning】斯坦福CS231n—深度学习与计算机视觉(资料汇总)

    官网 链接:CS231n: Convolutional Neural Networks for Visual Recognition Notes: 链接:http://cs231n.github.io ...

  9. 吴恩达《深度学习》-课后测验-第一门课 (Neural Networks and Deep Learning)-Week 4 - Key concepts on Deep Neural Networks(第四周 测验 – 深层神经网络)

    Week 4 Quiz - Key concepts on Deep Neural Networks(第四周 测验 – 深层神经网络) \1. What is the "cache" ...

随机推荐

  1. 搭建web.py

    输入以下命令:盘符切换:   >>d: >>D:\LYFLYFLYF\python\web.py-0.37 >>python setup.py install 出现 ...

  2. 4.tar的各个参数详解

    转于:https://blog.csdn.net/liuyundemhsg/article/details/52525028 参数:-c :建立一个压缩文件的参数指令(create 的意思):-x : ...

  3. Nginx+Tomcat+Memcache实现负载均衡及Session共享

    第一部分 环境介绍 部署环境: Host1:Nginx.Memcached.Tomcat1 Host2:Tomcat2 Tomcat_version:8.0.38 第二部分 Nginx+Tomcat实 ...

  4. EChart介绍和使用

    一.简单介绍 Echart是百度研发团队开发的一款报表视图JS插件,功能十分强大,使用内容做简单记录:(EChart下载地址 http://echarts.baidu.com/download.htm ...

  5. HTTP协议(3):HTTP1.1与HTTP1.0的区别

    翻了下HTTP1.1的协议标准RFC2616,下面是看到的一些它跟HTTP1.0的差别. 1. Persistent Connection持久连接 在HTTP1.0中,每对Request/Respon ...

  6. Tomcat——Tomcat使用详解

    Tomcat简介 官网:http://tomcat.apache.org/ Tomcat GitHub 地址:https://github.com/apache/tomcat Tomcat是Apach ...

  7. NCPC2016-E- Exponial

    题目描述 Illustration of exponial(3) (not to scale), Picture by C.M. de Talleyrand-Périgord via Wikimedi ...

  8. LintCode 158: Anagram

    LintCode 158: Anagram 题目描述 写出一个函数anagram(s, t)判断两个字符串是否可以通过改变字母的顺序变成一样的字符串. 样例 给出s = "abcd" ...

  9. 定价(Price)

    传送门 [题目描述] 在市场上有很多商品的定价类似于 999 元.4999 元.8999 元这样.它们和 1000 元.5000 元和 9000 元并没有什么本质区别,但是在心理学上会让人感觉便宜很多 ...

  10. 【译】第十篇 Replication:故障排除

    本篇文章是SQL Server Replication系列的第十篇,详细内容请参考原文. 复制故障排除是一项艰巨的任务.在任何复制设置中,都涉及到很多移动部件,而可用的工具并不总是很容易识别问题.Th ...