一个疑问:foundation models , 现在已经有了视觉的大模型也有了语言大模型,那么什么时候会有强化学习大模型,更准确的说什么时候会有强化学习的基础模型(foundation models)
一个疑问:foundation models , 现在已经有了视觉的大模型也有了语言大模型,那么什么时候会有强化学习大模型,更准确的说什么时候会有强化学习的基础模型(foundation models)
相关:
https://www.youtube.com/watch?v=QPQy7jUpmyA
首先,要声明,这是我早起赖床时候想的一个问题,可以说是完全的胡想的一个问题。
其次,必须要说明的是,我认为这个问题是一个伪命题,因为我认为视觉上不可能出现一个强化学习大模型,因为不论是语言大模型还是视觉大模型,其都是面向于具体的应用和某个具体方向的,这就像不会有监督学习大模型和无监督学习大模型一样,因为这样分类的话实在是太过于宽泛,而且要知道即使说现在大模型特别多,各种的foundation models,但是其实不同的领域和不同的应用都是有着不同的各自的大模型的,比如:生成图像的有图像大模型,生成视频的有视频大模型,对话系统的有语言大模型,识别物体的有视觉大模型,下棋的有下棋大模型,进行天气预报的有天气预报大模型,进行工业设备故障检测的有工业检测大模型,等等。可以说现在的大模型和foundation models看着很强大,但是其实各个模型都只是针对某个细化领域和具体方向的大模型,而不是像监督学习、无监督学习、强化学习那种把所有的学习类型或者某个大类的学习模型都包括,一个最简单的例子,语言大模型只是无监督模型里面的一个小部分,只是无监督学习里面的自然语言方向的对话系统中的一个模型,但是实际上无监督学习里还有其他的方向,比如无监督的视觉学习模型,等等,而且现在的语言大模型也只是对话系统大模型,而自然语言里面还有细分类别,比如:语言转文字、文字转语音、语音和语气、人物年龄、男女性别相互匹配、文章摘要总结、因果逻辑推导、文本分类、情感分析,等等,但是不得不说的是现在的对话系统的语言大模型也确实很优秀,因为现在的这个模型除了能生成比较要人满意的对话同时还能解决翻译、和简单的文字总结以及一些简单的逻辑推理问题,但是即使如此,作为人类历史上目前最优秀的语言模型现在依旧只是解决部分的NLP问题,而不是所有的NLP问题,更不用说是监督学习和无监督学习这种大分类的层面了。(据说今年年内OpenAI继推出ChatGPT后要推出AI搜索引擎,对标Google,不过这也是后话了,而且即使把搜索加上那也是两个大模型,一个是ChatGPT大模型,一个是搜索大模型,而不是把这两个产品做到一个产品里面)
最后,可以知道语言大模型(特指对话系统),其难度和所需的数据量是要远远小于视觉大模型的,NLP是人类后天创造的,这个数据数量再大也是有限的,Web级的文本数量再大那也只是以GB为单位的,但是视觉是自然觉本身就存在的,一个物体在不同的光照不同的角度下的呈现都是不同的,更何况自然界中的物体存在的数量是远远高于人类创造的语言文本的,而且视觉数据的收集难度也是远远高于文本数据的,毕竟电子化的文本数据是可以用爬虫爬下来的,而自然界中的图像数据总不能拍人一个一个的拍下来,而且还需要不同角度的拍,并且同一类物体其外表也是不尽相同的,比如苹果也还分品种、颜色、大小,等等,因此单从数据收集上来说数据大模型就很难做到语言大模型的这种程度。那么对于强化学习来说,这个数据量就更大了,甚至是最大的,自然语言是人类创造的,视觉图像是自然界中本身存在的,而强化学习是需要人类和自然界中物体进行交互的数据,这个数据量力量上来说是自然语言数据量与视觉图像数据量的乘积,注意,这里是乘积而不是加和,可以说这个难度是远远超过语言模型和视觉模型的。
上面先分析了强化学习大模型在理论上就不可能出现,然后又出数据量收集和学习难度上来分析强化学习大模型存在的不现实性,下面就该说说未来可能存在的“强化学习大模型”,注意这里指的是pseudo foundation models for Reinforcement Learning。
我认为未来的强化学习大模型肯定是存在的,当然这里是指“pseudo”版本的,也就是面向于某种特定场景的大模型,比如分拣系统的强化学习大模型,这种foundation models可以快速的适用这一类的问题,比如可以适应苹果分拣的场景,也可以快速适应梨的分拣,还能解决工件的分拣,还能解决垃圾分拣,等等。未来的强化学习大模型应该就是该种形式的,只是面向某一类场景下的大模型,这种大模型虽然感觉好像low一些,但是其价值是不会比语言大模型和视觉大模型差的,甚至更有实际价值,因为我们的各种科技,各种AI大模型最后都是要服务于实体经济的,不能落地的科技还是不完整的,还是对未来这种pseudo版本的强化学习大模型抱有期待的。
一个疑问:foundation models , 现在已经有了视觉的大模型也有了语言大模型,那么什么时候会有强化学习大模型,更准确的说什么时候会有强化学习的基础模型(foundation models)的更多相关文章
- ThinkPHP 学习笔记 ( 三 ) 数据库操作之数据表模型和基础模型 ( Model )
//TP 恶补ing... 一.定义数据表模型 1.模型映射 要测试数据库是否正常连接,最直接的办法就是在当前控制器中实例化数据表,然后使用 dump 函数输出,查看数据库的链接状态.代码: publ ...
- 一个标准的,兼容性很好的div仿框架的基础模型!
<!DOCTYPE html> <html > <head> <meta http-equiv="Content-Type" conten ...
- linux下bus、devices和platform的基础模型
转自:http://blog.chinaunix.net/uid-20672257-id-3147337.html 一.kobject的定义:kobject是Linux2.6引入的设备管理机制,在内核 ...
- [您有新的未分配科技点]博弈论进阶:似乎不那么恐惧了…… (SJ定理,简单的基础模型)
这次,我们来继续学习博弈论的知识.今天我们会学习更多的基础模型,以及SJ定理的应用. 首先,我们来看博弈论在DAG上的应用.首先来看一个小例子:在一个有向无环图中,有一个棋子从某一个点开始一直向它的出 ...
- linux下bus、devices和platform的基础模型 【转】
转自:http://blog.chinaunix.net/uid-20672257-id-3147337.html 一.kobject的定义:kobject是Linux2.6引入的设备管理机制,在内核 ...
- 百度DMLC分布式深度机器学习开源项目(简称“深盟”)上线了如xgboost(速度快效果好的Boosting模型)、CXXNET(极致的C++深度学习库)、Minerva(高效灵活的并行深度学习引擎)以及Parameter Server(一小时训练600T数据)等产品,在语音识别、OCR识别、人脸识别以及计算效率提升上发布了多个成熟产品。
百度为何开源深度机器学习平台? 有一系列领先优势的百度却选择开源其深度机器学习平台,为何交底自己的核心技术?深思之下,却是在面对业界无奈时的远见之举. 5月20日,百度在github上开源了其 ...
- odoo开发基础--模型之基本字段类型
定义模型的时候,和python的其他框架类似,可以对比Django,同样是一个模型即:一个class对应生成数据库中的一张表, 只是odoo的继承机制比较复杂一点,在日常的开发中,定义模型的时候, 基 ...
- ThinkPHP 数据库操作之数据表模型和基础模型 ( Model )
一.定义数据表模型 1.模型映射 要测试数据库是否正常连接,最直接的办法就是在当前控制器中实例化数据表,然后使用 dump 函数输出,查看数据库的链接状态.代码: public function te ...
- [20180713]关于hash join 测试中一个疑问.txt
[20180713]关于hash join 测试中一个疑问.txt --//上个星期做的测试,链接: http://blog.itpub.net/267265/viewspace-2157424/-- ...
- 一款基础模型的JS打飞机游戏特效代码
<!DOCTYPE html> <html lang="en"> <head> <title>一款基础模型的JS打飞机游戏特效代码& ...
随机推荐
- 使用Jsoup和htmlunit爬取动态网页
在对http://zkgg.tjtalents.com.cn/newzxxx.jsp这个网页爬取内容时,如果只使用Jsoup进行解析的话,起内部的a href标签内容无法获取到. 但是实际上通过 Do ...
- docker日常使用操作场景
日常使用场景 场景1:将自己的镜像从hub中拉取,并压缩成tar.gz文件 # 首先拉取镜像 docker pull docker.images.hub/{namespace}/{servicenam ...
- freemarker模板替换生成word
工具类 public static void createWord(Map<String,Object> dataMap, String templateName, String file ...
- vue2 混入 (mixin) 带来的小惊喜
最近在review自己写的代码时发现,在很多的地方都用了以下的代码块 1 async initCode() { 2 const resSource = await this.$API.syscode. ...
- 接口加密传输设计及AES加解密代码DEMO
接口加密传输设计及AES加解密代码DEMO 接口加密的方案设计:可以将请求的json字符串aes加密,通过params字段传输,接口服务端接收到参数,先解密,然后转换成对象.继续业务逻辑的处理.(另外 ...
- Thread的join方法demo
Thread的join方法demo /** * 关于join官方的解释是 Waits for this thread to die. 也就是等待一个线程结束. */ public class Thre ...
- __int1024!
使用说明: 数据范围约为\(-2^{1024}\le N \le2^{1024}\),反映到十进制约为\(-10^{309}\le N \le10^{309}\),但不保证完全如此. 输入输出使用自带 ...
- k8s集群搭建及对一些组件的简单理解(一)
背景 k8s的学习环境(用kubeadm方式搭建),我也搭过几次了,但都有点问题. 要么在云服务器上弄,这个的问题是就只有一台轻量服务器,只能搭个单节点的:后来买了一台便宜的,所以就有了两台,但是不在 ...
- VSCode中设置用IPython运行Python代码
VSCode中设置用IPython运行Python代码 在IPython中运行所选的代码: 在设置中, 找到python.terminal.launchArgs这一项, 设置为如下内容. " ...
- 高通SOC启动流程
背景 开始接手高通开发的有关工作,为了调试底层驱动,因此有必要了解高通平台上电启动的流程是怎么样的. 以 MSM8953 为例子. MSM:mobile station modems,移动基带处理器, ...