【Babble】批量学习与增量学习、稳定性与可塑性矛盾的乱想
一、开场白
做机器学习的对这几个词应该比较熟悉了。
最好是拿到全部数据,那就模型慢慢选,参数慢慢调,一轮一轮迭代,总能取得不错效果。
但是面对新来数据,怎么能利用已经训练好的模型,把新的信息加进去?
所以有很多人,包括我们组,一直想做好在线增量式学习。
(1)来一波新数据,(2)抽信息更新模型,(3)扔掉那些数据
用完的数据就扔掉,所以输入数据的顺序,会影响很大。
二、暑假结束了
在暑假的最后一天,发现过去的两周没有被最优利用。
如果我提前知道我的暑假有整整两周,那么我可以把python系统地学一遍,或者把C++从头复习一遍。
但是我暑假的状态属于来一天过一天,我并不知道暑假什么时候结束。
我就只能在懒散之余,把每天仅有的一点学习时间,用在可以速成的、我最感兴趣的东西。
比如看一篇文章,做两个折磨过我的题。
每天还算过的充实,但是回头去看整体,还是觉得有点可惜。
三、人生是一次在线增量学习
时间再拉大一点,比如长期计划。
人的想法是会变的,社会是会变的,
依照今天的想法,依照社会现状,制定了三年的学习、生活目标与规划,
过了半年、一年,有了一些阶段性成果,
幸运的情况是,实现了自己的追求、符合行业发展,庆幸及早的规划,
也有可能是,偏离了当前的追求、偏离了行业发展,甚至可能觉得过去的规划是一种误导。
这样来看,“早知如此,何必当初” 就是现实生活的稳定性与可塑性矛盾。
人生是一次彻头彻尾的在线增量学习,没有岁月可回头,愿无岁月可回头。
四、机器学习科学家都是哲学家
我们可以猜测明天,但不能预见明天。
为了明天更好的生活,
我们可以基于<今天>的经验,可以基于<昨天, 今天>的经验,可以基于<去年,今年>的经验。
利用多少/哪些历史信息,可以最好的预测明天,从而让自己准备好适应明天。
这真是个哲学问题。
但是机器学习科学家居然通过调参数就给解出来了。真是一群哲学家!
【Babble】批量学习与增量学习、稳定性与可塑性矛盾的乱想的更多相关文章
- 【Hibernate学习笔记-5.1】使用@Transient修饰不想持久保存的属性
作者:ssslinppp 1. 摘要 在默认情况下,持久化类的所有属性会自动映射到数据表的数据列.如果在实际应用中不想持久化保存某些属性,则可以考虑使用@Transient来修饰他们. ...
- 卡尔曼滤波学习笔记1-Matlab模拟温度例子--代码比较乱,还需优化
温度模拟参数选取 xk 系统状态 实际温度 A 系统矩阵 温度不变,为1 B.uk 状态的控制量 无控制量,为0 Zk 观测值 温度计读数 H 观测矩阵 直接读出,为1 wk 过程噪声 温度变化偏差, ...
- 【转载】BP神经网络
原文地址:http://blog.csdn.net/acdreamers/article/details/44657439 今天来讲BP神经网络,神经网络在机器学习中应用比较广泛,比如函数逼近,模式识 ...
- 机器学习 machine learn
机器学习 机器学习 概述 什么是机器学习 机器学习是一门能够让编程计算机从数据中学习的计算机科学.一个计算机程序在完成任务T之后,获得经验E,其表现效果为P,如果任务T的性能表现,也就是用以衡量的P, ...
- BP神经网络算法学习
BP(Back Propagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是眼下应用最广泛的神经网络模型之中的一个 ...
- 《机器学习实战(基于scikit-learn和TensorFlow)》第二章内容的学习心得
请支持正版图书, 购买链接 下方内容里面很多链接需要我们***,请大家自备梯子,实在不会再请留言,节约彼此时间. 源码在底部,请自行获取,谢谢! 当开始着手进行一个端到端的机器学习项目,大致需要以下几 ...
- lecture6-mini批量梯度训练及三个加速的方法
Hinton的第6课,这一课中最后的那个rmsprop,关于它的资料,相对较少,差不多除了Hinton提出,没论文的样子,各位大大可以在这上面研究研究啊. 一.mini-批量梯度下降概述 这部分将介绍 ...
- lecture10-模型的结合与全贝叶斯学习
这是Hinton的第10课 这节课有两篇论文可以作为背景或者课外读物<Adaptive mixtures of local experts>和<Improving neural ne ...
- windows类书的学习心得(转载)
原文网址:http://www.blogjava.net/sound/archive/2008/08/21/40499.html 现在的计算机图书发展的可真快,很久没去书店,昨日去了一下,真是感叹万千 ...
随机推荐
- Journal of BitcoinJ 从clone开始
启动Powershell cd D:\workspace mkdir BitcoinJ git init
- 解决Delphi7的自带的UTF-8编码转换函数BUG
Delphi7及其以下版本的 VCL 只支持 Ansi, 所以... WideString 与 UTF8String (定义与 AnsiString 相同) 并没有办法正确的在 VCL 中显示 Del ...
- java:矩阵面积
实现一个矩阵类Rectangle,包含如下的一些成员变量与函数: 两个共有的成员变量 width 和 height 分别代表宽度和高度. 一个构造函数,接受2个参数 width 和 height 来设 ...
- 090实战 Hadoop离线项目介绍(不包括程序)
一:项目场景 1.需求分析 根据用户行为数据进行程序的处理,得到结果保存到关系型数据库中 需要收集用户(系统使用者)在不同客户端上产生的用户行为数据,最终保存到hdfs上 需要明确收集字段的相关信息, ...
- 如何查看Ubuntu版本,以及Linux内核版本??
查看Ubuntu版本: 方法一: cat /etc/issue 方法二: sudo lsb_release -a 查看内核版本: uname -r
- sass和less
一.相同点 sass和less具有变量.作用域.混合.嵌套.继承.运算符.颜色函数.导入和注释等基本特性,而且以“变量”.“混合”.“嵌套”.“继承”和“颜色函数”为五大基本特性. sass和less ...
- Codeforces.297C.Splitting the Uniqueness(构造)
题目链接 \(Description\) 给定一个长为n的序列A,求两个长为n的序列B,C,对任意的i满足B[i]+C[i]=A[i],且B,C序列分别至少有\(\lfloor\frac{2*n}{3 ...
- 用一颗学美术的心来理解PID调节
用一颗学美术的心来理解PID调节 泡利 3 个月前 相信大家小时候都画过美术作品吧?(什么?你还是宝宝?)没关系,不管你是文科.理科.工科.艺术还是家里蹲的,这篇文章对你来说一定会简单到爆炸的. 这种 ...
- 晚期(运行期)优化---HotSpot虚拟机内的即时编译器
最初java程序是通过解释器进行解释执行的,当虚拟机发现某个方法或代码块的运行特别频繁时,就会把这些代码认定为“热点代码”.为了提高热点代码的执行效率,在运行时,虚拟机将会把这些代码编译成与本地平台相 ...
- React系列文章:Webpack模块组织关系
现代前端开发离不开打包工具,以Webpack为代表的打包工具已经成为日常开发必备之利器,拿React技术栈为例,我们ES6形式的源代码,需要经过Webpack和Babel处理,才能生成发布版文件,在浏 ...