一、开场白

做机器学习的对这几个词应该比较熟悉了。

最好是拿到全部数据,那就模型慢慢选,参数慢慢调,一轮一轮迭代,总能取得不错效果。

但是面对新来数据,怎么能利用已经训练好的模型,把新的信息加进去?

所以有很多人,包括我们组,一直想做好在线增量式学习。

(1)来一波新数据,(2)抽信息更新模型,(3)扔掉那些数据

用完的数据就扔掉,所以输入数据的顺序,会影响很大。

二、暑假结束了

在暑假的最后一天,发现过去的两周没有被最优利用。

如果我提前知道我的暑假有整整两周,那么我可以把python系统地学一遍,或者把C++从头复习一遍。

但是我暑假的状态属于来一天过一天,我并不知道暑假什么时候结束。

我就只能在懒散之余,把每天仅有的一点学习时间,用在可以速成的、我最感兴趣的东西。

比如看一篇文章,做两个折磨过我的题。

每天还算过的充实,但是回头去看整体,还是觉得有点可惜。

三、人生是一次在线增量学习

时间再拉大一点,比如长期计划。

人的想法是会变的,社会是会变的,

依照今天的想法,依照社会现状,制定了三年的学习、生活目标与规划,

过了半年、一年,有了一些阶段性成果,

幸运的情况是,实现了自己的追求、符合行业发展,庆幸及早的规划,

也有可能是,偏离了当前的追求、偏离了行业发展,甚至可能觉得过去的规划是一种误导。

这样来看,“早知如此,何必当初” 就是现实生活的稳定性与可塑性矛盾。

人生是一次彻头彻尾的在线增量学习,没有岁月可回头,愿无岁月可回头。

四、机器学习科学家都是哲学家

我们可以猜测明天,但不能预见明天。

为了明天更好的生活,

我们可以基于<今天>的经验,可以基于<昨天, 今天>的经验,可以基于<去年,今年>的经验。

利用多少/哪些历史信息,可以最好的预测明天,从而让自己准备好适应明天。

这真是个哲学问题。

但是机器学习科学家居然通过调参数就给解出来了。真是一群哲学家!

【Babble】批量学习与增量学习、稳定性与可塑性矛盾的乱想的更多相关文章

  1. 【Hibernate学习笔记-5.1】使用@Transient修饰不想持久保存的属性

     作者:ssslinppp       1. 摘要 在默认情况下,持久化类的所有属性会自动映射到数据表的数据列.如果在实际应用中不想持久化保存某些属性,则可以考虑使用@Transient来修饰他们. ...

  2. 卡尔曼滤波学习笔记1-Matlab模拟温度例子--代码比较乱,还需优化

    温度模拟参数选取 xk 系统状态 实际温度 A 系统矩阵 温度不变,为1 B.uk 状态的控制量 无控制量,为0 Zk 观测值 温度计读数 H 观测矩阵 直接读出,为1 wk 过程噪声 温度变化偏差, ...

  3. 【转载】BP神经网络

    原文地址:http://blog.csdn.net/acdreamers/article/details/44657439 今天来讲BP神经网络,神经网络在机器学习中应用比较广泛,比如函数逼近,模式识 ...

  4. 机器学习 machine learn

    机器学习 机器学习 概述 什么是机器学习 机器学习是一门能够让编程计算机从数据中学习的计算机科学.一个计算机程序在完成任务T之后,获得经验E,其表现效果为P,如果任务T的性能表现,也就是用以衡量的P, ...

  5. BP神经网络算法学习

    BP(Back Propagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是眼下应用最广泛的神经网络模型之中的一个 ...

  6. 《机器学习实战(基于scikit-learn和TensorFlow)》第二章内容的学习心得

    请支持正版图书, 购买链接 下方内容里面很多链接需要我们***,请大家自备梯子,实在不会再请留言,节约彼此时间. 源码在底部,请自行获取,谢谢! 当开始着手进行一个端到端的机器学习项目,大致需要以下几 ...

  7. lecture6-mini批量梯度训练及三个加速的方法

    Hinton的第6课,这一课中最后的那个rmsprop,关于它的资料,相对较少,差不多除了Hinton提出,没论文的样子,各位大大可以在这上面研究研究啊. 一.mini-批量梯度下降概述 这部分将介绍 ...

  8. lecture10-模型的结合与全贝叶斯学习

    这是Hinton的第10课 这节课有两篇论文可以作为背景或者课外读物<Adaptive mixtures of local experts>和<Improving neural ne ...

  9. windows类书的学习心得(转载)

    原文网址:http://www.blogjava.net/sound/archive/2008/08/21/40499.html 现在的计算机图书发展的可真快,很久没去书店,昨日去了一下,真是感叹万千 ...

随机推荐

  1. Journal of BitcoinJ 从clone开始

    启动Powershell cd D:\workspace mkdir BitcoinJ git init

  2. 解决Delphi7的自带的UTF-8编码转换函数BUG

    Delphi7及其以下版本的 VCL 只支持 Ansi, 所以... WideString 与 UTF8String (定义与 AnsiString 相同) 并没有办法正确的在 VCL 中显示 Del ...

  3. java:矩阵面积

    实现一个矩阵类Rectangle,包含如下的一些成员变量与函数: 两个共有的成员变量 width 和 height 分别代表宽度和高度. 一个构造函数,接受2个参数 width 和 height 来设 ...

  4. 090实战 Hadoop离线项目介绍(不包括程序)

    一:项目场景 1.需求分析 根据用户行为数据进行程序的处理,得到结果保存到关系型数据库中 需要收集用户(系统使用者)在不同客户端上产生的用户行为数据,最终保存到hdfs上 需要明确收集字段的相关信息, ...

  5. 如何查看Ubuntu版本,以及Linux内核版本??

    查看Ubuntu版本: 方法一:   cat /etc/issue 方法二:   sudo lsb_release -a 查看内核版本: uname -r

  6. sass和less

    一.相同点 sass和less具有变量.作用域.混合.嵌套.继承.运算符.颜色函数.导入和注释等基本特性,而且以“变量”.“混合”.“嵌套”.“继承”和“颜色函数”为五大基本特性. sass和less ...

  7. Codeforces.297C.Splitting the Uniqueness(构造)

    题目链接 \(Description\) 给定一个长为n的序列A,求两个长为n的序列B,C,对任意的i满足B[i]+C[i]=A[i],且B,C序列分别至少有\(\lfloor\frac{2*n}{3 ...

  8. 用一颗学美术的心来理解PID调节

    用一颗学美术的心来理解PID调节 泡利 3 个月前 相信大家小时候都画过美术作品吧?(什么?你还是宝宝?)没关系,不管你是文科.理科.工科.艺术还是家里蹲的,这篇文章对你来说一定会简单到爆炸的. 这种 ...

  9. 晚期(运行期)优化---HotSpot虚拟机内的即时编译器

    最初java程序是通过解释器进行解释执行的,当虚拟机发现某个方法或代码块的运行特别频繁时,就会把这些代码认定为“热点代码”.为了提高热点代码的执行效率,在运行时,虚拟机将会把这些代码编译成与本地平台相 ...

  10. React系列文章:Webpack模块组织关系

    现代前端开发离不开打包工具,以Webpack为代表的打包工具已经成为日常开发必备之利器,拿React技术栈为例,我们ES6形式的源代码,需要经过Webpack和Babel处理,才能生成发布版文件,在浏 ...