流水的算法,铁打的损失函数/MLE】的更多相关文章

机器学习算法可以说是不少的,如果死记硬背的话,只能当时记得推导过程和步骤,过一段时间就又想不起来了,只能依稀记得一些影子.所以,应该找到算法的一些通用的方法来理解算法的思路以及推导过程. 我认为,最大似然估计和损失函数,就是机器学习算法的通用框架,是掌握机器学习算法的钥匙. 以下,用实际算法来证实这两把钥匙的威力. 1.Linear Regression.可以转化为求 损失函数最小,来求解参数θ. 之后用梯度下降法来实际求解θ.除了梯度下降这一个工具外,还有拟牛顿法,拉格朗日乘子法重要工具. 2…
大家好,我是Eluxjs的作者,Eluxjs是一套基于"微模块"和"模型驱动"的跨平台.跨框架『同构方案』,欢迎了解... 文前声明,以下推断和结论纯属个人探索,鉴于本人知识水平所限,谬误在所难免,恳请各位大佬不吝赐教... 为什么在web前端很少有人会提到分层架构,例如经典MVC架构,这是因为浏览器诞生之初就只是作为一个后端数据的GUI渲染器.也就是说整体来看,web1.0时代的整个web前端工程就是一个View层,而Model和Controller就是指后端,所…
关注嘉为科技,获取运维新知 这一年人工智能火了,凡是带电的专业都往AI上靠,实在靠不上的还可以看AlphaGo下棋,探讨AI能否取代人类.这种全民跟风,比前两年的“云计算”.“大数据”热度还高.就算你不懂AI技术,还可以百度“神经网络”“深度学习”科普,心里YY一下机器人取代人类.云计算大数据就不行了——想搞hadoop.openstack.docker……起码也得有个Linux吧?连个系统命令都敲不明白,这些高级应用你往哪儿装? 无论AI和区块链再怎么火,也要记得,对于大多数公司来说,你们机房…
现在很多行业,都离不开用Excel: 做财务的,要用Excel做报表:做物流的,会用Excel来跟踪订单情况:做HR的,会用Excel算工资:做分析的,会用Excel计算数据做报表.不知道你有没有这样的经历,每次你用Excel做数据分析时,你往往会生成好多张工作簿,来做中间计算过程, 鼠标一路移到最后一页,才出现最终结果表.这种现象在咨询师,分析师很常见. 如果这时候源数据出了些问题,你可能要从第一种报表开始看起,然后,一张张的仔细查看,确定错误出在哪.而且,这样一张张切换工作簿,很容易看花眼,…
在上篇,我了解了基数的基本概念,现在进入Linear Counting算法的学习. 理解颇浅,还请大神指点! http://blog.codinglabs.org/articles/algorithms-for-cardinality-estimation-part-ii.html 它的基本处理方法和上篇中用bitmap统计的方法类似,但是最后要用到一个公式: 说明:m为bitmap总位数,u为0的个数,最后的结果为n的一个估计,且为最大似然估计(MLE). 那么问题来了,最大似然估计是什么东东…
在上篇,我了解了基数的基本概念,现在进入Linear Counting算法的学习. 理解颇浅,还请大神指点! http://blog.codinglabs.org/articles/algorithms-for-cardinality-estimation-part-ii.html 它的基本处理方法和上篇中用bitmap统计的方法类似,但是最后要用到一个公式: 说明:m为bitmap总位数,u为0的个数,最后的结果为n的一个估计,且为最大似然估计(MLE). 那么问题来了,最大似然估计是什么东东…
上周四(6.20)GMTC2019大会的第一天,很荣幸作为「UI与图形渲染」专场出品人获得了与图形领域几位技术专家同场交流的机会. 图形技术在前端范畴内是一个相对小众的话题,虽然前端工程师几乎每天都在跟图形打交道(CSS).CSS能够满足绝大多数的需求,即便偶尔遇到相对复杂的UI(比如描边文字),稍加使用canvas或SVG便足以应对.大多数前端工程师在日常开发工作中并不会(也没必要)思考每个CSS方块背后的底层技术原理.除了从事于数据可视化.地图.游戏等强依赖图形技术行业的人以外,Canvas…
[十大经典数据挖掘算法]系列 C4.5 K-Means SVM Apriori EM PageRank AdaBoost kNN Naïve Bayes CART 1. 集成学习 集成学习(ensemble learning)通过组合多个基分类器(base classifier)来完成学习任务,颇有点"三个臭皮匠顶个诸葛亮"的意味.基分类器一般采用的是弱可学习(weakly learnable)分类器,通过集成学习,组合成一个强可学习(strongly learnable)分类器.所谓…
scikit-learn对于线性回归提供了比较多的类库,这些类库都可以用来做线性回归分析,本文就对这些类库的使用做一个总结,重点讲述这些线性回归算法库的不同和各自的使用场景. 线性回归的目的是要得到输出向量\(\mathbf{Y}\)和输入特征\(\mathbf{X}\)之间的线性关系,求出线性回归系数\(\mathbf\theta\),也就是 \(\mathbf{Y = X\theta}\).其中\(\mathbf{Y}\)的维度为mx1,\(\mathbf{X}\)的维度为mxn,而\(\m…
机器学习中梯度下降(Gradient Descent, GD)算法只需要计算损失函数的一阶导数,计算代价小,非常适合训练数据非常大的应用. 梯度下降法的物理意义很好理解,就是沿着当前点的梯度方向进行线搜索,找到下一个迭代点.但是,为什么有会派生出 batch.mini-batch.online这些GD算法呢? 原来,batch.mini-batch.SGD.online的区别在于训练数据的选择上:   batch mini-batch Stochastic Online 训练集 固定 固定 固定…