ML机器学习导论学习笔记
机器学习的定义:
机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
机器学习的应用实例:
1.学习关联性
在零售业中,机器学习的应用就是购物篮分析,任务就是发现顾客所购商品之间的关联性。
2.分类
2.1信贷行业,做好风险评估,以及做好银行贷款问题中的信用评分。还有就是做好预测,通过学习过去的数据,例如收入和存款等,然后预测此客户的是高风险客户还是低风险客户。
2.2 机器学习在模式识别中也有应用,其中之一就是光学字符识别(optional character recognition,OCR),即从字符图像识别字符编码。
2.3 人脸识别,输入的是人脸图像,类是需要识别的人,并且学习程序应当学习人脸图像与身份之间的关联性。
2.4 医学诊断。输入的是患者的信息,而类是疾病。
2.5 语音识别。输入的是语音,类是可以读出的词汇。语音方面的难题就是每个人、每个地域的说话不一样。这是未来的研究领域。
2.6 生物测定学,使用人的生理和行为特征来识别或认证人的身份,需要集成来自不同形态的输入。生理特征的例子是面部图像、指纹、虹膜和手掌;行为特征的例子是:签字的力度、嗓音、步态和击键。
2.7 机器学习还可以进行压缩,用规则拟合数据,能够得到比数据更简单的解释,需要的存储空间更少,处理需要的计算更少。
2.8 离群点检测,即发现哪些不遵守规则的例外实例。
3. 回归
机器学习的应用例子:对机器人的导航,例如现在的自动驾驶汽车导航。
4. 非监督学习
在监督学习中,目标是学习从输入到输出的映射关系,其中的输出是正确值已经由指导者提供。
非监督学习是没有指导者,单纯只有输入数据,目标是发现输入的数据中的规律。
密度估计的概念:
输入空间存在某种结构,使得特定的模式比其他的模式更常出现,而我们希望知道哪些常发生,那些不常发生,在统计学中,称之为密度估计(Density estimation)
密度估计的方法:聚类———目标是发现输入数据的蔟和分组。
聚类的应用之一————图像压缩,输入实例是由RGB值表示的图像像素。
在文本聚类中,目标是把相似的文档分组。
5. 增加学习
机器学习程序就是应当能够评估策略的好坏程度,并从以往的动作序列中学习,以便能够产生策略,这种学习方法称之为增强学习(Reinforcement learning)算法。
参考书籍:《机器学习导论》
ML机器学习导论学习笔记的更多相关文章
- TensorFlow机器学习框架-学习笔记-001
# TensorFlow机器学习框架-学习笔记-001 ### 测试TensorFlow环境是否安装完成-----------------------------```import tensorflo ...
- 机器学习技法--学习笔记04--Soft SVM
背景 之前所讨论的SVM都是非常严格的hard版本,必须要求每个点都被正确的区分开.但是,实际情况时很少出现这种情况的,因为噪声数据时无法避免的.所以,需要在hard SVM上添加容错机制,使得可以容 ...
- Spark.ML之PipeLine学习笔记
地址: http://spark.apache.org/docs/2.0.0/ml-pipeline.html Spark PipeLine 是基于DataFrames的高层的API,可以方便用户 ...
- 【机器学习实战学习笔记(2-2)】决策树python3.6实现及简单应用
文章目录 1.ID3及C4.5算法基础 1.1 计算香农熵 1.2 按照给定特征划分数据集 1.3 选择最优特征 1.4 多数表决实现 2.基于ID3.C4.5生成算法创建决策树 3.使用决策树进行分 ...
- 【机器学习实战学习笔记(1-1)】k-近邻算法原理及python实现
笔者本人是个初入机器学习的小白,主要是想把学习过程中的大概知识和自己的一些经验写下来跟大家分享,也可以加强自己的记忆,有不足的地方还望小伙伴们批评指正,点赞评论走起来~ 文章目录 1.k-近邻算法概述 ...
- Python scikit-learn机器学习工具包学习笔记:feature_selection模块
sklearn.feature_selection模块的作用是feature selection,而不是feature extraction. Univariate feature selecti ...
- 机器学习基石--学习笔记01--linear hard SVM
背景 支持向量机(SVM)背后的数学知识比较复杂,之前尝试过在网上搜索一些资料自学,但是效果不佳.所以,在我的数据挖掘工具箱中,一直不会使用SVM这个利器.最近,台大林轩田老师在Coursera上的机 ...
- Python scikit-learn机器学习工具包学习笔记
feature_selection模块 Univariate feature selection:单变量的特征选择 单变量特征选择的原理是分别单独的计算每个变量的某个统计指标,根据该指标来判断哪些指标 ...
- 机器学习 MLIA学习笔记(一)
监督学习(supervised learning):叫监督学习的原因是因为我们告诉了算法,我们想要预测什么.所谓监督,其实就是我们的意愿是否能直接作用于预测结果.典型代表:分类(classificat ...
随机推荐
- 关于javascript的各种高宽
- Check类之TypeValidation
(1)Validator类的visitTypeApply()方法 实例1: class TestTypeVal<T extends InputStream>{ TestTypeVal< ...
- ActiveMQ:Exception occurred while processing this request, check the log for more information!
出现上面错误的原因有以下两种 1 jdk的版本和activemq的版本不符 安装完ActiveMQ之后,通过http://IP:8161登陆到控制台. 通过测试代码给服务端发送队列消息,在控制台点击q ...
- Android中Handler的使用方法及实例(基础回顾)
Handler使用例1 这个例子是最简单的介绍handler使用的,是将handler绑定到它所建立的线程中.本次实验完成的功能是:单击Start按钮,程序会开始启动线程,并且线程程序完成后延时1s会 ...
- 对Table_locks_immediate值的理解
Table_locks_immediate表示立即释放表锁数,Table_locks_waited表示需要等待的表锁数,如果Table_locks_immediate / Table_locks_wa ...
- C 标准库 - ctype.h之iscntrl 使用
iscntrl int iscntrl ( int c ); Check if character is a control character 检查给定字符是否为控制字符,即编码 0x00-0x1F ...
- PTA (Advanced Level) 1012 The Best Rank
The Best Rank To evaluate the performance of our first year CS majored students, we consider their g ...
- springboot主从数据库
是从springmvc的思路上来做的,主要就是配置主.从DataSource,再继承AbstractRoutingDataSource,重写determineCurrentLookupKey方法,通过 ...
- guava快速入门(三)
Guava工程包含了若干被Google的 Java项目广泛依赖 的核心库,例如:集合 [collections] .缓存 [caching] .原生类型支持 [primitives support] ...
- SqlServer常用语句
首先,写这个的原因是我其实sql语句不太行,总觉得自己写得很乱,好像也没有系统学习过,借此复习和与大家探讨 No.1 关于查询时间区间是否重叠的sql语句 问题是这样:插入之前,想查询同User是否其 ...