ML机器学习导论学习笔记
机器学习的定义:
机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
机器学习的应用实例:
1.学习关联性
在零售业中,机器学习的应用就是购物篮分析,任务就是发现顾客所购商品之间的关联性。
2.分类
2.1信贷行业,做好风险评估,以及做好银行贷款问题中的信用评分。还有就是做好预测,通过学习过去的数据,例如收入和存款等,然后预测此客户的是高风险客户还是低风险客户。
2.2 机器学习在模式识别中也有应用,其中之一就是光学字符识别(optional character recognition,OCR),即从字符图像识别字符编码。
2.3 人脸识别,输入的是人脸图像,类是需要识别的人,并且学习程序应当学习人脸图像与身份之间的关联性。
2.4 医学诊断。输入的是患者的信息,而类是疾病。
2.5 语音识别。输入的是语音,类是可以读出的词汇。语音方面的难题就是每个人、每个地域的说话不一样。这是未来的研究领域。
2.6 生物测定学,使用人的生理和行为特征来识别或认证人的身份,需要集成来自不同形态的输入。生理特征的例子是面部图像、指纹、虹膜和手掌;行为特征的例子是:签字的力度、嗓音、步态和击键。
2.7 机器学习还可以进行压缩,用规则拟合数据,能够得到比数据更简单的解释,需要的存储空间更少,处理需要的计算更少。
2.8 离群点检测,即发现哪些不遵守规则的例外实例。
3. 回归
机器学习的应用例子:对机器人的导航,例如现在的自动驾驶汽车导航。
4. 非监督学习
在监督学习中,目标是学习从输入到输出的映射关系,其中的输出是正确值已经由指导者提供。
非监督学习是没有指导者,单纯只有输入数据,目标是发现输入的数据中的规律。
密度估计的概念:
输入空间存在某种结构,使得特定的模式比其他的模式更常出现,而我们希望知道哪些常发生,那些不常发生,在统计学中,称之为密度估计(Density estimation)
密度估计的方法:聚类———目标是发现输入数据的蔟和分组。
聚类的应用之一————图像压缩,输入实例是由RGB值表示的图像像素。
在文本聚类中,目标是把相似的文档分组。
5. 增加学习
机器学习程序就是应当能够评估策略的好坏程度,并从以往的动作序列中学习,以便能够产生策略,这种学习方法称之为增强学习(Reinforcement learning)算法。
参考书籍:《机器学习导论》
ML机器学习导论学习笔记的更多相关文章
- TensorFlow机器学习框架-学习笔记-001
# TensorFlow机器学习框架-学习笔记-001 ### 测试TensorFlow环境是否安装完成-----------------------------```import tensorflo ...
- 机器学习技法--学习笔记04--Soft SVM
背景 之前所讨论的SVM都是非常严格的hard版本,必须要求每个点都被正确的区分开.但是,实际情况时很少出现这种情况的,因为噪声数据时无法避免的.所以,需要在hard SVM上添加容错机制,使得可以容 ...
- Spark.ML之PipeLine学习笔记
地址: http://spark.apache.org/docs/2.0.0/ml-pipeline.html Spark PipeLine 是基于DataFrames的高层的API,可以方便用户 ...
- 【机器学习实战学习笔记(2-2)】决策树python3.6实现及简单应用
文章目录 1.ID3及C4.5算法基础 1.1 计算香农熵 1.2 按照给定特征划分数据集 1.3 选择最优特征 1.4 多数表决实现 2.基于ID3.C4.5生成算法创建决策树 3.使用决策树进行分 ...
- 【机器学习实战学习笔记(1-1)】k-近邻算法原理及python实现
笔者本人是个初入机器学习的小白,主要是想把学习过程中的大概知识和自己的一些经验写下来跟大家分享,也可以加强自己的记忆,有不足的地方还望小伙伴们批评指正,点赞评论走起来~ 文章目录 1.k-近邻算法概述 ...
- Python scikit-learn机器学习工具包学习笔记:feature_selection模块
sklearn.feature_selection模块的作用是feature selection,而不是feature extraction. Univariate feature selecti ...
- 机器学习基石--学习笔记01--linear hard SVM
背景 支持向量机(SVM)背后的数学知识比较复杂,之前尝试过在网上搜索一些资料自学,但是效果不佳.所以,在我的数据挖掘工具箱中,一直不会使用SVM这个利器.最近,台大林轩田老师在Coursera上的机 ...
- Python scikit-learn机器学习工具包学习笔记
feature_selection模块 Univariate feature selection:单变量的特征选择 单变量特征选择的原理是分别单独的计算每个变量的某个统计指标,根据该指标来判断哪些指标 ...
- 机器学习 MLIA学习笔记(一)
监督学习(supervised learning):叫监督学习的原因是因为我们告诉了算法,我们想要预测什么.所谓监督,其实就是我们的意愿是否能直接作用于预测结果.典型代表:分类(classificat ...
随机推荐
- linux常用多线程下载工具
1.axel 下载安装yum install axel 这个软件下载速度实时显示
- nginx: [alert] kill(3475, 15) failed (3: No such process) 解决方案
cd nginx安装目录下/conf/nginx.conf 查看pid文件存放路径 (如果自己知道就不用执行上面这一步) 然后删除这个nginx.pid文件 然后再次杀掉nginx进程 搞定
- Java类文件结构及javac的ClassReader类解读
首先来看一下ClassFile,类注释如下: A JVM class file. Generic Java classfiles have one additional attribute for c ...
- mysql exceeded the 'max_questions' resource 记录
最近Hive Meta的 Mysql 常报错 'user' has exceeded the 'max_questions' resource (current value: 10000) 解决:调 ...
- AutoMapper控件
1.下载AutoMapper控件. 2.定义类,实现Profile. 3.在定义类的构造方法中使用如下代码进行转换 // 1.匹配,o,t代表TDestination;s代表TSource,返回TDe ...
- Group by、having、order by、Distinct 使用注意事项
直奔主题,如下SQL语句 SELECT COUNT(*) AS COUNT,REQUEST,METHOD FROM REQUESTMETH GROUP BY REQUEST,METHOD HAVING ...
- MTCNN 实现人脸识别
MTCNN(Multi-task CNN) MTCNN难点 WIDER FACE等数据集为我们提供的图片并不是MTCNN支持的训练样本, 需要通过几个脚本将其转为MTCNN可以接受的数据集, 这些脚本 ...
- [转]MVC Razor模板引擎 @RenderBody、@RenderPage、@RenderSection及Html.RenderPartial、Html.RenderAction
本文参考自下面文章整理 MVC Razor模板引擎 @RenderBody.@RenderPage.@RenderSection及Html.RenderPartial.Html.RenderActio ...
- MySQL---8、索引
1.索引中关于搜索的算法 2.索引的使用原则 3.索引的优缺点 4.索引的种类 5.显示索引 show index from 表名; 6.创建唯一索引 alter table 表名 add ...
- JSON 教程
1JSON 1.什么是 JSON ? 1.1JSON:JavaScript 对象表示法(JavaScript Object Notation). 1.2JSON 是存储和交换文本信息的语法.类似 XM ...