背景基础知识备忘


  平均差

    MD=(∑|xi-x'|)/n

  加权平均差

    A.D=(∑|xi-x'|fi)/∑fi


  方差

    

  标准差

    SD=方差的平方根


  分布函数:
    
 

    设X是一个随机变量,x是任意实数,函数称为X的分布函数。有时也记为X~F(x)    对于任意实数

,有
        
        
  
  概率密度函数:
    

    随机数据的概率密度函数:表示瞬时幅值落在某指定范围内的概率,因此是幅值的函数。它随所取范围的幅值而变化。
   密度函数f(x) 具有下列性质:
    1     
 
    2    
 
    3    
  对概率密度函数作傅里叶变换可得特征函数。
  特征函数与概率密度函数有一对一的关系。因此知道一个分布的特征函数就等同于知道一个分布的概率密度函数。
  

  期望

  离散型:

    离散型随机变量的一切可能的取值xi与对应的概率Pi(=xi)之积的和称为该离散型随机变量的数学期望 

      

  连续型:

    若随机变量X的分布函数F(x)可表示成一个非负可积函数f(x)的积分,则称X为连续性随机变量,f(x)称为X的概率密度函数(分布密度函数)。

      


监督学习:

  目标:学习出一个模型对于给定输入,对其相应输出做出很好的预测

  训练数据集:T={(xi,yi)}  i=1,2,3.......N

  统计学习要素:

    方法=模型+策略+算法

   模型:所要学习的条件概率分布或者决策函数

   策略:略    损失最小的最优化的目标函数

   算法:学习模型的计算方法

  exp:

    损失函数 L(Y,f(x))   f(x)为预测值:

      0-1损失:

        L(Y,f(x))=1   Y !=f(x)

        L(Y,f(x))=0   Y==f(x)

      平方损失:

        L(Y,f(x))=∑(Y-x')2

      绝对损失:

        L(Y,f(x))=|Y-f(x)|

      对数损失   对数似然损失函数:

        L(Y,P(Y|X))=-logP(Y|X)

  损失期望函数:

    Rexp (f)=Ep [L(Y,f(x))]=∫x*y L(y,f(x))p(x,y)dxdy   为模型联合分布的期望损失

  由于对联合分布概率 p(x,y) 未知 对训练集T有经验损失为

    Rexp (f)=(∑L(yi,f(xi)))/N   i=1,2,3,4.......N    为模型的平均损失

  由大数定理:当样本容量N趋向于无穷时,经验损失趋向于期望损失     由于N在实际问题中不可能趋向于无穷,用平均损失估计期望损失不准确,必须对他校正

  方法有:1 经验风险最小化    2 结构风险最小化

  经验风险最小化: 对于假设空间F

    min (∑L(yi,f(xi)))/N  的模型为最佳模型

  结构风险最小化:

    min (∑L(yi,f(xi)))/N+λJ(f)   J(f)为模型复杂度  模型越复杂   J(f)越大   反之亦然   λ为系数  用来权衡经验风险和模型复杂度


以上为背景知识,下一篇看模型评估以及模型选择

    

统计学习方法——P1的更多相关文章

  1. 【NLP】基于统计学习方法角度谈谈CRF(四)

    基于统计学习方法角度谈谈CRF 作者:白宁超 2016年8月2日13:59:46 [摘要]:条件随机场用于序列标注,数据分割等自然语言处理中,表现出很好的效果.在中文分词.中文人名识别和歧义消解等任务 ...

  2. 统计学习方法 --- 感知机模型原理及c++实现

    参考博客 Liam Q博客 和李航的<统计学习方法> 感知机学习旨在求出将训练数据集进行线性划分的分类超平面,为此,导入了基于误分类的损失函数,然后利用梯度下降法对损失函数进行极小化,从而 ...

  3. 统计学习方法笔记--EM算法--三硬币例子补充

    本文,意在说明<统计学习方法>第九章EM算法的三硬币例子,公式(9.5-9.6如何而来) 下面是(公式9.5-9.8)的说明, 本人水平有限,怀着分享学习的态度发表此文,欢迎大家批评,交流 ...

  4. 统计学习方法:KNN

    作者:桂. 时间:2017-04-19  21:20:09 链接:http://www.cnblogs.com/xingshansi/p/6736385.html 声明:欢迎被转载,不过记得注明出处哦 ...

  5. 统计学习方法:罗杰斯特回归及Tensorflow入门

    作者:桂. 时间:2017-04-21  21:11:23 链接:http://www.cnblogs.com/xingshansi/p/6743780.html 前言 看到最近大家都在用Tensor ...

  6. 统计学习方法:核函数(Kernel function)

    作者:桂. 时间:2017-04-26  12:17:42 链接:http://www.cnblogs.com/xingshansi/p/6767980.html 前言 之前分析的感知机.主成分分析( ...

  7. 统计学习方法学习(四)--KNN及kd树的java实现

    K近邻法 1基本概念 K近邻法,是一种基本分类和回归规则.根据已有的训练数据集(含有标签),对于新的实例,根据其最近的k个近邻的类别,通过多数表决的方式进行预测. 2模型相关 2.1 距离的度量方式 ...

  8. 李航《统计学习方法》CH01

    CH01 统计学方法概论 前言 章节目录 统计学习 监督学习 基本概念 问题的形式化 统计学习三要素 模型 策略 算法 模型评估与模型选择 训练误差与测试误差 过拟合与模型选择 正则化与交叉验证 正则 ...

  9. 统计学习方法c++实现之六 支持向量机(SVM)及SMO算法

    前言 支持向量机(SVM)是一种很重要的机器学习分类算法,本身是一种线性分类算法,但是由于加入了核技巧,使得SVM也可以进行非线性数据的分类:SVM本来是一种二分类分类器,但是可以扩展到多分类,本篇不 ...

随机推荐

  1. (hdu)5234 Happy birthday 二维dp+01背包

    题目链接:http://acm.split.hdu.edu.cn/showproblem.php?pid=5234 Problem Description Today is Gorwin’s birt ...

  2. [JS]Cookie精通之路

    [JS]Cookie精通之路 转http://blog.163.com/neu_pdh1983/blog/static/572407020077310528915/ 发布:Cary 媒体:www.Ju ...

  3. 使用WMI监控进程启动与结束

    需要添加引用System.Management 代码: static void Main(string[] args) { //创建WQL事件查询,监视进程开启 var qCreate = new W ...

  4. POJ 3273 Monthly Expense 二分枚举

    题目:http://poj.org/problem?id=3273 二分枚举,据说是经典题,看了题解才做的,暂时还没有完全理解.. #include <stdio.h> #include ...

  5. Remove linked list elements | leetcode

    Remove all elements from a linked list of integers that have value val. Example Given: 1 --> 2 -- ...

  6. aircrack-ng on OSX 从零开始之探测

    继续上一篇内容,在安装好aircrack-ng之后,就要学习如何对目标进行探测了.找了篇教程跟着学习一下吧.其实网上关于使用aircrack-ng的教程还是很多的,我也参考了很多,不过最后还是以官方的 ...

  7. [转载]做一个 App 前需要考虑的几件事

    本文转自http://limboy.me/tech/2016/07/06/starting-an-app.html ========================================= ...

  8. JAVA 反射特性

    1.   反射(概念):程序在运行期可以改变程序结构和变量类型,主要是指程序可以访问.检测和修改它本身状态或行为的一种能力. 2.   反射的特性: •在运行时判断任意一个对象所属的类 •在运行时构造 ...

  9. matlab学习笔记(一)单元数组

    matlab学习笔记(一)单元数组 1.floor(x) :取最小的整数 floor(3.18)=3,floor(3.98)=3 ceil(x)  :取最大的整数 ceil(3.18)=4,ceil( ...

  10. 矩阵分解(rank decomposition)文章代码汇总

    矩阵分解(rank decomposition)文章代码汇总 矩阵分解(rank decomposition) 本文收集了现有矩阵分解的几乎所有算法和应用,原文链接:https://sites.goo ...