线性回归-API

线性回归的定义
- 利用回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之间关系进行建模的一种分析方式

线性回归的分类

线性关系
非线性关系

损失函数
- 最小二乘法

线性回归优化方法

正规方程
梯度下降法

正规方程 -- 一蹴而就

利用矩阵的逆,转置进行一步求解
只是适合样本和特征比较少的情况

梯度下降法 — 循序渐进
- 梯度的概念
  - 单变量 -- 切线
  - 多变量 -- 向量
- 梯度下降法中关注的两个参数
  - α -- 就是步长
    - 步长太小 -- 下山太慢
    - 步长太大 -- 容易跳过极小值点(*)
  - 为什么梯度要加一个负号
    - 梯度方向是上升最快方向,负号就是下降最快方向
梯度下降法和正规方程选择依据
- 小规模数据：
  - 正规方程：LinearRegression(不能解决拟合问题)
  - 岭回归
- 大规模数据：
  - 梯度下降法：SGDRegressor

sklearn.linear_model.LinearRegression(fit_intercept=True)
- 通过正规方程优化
- 参数
  - fit_intercept：是否计算偏置
- 属性
  - LinearRegression.coef_：回归系数
  - LinearRegression.intercept_：偏置
sklearn.linear_model.SGDRegressor(loss="squared_loss", fit_intercept=True, learning_rate ='invscaling', eta0=0.01)
- SGDRegressor类实现了随机梯度下降学习，它支持不同的loss函数和正则化惩罚项来拟合线性回归模型。
- 参数：
  - loss:损失类型
    - loss=”squared_loss”: 普通最小二乘法
  - fit_intercept：是否计算偏置
  - learning_rate : string, optional
    - 学习率填充
    - 'constant': eta = eta0
    - 'optimal': eta = 1.0 / (alpha * (t + t0)) [default]
    - 'invscaling': eta = eta0 / pow(t, power_t)
      - power_t=0.25:存在父类当中
    - 对于一个常数值的学习率来说，可以使用learning_rate=’constant’ ，并使用eta0来指定学习率。
- 属性：
  - SGDRegressor.coef_：回归系数
  - SGDRegressor.intercept_：偏置

线性回归-API的更多相关文章

Spark（十一） -- Mllib API编程线性回归、KMeans、协同过滤演示
本文测试的Spark版本是1.3.1 在使用Spark的机器学习算法库之前,需要先了解Mllib中几个基础的概念和专门用于机器学习的数据类型特征向量Vector: Vector的概念是和数学中的向量 ...
机器学习笔记5-Tensorflow高级API之tf.estimator
前言本文接着上一篇继续来聊Tensorflow的接口,上一篇中用较低层的接口实现了线性模型,本篇中将用更高级的API--tf.estimator来改写线性模型. 还记得之前的文章<机器学习笔记 ...
【TensorFlow篇】--Tensorflow框架初始，实现机器学习中多元线性回归
一.前述 TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统,其命名来源于本身的运行原理.Tensor(张量)意味着N维数组,Flow(流)意味着基于数据流图的计算,T ...
Python----多元线性回归
多元线性回归 1.多元线性回归方程和简单线性回归方程类似,不同的是由于因变量个数的增加,求取参数的个数也相应增加,推导和求取过程也不一样.. y=β0+β1x1+β2x2+ ... +βpxp+ε 对 ...
【学习笔记】tensorflow实现一个简单的线性回归
目录准备知识 Tensorflow运算API 梯度下降API 简单的线性回归的实现建立事件文件变量作用域增加变量显示模型的保存与加载自定义命令行参数准备知识 Tensorflow运算AP ...
spark-MLlib之线性回归
>>提君博客原创 http://www.cnblogs.com/tijun/ << 假定线性拟合方程: 提君博客原创变量 Xi 是 i 个变量或者说属性参数 ai 是 ...
pandas进行条件格式化以及线性回归的预测
条件格式化需求1: 将三次考试的成绩小于60分的值找出来,并将字体变为红色需求2: 将每次考试的第一名找出来,将背景变为绿色需求3: 使用背景颜色的深浅来表示数值的大小需求4: 使用数据条的长 ...
AI学习---基于TensorFlow的案例[实现线性回归的训练]
线性回归原理复习 1)构建模型 |_> y = w1x1 + w2x2 + -- + wnxn + b 2)构造损失函数 | ...
用 scikit-learn 和 pandas 学习线性回归
用 scikit-learn 和 pandas 学习线性回归¶ from https://www.cnblogs.com/pinard/p/6016029.html 就算是简单的算法,也需要跑通整 ...

随机推荐

ubuntu 各压缩文件解压命令大全
.tar 解包:tar xvf xxx.tar 打包:tar cvf xxx.tar DirName (注:tar是打包,不是压缩!) .gz 解压1:gunzip FileName.gz 解压2:g ...
深入解读阿里云Redis开发规范
Key命名设计:可读性.可管理性.简介性规范建议使用冒号即:进行分割拼接,因为很多Redis客户端是根据冒号分类的.比如有几个Key:apps:app:1.apps:app:2和apps:app:3 ...
媲美GWAS Catalog，囊括45万人数据，778个表型，3千万个位点的公共数据库：GeneATLAS
欢迎关注微信公众号"bio生物信息" GeneATLAS的数据全部来自 UK Biobank 的452,264个英国白人样本. 总共囊括的表型有778个,位点有三千万个. 优点网 ...
词向量词嵌入 word embedding
词嵌入 word embedding embedding 嵌入 embedding: 嵌入, 在数学上表示一个映射f:x->y, 是将x所在的空间映射到y所在空间上去,并且在x空间中每一个x有y ...
【Maven学习】定制库到Maven本地资源库
目标:手工操作将一个jar安装到本地仓库第一步:首先获取到jar包,可以是第三方的也可以是自己创建的,放到本地任意目录比如:joda-time-2.10.3,放到C:\jar\ 目录下面第二 ...
Ubuntu下重启mysql
启动mysql: 方式一:sudo /etc/init.d/mysql start 方式二:sudo service mysql start 停止mysql: 方式一:sudo /etc/init.d ...
kafka备份原理
CORS解决跨域问题（403问题）
1.什么是跨域问题? 跨域问题是浏览器对于ajax请求的一种安全限制:一个页面发起的ajax请求,只能是用当前页同域名同端口的路径,这能有效的阻止跨站攻击. 2.跨域问题出现的条件: 1.跨域问题是a ...
jQuery Ajax async=>false异步改为同步时，导致浏览器假死的处理方法
今天做一个需求遇到了这么个情况,就是用户个人中心有个功能,点击按钮,可以刷新用户当前的积分,这个肯定需要使用到ajax的同步请求了,当时喀喀喀三下五除二写玩了,大概代码如下: /** * 异步当前用户 ...
大数据之路【第十二篇】：数据挖掘--NLP文本相似度
一.词频----TF • 假设:如果一个词很重要,应该会在文章中多次出现 • 词频——TF(Term Frequency):一个词在文章中出现的次数 • 也不是绝对的!出现次数最多的是“的”“是”“在 ...

线性回归-API

线性回归-API的更多相关文章

随机推荐

热门专题