转发说明:by majunman    from HIT    email:2192483210@qq.com

简介:scikit-learn是数据挖掘和数据分析的有效工具,它建立在 NumPy, SciPy, and matplotlib基础上。开源的但商业不允许

1. Supervised learning

1.1. Generalized Linear Models

1.1.1. Ordinary Least Squares最小二乘法

  1. >>> from sklearn import linear_model
  2. >>> reg = linear_model.LinearRegression()
  3. >>> reg.fit ([[0, 0], [1, 1], [2, 2]], [0, 1, 2])
  4. LinearRegression(copy_X=True, fit_intercept=True, n_jobs=1, normalize=False)
  5. >>> reg.coef_
  6. array([ 0.5, 0.5])

reg-http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html#sklearn.linear_model.LinearRegression

reg.coef_   是回归函数的结果,即相关系数

具体实验:

  1. print(__doc__)
  2.  
  3. # Code source: Jaques Grobler
  4. # License: BSD 3 clause
  5.  
  6. import matplotlib.pyplot as plt
  7. import numpy as np
  8. from sklearn import datasets, linear_model
  9. from sklearn.metrics import mean_squared_error, r2_score
  10.  
  11. # Load the diabetes dataset
  12. diabetes = datasets.load_diabetes() #加载diabetes数据集(sklearn提供的几种数据集之一,该数据是糖尿病数据集)
  13.  
  14. # Use only one feature
  15. diabetes_X = diabetes.data[:, np.newaxis, 2] #只加载一个特征值
  16.  
  17. # Split the data into training/testing sets
  18. diabetes_X_train = diabetes_X[:-20]
  19. diabetes_X_test = diabetes_X[-20:]
  20.  
  21. # Split the targets into training/testing sets
  22. diabetes_y_train = diabetes.target[:-20]
  23. diabetes_y_test = diabetes.target[-20:]
  24.  
  25. # Create linear regression object
  26. regr = linear_model.LinearRegression()
  27.  
  28. # Train the model using the training sets
  29. regr.fit(diabetes_X_train, diabetes_y_train)
  30.  
  31. # Make predictions using the testing set
  32. diabetes_y_pred = regr.predict(diabetes_X_test)
  33.  
  34. # The coefficients
  35. print('Coefficients: \n', regr.coef_)
  36. # The mean squared error
  37. print("Mean squared error: %.2f"
  38. % mean_squared_error(diabetes_y_test, diabetes_y_pred))
  39. # Explained variance score: 1 is perfect prediction
  40. print('Variance score: %.2f' % r2_score(diabetes_y_test, diabetes_y_pred))
  41.  
  42. # Plot outputs
  43. plt.scatter(diabetes_X_test, diabetes_y_test, color='black')
  44. plt.plot(diabetes_X_test, diabetes_y_pred, color='blue', linewidth=3)
  45.  
  46. plt.xticks(())
  47. plt.yticks(())
  48.  
  49. plt.show()

  

sklearn学习一的更多相关文章

  1. sklearn学习笔记之简单线性回归

    简单线性回归 线性回归是数据挖掘中的基础算法之一,从某种意义上来说,在学习函数的时候已经开始接触线性回归了,只不过那时候并没有涉及到误差项.线性回归的思想其实就是解一组方程,得到回归函数,不过在出现误 ...

  2. sklearn学习总结(超全面)

    https://blog.csdn.net/fuqiuai/article/details/79495865 前言sklearn想必不用我多介绍了,一句话,她是机器学习领域中最知名的python模块之 ...

  3. sklearn学习 第一篇:knn分类

    K临近分类是一种监督式的分类方法,首先根据已标记的数据对模型进行训练,然后根据模型对新的数据点进行预测,预测新数据点的标签(label),也就是该数据所属的分类. 一,kNN算法的逻辑 kNN算法的核 ...

  4. sklearn 学习 第一篇:分类

    分类属于监督学习算法,是指根据已有的数据和标签(分类)进行学习,预测未知数据的标签.分类问题的目标是预测数据的类别标签(class label),可以把分类问题划分为二分类和多分类问题.二分类是指在两 ...

  5. SKlearn | 学习总结

    1 简介 scikit-learn,又写作sklearn,是一个开源的基于python语言的机器学习工具包.它通过NumPy, SciPy和Matplotlib等python数值计算的库实现高效的算法 ...

  6. sklearn学习笔记3

    Explaining Titanic hypothesis with decision trees decision trees are very simple yet powerful superv ...

  7. sklearn学习笔记2

    Text classifcation with Naïve Bayes In this section we will try to classify newsgroup messages using ...

  8. sklearn学习笔记1

    Image recognition with Support Vector Machines #our dataset is provided within scikit-learn #let's s ...

  9. 莫烦sklearn学习自修第九天【过拟合问题处理】

    1. 过拟合问题可以通过调整机器学习的参数来完成,比如sklearn中通过调节gamma参数,将训练损失和测试损失降到最低 2. 代码实现(显示gamma参数对训练损失和测试损失的影响) from _ ...

  10. 莫烦sklearn学习自修第八天【过拟合问题】

    1. 什么是过拟合问题 所谓过拟合问题指的是使用训练样本进行训练时100%正确分类或规划,当使用测试样本时则不能正确分类和规划 2. 代码实战(模拟过拟合问题) from __future__ imp ...

随机推荐

  1. 【DSP开发】HyperLink 编程和性能考量

    冯华亮/Brighton Feng---Communication Infrastructure 摘要 HyperLink 为两个 KeyStone 架构 DSP 之间提供了一种高速,低延迟,引脚数量 ...

  2. Emgu 学习(2) 视频文件播放

    播放AVI视频文件 static void Main(string[] args) { CvInvoke.NamedWindow("TestVideo", NamedWindowT ...

  3. PTA(Basic Level)1058.A+B in Hogwarts

    If you are a fan of Harry Potter, you would know the world of magic has its own currency system -- a ...

  4. # Clion复制提示信息

    Clion复制提示信息 windows: 按着alt 左键点击错误信息(按键点击同时进行) mac:按着option 左键点击错误信息 搞定

  5. php aes加解密,mcrypt_encrypt 和openssl_encrypt

    php7.1以下版本使用 /* * mcrypt_encrypt 加密 * php7.1开始被丢弃 可以使用openssl_encrypt * */ function aes_encrypt($con ...

  6. 微信小程序,预览在开发工具上显示正常,手机预览二维码报request->fail错误,打开手机的调试功能又正常。

    这里错误很明显是属于网址错误,开发工具和手机调试都能走request->success: 唯独常规模式下无法显示. 最开始调试过很多方法,没找出原因.最后到小程序开发设置才发现,自己未配置服务器 ...

  7. mysql连接数据库时报2003错误怎么解决

    mysql 2003是连接错误,连不上服务器. 你目前可以如下方法:进入控制面板->服务管理(我的是管理工具),->服务,然后找到Mysql服务,右键修改属性,改为自启动,以后再重启就没有 ...

  8. 使用iview 的表单组件验证 Upload 组件

    使用iview 的表单组件验证 Upload 组件 结果: 点击提交按钮, 没有填的form 项, 提示错误, 当填入数据后提示验证成功 代码: <template> <div id ...

  9. python 定义变量

    定义变量 什么是变量? 在程序运行过程中,其值可以改变的量 标识符(命令规范) 只能由数字.字母.下划线组成 不能以数字开头 不能是系统关键字 # 导入包import keyword​# 打印所有关键 ...

  10. Reference to ‘xxxxx’ is ambiguous 错误

    1.原因,在当前类重复引入了 类库,比如 pch里面导入了#import "XXX" 此类的.h 又引入 #import <xxx/xxx> 导致 解决方法:删除此类的 ...