Lasso回归: #-*- encoding:utf-8 -*- import numpy as np import matplotlib.pyplot as plt from sklearn.metrics import r2_score np.random.seed(42) n_samples,n_features=50,200 X=np.random.randn(n_samples,n_features) coef=3*np.random.randn(n_features) inds=np…
学习了SVM分类器的简单原理,并调用sklearn库,对40个线性可分点进行训练,并绘制出图形画界面. 一.问题引入 如下图所示,在x,y坐标轴上,我们绘制3个点A(1,1),B(2,0),C(2,3),其中A和B属于一类,C属于一类. 我们希望找到一条直线,将两个类分开来,且保持实线和两条虚线的距离最大,我们就能将两个类最大化分割开来.当然,我们还有很多其他直线的可以将两个点分割开来,但是这样分割效果最好. 当一个新的点进行预测时,根据点在直线的位置,判断所属分类.例如D(4,3)点在实线上方…
认识 sklearn 官网地址: https://scikit-learn.gor/stable/ 从2007年发布以来, scikit-learn已成为重要的Python机器学习库, 简称sklearn, 支持包括分类, 回归, 降维和聚类等机器学习算法, 还包括了特征提取, 数据处理, 模型评估三大模块. sklearn是Scipy的扩展, 建立在Numpy, Matplotlib..等库的基础上. 拥有完善的文档, 上手容易, API丰富, 同时封装了大量的机器学习算法, 且内置了大量数据…
skleran-处理流程 获取数据 以用sklearn的内置数据集, 先导入datasets模块. 最经典的iris数据集作为例子. from sklearn import datasets iris = datasets.load_iris() # 导入数据集, json格式 X = iris.data # 获取特征向量 y = iris.target # 获取样本标签 print('特征向量:', X[:3]) print("样本标签:", y[40:60]) 特征向量: [[5.…
本节构建一个网络,将路透社新闻划分为46个互斥的主题,也就是46分类 案例2:新闻分类(多分类问题) 1. 加载数据集 from keras.datasets import reuters (train_data, train_labels), (test_data, test_labels) = reuters.load_data(num_words=10000) 将数据限定在10000个最常见出现的单词,8982个训练样本和2264个测试样本 len(train_data) 8982 len…
sklearn库中的标准数据集与基本功能 下面我们详细介绍几个有代表性的数据集: 当然同学们也可以用sklearn机器学习函数来挖掘这些数据,看看可不可以捕捉到一些有趣的想象或者是发现: 波士顿房价数据集: 波士顿房价数据集包含506组数据,每条数据包含房屋以及房屋周围的详细信息.其中包含城镇犯罪率.一氧化氮浓度.住宅平均房间数.到中心区域的加权距离以及自住房平均房价等.因此,波士顿房价数据集能够应用到回归问题上. 这里是波士顿房价数据集的部分房价数据信息展示:例如:NOX这个属性代表一氧化氮的…
Python: sklearn库 —— 数据预处理 数据集转换之预处理数据:      将输入的数据转化成机器学习算法可以使用的数据.包含特征提取和标准化.      原因:数据集的标准化(服从均值为0方差为1的标准正态分布(高斯分布))是大多数机器学习算法的常见要求. 如果原始数据不服从高斯分布,在预测时表现可能不好.在实践中,我们经常进行标准化(z-score 特征减去均值/标准差). 一.标准化(Z-Score),或者去除均值和方差缩放 公式为:(X-mean)/std  计算时对每个属性…
1.Category简介 Category,又称为类别&类目&分类,是OC特有语法,在不修改原有类的基础上增加新的方法,一个庞大的类可以多人来分模块开发,有助于团队合作,或者对当前类方法做一个归类,以便于更好的更新和维护 2.Category的用法 命名规则:类名+扩展方法,比如给 Car增加一个run方法,那么命名为 (Car+run) 新建new file中选择Objective-C file  选择Category 在.h文件中,声明类别: @interface 原有类类名 (分类名…
我觉得把课本上的案例先自己抄一遍,然后将书看一遍.最后再写一篇博客记录自己所学过程的感悟.虽然与课本有很多相似之处.但自己写一遍感悟会更深 电影评论分类(二分类问题) 本节使用的是IMDB数据集,使用Jupyter作为编译器.这是我刚开始使用Jupyter,不得不说它的自动补全真的不咋地(以前一直用pyCharm)但是看在能够分块运行代码的份上,忍了.用pyCharm敲代码确实很爽,但是调试不好调试(可能我没怎么用心学),而且如果你完全不懂代码含义的话,就算你运行成功也不知道其中的含义,代码有点…
sklearn库 sklearn是scikit-learn的简称,是一个基于Python的第三方模块.sklearn库集成了一些常用的机器学习方法,在进行机器学习任务时,并不需要实现算法,只需要简单的调用sklearn库中提供的模块就能完成大多数的机器学习任务. sklearn库是在Numpy.Scipy和matplotlib的基础上开发而成的,因此在介绍sklearn的安装前,需要先安装这些依赖库. Numpy库:Numpy(Numerical Python的缩写)是一个开源的Python科学…