lsomap降维

# -*- coding: utf-8 -*-

"""

    lsomap

"""

import numpy as np

import matplotlib.pyplot as plt

from sklearn import   datasets,manifold

def load_data():

    '''

    加载用于降维的数据

    :return: 一个元组，依次为训练样本集和样本集的标记

    '''

    iris=datasets.load_iris()# 使用 scikit-learn 自带的 iris 数据集

    return  iris.data,iris.target

def test_lsomap(*data):

    '''

    测试 lsomap 的用法

    :param data: 可变参数。它是一个元组，这里要求其元素依次为：训练样本集、训练样本的标记

    :return: None

    '''

    X,y=data

    for n in [4,3,2,1]: # 依次考察降维目标为 4维、3维、2维、1维

        lsomap=manifold.lsomap(n_components=n)

        lsomap.fit(X)

        print('reconstruction_error(n_components=%d) : %s'%

            (n, lsomap.reconstruction_error()))

def plot_lsomap_k(*data):

    '''

    测试 lsomap 中 n_neighbors 参数的影响，其中降维至 2维

    :param data: 可变参数。它是一个元组，这里要求其元素依次为：训练样本集、训练样本的标记

    :return: None

    '''

    X,y=data

    Ks=[1,5,25,y.size-1] # n_neighbors参数的候选值的集合

    fig=plt.figure()

    for i, k in enumerate(Ks):

        lsomap=manifold.lsomap(n_components=2,n_neighbors=k)

        X_r=lsomap.fit_transform(X)#原始数据集转换到二维

        ax=fig.add_subplot(2,2,i+1)## 两行两列，每个单元显示不同 n_neighbors 参数的 lsomap 的效果图

        colors=((1,0,0),(0,1,0),(0,0,1),(0.5,0.5,0),(0,0.5,0.5),(0.5,0,0.5),

            (0.4,0.6,0),(0.6,0.4,0),(0,0.6,0.4),(0.5,0.3,0.2),)# 颜色集合，不同标记的样本染不同的颜色

        for label ,color in zip( np.unique(y),colors):

            position=y==label

            ax.scatter(X_r[position,0],X_r[position,1],label="target= %d"

            %label,color=color)

        ax.set_xlabel("X[0]")

        ax.set_ylabel("X[1]")

        ax.legend(loc="best")

        ax.set_title("k=%d"%k)

    plt.suptitle("lsomap")

    plt.show()

def plot_lsomap_k_d1(*data):

    '''

    测试 lsomap 中 n_neighbors 参数的影响，其中降维至 1维

    :param data: 可变参数。它是一个元组，这里要求其元素依次为：训练样本集、训练样本的标记

    :return: None

    '''

    X,y=data

    Ks=[1,5,25,y.size-1]# n_neighbors参数的候选值的集合

    fig=plt.figure()

    for i, k in enumerate(Ks):

        lsomap=manifold.lsomap(n_components=1,n_neighbors=k)

        X_r=lsomap.fit_transform(X)#原始数据集转换到 1 维

        ax=fig.add_subplot(2,2,i+1)## 两行两列，每个单元显示不同 n_neighbors 参数的 lsomap 的效果图

        colors=((1,0,0),(0,1,0),(0,0,1),(0.5,0.5,0),(0,0.5,0.5),(0.5,0,0.5),

            (0.4,0.6,0),(0.6,0.4,0),(0,0.6,0.4),(0.5,0.3,0.2),)# 颜色集合，不同标记的样本染不同的颜色

        for label ,color in zip( np.unique(y),colors):

            position=y==label

            ax.scatter(X_r[position],np.zeros_like(X_r[position]),

            label="target= %d"%label,color=color)

        ax.set_xlabel("X")

        ax.set_ylabel("Y")

        ax.legend(loc="best")

        ax.set_title("k=%d"%k)

    plt.suptitle("lsomap")

    plt.show()

if __name__=='__main__':

    X,y=load_data() # 产生用于降维的数据集

    test_lsomap(X,y)   # 调用 test_lsomap

    #plot_lsomap_k(X,y)   # 调用 plot_lsomap_k

    #plot_lsomap_k_d1(X,y)   # 调用 plot_lsomap_k_d1

lsomap降维的更多相关文章

奇异值分解(SVD)原理与在降维中的应用
奇异值分解(Singular Value Decomposition,以下简称SVD)是在机器学习领域广泛应用的算法,它不光可以用于降维算法中的特征分解,还可以用于推荐系统,以及自然语言处理等领域.是 ...
用scikit-learn进行LDA降维
在线性判别分析LDA原理总结中,我们对LDA降维的原理做了总结,这里我们就对scikit-learn中LDA的降维使用做一个总结. 1. 对scikit-learn中LDA类概述在scikit-le ...
scikit-learn一般实例之四:使用管道和GridSearchCV选择降维
本例构建一个管道来进行降维和预测的工作:先降维,接着通过支持向量分类器进行预测.本例将演示与在网格搜索过程进行单变量特征选择相比,怎样使用GrideSearchCV和管道来优化单一的CV跑无监督的PC ...
机器学习基础与实践（三）----数据降维之PCA
写在前面:本来这篇应该是上周四更新,但是上周四写了一篇深度学习的反向传播法的过程,就推迟更新了.本来想参考PRML来写,但是发现里面涉及到比较多的数学知识,写出来可能不好理解,我决定还是用最通俗的方法 ...
数据降维技术（1）—PCA的数据原理
PCA(Principal Component Analysis)是一种常用的数据分析方法.PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降 ...
Javascript实现的数组降维——维度不同，怎么谈恋爱
数组的元素可能是数组,这样一层层嵌套,可能得到一个嵌套很深的数组,数组降维要做的事就是把嵌套很深的数组展开,一般最后得到一个一维数组,其中的元素都是非数组元素,比如数组[1, [2, 3, [4, 5 ...
运用PCA进行降维的好处
运用PCA对高维数据进行降维,有一下几个特点: (1)数据从高维空间降到低维,因为求方差的缘故,相似的特征会被合并掉,因此数据会缩减,特征的个数会减小,这有利于防止过拟合现象的出现.但PCA并不是一种 ...
机器学习笔记----四大降维方法之PCA（内带python及matlab实现）
大家看了之后,可以点一波关注或者推荐一下,以后我也会尽心尽力地写出好的文章和大家分享. 本文先导:在我们平时看NBA的时候,可能我们只关心球员是否能把球打进,而不太关心这个球的颜色,品牌,只要有3D效 ...
PCA数据降维
Principal Component Analysis 算法优缺点: 优点:降低数据复杂性,识别最重要的多个特征缺点:不一定需要,且可能损失有用的信息适用数据类型:数值型数据算法思想: 降维的 ...

随机推荐

Python实现批量MD5加密
#!/usr/bin/python # -*- coding: utf-8 -*- import hashlib def md5(str): hl = hashlib.md5() hl.update( ...
hdl - 软件编程与硬件建模
https://mp.weixin.qq.com/s/Y75I9e3s4fDPZuv-CyiNDA 介绍软件编程思维与硬件建模思维的不同与相似之处. 1. 软件编程思维编程,意 ...
又发现一款纯js开源电子表格Luckysheet
据官网介绍这个电子表格插件,是一款纯前端类似excel的在线表格,功能强大.配置简单.完全开源. 官网链接: Luckysheet官网在线DEMO 特性包含: 表格设置,包括冻结行列.合并单元格.筛 ...
细说Java多线程之内存可见性笔记
个人博客网:https://wushaopei.github.io/ (你想要这里多有) 说明:多线程的内存可见性涉及到多线程间的数据争用,也涉及到了多线程间的数据可见性一.共享变量在线程间的 ...
Java实现 LeetCode 421 数组中两个数的最大异或值
421. 数组中两个数的最大异或值给定一个非空数组,数组中元素为 a0, a1, a2, - , an-1,其中 0 ≤ ai < 231 . 找到 ai 和aj 最大的异或 (XOR) 运算 ...
Java实现蓝桥杯算法提高计算行列式
试题算法提高计算行列式资源限制时间限制:1.0s 内存限制:256.0MB 问题描述 //据说很多人的题目会有一大堆废话,本傻×就不在这里废话了. 给定一个N×N的矩阵A,求|A|. 输入格式 ...
Java实现无向图的欧拉回路判断问题
1 问题描述 Problem Description 欧拉回路是指不令笔离开纸面,可画过图中每条边仅一次,且可以回到起点的一条回路.现给定一个图,问是否存在欧拉回路? Input 测试输入包含若干测试 ...
Python 网络爬虫基本概念篇
爬虫的概念网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本.这是百度百科对爬虫的定义,其实,说简单点,爬虫 ...
数据的存储结构浅析LSM-Tree和B-tree
目录顺序存储与哈希索引 SSTable和LSM tree B-Tree 存储结构的比对小结本篇主要讨论的是不同存储结构(主要是LSM-tree和B-tree),它们应对的不同场景,所采用的底层存 ...
Android getMeasuredHeight()与getHeight()的区别
getMeasuredHeight()返回的是原始测量高度,与屏幕无关 getHeight()返回的是在屏幕上显示的高度实际上在当屏幕可以包裹内容的时候,他们的值是相等的,只有当view超出屏幕后, ...

lsomap降维

lsomap降维的更多相关文章

随机推荐

热门专题