【笔记】关于N-Way K-Shot 分类问题的理解

Time: 2019年10月27日

Author：Veagau

在看讲Repitle的论文【On First-Order Meta-Learning Algorithm】时，实验环节对N-Way K-Shot分类问题的SetUp进行的描述引起了我的二度思考，以前对这个问题的理解感觉没摸透，以此为契机，重新思考得出了一种理解。

所谓N-Way K-Shot 分类问题就是指用少量样本构建分类任务的。主要应用于少样本学习（Few-Shot Learning）领域，样本数据不足的情况，后来逐渐延伸到元学习（Meta-Learning）领域。

元学习需要通过在大量的任务上进行学习，学习到泛化能力强大的模型算法，以快速适应新的任务，即学会学习。

因为元学习是以一个个的任务（如分类任务）作为自己的训练数据的，传统的基于大量数据的训练任务显然不适用于目前的研究（算力约束）。

从字面上理解，N-Way就是N-路或N-类，K-Shot就是K-次或K-个。

每次在构建分类任务时，从数据集里抽取N-类的数据，每一类数据由K-个样本构成。这样就形成了一个小型分类任务的数据集，实际上就是原始数据集的一次采样。

那这个小型分类任务的训练集和测试集具体是怎么划分的呢?

其实这个问题也是困扰我很久的，看了几篇文献都没明白。训练过程中用的是什么数据？测试过程中呢？直到我看到这篇论文中的描述：

If we are doing K-shot, N-way classication, then we sample tasks by selecting N classes from C and then selecting K + 1 examples for each class. We split these examples into a training set and a test set, where the test set contains a single example for each class.

其中关键的一点就是，在取数据时对于N类数据，每一类其实取了K+1个样本，而不是K个！

然后就是这个+1引出了我的理解。

以5-Way 5-Shot分类问题为例，在构建一个任务的数据集时的具体流程应该如下：

从元数据集（Meta-dataset）中随机抽取5类（Way）样本，每一类样本随机抽取5+1个（Shot）实例

元数据集：也就是整体数据集中，可以理解为传统的大型数据集，其中的数据类别>>N-Way，每一类的实例数量>>K-Shot.

从这5类样本的6个实例中，每类样本随机抽取5个实例一起作为Training Set（→Support Set），每一类剩下的一个实例一起组成Testing Set（→Query Set）。

由于元学习是以任务（Task）作为自己的训练数据的，即元学习的实际训练集和测试集是由一个个的Task组成的，所以为了进行区分，每个任务内部的训练集（Training Set）更名为支持集（Support Set）、测试集更名为查询集（Query Set）。

训练：从Support Set中每一类随机选取一个实例，一起够成一组训练数据，输入到模型中，进行训练。

测试：从Query Set中随机抽取一个实例，用模型判断其属于哪一类。

这个判断过程其实可以视为一种查询过程，给定了支持集，只要让模型能够准确的查询到其属于支持集中的哪一类即可证明模型性能较好。

重复几轮，最终得出该任务模型的准确率，实际上即是元学习参数确定的模型在该任务上的损失。

损失梯度反向传播到元学习参数，对其进行更新，也即元学习过程。

图示如下：

Way 1 （C1）	Way 2 （C2）	Way3 （C3）	Way 4 （C4）	Way5 （C5）
C~11~	C~21~	C~31~	C~41~	C~51~	Support
C~12~	C~22~	C~32~	C~42~	C~52~	Support
C~13~	C~23~	C~33~	C~43~	C~53~	Support
C~14~	C~24~	C~34~	C~44~	C~54~	Support
C~15~	C~25~	C~35~	C~45~	C~55~	Support
C~16~	C~26~	C~36~	C~46~	C~56~	Query

【笔记】关于N-Way K-Shot 分类问题的理解的更多相关文章

Magento架构师的笔记-----Magento显示当前目录的父分类和子分类的分类名
在Magento目录的分类页面里,希望在左侧导航获取到父分类和子分类,可以用以下方法:打开app/your_package/your_themes/template/catalog/navigatio ...
K邻近分类算法
# -*- coding: utf-8 -*- """ Created on Thu Jun 28 17:16:19 2018 @author: zhen "& ...
K近邻分类算法实现 in Python
K近邻(KNN):分类算法 * KNN是non-parametric分类器(不做分布形式的假设,直接从数据估计概率密度),是memory-based learning. * KNN不适用于高维数据(c ...
机器学习实战 - python3 学习笔记（一） - k近邻算法
一. 使用k近邻算法改进约会网站的配对效果 k-近邻算法的一般流程: 收集数据:可以使用爬虫进行数据的收集,也可以使用第三方提供的免费或收费的数据.一般来讲,数据放在txt文本文件中,按照一定的格式进 ...
[吴恩达机器学习笔记]12支持向量机3SVM大间距分类的数学解释
12.支持向量机觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考资料斯坦福大学 2014 机器学习教程中文笔记 by 黄海广 12.3 大间距分类背后的数学原理- Mathematic ...
每日一个机器学习算法——k近邻分类
K近邻很简单. 简而言之,对于未知类的样本,按照某种计算距离找出它在训练集中的k个最近邻,如果k个近邻中多数样本属于哪个类别,就将它判决为那一个类别. 由于采用k投票机制,所以能够减小噪声的影响. 由 ...
机器学习框架ML.NET学习笔记【6】TensorFlow图片分类
一.概述通过之前两篇文章的学习,我们应该已经了解了多元分类的工作原理,图片的分类其流程和之前完全一致,其中最核心的问题就是特征的提取,只要完成特征提取,分类算法就很好处理了,具体流程如下: 之前介绍 ...
【PRML学习笔记】第四章：分类的线性模型
一.基础概念线性分类模型:决策面(decision boundary)是输入向量的线性函数目标类别的表示"1 of K" :$ t = (0,1,0,0,0)^T$ 二.分类问 ...
LeetCode 笔记21 生成第k个排列
题目是这样的: The set [1,2,3,…,n] contains a total of n! unique permutations. By listing and labeling all ...

随机推荐

【带着canvas去流浪（14）】Three.js中凹浮雕模型的生成方式
目录一. 方案1:ThreeBSP.js或ThreeCSG.js扩展库二. 方案2:平面镂空模型拉伸三. 方案3:Cinema 4D建模后输出模型文件示例代码托管在:http://www.gi ...
HTML5实现首页动态视频背景
话不多说,先看效果图: 炫酷吗?你想实现这种动态视频作为背景的首页吗?来,一起来学习,本文将带你一起实现H5动态视频背景: 首先网上找一段清晰的视频下载下来,最好是MP4格式的: 下载好了之后 ...
FPGA 内部详细架构你明白了吗？
FPGA 芯片整体架构如下所示,大体按照时钟域划分的,即根据不同的工艺.器件速度和对应的时钟进行划分: FPGA 内部详细架构又细分为如下六大模块: 1.可编程输入输出单元(IOB)(Input Ou ...
mysql创建表时字段类型选择与优化
一.选择原则 1.应该尽量使用可以正确存储数据的最小字段类型 2.选用简单的数据类型,例如:一个是尽量用mysql内置的字段类型来存储日期和时间:另一个存储IP地址尽量用整型:能用整型的尽量不用字符串 ...
微服务SpringCloud之注册中心Consul
Consul 介绍 Consul 是 HashiCorp 公司推出的开源工具,用于实现分布式系统的服务发现与配置.与其它分布式服务注册与发现的方案,Consul 的方案更“一站式”,内置了服务注册与发 ...
Java假期样卷简易通讯录
score.java package score; public class score { String name; String num; int age; boolean sex; double ...
转载：alpha测试和beta测试的区别；黑盒测试和白盒测试的区别；
alpha测试版,有点相当于内部测试,一般开发人员在场 ,是由用户做测试,但开发人员在场,一般是请用户到开发现场去测试 beta测试版,完全交给用户,由用户做测试,返回测试报告,相当于发行前的一个 ...
Andorid监听SoftKeyboard弹起事件
对于Android键盘事件Google并没有提供一个好的接口去监听它,有时候就为项目需要就必须要自己去想办法去监听,由于我最近也要实现登陆与注册的功能,我的想法很简单实现起来也比较容易,主要的原理是在 ...
poi下载excel模板
/** * 下载模板 * @param tplName * @param returnName * @param response * @param request * @throws Excepti ...
Java 学习笔记之实例变量非线程安全
实例变量非线程安全: 如果多个线程共同访问1个对象中的实例变量,则可能出现“非线程安全”问题. public class UnSafeHasSelfPrivateNum { private int n ...

【笔记】关于N-Way K-Shot 分类问题的理解

【笔记】关于N-Way K-Shot 分类问题的理解的更多相关文章

随机推荐

热门专题