发表于2015年5月PAMI

作者:

Kota Yamaguchi,

M.Hadi Kiapour,

Luis E. Ortiz,

Tamara L. Berg

相关工作:

【服装检索Clothing Retrieval】越来越多的人对clothing recognition problem增加兴趣,Automatic clothing recognition methods可以推动natural and semantic image search,这反映在论文3,4,5,6,7,8中:越来越多有关clothing recognition for retrieval or recommendation applications的论文出现。

其中论文【3】提出一个street-to-shop应用:想要根据现实生活照片从网店中匹配服装图片。使用稀疏编码的transfer matrix进行mapping(street image / shopping image),防止不同的two distribution差异对检索结果造成影响。论文【5】采用类似的cross-scenario检索方法,实例化一个服装解析器显式表现每个衣物件。论文【8】关注的是同一个问题,但是更在意mobile scenarios的效率问题。除了直接关注clothing retrieval的应用外,还有服装外观相似度的应用,如在视频集中找到同一个人【9】。除了与服装相关的应用增长,与服装相关的数据集也越来越多【1】【10】【11】。为了推动应用的发展,我们需要改进图片中衣服的识别准确度,方法之一就是clothing parsing:其目的是对一个人的每个像素给出一个语义标记,如衬衫、裤子、鞋子。本论文的目标就是提供一种clothing parsing方法,可以被有效的运用于很多服装应用中。

【属性识别Attribute Recognition】一般来说,属性和物体的显式特点相关,如:颜色、图案或者形状。对于衣服属性的研究有论文6,12,13,14,15。通常,属性分析建立在检测和定位衣服件或者衣服部位。衣服属性识别这个想法源于论文【16】,该文主要专注于上半身衣服识别。近来Berg等人【12】则提出使用text description自动发现属性并定位。Bossard等人【15】提供了一种从含噪音的Web图像中获取attribute classification的方法。Bourdev等人【13】提出的使用poselets、discriminative image patches(可以捕获图片中小的视觉图案)去检测衣服属性,如“戴着帽子”。因为属性通常不会孤立存在,Chen等人【14】使用CRF考虑属性间的co-occurrence。衣服属性识别的一个应用是retrieval scenarios。使用细粒度(fine-grained)属性检测器或者human-in-the-loop方法交互式的减少搜索结果,找到什么是用户搜索的或者建立用户搜索的具体目标模型。

【衣服或者人体确定】clothing recognition的一个重要应用就是person identification。论文有【19】【20】【21】【22】【23】【24】。

【服装解析clothing parsing】服装解析是一个相对比较新的话题,但是对于解决以上提出的应用、找到有效的服装表示(clothing representations)具有很重要的作用。衣服表示相关的论文【30】将衣服语法上建模成sketch templates。别的论文采用子空间的方法,描述衣服变形(clothing deformations)或者可变空间先验值(deformable spatial priors)【33】。这些方法主要专注于how to model shape deformations用于衣服识别,与他们不同,我们则采用clothing parsing。

继承上一篇论文《Parsing clothing in fashion photographs - 2012》阐述clothing parsing:形式化为一个使用CRF的超像素标记MAP估计,该方法主要亮点就是使用姿态估计用于clothing parsing。Dong等人之后提出将clothing parsing视为一个关于parselets的推理问题:一组最基础的图像块(image region)组成衣服原件(clothing items)【34】。Liu等人提出一个方法:在训练中消除像素级的指导而使用图像级的颜色标签【35】。

本文不同之处在于:1)在没有任何关于图片的先验信息的情况下,识别细粒度的衣服类别。2)本方法不依赖任何over-segmentation,克服了假设超像素均匀分布的限制。3)本方法利用了在关注时装的社会网络中的大量免费的、弱标记的网络图片。

【论文阅读】Retrieving Similar Similar Styles to Parse Clothing(相关工作)的更多相关文章

  1. 论文阅读笔记 Word Embeddings A Survey

    论文阅读笔记 Word Embeddings A Survey 收获 Word Embedding 的定义 dense, distributed, fixed-length word vectors, ...

  2. 论文阅读 | Universal Adversarial Triggers for Attacking and Analyzing NLP

    [code] [blog] 主要思想和贡献 以前,NLP中的对抗攻击一般都是针对特定输入的,那么他们对任意的输入是否有效呢? 本文搜索通用的对抗性触发器:与输入无关的令牌序列,当连接到来自数据集的任何 ...

  3. Bigtable 论文 阅读笔记 - 原理部分

    不支持markdown,桑心.更好的阅读体验请看:Github/Bigtable.md Paper: Google Bigtable paper Notes author: Lhfcws Wu Tim ...

  4. 论文阅读(Xiang Bai——【PAMI2017】An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition)

    白翔的CRNN论文阅读 1.  论文题目 Xiang Bai--[PAMI2017]An End-to-End Trainable Neural Network for Image-based Seq ...

  5. BITED数学建模七日谈之三:怎样进行论文阅读

    前两天,我和大家谈了如何阅读教材和备战数模比赛应该积累的内容,本文进入到数学建模七日谈第三天:怎样进行论文阅读. 大家也许看过大量的数学模型的书籍,学过很多相关的课程,但是若没有真刀真枪地看过论文,进 ...

  6. 【论文阅读】Parsing Clothing in Fashion Photographs(翻译与理解)

    发表于2012年 作者:Kota Yamaguchi M.Hadi Kiapour Luis E.Ortiz Tamara L.Berg 摘要:展示了一个从时装图片中解析衣服的有效方法,提供了一个一般 ...

  7. 论文阅读笔记 - YARN : Architecture of Next Generation Apache Hadoop MapReduceFramework

    作者:刘旭晖 Raymond 转载请注明出处 Email:colorant at 163.com BLOG:http://blog.csdn.net/colorant/ 更多论文阅读笔记 http:/ ...

  8. 论文阅读笔记 - Mesos: A Platform for Fine-Grained ResourceSharing in the Data Center

    作者:刘旭晖 Raymond 转载请注明出处 Email:colorant at 163.com BLOG:http://blog.csdn.net/colorant/ 更多论文阅读笔记 http:/ ...

  9. Deep Reinforcement Learning for Dialogue Generation 论文阅读

    本文来自李纪为博士的论文 Deep Reinforcement Learning for Dialogue Generation. 1,概述 当前在闲聊机器人中的主要技术框架都是seq2seq模型.但 ...

随机推荐

  1. MySqlQueryList

    //辅助查询列表,或实例 public class MySqlQueryList { #region List<T> ToList<T>(string sql, params ...

  2. nrf51 SDK自带例程的解读

    简单的pwm电机控制示例 simple_pwm_motor_control_example 其实就是pwm控制led的亮度 1.首先设置gpiote 设置初始为高电平2.接着设置ppi 定时器time ...

  3. 64位linux下安装oracle10 64位 遇到 :ins_ctx.mk ;ins_emdb.mk

    http://blog.csdn.net/bamuta/article/details/10523835 http://www.cnblogs.com/kerrycode/p/3519446.html ...

  4. ALV列、行、单元格颜色设置

    )颜色含义 :海蓝:2:浅清:3:黄色:4:浅蓝:5:青色:6:红色:7:橙色. (1)首位为主颜色: (2)次位为辅助颜色: (3)末位为0时,表示首位数字表为表格的底色: 末位为1时,则表示以1为 ...

  5. 利用bind搭建dns

    下载bind,我下载的是bind-9.3.1rc1.tar.gz 我下载的文件放在/root目录下 进入目录解压缩 [root@linux root]#tar xfz bind-9.3.1rc1.ta ...

  6. 17.1.2.1 Advantages and Disadvantages of Statement-Based and Row-Based Replication

    17.1.2.1 Advantages and Disadvantages of Statement-Based and Row-Based Replication 基于语句和基于行复制的优点和缺点: ...

  7. 基于Visual C++2013拆解世界五百强面试题--题14-循环删除

    有一个数组a[1000]存放0-1000,要求每隔二个数删除一个数,到末尾时循环到开头继续进行,求最后一个被删掉数的原始下标. 看到题目可以用循环链表保存这些数,然后循环删除,大大减少了一些复杂的边界 ...

  8. C++模板:qsort

    void qsort(int l,int r){ int i,j,t,mid; mid=b[(l+r)>>1]; i=l; j=r; do{ while (b[i]<mid) i++ ...

  9. MaxSubArray 最大子数列和

    public int maxSubArray(int[] A) { int newsum=A[0]; int max=A[0]; for(int i=1;i<A.length;i++){ new ...

  10. poj 2411 Mondriaan's Dream 轮廓线dp

    题目链接: http://poj.org/problem?id=2411 题目意思: 给一个n*m的矩形区域,将1*2和2*1的小矩形填满方格,问一共有多少种填法. 解题思路: 用轮廓线可以过. 对每 ...