发表于2015年5月PAMI

作者:

Kota Yamaguchi,

M.Hadi Kiapour,

Luis E. Ortiz,

Tamara L. Berg

相关工作:

【服装检索Clothing Retrieval】越来越多的人对clothing recognition problem增加兴趣,Automatic clothing recognition methods可以推动natural and semantic image search,这反映在论文3,4,5,6,7,8中:越来越多有关clothing recognition for retrieval or recommendation applications的论文出现。

其中论文【3】提出一个street-to-shop应用:想要根据现实生活照片从网店中匹配服装图片。使用稀疏编码的transfer matrix进行mapping(street image / shopping image),防止不同的two distribution差异对检索结果造成影响。论文【5】采用类似的cross-scenario检索方法,实例化一个服装解析器显式表现每个衣物件。论文【8】关注的是同一个问题,但是更在意mobile scenarios的效率问题。除了直接关注clothing retrieval的应用外,还有服装外观相似度的应用,如在视频集中找到同一个人【9】。除了与服装相关的应用增长,与服装相关的数据集也越来越多【1】【10】【11】。为了推动应用的发展,我们需要改进图片中衣服的识别准确度,方法之一就是clothing parsing:其目的是对一个人的每个像素给出一个语义标记,如衬衫、裤子、鞋子。本论文的目标就是提供一种clothing parsing方法,可以被有效的运用于很多服装应用中。

【属性识别Attribute Recognition】一般来说,属性和物体的显式特点相关,如:颜色、图案或者形状。对于衣服属性的研究有论文6,12,13,14,15。通常,属性分析建立在检测和定位衣服件或者衣服部位。衣服属性识别这个想法源于论文【16】,该文主要专注于上半身衣服识别。近来Berg等人【12】则提出使用text description自动发现属性并定位。Bossard等人【15】提供了一种从含噪音的Web图像中获取attribute classification的方法。Bourdev等人【13】提出的使用poselets、discriminative image patches(可以捕获图片中小的视觉图案)去检测衣服属性,如“戴着帽子”。因为属性通常不会孤立存在,Chen等人【14】使用CRF考虑属性间的co-occurrence。衣服属性识别的一个应用是retrieval scenarios。使用细粒度(fine-grained)属性检测器或者human-in-the-loop方法交互式的减少搜索结果,找到什么是用户搜索的或者建立用户搜索的具体目标模型。

【衣服或者人体确定】clothing recognition的一个重要应用就是person identification。论文有【19】【20】【21】【22】【23】【24】。

【服装解析clothing parsing】服装解析是一个相对比较新的话题,但是对于解决以上提出的应用、找到有效的服装表示(clothing representations)具有很重要的作用。衣服表示相关的论文【30】将衣服语法上建模成sketch templates。别的论文采用子空间的方法,描述衣服变形(clothing deformations)或者可变空间先验值(deformable spatial priors)【33】。这些方法主要专注于how to model shape deformations用于衣服识别,与他们不同,我们则采用clothing parsing。

继承上一篇论文《Parsing clothing in fashion photographs - 2012》阐述clothing parsing:形式化为一个使用CRF的超像素标记MAP估计,该方法主要亮点就是使用姿态估计用于clothing parsing。Dong等人之后提出将clothing parsing视为一个关于parselets的推理问题:一组最基础的图像块(image region)组成衣服原件(clothing items)【34】。Liu等人提出一个方法:在训练中消除像素级的指导而使用图像级的颜色标签【35】。

本文不同之处在于:1)在没有任何关于图片的先验信息的情况下,识别细粒度的衣服类别。2)本方法不依赖任何over-segmentation,克服了假设超像素均匀分布的限制。3)本方法利用了在关注时装的社会网络中的大量免费的、弱标记的网络图片。

【论文阅读】Retrieving Similar Similar Styles to Parse Clothing(相关工作)的更多相关文章

  1. 论文阅读笔记 Word Embeddings A Survey

    论文阅读笔记 Word Embeddings A Survey 收获 Word Embedding 的定义 dense, distributed, fixed-length word vectors, ...

  2. 论文阅读 | Universal Adversarial Triggers for Attacking and Analyzing NLP

    [code] [blog] 主要思想和贡献 以前,NLP中的对抗攻击一般都是针对特定输入的,那么他们对任意的输入是否有效呢? 本文搜索通用的对抗性触发器:与输入无关的令牌序列,当连接到来自数据集的任何 ...

  3. Bigtable 论文 阅读笔记 - 原理部分

    不支持markdown,桑心.更好的阅读体验请看:Github/Bigtable.md Paper: Google Bigtable paper Notes author: Lhfcws Wu Tim ...

  4. 论文阅读(Xiang Bai——【PAMI2017】An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition)

    白翔的CRNN论文阅读 1.  论文题目 Xiang Bai--[PAMI2017]An End-to-End Trainable Neural Network for Image-based Seq ...

  5. BITED数学建模七日谈之三:怎样进行论文阅读

    前两天,我和大家谈了如何阅读教材和备战数模比赛应该积累的内容,本文进入到数学建模七日谈第三天:怎样进行论文阅读. 大家也许看过大量的数学模型的书籍,学过很多相关的课程,但是若没有真刀真枪地看过论文,进 ...

  6. 【论文阅读】Parsing Clothing in Fashion Photographs(翻译与理解)

    发表于2012年 作者:Kota Yamaguchi M.Hadi Kiapour Luis E.Ortiz Tamara L.Berg 摘要:展示了一个从时装图片中解析衣服的有效方法,提供了一个一般 ...

  7. 论文阅读笔记 - YARN : Architecture of Next Generation Apache Hadoop MapReduceFramework

    作者:刘旭晖 Raymond 转载请注明出处 Email:colorant at 163.com BLOG:http://blog.csdn.net/colorant/ 更多论文阅读笔记 http:/ ...

  8. 论文阅读笔记 - Mesos: A Platform for Fine-Grained ResourceSharing in the Data Center

    作者:刘旭晖 Raymond 转载请注明出处 Email:colorant at 163.com BLOG:http://blog.csdn.net/colorant/ 更多论文阅读笔记 http:/ ...

  9. Deep Reinforcement Learning for Dialogue Generation 论文阅读

    本文来自李纪为博士的论文 Deep Reinforcement Learning for Dialogue Generation. 1,概述 当前在闲聊机器人中的主要技术框架都是seq2seq模型.但 ...

随机推荐

  1. JS 修改元素

    var ele; window.onload=function(){ ele=document.createElement('div'); ele.id='myEle1'; ele.style.bor ...

  2. ie浏览器css中的行为expression详解

    CSS中的行为——expression (ie only) 最近对CSS中的行为比较感兴趣,虽然是不符合标准的也只有ie才能识别,但是他确实给css的功能扩展了不少.下面是摘自互联网上的文字和例子,因 ...

  3. Windows Azure 存储的冗余存储选项和只读访问跨地域冗余存储

    我们很高兴地宣布,现在我们使客户可以获得对数据更高的读取可用性.该预览功能称为"只读访问- 跨地域冗余存储(RA-GRS)",使客户可以在存储帐户主要区域无法读取数据时,通过跨 ...

  4. Ubuntu系统下在Eclipse中使用真实手机运行调试Android应用

    本文是在Ubuntu下已搭建好JRE+Eclipse+AndroidSDK的环境中进行的. 如果从未进行过如下的操作的话,在运行Android应用时,在设备选择器那里你的手机会显示为一大串" ...

  5. Mysql 创建联合主键

    Mysql 创建联合主键2008年01月11日 星期五 下午 5:21使用primary key (fieldlist)      比如:   create table mytable (       ...

  6. Hidden String(深搜)

    Hidden String Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 262144/262144 K (Java/Others) ...

  7. Sql语句之select 5种查询

    select 5种子句:注意顺序where / group by /having / order by / limit / 清空表中的数据:truncate 表名: 导入表结构(不含数据): crea ...

  8. .net EF中从数据添加表或视图时无法添加的问题

    .net 使用EF模式进行开发,添加实体时不能够正常添加 错误描述: .net中在EF文件中添加数据库中已有的表或视图时不能正常添加,在添加时没有任何的错误提示,但是表或视图就一直拉不过来,,保存也没 ...

  9. wpf将表中数据显示到datagrid示例(转)

    原文:http://www.jb51.net/article/47120.htm 这篇文章主要介绍了wpf将表中数据显示到datagrid示例,需要的朋友可以参考下 a.在.xaml文件中拖入一个da ...

  10. .html与.htm为网页后缀的区别

    有些人在做网页的时候会有疑问,到底是应该用.html还是.htm做网页后缀呢?.html和.htm有什么区别吗?在做网页时到底用哪一个好呢? 现在,我说一下我对这两个文件后缀的看法: 首先,要想使用后 ...