1.        SemStyle: Learning to Generate Stylised Image Captions using Unaligned Text(2018 CVPR) 主要研究方向:本论文主要是做语言风格,就是对同一张图片有多种描述. 2.        Neural Baby Talk(2018 cvpr) 主要研究内容:对于图片的描述更多的应该是基于图像内容,而不是基于语言模型去推理:如果是非常见场景,那么模型就差强人意. 3.        Bottom-Up a…
1.        SCA-CNN: Spatial and Channel-wise Attention in Convolutional Networks for Image Captioning(2017 CVPR) 主要研究方向:大多数现有的基于注意力的图像字幕模型只考虑了空间特征,本文是对同一层的feature map(特征图)加入了权重考虑. 2.        Knowing When to Look: Adaptive Attention via A Visual Sentine…
1.MSCap: Multi-Style Image Captioning with Unpaired Stylized Text 生成多种风格的caption 当前的image captioning systems的问题:生成的caption是很相对很中性,不能体现人类语言风格的多种多样 面临的困难:得到配对的风格和对应的caption是很昂贵的,所以本论文只是使用image和对应的多个caption,最后加一个分类器,对caption分类 整体框架:Caption Generator输入图像…
1.Show and Tell: A Neural Image Caption Generator Google团队的成果 整体处理流程: 1)通过CNN提取到图片的特征,简称feature. 2)而后将feature输入到LSTM中,生成第一个词S0 3)而后每个词Si的生成只需要上一个生成的词Si-1的对应的embedding,直到生成最后一个特殊符号 框架: 生成词的方法 Sampling:softmax取最大值 BeamSearch:每次生成一个单词,保存到目前为止生成的概率最大的K个句…
CVPR 2020 共收录 1470篇文章,根据当前的公布情况,人工智能学社整理了以下约100篇,分享给读者. 代码开源情况:详见每篇注释,当前共15篇开源.(持续更新中,可关注了解). 算法主要领域:图像与视频处理,图像分类&检测&分割.视觉目标跟踪.视频内容分析.人体姿态估计.模型加速.网络架构搜索(NAS).生成对抗(GAN).光学字符识别(OCR).人脸识别.三维重建等方向. 目录如下: 总目录 图像处理 Deep Image Harmonization via Domain Ve…
main.py import pymysql import re import requests # 连接数据库函数 from bs4 import BeautifulSoup def insertCvpr(value): try: db = pymysql.connect(host="localhost", user="root", password="password", database="article",charse…
完整录用论文官方链接:http://www.pamitc.org/cvpr13/program.php 过段时间CvPaper上面应该会有正文链接 今年有关RGB-D摄像机应用和研究的论文渐多起来了. 当然,自己还是比较关心Tracking方面的Papers.从作者来看,一作大部分为华人,而且有不少在Tracking这个圈子里相当有名的牛,比如Ming-Hsuan Yang,RobertCollins等(中科院到阿大的Xi Li也是非常活跃,从他的论文可以看出深厚的数学功底,另外ChunhuaS…
高温作业专用服装设计 摘 要 本文针对多层材料的高温作业服装的传热问题进行研究,综合考虑多种传热方式建立传热模型,并以此模型为基础解决了服装设计中各层材料最佳厚度的问题. 对于问题一,要求在热物性系数不足的情况下求热量分布,故需先求取所缺少的空气对流换热系数,于是求解问题的第一步是已知假人皮肤外侧的温度变化求对流换热系数的反问题.本文首先建立了一维热传导正问题模型,随后根据最小二乘法的思想,以左边界空气对流换热系数为决策变量,以可能的空气对流换热系数对应的假人皮肤外侧理论温度与测量温度之差的平方…
main.py #保存单个界面数据 def getInfo(url): # url='https://openaccess.thecvf.com/WACV2021' header={ 'User-Agent':'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.212 Mobile Safari/537.36' } html=…
这篇博客会介绍点云的基本知识,重点介绍最近两年发表的部分经典论文,有什么建议欢迎留言! 点云基本介绍 点云是某个坐标系下的点的数据集,包含了丰富的信息,可以是三维坐标X,Y,Z.颜色.强度值.时间等等.下面两张图分别展示了点云在三维空间可视化以后的效果和数据格式.点云的数据获取方式有很多种,比较常见的是三维激光扫描仪进行数据采集,它有三大类: 星载(星载LiDAR采用卫星平台,运行轨道高.观测视野广,基本可以测量到地球的每一个角落,为三维控制点和数字高程模型的获取提供了新的途径,有些星载激光雷达…