Deformable conv赋予了CNN位置变换的能力,与普通卷积的对比如下.可以看到,在每个特征点上,会产生一个偏移,变成 不规则的卷积(感觉本质上,就是让CNN自己去学习感受野). 思想来源于STN(Spatial Transform Network),但它们有着巨大的差别: STN得到的是全局(global)的变换,也就是说所得的的变换(旋转.缩放等)都是对整幅图片有效的,因而一幅图片只有一个变换.但许多图片是复杂的, 有多个目标,不同目标的变换方式不同,一个变换包打天下不成.因而出现了…