roi pooling是先进行roi projection(即映射)然后再池化 映射是把用来训练的图片的roi映射到最后一层特征层(即卷积层).方法其实很简单,图片经过特征提取后,到最后一层卷积层时,真个图片是原始图片的1/16,你把roi的4个坐标都乘以1/16,也就变成了在这个卷积层上对应的坐标.这和我当时把1920x1200图片转化为960x600进行的gt-roi变换是一样的. 得到roi在最后一层卷积层的坐标后,就把这个roi区域均分成HxW份,每份进行池化,最后再把这么多份conca