转载自:https://zhuanlan.zhihu.com/p/34222060 通过作者在专栏里面放的几张响应图我们可以看到:SiamFC并不能区分不同的物体,图片上所有具有语义信息的物体都会得到较大的响应: 但是它在数据集上的表现确实是不错的,那么为什么呢,是因为加了窗函数,将周边的物体抑制掉了,猜测在跟踪的评价数据集中,大部分也是目标物体周围的其他物体较少,因此才能有不错的表现: 接下来作者进行了分析,既然网络所学习到的特征不够好,那么只需要学习到好的特诊好就行了,一个很容易想到的方法就…