感知域太小,相当于拿着目标图像被裁剪的一个子图去做判断,这是非常难的;
感知域太大,网络会基于一些不相关的信息做出判断;
目标的大小是变化,所以并没有一个万能的感知域适合所以的目标;
有说法是感知域略小于目标更好