改进YOLO | 可能这才是用Transformer正确打开YOLO的方式吧?

目前最先进的One-Stage目标检测器的限制是只分别处理每个图像区域,而不考虑目标之间存在的可能关系。这就导致了模型只依赖于高质量的卷积特征