全球讯息:YOLOv8来啦 | 详细解读YOLOv8的改进模块!YOLOv5官方出品YOLOv8,必卷!

全球讯息:YOLOv8来啦 | 详细解读YOLOv8的改进模块!YOLOv5官方出品YOLOv8,必卷!

点击下方名片关注【集智书童】,后台回复【YOLOv8】获取YOLOv8源码以及书童亲自绘制的YOLOv8结构图原图。回顾一下YOLOv5,不然没机会了这里粗略回

极市直播预告丨NeurIPS 2022 Oral-张博航:如何从模型层面获得对抗鲁棒性保证?-每日速讯

极市直播预告丨NeurIPS 2022 Oral-张博航:如何从模型层面获得对抗鲁棒性保证?-每日速讯

↑点击蓝字关注极市平台|极市线上分享第107期|一直以来,为让大家更好地了解学界业界优秀的论文和工作,极市已邀请了超过100位技术大咖嘉宾,

目标检测系列 | 无NMS的端到端目标检测模型,超越OneNet,FCOS等SOTA!|天天要闻

目标检测系列 | 无NMS的端到端目标检测模型,超越OneNet,FCOS等SOTA!|天天要闻

全卷积检测器放弃一对多匹配,采用一对一匹配策略实现端到端检测,但存在收敛速度慢的问题。在本文中重新审视了这两种匹配方法,发现将一对多

DiffusionDet: Diffusion Model for Object Detection

DiffusionDet: Diffusion Model for Object Detection

1 论文信息标题:DiffusionDet:DiffusionModelforObjectDetection作者:ShoufaChen

DiffusionDet:用于对象检测的扩散模型

DiffusionDet:用于对象检测的扩散模型

点击进入—>3D视觉工坊学习交流群DiffusionDet:用于对象检测的扩散模型ShoufaChen1,PeizeSun1,Yibi

天天日报丨超轻目标检测 | 超越 NanoDet-Plus、YOLOv4-Tiny实时性、高精度都是你想要的!

天天日报丨超轻目标检测 | 超越 NanoDet-Plus、YOLOv4-Tiny实时性、高精度都是你想要的!

近年来,压缩高精度卷积神经网络(CNNs)在实时目标检测方面取得了显著进展。为了加快检测速度,轻量级检测器采用单路径主干,卷积层数较少。然

看热讯:Pillar-Base | 超越SECOND、PointPillar等一系列3D目标检测,PillarNet=Pillar王者

看热讯:Pillar-Base | 超越SECOND、PointPillar等一系列3D目标检测,PillarNet=Pillar王者

实时和高性能的3D目标检测对于自动驾驶至关重要。最近表现最好的3D目标检测器主要依赖于基于点或基于3Dvoxel的卷积,这两种方法在板

每日速看!ECCV 2022 | 单点监督目标检测!国科大提出P2BNet:标一个点就能训练出强有力的目标检测器

每日速看!ECCV 2022 | 单点监督目标检测!国科大提出P2BNet:标一个点就能训练出强有力的目标检测

点击下方卡片,关注“CVer”公众号AI CV重磅干货,第一时间送达针对于单点监督的精准目标检测网络:P2BNet目标检测只需要标一个点就行,比强监

环球观热点:Anchor-Free即插即用标签分配 | 平滑标签分配+动态IoU匹配解决标签分配不一致

环球观热点:Anchor-Free即插即用标签分配 | 平滑标签分配+动态IoU匹配解决标签分配不一致

Anchor-free检测器基本上将目标检测表述为密集分类和回归。对于流行的Anchor-free检测器,通常会引入一个单独的预测分支来估计定位的质

今头条!YOLOv7-Pose尝鲜,基于YOLOv7的关键点模型测评

今头条!YOLOv7-Pose尝鲜,基于YOLOv7的关键点模型测评

【前言】目前人体姿态估计总体分为Top-down和Bottom-up两种,与目标检测不同,无论是基于热力图或是基于检测器处理的关键点检测算法,都较为

全球看点:目标检测中的非最大值抑制算法

全球看点:目标检测中的非最大值抑制算法

计算机视觉是人工智能的一个重要领域,它可以识别和理解图像和场景。它包括图像识别、目标检测、图像分割、图像生成、图像超分辨率等多个子领

世界热头条丨YOLOv7来临:论文详读和解析

世界热头条丨YOLOv7来临:论文详读和解析

前言:2022年7月,YOLOv7来临,论文链接:https: arxiv org abs 2207 02696代码链接:https: gi

天天快讯:Shunted Self-Attention | 源于 PvT又高于PvT,解决小目标问题的ViT方法

天天快讯:Shunted Self-Attention | 源于 PvT又高于PvT,解决小目标问题的ViT方法

最近的VisionTransformer(ViT)模型在各种计算机视觉任务中都展示了不错的性能,这要归功于其通过Self-Attention

每日讯息!改进Yolov5 | 用 GSConv+Slim Neck 一步步把 Yolov5 提升到极致!!!

每日讯息!改进Yolov5 | 用 GSConv+Slim Neck 一步步把 Yolov5 提升到极致!!!

目标检测是计算机视觉中一项艰巨的下游任务。对于车载边缘计算平台,大模型很难达到实时检测的要求。而且,由大量深度可分离卷积层构建的轻量

建议背诵 | 字节用4大准则教你设计一个拥有CNN的速度,Transformer精度的模型!

本文作者从实际应用的角度重新审视现有的Transformer。它们中的大多数甚至不如基本的ResNets系列高效,并且偏离了现实的部署场景。这可能是

分割冠军 | 超越Swin v2、PvT v2等模型,ViT-Adaptiver实现ADE20K冠军60.5mIoU

与最近将视觉特定的归纳偏差引入VisionTransformer架构不同,ViT由于缺乏图像的先验信息,在密集预测任务上的性能较差。为了解决这个问

全新Backbone | 模拟CNN创造更具效率的Self-Attention

在本文中提出了一种新的注意力机制,称为交叉注意力,交叉注意力通过交替应用图像Patch内部的注意力而不是整个图像来捕获局部信息,并在单通道

超越 Swin、ConvNeXt | Facebook提出Neighborhood Attention Transformer

本文提出了NeighborhoodAttentionTransformer(NAT),NAT是一种集高效、准确和可扩展的分层Transforme

PolyLoss | 统一CE Loss与Focal Loss,PolyLoss用1行代码+1个超参完成超车!!!

Cross-entropyloss和Focalloss是在训练深度神经网络进行分类问题时最常见的选择。然而,一般来说,一个好的损失函数可以采取更

图解目标检测算法之 YOLO

YOLOv3是目标检测各类算法中非常经典的一款,本文试着图解它的网络架构和基本流程,给想快速了解它的童鞋提供一些参考。1引言近年来,由于在海量

视觉 Transformer 研究的关键问题: 现状及展望

作者:田永林1,2,,王雨桐2,,王建功2,,王晓2,3,,王飞跃2,3,/导读/深度神经网络(Deepneuralnetwork,DNN)由于其突出的性能表现

CVPR 2022|旋转小目标新解法,浙大等提出Oriented RepPoints!

↑点击蓝字关注极市平台作者丨所向披靡的张大刀编辑丨极市平台极市导读本文做为保姆级解读,从他的前前身DCN系列网络开始,再回

一位算法工程师从30+场秋招面试中总结出的超强面经——目标检测篇(含答案)

↑点击蓝字关注极市平台作者丨灯会来源丨极市平台编辑丨极市平台极市导读作者灯会为21届中部985研究生,凭借自己整理的面经,

YOLOv5永不缺席 | YOLO-Pose带来实时性高且易部署的姿态估计模型!!!

本文介绍了YOLO-Pose,一种新的无Heatmap联合检测方法,是基于YOLOv5目标检测框架的姿态估计。现有的基于Heatmap的两阶段方法并

收获17个offer!我的105场秋招面试经验

↑点击蓝字关注极市平台作者丨LeoFerguson编辑丨极市平台极市导读在秋招算法岗大潮中,参加了105场面试,24场笔试

CVPR2022 oral | MetaFormer才是探索Transformer的源泉,衍生PoolFormer速度喜人

Transformer在计算机视觉任务中显示出了巨大的潜力。一个普遍的观念就是,基于注意力的tokenmixermodule对Transform

YOLOv5-Face | 原理超精细讲解、训练步骤还原、C++边缘部署(就要这么学!!!)

近年来,CNN在人脸检测方面已经得到广泛的应用。但是许多人脸检测器都是需要使用特别设计的人脸检测器来进行人脸的检测,而YOLOv5的作者则是把

详解MLP系列|借助傅里叶变换的高效 token mixer:AFNO

↑点击蓝字关注极市平台作者丨科技猛兽编辑丨极市平台极市导读本文提出了一种借助傅里叶变换的高效tokenmixer,AF

CVPR 2022 | 即插即用!助力自监督涨点的ContrastiveCrop开源了!

点击下方卡片,关注“CVer”公众号AI CV重磅干货,第一时间送达【引言】自SimCLR、MoCo等自监督里程碑工作发表以来,对比学习已经在视觉领

改进YOLO | 可能这才是用Transformer正确打开YOLO的方式吧?

目前最先进的One-Stage目标检测器的限制是只分别处理每个图像区域,而不考虑目标之间存在的可能关系。这就导致了模型只依赖于高质量的卷积特征