视觉-语言预训练入门指南_天天热点

视觉-语言预训练入门指南_天天热点

Datawhale干货作者:张义杰单位:中国移动云能力中心前言视觉-语言(Vision-Language,VL)是计算机视觉和自然语言处理这两个研究领域

用于语言引导视频分割的局部-全局语境感知Transformer

0 引言随着Transformer的大火,NLP任务和CV任务的壁垒逐渐被打通。视频分割一直是一项极具挑战的任务,因为它对理解整个视频内容和各种语