用于长视频生成的双速学习系统SLOWFAST-VGEN:模仿了人类大脑中慢速学习和快速学习相结合的互补学习系统
人类拥有一个独特的学习系统,它既能从普遍的世界规律中缓慢学习,也能迅速地将新...
视频对象分割技术SMITE:解决视频内对象的分割问题,特别是在需要任意粒度(即对象可以被分割成不同数量的片段)的情况下
视频对象分割是一项具有挑战性的任务,每个像素必须被准确标记,并且这些标签必须...
Midjourney 推出全新外部图像编辑功能、图像重新纹理化以及下一代AI审查系统
由前 Magic Leap 工程师 David Holz 创立的 AI 图像生成初创公司Midjourney,昨晚...
新型多模态大语言模型PUMA:不仅能理解文本指令,还能根据这些指令创作出精细的图像,或者对现有图像进行精确的编辑
近年来,多模态基础模型在视觉-语言理解领域取得了显著进展,同时也开始探索多模态...