Segment Anything Model 2 (SAM 2) 是一个在物体分割任务中表现出色的模型,但在视...
2024-11-21 152
尽管线性层的量化技术已经广泛应用于深度学习模型中,但在加速注意力机制方面的应...
2024-11-21 86
近年来,基础视觉语言模型(VLMs)的发展彻底改变了计算机视觉领域的研究方向。这...
2024-11-21 90
中国科学院大学、中国科学院自动化研究所和中国铁塔的研究人员介绍了一种名为“Cont...
2024-11-21 76
DiT架构因其强大的生成能力而在图像、视频和语音合成等多个领域展现出巨大潜力。然...
2024-11-21 90
中国科学技术大学的研究人员推出视频编辑方法STABLEV2V,旨在解...
2024-11-21 80
尽管基于图像的虚拟试穿技术已取得显著进展,但在生成高保真度和适应性强的拟合图...
2024-11-21 82
东南大学、马克斯普朗克信息学研究所、腾讯微信和加州大学伯克利分校的研究人员推...
2024-11-21 78
新加坡南洋理工大学、上海人工智能实验室和北京大学的研究人员推出新型3D生成框架G...
2024-11-21 74
草图动画作为一种强大的视觉叙事工具,从简单的手工翻页涂鸦发展到了专业的工作室...
2024-11-21 92
视频生成是一个复杂而多样的任务,涉及多个条件的控制,如摄像机轨迹、文本提示和...
2024-11-20 92
基于校正流的DiT模型,如FLUX和OpenSora,在图像和视频生成领域展示了卓越的性能。...
2024-11-19 82