基于视频扩散模型的上色工具AniDoc:用于自动化2D动画制作流程中的线稿着色自动化视频线稿上色是简化动画制作流程、降低劳动力成本的关键技术。然而,传统方法面临多个挑战: 角色设计艺术与线稿草图对齐问题:确保颜色信息准确地映射到线稿中。 时间一致性需求:保证动画帧之间的颜色和风...新技术# AniDoc# 线稿着色1年前02880
零样本多实例视频编辑框架MIVE:能够对视频中的多个独立对象进行精确编辑,而不影响视频中的其他部分近年来,基于人工智能的视频编辑技术取得了显著进展,用户可以通过简单的文本提示轻松编辑视频。然而,现有的零样本视频编辑方法主要集中在全局或单一对象的编辑上,这可能导致视频其他部分发生意外变化。当需要对多...新技术# MIVE# 视频编辑1年前03350
Adobe推出以主题驱动的零样本视频定制新方法SUGARAdobe介绍了一个名为SUGAR(Subject-Driven Video Customization in a Zero-Shot Manner)的新技术,它是一种零样本(zero-shot)方法...新技术# SUGAR1年前02670
视觉-语言模型加速技术FEATHER:实现了超过5倍的性能提升最近的研究表明,尽管视觉信息被高度压缩,视觉-语言模型(VLMs)依然能在多种任务中保持出色的性能。本研究聚焦于一种流行的加速方法——早期修剪视觉标记,并揭示了其成功背后的关键原因。研究人员发现,许多...新技术# FEATHER1年前02540
通过实现空间可扩展和全景动态场景合成的创新框架DynamicScaler:用于生成高质量、可扩展的全景动态场景视频随着对沉浸式 AR/VR 应用和空间智能需求的增加,生成高质量的场景级和 360° 全景视频变得尤为重要。然而,大多数视频扩散模型受限于分辨率和宽高比,限制了它们在场景级动态内容合成中的应用。为了解决...新技术# DynamicScaler1年前02890
新型扩散模型框架VividFace:专门为视频换脸而设计视频换脸技术近年来在各种应用中变得越来越流行,但现有方法主要集中在静态图像上,难以应对视频换脸中的时间一致性和复杂场景问题。为了解决这些问题,香港中文大学 MMLab、商汤科技研究院和 InnoHK ...新技术# VividFace# 视频换脸1年前02850
字节推出CausalFusion:基于解码器的变换器,旨在统一自回归(AR)和扩散模型的生成范式字节跳动介绍了一个名为CausalFusion的模型,它是一个基于解码器的变换器(decoder-only transformer),旨在统一自回归(AR)和扩散模型(diffusion models...新技术# CausalFusion1年前03430
新型图像编辑方法FluxSpace:基于修正流变换器(如Flux)来实现文本引导的图像编辑校正流模型(如 Flux)在图像生成中已成为主导方法,展示了高质量图像合成的卓越能力。然而,尽管它们在视觉生成中表现出色,校正流模型在图像的解耦编辑方面往往表现不佳。这一限制阻碍了在不影响图像无关部分...新技术# FLUX# FluxSpace# 图像编辑1年前03330
多模态音乐生成系统VMB:够从多种输入模态(如文本、图像和视频)中生成音乐多模态音乐生成旨在从多种输入模态(如文本、视频和图像)中生成音乐。尽管现有方法通过使用通用嵌入空间进行多模态融合,在其他任务中表现出色,但在多模态音乐生成中仍面临以下挑战: 数据稀缺:高质量的多模态音...新技术# VMB# 音乐生成1年前03030
ObjectMate:能够在无需微调的情况下,实现对象插入和主题驱动的图像生成对象插入和主体驱动生成是计算机视觉中的两个重要任务,旨在将给定的对象合成到由图像或文本指定的场景中。具体来说: 对象插入:将一个对象无缝地插入到目标场景中,要求合成后的图像在姿态、光照等方面看起来逼真...新技术# ObjectMate# 图像编辑1年前04090
无需微调的推理范式FreeScale:通过 尺度融合 实现更高分辨率的图片生成视觉扩散模型(Diffusion Models)在图像和视频生成领域取得了显著进展,但由于缺乏高分辨率数据和计算资源的限制,它们通常只能在有限的分辨率下进行训练。这阻碍了其生成高保真图像或视频的能力...新技术# FreeScale1年前02630
实例感知结构化字幕框架InstanceCap:实现实例级 和 细粒度 的视频字幕生成,显著提升了字幕与视频之间的一致性和保真度近年来,文本到视频生成技术取得了显著进展,但现有的视频字幕生成方法仍然存在一些问题: 细节不足:传统的视频字幕往往缺乏对视频中物体和场景的细粒度描述,导致生成的视频在细节上不够丰富。 幻觉现象:由于模...新技术# InstanceCap# 字幕1年前03040