字节跳动推出统一的视频生成框架Phantom :通过跨模态对齐实现主体一致性的视频生成字节跳动的研究人员推出一个统一的视频生成框架Phantom ,通过跨模态对齐实现主体一致性的视频生成(Subject-to-Video, S2V),用于单主体和多主体参考,构建在现有的文本到视频和图像...新技术# Phantom# 字节跳动# 视频生成8个月前02750
Any2Caption:通过将多样化的输入条件(如文本、图像、视频、人体姿态、相机运动等)转化为结构化的详细字幕,从而实现可控的视频生成快手和新加坡国立大学的研究人员推出新型框架 Any2Caption ,通过将多样化的输入条件(如文本、图像、视频、人体姿态、相机运动等)转化为结构化的详细字幕,从而实现可控的视频生成。这一框架的核心思...新技术# Any2Caption# 视频生成8个月前02730
Adobe 推出全新 Firefly 应用程序,扩展生成式 AI 产品线Adobe发布了全新的Firefly 应用程序,这是一款集生成图像、矢量和视频于一体的全面创意工具。它不仅提供了无与伦比的创意控制能力,还与 Adobe Creative Cloud 应用程序深度集成...早报# Adobe# Firefly# 视频生成10个月前02650
字节跳动推出新型身份保持视频生成方法EchoVideo字节跳动推出新型身份保持视频生成方法EchoVideo ,旨在通过多模态特征融合解决传统方法中存在的“复制粘贴”现象和身份相似度低的问题。该方法能够生成高质量、连贯且一致的视频内容,同时保持人物的身份...新技术# EchoVideo# 视频生成11个月前02480
视频生成控制框架Uni3C:通过统一的3D增强方法精确控制视频生成中的相机和人物动作阿里巴巴达摩院、复旦大学和湖畔实验室的研究人员推出Uni3C框架,通过统一的3D增强方法精确控制视频生成中的相机和人物动作。 项目主页:https://ewrfcas.github.io/Uni3C ...新技术# Uni3C# 视频生成7个月前02460
基于解耦身份和运动的主体驱动视频生成的新方法首尔国立大学、 微软亚洲研究院和浦项科技大学的研究人员推出提出了一种**基于解耦身份和运动的主体驱动视频生成(Subject-driven Video Generation via Disentang...新技术# 视频生成7个月前02360
Wan2.1 GP:基于阿里视频生成模型Wan 2.1,8G显存即可生成视频Wan2.1 GP是一个基于阿里视频生成模型Wan 2.1的优化模型,专为普通消费级显卡用户优化,降低资源需求,同时提供强大的视频生成能力。它支持多种生成任务,包括文生视频(T2V)、图生视频(I2V...视频模型# Wan 2.1# Wan2.1 GP# 视频生成9个月前02330
LightX2V:轻量级视频生成推理框架,统一支持多种模态输入随着多模态生成模型的发展,文本到视频(T2V)、图像到视频(I2V)等任务逐渐成为研究热点。然而,不同模型往往使用不同的推理流程,导致部署与调用复杂、资源占用高。 为此,研究人员推出了一个全新的轻量级...视频模型# LightX2V# 视频生成5个月前02290
OpenAI计划将视频生成工具Sora引入ChatGPT,拓展AI创作能力在本周五的一次Discord办公时间会议上,OpenAI的高管透露了其计划将AI视频生成工具 Sora 集成到广受欢迎的消费者聊天机器人 ChatGPT 中。这一举措标志着OpenAI正致力于进一步扩...早报# OpenAI# Sora# 视频生成9个月前02250
新型视频生成技术Magic 1-For-1:通过优化内存消耗和推理延迟,快速生成高质量的视频内容北京大学、Hedra和英伟达的研究人员推出新型视频生成技术Magic 1-For-1 ,通过将复杂的文本到视频(T2V)生成任务分解为两个更简单的子任务:文本到图像(T2I)生成和图像到视频( I2V...视频模型# Magic 1-For-1# 视频生成10个月前02180
Character.AI 发布全新多媒体功能:视频生成和社交动态功能AI 角色平台 Character.AI 宣布推出一系列重大更新,标志着其从传统的文本对话平台向多模态互动创作平台迈出关键一步。这些新功能包括: AvatarFX(视频生成模型) 场景(沉浸式叙事) ...早报# Character.AI# 视频生成6个月前01790
南大、复旦联合英伟达提出LongVie:可控超长视频生成突破1分钟,解决时间不一致难题可控超长视频生成(如生成1分钟以上、场景与动作精准可控的视频)是AI生成领域的核心挑战——现有方法在短视频生成中表现尚可,但扩展到长视频时,常出现时间不一致(帧间突变、物体位置漂移)与视觉质量下降(颜...视频模型# LongVie# 视频生成4个月前01440