视频生成

排序

发布更新浏览点赞

基于扩散模型的人类视频生成框架AnchorCrafter：用于创建高保真度的主播风格产品推广视频。

自动生成锚点风格的产品推广视频在在线商务、广告和消费者互动中展现出巨大的潜力。然而，尽管姿态引导的人类视频生成技术取得了显著进展，这一任务仍然充满挑战。特别是将人-物交互（Human-Object I...

新技术 # AnchorCrafter # 视频生成

1年前

03100

Any2Caption：通过将多样化的输入条件（如文本、图像、视频、人体姿态、相机运动等）转化为结构化的详细字幕，从而实现可控的视频生成

快手和新加坡国立大学的研究人员推出新型框架 Any2Caption ，通过将多样化的输入条件（如文本、图像、视频、人体姿态、相机运动等）转化为结构化的详细字幕，从而实现可控的视频生成。这一框架的核心思...

新技术 # Any2Caption # 视频生成

1年前

03010

字节跳动推出统一的视频生成框架Phantom ：通过跨模态对齐实现主体一致性的视频生成

字节跳动的研究人员推出一个统一的视频生成框架Phantom ，通过跨模态对齐实现主体一致性的视频生成（Subject-to-Video, S2V），用于单主体和多主体参考，构建在现有的文本到视频和图像...

新技术 # Phantom # 字节跳动 # 视频生成

11个月前

02960

基于解耦身份和运动的主体驱动视频生成的新方法

首尔国立大学、微软亚洲研究院和浦项科技大学的研究人员推出提出了一种**基于解耦身份和运动的主体驱动视频生成（Subject-driven Video Generation via Disentang...

新技术 # 视频生成

11个月前

02880

LightX2V：轻量级视频生成推理框架，统一支持多种模态输入

随着多模态生成模型的发展，文本到视频（T2V）、图像到视频（I2V）等任务逐渐成为研究热点。然而，不同模型往往使用不同的推理流程，导致部署与调用复杂、资源占用高。为此，研究人员推出了一个全新的轻量级...

视频模型 # LightX2V # 视频生成

9个月前

02770

Adobe 推出全新 Firefly 应用程序，扩展生成式 AI 产品线

Adobe发布了全新的Firefly 应用程序，这是一款集生成图像、矢量和视频于一体的全面创意工具。它不仅提供了无与伦比的创意控制能力，还与 Adobe Creative Cloud 应用程序深度集成...

早报 # Adobe # Firefly # 视频生成

1年前

02730

Wan2.1 GP：基于阿里视频生成模型Wan 2.1，8G显存即可生成视频

Wan2.1 GP是一个基于阿里视频生成模型Wan 2.1的优化模型，专为普通消费级显卡用户优化，降低资源需求，同时提供强大的视频生成能力。它支持多种生成任务，包括文生视频（T2V）、图生视频（I2V...

视频模型 # Wan 2.1 # Wan2.1 GP # 视频生成

1年前

02680

字节跳动推出新型身份保持视频生成方法EchoVideo

字节跳动推出新型身份保持视频生成方法EchoVideo ，旨在通过多模态特征融合解决传统方法中存在的“复制粘贴”现象和身份相似度低的问题。该方法能够生成高质量、连贯且一致的视频内容，同时保持人物的身份...

新技术 # EchoVideo # 视频生成

1年前

02580

OpenAI计划将视频生成工具Sora引入ChatGPT，拓展AI创作能力

在本周五的一次Discord办公时间会议上，OpenAI的高管透露了其计划将AI视频生成工具 Sora 集成到广受欢迎的消费者聊天机器人 ChatGPT 中。这一举措标志着OpenAI正致力于进一步扩...

早报 # OpenAI # Sora # 视频生成

1年前

02320

新型视频生成技术Magic 1-For-1：通过优化内存消耗和推理延迟，快速生成高质量的视频内容

北京大学、Hedra和英伟达的研究人员推出新型视频生成技术Magic 1-For-1 ，通过将复杂的文本到视频（T2V）生成任务分解为两个更简单的子任务：文本到图像（T2I）生成和图像到视频（ I2V...

视频模型 # Magic 1-For-1 # 视频生成

1年前

02300

Character.AI 发布全新多媒体功能：视频生成和社交动态功能

AI 角色平台 Character.AI 宣布推出一系列重大更新，标志着其从传统的文本对话平台向多模态互动创作平台迈出关键一步。这些新功能包括： AvatarFX（视频生成模型）场景（沉浸式叙事） ...

早报 # Character.AI # 视频生成

10个月前

01860

南大、复旦联合英伟达提出LongVie：可控超长视频生成突破1分钟，解决时间不一致难题

可控超长视频生成（如生成1分钟以上、场景与动作精准可控的视频）是AI生成领域的核心挑战——现有方法在短视频生成中表现尚可，但扩展到长视频时，常出现时间不一致（帧间突变、物体位置漂移）与视觉质量下降（颜...

视频模型 # LongVie # 视频生成

7个月前

01610

加载更多