视频生成

排序

发布更新浏览点赞

基于解耦身份和运动的主体驱动视频生成的新方法

首尔国立大学、微软亚洲研究院和浦项科技大学的研究人员推出提出了一种**基于解耦身份和运动的主体驱动视频生成（Subject-driven Video Generation via Disentang...

新技术 # 视频生成

10个月前

02820

新型框架Uni3C：通过3D增强技术实现对视频生成中相机和人体运动的精确控制

阿里达摩院、复旦大学和湖畔实验室的研究人员推出新型框架Uni3C，旨在通过3D增强技术实现对视频生成中相机和人体运动的精确控制。Uni3C通过将相机控制和人体运动控制统一到一个框架中，解决了现有方法中...

新技术 # Uni3C # 人体运动 # 视频生成

11个月前

06260

Any2Caption：通过将多样化的输入条件（如文本、图像、视频、人体姿态、相机运动等）转化为结构化的详细字幕，从而实现可控的视频生成

快手和新加坡国立大学的研究人员推出新型框架 Any2Caption ，通过将多样化的输入条件（如文本、图像、视频、人体姿态、相机运动等）转化为结构化的详细字幕，从而实现可控的视频生成。这一框架的核心思...

新技术 # Any2Caption # 视频生成

11个月前

02920

视频生成框架ReCamMaster：能够根据新的相机轨迹重新渲染输入视频的动态场景

浙江大学、快手科技、中国香港中文大学、华中科技大学的研究人员推出一种创新的视频生成框架ReCamMaster，能够根据新的相机轨迹重新渲染输入视频的动态场景。该技术的核心在于通过预训练的文本到视频（t...

新技术 # ReCamMaster # 动态场景 # 视频生成

1年前

04340

LTX-Video推出0.9.5版本：原生 ComfyUI 支持，关键帧与视频扩展增强可控性

时隔近3个月，LTX-Video再次引来更新，随着2025年3月5日发布的v0.9.5版本，LTX-Video带来了多项改进和新特性，进一步增强了用户体验。通过质量提升、功能增强和用户体验改进，LTX...

视频模型 # LTX # LTX Video # 视频生成

1年前

03450

Wan2.1 GP：基于阿里视频生成模型Wan 2.1，8G显存即可生成视频

Wan2.1 GP是一个基于阿里视频生成模型Wan 2.1的优化模型，专为普通消费级显卡用户优化，降低资源需求，同时提供强大的视频生成能力。它支持多种生成任务，包括文生视频（T2V）、图生视频（I2V...

视频模型 # Wan 2.1 # Wan2.1 GP # 视频生成

1年前

02670

OpenAI计划将视频生成工具Sora引入ChatGPT，拓展AI创作能力

在本周五的一次Discord办公时间会议上，OpenAI的高管透露了其计划将AI视频生成工具 Sora 集成到广受欢迎的消费者聊天机器人 ChatGPT 中。这一举措标志着OpenAI正致力于进一步扩...

早报 # OpenAI # Sora # 视频生成

1年前

02300

字节跳动推出统一的视频生成框架Phantom ：通过跨模态对齐实现主体一致性的视频生成

字节跳动的研究人员推出一个统一的视频生成框架Phantom ，通过跨模态对齐实现主体一致性的视频生成（Subject-to-Video, S2V），用于单主体和多主体参考，构建在现有的文本到视频和图像...

新技术 # Phantom # 字节跳动 # 视频生成

11个月前

02880

Adobe 推出全新 Firefly 应用程序，扩展生成式 AI 产品线

Adobe发布了全新的Firefly 应用程序，这是一款集生成图像、矢量和视频于一体的全面创意工具。它不仅提供了无与伦比的创意控制能力，还与 Adobe Creative Cloud 应用程序深度集成...

早报 # Adobe # Firefly # 视频生成

1年前

02710

新型图生视频模型VidCRAFT3：能够同时控制相机运动、物体运动和光照方向

复旦大学、浙江大学、华为诺亚方舟实验室、西湖大学的研究人员推出新型高质量图像到视频生成模型VidCRAFT3 ，能够同时控制相机运动、物体运动和光照方向。它通过解耦这些视觉元素的控制，实现了对生成视频...

新技术 # VidCRAFT3 # 视频生成

1年前

04070

新型视频生成技术Magic 1-For-1：通过优化内存消耗和推理延迟，快速生成高质量的视频内容

北京大学、Hedra和英伟达的研究人员推出新型视频生成技术Magic 1-For-1 ，通过将复杂的文本到视频（T2V）生成任务分解为两个更简单的子任务：文本到图像（T2I）生成和图像到视频（ I2V...

视频模型 # Magic 1-For-1 # 视频生成

1年前

02280

字节跳动推出基于修正流Transformer 架构的新型图像和视频生成模型家族Goku

香港大学和字节跳动的研究人员推出新型图像和视频生成模型家族Goku，它基于修正流Transformer 架构，实现了行业领先的图像和视频联合生成性能。Goku 的目标是通过高质量的视觉内容生成，推动媒...

视频模型 # Goku # 字节跳动 # 视频生成

1年前

04950

加载更多

基于解耦身份和运动的主体驱动视频生成的新方法

新型框架Uni3C：通过3D增强技术实现对视频生成中相机和人体运动的精确控制

Any2Caption：通过将多样化的输入条件（如文本、图像、视频、人体姿态、相机运动等）转化为结构化的详细字幕，从而实现可控的视频生成

视频生成框架ReCamMaster：能够根据新的相机轨迹重新渲染输入视频的动态场景

LTX-Video推出0.9.5版本：原生 ComfyUI 支持，关键帧与视频扩展增强可控性

Wan2.1 GP：基于阿里视频生成模型Wan 2.1，8G显存即可生成视频

OpenAI计划将视频生成工具Sora引入ChatGPT，拓展AI创作能力

字节跳动推出统一的视频生成框架Phantom ：通过跨模态对齐实现主体一致性的视频生成

Adobe 推出全新 Firefly 应用程序，扩展生成式 AI 产品线

新型图生视频模型VidCRAFT3：能够同时控制相机运动、物体运动和光照方向

新型视频生成技术Magic 1-For-1：通过优化内存消耗和推理延迟，快速生成高质量的视频内容

字节跳动推出基于修正流Transformer 架构的新型图像和视频生成模型家族Goku

新JVSClaw

S.H.I.T

ArkClaw

Agency Agents

OpenClaw startups

WorkBuddy

视频生成

网址

新JVSClaw

S.H.I.T

ArkClaw

Agency Agents

OpenClaw startups

WorkBuddy