图生视频

排序

发布更新浏览点赞

韩国科学技术院提出 ALG 方法：显著提升图生视频模型的动态性

图像到视频（Image-to-Video, I2V）模型近年来取得了长足进展，能够根据一张静态图像和文本提示生成动态视频，实现更强的视觉控制。然而，研究发现，这类模型往往生成的视频过于静态，动态性远不...

视频模型 # ALG # 图生视频

9个月前

01660

谷歌为 Veo 3 添加图生视频功能，AI 视频创作更进一步

谷歌今天宣布，其 AI 视频生成模型 Veo 3 已新增对图生视频的支持。这项功能已通过 Gemini 应用和新推出的 Flow 工具向用户开放。该功能最初在 5 月的 Google I/O 开...

早报 # Veo 3 # 图生视频 # 谷歌

9个月前

02410

如何在谷歌Veo 3中实现图生视频（I2V）的角色一致性？实用技巧分享

在使用Veo 3 进行图像生成视频任务时，一个常见的挑战是：如何在不同场景中保持角色形象的一致性。尤其是在需要生成多个片段、切换背景或环境的情况下，AI 容易“忘记”角色原本的样子。来自用户 @Ma...

提示词 # Veo 3 # 图生视频 # 角色一致性

10个月前

05800

新型图像到视频生成技术 Frame In-N-Out：突破传统视频生成中帧边界限制，实现更自由、更具创意的视频生成效果

弗吉尼亚大学和Adobe Research的研究人员推出新型图像到视频生成技术 Frame In-N-Out，突破传统视频生成中帧边界限制，实现更自由、更具创意的视频生成效果。具体来说，Frame I...

新技术 # Frame In-N-Out # 图生视频

10个月前

03400

腾讯推出新型图生视频框架FlexiAct：实现灵活的视频动作克隆

腾讯和清华大学的研究人员推出新型图生视频框架FlexiAct，实现灵活的动作控制，能够在异构场景（即具有不同空间结构、骨骼结构或视角的场景）中将参考视频中的动作迁移到任意目标图像上，同时保持动作动态和...

视频模型 # FlexiAct # 图生视频

11个月前

03760

ComfyUI已原生支持LTX-Video 0.9.5：支持文生视频、图生视频及多帧控制

ComfyUI 官方宣布，LTX-Video 0.9.5 已获得全面支持！此次更新带来了闪电般的速度和全新控制水平，包括多关键帧控制、质量提升和更长的视频支持。这些功能现已完全集成到 ComfyUI ...

工作流 # ComfyUI # LTX-Video 0.9.5 # 图生视频

1年前

01,0880

Luma AI正式上线Ray2模型图生视频功能

Luma AI于今年1月推出了其新一代文生视频和图生视频模型——Ray2。不过，在上个月，Ray2的文生视频版本率先在Dream Machine平台上线，而今天，官方正式宣布Ray2的图生视频版本也已...

早报 # Luma AI # Ray2模型 # 图生视频

1年前

02510

图生视频框架Through-The-Mask：将静态图像转换为基于文本描述的真实视频序列

Meta和耶路撒冷希伯来大学的研究人员推出图生视频框架Through-The-Mask，旨在将静态图像转换为基于文本描述的真实视频序列。该框架通过引入基于掩码的运动轨迹作为中间表示，能够准确地动画化多...

新技术 # Through-The-Mask # 图生视频

1年前

03030

MotiF：通过引导模型关注更多运动区域来改善文本对齐和运动生成

文本-图像到视频生成（TI2V）是一项旨在根据文本描述从静态图像生成动态视频的技术。尽管这一领域已经取得了一定进展，但现有方法在生成与文本提示良好对齐的视频时仍面临显著挑战，尤其是在指定运动细节方面...

新技术 # MotiF # 图生视频

1年前

03690

ObjCtrl-2.5D：用于图像到视频（I2V）生成中的训练无关对象控制技术

图像到视频（I2V）生成任务的目标是从单张图像生成一段连贯的视频，通常涉及对目标对象进行空间移动或变形。现有的方法大多依赖于2D轨迹来表示对象的运动，这虽然简单但存在局限性：无法捕捉用户意图：2D轨...

新技术 # ObjCtrl-2.5D # 图生视频

1年前

03080

基于CogVideoX打造的ComfyUI图生视频工作流

基于智谱开源的图生视频模型CogVideoX打造的ComfyUI工作流，作者采用了外绘（outpainting）技术来实现更高分辨率视频的生成，此外，作者还调整了大语言模型（LLM）的系统提示，使得输...

工作流 # CogVideoX # 图生视频

1年前

05260

新颖的图生视频方法PhysGen：能够将一张静态图片转换成一段真实感强、物理上可信、时间上连贯的视频

伊利诺伊大学香槟分校推出一种新颖的图像到视频生成方法PhysGen，它能够将一张静态图片转换成一段真实感强、物理上可信、时间上连贯的视频。简单来说，就是给定一张图片，比如一个球在斜坡上，PhysGen...

新技术 # PhysGen # 图生视频

2年前

05310

加载更多