SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    图生视频

    共 13 篇文章
    排序
    发布更新浏览点赞
    韩国科学技术院提出 ALG 方法:显著提升图生视频模型的动态性

    韩国科学技术院提出 ALG 方法:显著提升图生视频模型的动态性

    图像到视频(Image-to-Video, I2V)模型近年来取得了长足进展,能够根据一张静态图像和文本提示生成动态视频,实现更强的视觉控制。然而,研究发现,这类模型往往生成的视频过于静态,动态性远不...
    视频模型# ALG# 图生视频
    8个月前
    01610
    谷歌为 Veo 3 添加图生视频功能,AI 视频创作更进一步

    谷歌为 Veo 3 添加图生视频功能,AI 视频创作更进一步

    谷歌今天宣布,其 AI 视频生成模型 Veo 3 已新增对图生视频的支持。这项功能已通过 Gemini 应用 和新推出的 Flow 工具 向用户开放。 该功能最初在 5 月的 Google I/O 开...
    早报# Veo 3# 图生视频# 谷歌
    8个月前
    02350
    如何在谷歌Veo 3中实现图生视频(I2V)的角色一致性?实用技巧分享

    如何在谷歌Veo 3中实现图生视频(I2V)的角色一致性?实用技巧分享

    在使用Veo 3 进行图像生成视频任务时,一个常见的挑战是:如何在不同场景中保持角色形象的一致性。尤其是在需要生成多个片段、切换背景或环境的情况下,AI 容易“忘记”角色原本的样子。 来自用户 @Ma...
    提示词# Veo 3# 图生视频# 角色一致性
    9个月前
    05520
    新型图像到视频生成技术 Frame In-N-Out:突破传统视频生成中帧边界限制,实现更自由、更具创意的视频生成效果

    新型图像到视频生成技术 Frame In-N-Out:突破传统视频生成中帧边界限制,实现更自由、更具创意的视频生成效果

    弗吉尼亚大学和Adobe Research的研究人员推出新型图像到视频生成技术 Frame In-N-Out,突破传统视频生成中帧边界限制,实现更自由、更具创意的视频生成效果。具体来说,Frame I...
    新技术# Frame In-N-Out# 图生视频
    10个月前
    03290
    腾讯推出新型图生视频框架FlexiAct:实现灵活的视频动作克隆

    腾讯推出新型图生视频框架FlexiAct:实现灵活的视频动作克隆

    腾讯和清华大学的研究人员推出新型图生视频框架FlexiAct,实现灵活的动作控制,能够在异构场景(即具有不同空间结构、骨骼结构或视角的场景)中将参考视频中的动作迁移到任意目标图像上,同时保持动作动态和...
    视频模型# FlexiAct# 图生视频
    10个月前
    03710
    ComfyUI已原生支持LTX-Video 0.9.5:支持文生视频、图生视频及多帧控制

    ComfyUI已原生支持LTX-Video 0.9.5:支持文生视频、图生视频及多帧控制

    ComfyUI 官方宣布,LTX-Video 0.9.5 已获得全面支持!此次更新带来了闪电般的速度和全新控制水平,包括多关键帧控制、质量提升和更长的视频支持。这些功能现已完全集成到 ComfyUI ...
    工作流# ComfyUI# LTX-Video 0.9.5# 图生视频
    1年前
    01,0250
    Luma AI正式上线Ray2模型图生视频功能

    Luma AI正式上线Ray2模型图生视频功能

    Luma AI于今年1月推出了其新一代文生视频和图生视频模型——Ray2。不过,在上个月,Ray2的文生视频版本率先在Dream Machine平台上线,而今天,官方正式宣布Ray2的图生视频版本也已...
    早报# Luma AI# Ray2模型# 图生视频
    1年前
    02480
    图生视频框架Through-The-Mask:将静态图像转换为基于文本描述的真实视频序列

    图生视频框架Through-The-Mask:将静态图像转换为基于文本描述的真实视频序列

    Meta和耶路撒冷希伯来大学的研究人员推出图生视频框架Through-The-Mask,旨在将静态图像转换为基于文本描述的真实视频序列。该框架通过引入基于掩码的运动轨迹作为中间表示,能够准确地动画化多...
    新技术# Through-The-Mask# 图生视频
    1年前
    03000
    MotiF:通过引导模型关注更多运动区域来改善文本对齐和运动生成

    MotiF:通过引导模型关注更多运动区域来改善文本对齐和运动生成

    文本-图像到视频生成(TI2V) 是一项旨在根据文本描述从静态图像生成动态视频的技术。尽管这一领域已经取得了一定进展,但现有方法在生成与文本提示良好对齐的视频时仍面临显著挑战,尤其是在指定运动细节方面...
    新技术# MotiF# 图生视频
    1年前
    03660
    ObjCtrl-2.5D:用于图像到视频(I2V)生成中的训练无关对象控制技术

    ObjCtrl-2.5D:用于图像到视频(I2V)生成中的训练无关对象控制技术

    图像到视频(I2V)生成任务的目标是从单张图像生成一段连贯的视频,通常涉及对目标对象进行空间移动或变形。现有的方法大多依赖于2D轨迹来表示对象的运动,这虽然简单但存在局限性: 无法捕捉用户意图:2D轨...
    新技术# ObjCtrl-2.5D# 图生视频
    1年前
    03060
    基于CogVideoX打造的ComfyUI图生视频工作流

    基于CogVideoX打造的ComfyUI图生视频工作流

    基于智谱开源的图生视频模型CogVideoX打造的ComfyUI工作流,作者采用了外绘(outpainting)技术来实现更高分辨率视频的生成,此外,作者还调整了大语言模型(LLM)的系统提示,使得输...
    工作流# CogVideoX# 图生视频
    1年前
    05260
    新颖的图生视频方法PhysGen:能够将一张静态图片转换成一段真实感强、物理上可信、时间上连贯的视频

    新颖的图生视频方法PhysGen:能够将一张静态图片转换成一段真实感强、物理上可信、时间上连贯的视频

    伊利诺伊大学香槟分校推出一种新颖的图像到视频生成方法PhysGen,它能够将一张静态图片转换成一段真实感强、物理上可信、时间上连贯的视频。简单来说,就是给定一张图片,比如一个球在斜坡上,PhysGen...
    新技术# PhysGen# 图生视频
    1年前
    05290
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    QClaw

    新QClaw

    腾讯推出QClaw ,这是基于 OpenClaw 进行深度产品化封装的“官方一键安装包”。它的目标非常明确:让强大的 AI Agent 能力,像安装普通软件一样简单,并直接融入中国人的国民级应用——微信和 QQ。
    纳米漫剧流水线

    纳米漫剧流水线

    国内首个工业级 AI 漫剧智能体生产平台 ——“纳米漫剧流水线” 启动公开测试。该平台面向漫剧工作室、视频制作机构与专业创作者,直击行业 “效率与品质难以兼顾” 的长期痛点,以高效量产、品质可控、风格统一为核心,正式开启 AI 漫剧工业化生产新时代。
    CoPaw

    CoPaw

    阿里云旗下阿里桌面 Agent 工具 CoPaw 正式开源,CoPaw 原生支持钉钉、飞书、QQ、Discord、iMessage 等聊天软件和平台,内置了多种 Skills,用户可一键本地部署也可通过阿里云计算巢和魔搭社区创空间实现一键云端部署,并调用千问系列等主流模型,是业界部署门槛最低的 Agent 工具之一。
    Cutia

    Cutia

    Cutia 是一个开源、基于浏览器的视频编辑工具,旨在成为 CapCut 的最佳替代品。它坚持“本地优先”的理念,让你无需安装任何重型软件,只需打开浏览器,即可享受专业级的多轨道剪辑体验,且全程无订阅、无追踪、无水印。
    Joker of Academics(小丑学术期刊 )

    Joker of Academics(小丑学术期刊 )

    Joker 🤡 of Academics(小丑学术期刊 ) 是一本完全经过同行评审的开放获取期刊,致力于严肃研究非严肃的学术成果。我们发表敢于风趣的严谨研究、不知何故居然行得通的荒诞主义方法论,以及应用于可能并不需要它的领域的批判理论。
    查看完整榜单