SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    图生视频

    共 13 篇文章
    排序
    发布更新浏览点赞
    ComfyUI已原生支持LTX-Video 0.9.5:支持文生视频、图生视频及多帧控制

    ComfyUI已原生支持LTX-Video 0.9.5:支持文生视频、图生视频及多帧控制

    ComfyUI 官方宣布,LTX-Video 0.9.5 已获得全面支持!此次更新带来了闪电般的速度和全新控制水平,包括多关键帧控制、质量提升和更长的视频支持。这些功能现已完全集成到 ComfyUI ...
    工作流# ComfyUI# LTX-Video 0.9.5# 图生视频
    11个月前
    09420
    新型图像到视频扩散模型TRIP:专注于将静态图像转换为动态视频

    新型图像到视频扩散模型TRIP:专注于将静态图像转换为动态视频

    来自中国科学技术大学和HiDream.ai的研究人员推出新型图像到视频扩散模型TRIP(Temporal Residual Learning with Image noise Prior),它专注于将...
    新技术# TRIP# 图生视频
    2年前
    05930
    新颖的图生视频方法PhysGen:能够将一张静态图片转换成一段真实感强、物理上可信、时间上连贯的视频

    新颖的图生视频方法PhysGen:能够将一张静态图片转换成一段真实感强、物理上可信、时间上连贯的视频

    伊利诺伊大学香槟分校推出一种新颖的图像到视频生成方法PhysGen,它能够将一张静态图片转换成一段真实感强、物理上可信、时间上连贯的视频。简单来说,就是给定一张图片,比如一个球在斜坡上,PhysGen...
    新技术# PhysGen# 图生视频
    1年前
    05260
    基于CogVideoX打造的ComfyUI图生视频工作流

    基于CogVideoX打造的ComfyUI图生视频工作流

    基于智谱开源的图生视频模型CogVideoX打造的ComfyUI工作流,作者采用了外绘(outpainting)技术来实现更高分辨率视频的生成,此外,作者还调整了大语言模型(LLM)的系统提示,使得输...
    工作流# CogVideoX# 图生视频
    1年前
    05150
    如何在谷歌Veo 3中实现图生视频(I2V)的角色一致性?实用技巧分享

    如何在谷歌Veo 3中实现图生视频(I2V)的角色一致性?实用技巧分享

    在使用Veo 3 进行图像生成视频任务时,一个常见的挑战是:如何在不同场景中保持角色形象的一致性。尤其是在需要生成多个片段、切换背景或环境的情况下,AI 容易“忘记”角色原本的样子。 来自用户 @Ma...
    提示词# Veo 3# 图生视频# 角色一致性
    8个月前
    04840
    MotiF:通过引导模型关注更多运动区域来改善文本对齐和运动生成

    MotiF:通过引导模型关注更多运动区域来改善文本对齐和运动生成

    文本-图像到视频生成(TI2V) 是一项旨在根据文本描述从静态图像生成动态视频的技术。尽管这一领域已经取得了一定进展,但现有方法在生成与文本提示良好对齐的视频时仍面临显著挑战,尤其是在指定运动细节方面...
    新技术# MotiF# 图生视频
    1年前
    03620
    腾讯推出新型图生视频框架FlexiAct:实现灵活的视频动作克隆

    腾讯推出新型图生视频框架FlexiAct:实现灵活的视频动作克隆

    腾讯和清华大学的研究人员推出新型图生视频框架FlexiAct,实现灵活的动作控制,能够在异构场景(即具有不同空间结构、骨骼结构或视角的场景)中将参考视频中的动作迁移到任意目标图像上,同时保持动作动态和...
    视频模型# FlexiAct# 图生视频
    9个月前
    03610
    新型图像到视频生成技术 Frame In-N-Out:突破传统视频生成中帧边界限制,实现更自由、更具创意的视频生成效果

    新型图像到视频生成技术 Frame In-N-Out:突破传统视频生成中帧边界限制,实现更自由、更具创意的视频生成效果

    弗吉尼亚大学和Adobe Research的研究人员推出新型图像到视频生成技术 Frame In-N-Out,突破传统视频生成中帧边界限制,实现更自由、更具创意的视频生成效果。具体来说,Frame I...
    新技术# Frame In-N-Out# 图生视频
    8个月前
    03120
    ObjCtrl-2.5D:用于图像到视频(I2V)生成中的训练无关对象控制技术

    ObjCtrl-2.5D:用于图像到视频(I2V)生成中的训练无关对象控制技术

    图像到视频(I2V)生成任务的目标是从单张图像生成一段连贯的视频,通常涉及对目标对象进行空间移动或变形。现有的方法大多依赖于2D轨迹来表示对象的运动,这虽然简单但存在局限性: 无法捕捉用户意图:2D轨...
    新技术# ObjCtrl-2.5D# 图生视频
    1年前
    03040
    图生视频框架Through-The-Mask:将静态图像转换为基于文本描述的真实视频序列

    图生视频框架Through-The-Mask:将静态图像转换为基于文本描述的真实视频序列

    Meta和耶路撒冷希伯来大学的研究人员推出图生视频框架Through-The-Mask,旨在将静态图像转换为基于文本描述的真实视频序列。该框架通过引入基于掩码的运动轨迹作为中间表示,能够准确地动画化多...
    新技术# Through-The-Mask# 图生视频
    1年前
    02970
    Luma AI正式上线Ray2模型图生视频功能

    Luma AI正式上线Ray2模型图生视频功能

    Luma AI于今年1月推出了其新一代文生视频和图生视频模型——Ray2。不过,在上个月,Ray2的文生视频版本率先在Dream Machine平台上线,而今天,官方正式宣布Ray2的图生视频版本也已...
    早报# Luma AI# Ray2模型# 图生视频
    12个月前
    02420
    谷歌为 Veo 3 添加图生视频功能,AI 视频创作更进一步

    谷歌为 Veo 3 添加图生视频功能,AI 视频创作更进一步

    谷歌今天宣布,其 AI 视频生成模型 Veo 3 已新增对图生视频的支持。这项功能已通过 Gemini 应用 和新推出的 Flow 工具 向用户开放。 该功能最初在 5 月的 Google I/O 开...
    早报# Veo 3# 图生视频# 谷歌
    7个月前
    02240
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Skills.sh

    Skills.sh

    Vercel 近日上线了一个名为 skills.sh 的新站点,专门用于发现、浏览和安装 AI 智能体的“技能”(Skills)。
    Clawdbot/Moltbot

    Clawdbot/Moltbot

    Clawdbot 是一款可在您自己的设备上运行的个人 AI 助手。它在您已使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及扩展渠道(如 BlueBubbles、Matrix、Zalo 和 Zalo Personal)上为您提供应答。它可以在 macOS/iOS/Android 上进行语音交谈,并能渲染一个您可控制的实时画布。网关仅是控制平面——核心产品是助手本身。
    Situation Monitor

    Situation Monitor

    Situation Monitor 是由开发者 Reggie James 创建的一个免费、开源的全球风险监测平台。它通过一张交互式地图,实时整合并可视化全球范围内的关键地缘政治与安全信息,帮助用户快速掌握潜在冲突热点和战略动态。
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Awesome Clawdbot(Moltbot) Skills

    新Awesome Clawdbot(Moltbot) Skills

    社区维护了一份名为 Awesome Clawdbot (Moltbot) Skills 的精选技能集合。该列表收录了 565 项以上 来自 ClawdHub(Moltbot 官方公共技能注册表)的技能,并按功能类别组织,便于浏览与安装。
    查看完整榜单