SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航

    文生视频

    共 8 篇文章
    排序
    发布更新浏览点赞
    ComfyUI已原生支持LTX-Video 0.9.5:支持文生视频、图生视频及多帧控制

    ComfyUI已原生支持LTX-Video 0.9.5:支持文生视频、图生视频及多帧控制

    ComfyUI 官方宣布,LTX-Video 0.9.5 已获得全面支持!此次更新带来了闪电般的速度和全新控制水平,包括多关键帧控制、质量提升和更长的视频支持。这些功能现已完全集成到 ComfyUI ...
    工作流# ComfyUI# LTX-Video 0.9.5# 图生视频
    4个月前
    04540
    多代理协作框架GENMAC:实现复杂的文本到视频生成,特别是针对组合性文本提示的生成

    多代理协作框架GENMAC:实现复杂的文本到视频生成,特别是针对组合性文本提示的生成

    香港大学、清华大学和微软研究院的研究人员推出多代理协作框架GENMAC,旨在实现复杂的文本到视频生成,特别是针对组合性文本提示的生成。传统的文本到视频生成模型在处理复杂场景时常常面临挑战,例如多个对象...
    新技术# GENMAC# 文生视频
    7个月前
    02030
    MVideo:用于生成具有精确、流畅动作的长时视频

    MVideo:用于生成具有精确、流畅动作的长时视频

    无限光年、上海交通大学和复旦大学的研究人员推出新型框架MVideo,它专门设计用于生成具有精确、流畅动作的长时视频。MVideo通过结合文本提示和掩码序列(mask sequences)作为额外的运动...
    新技术# MVideo# 文生视频
    8个月前
    03850
    CAMI2V:引入物理约束提升文生视频模型中的相机控制精度

    CAMI2V:引入物理约束提升文生视频模型中的相机控制精度

    浙江大学计算机科学与技术学院的研究团队推出一个名为CAMI2V(Camera-Controlled Image-to-Video Diffusion Model)的模型,它是一个基于扩散模型的图像到视...
    新技术# CAMI2V# 文生视频# 相机控制
    9个月前
    03050
    新型文本到视频生成框架VideoTetris:专门设计来解决现有方法在处理复杂场景(如多对象或对象数量动态变化的长视频)生成时面临的挑战

    新型文本到视频生成框架VideoTetris:专门设计来解决现有方法在处理复杂场景(如多对象或对象数量动态变化的长视频)生成时面临的挑战

    来自北京大学和快手科技的研究人员推出新型文本到视频生成框架VideoTetris,此框架专门设计来解决现有方法在处理复杂场景(如多对象或对象数量动态变化的长视频)生成时面临的挑战。VideoTetri...
    新技术# VideoTetris# 北京大学# 快手
    1年前
    07240
    文生视频新技术T2V-Turbo:快速生成高质量的视频,并且能够根据文本描述来创建视频内容

    文生视频新技术T2V-Turbo:快速生成高质量的视频,并且能够根据文本描述来创建视频内容

    来自加州大学圣巴巴拉分校、谷歌和滑铁卢大学的研究人员推出文生视频新技术T2V-Turbo,它可以快速生成高质量的视频,并且能够根据文本描述来创建视频内容。它将来自混合的不同可微奖励模型的反馈整合到预训...
    新技术# T2V-Turbo# 文生视频
    1年前
    06250
    文生视频新技术FIFO-Diffusion:无需训练即可从文本生成无限长度的视频

    文生视频新技术FIFO-Diffusion:无需训练即可从文本生成无限长度的视频

    首尔国立大学推出文生视频新技术FIFO-Diffusion,它基于预训练的扩散模型,用于文本条件视频生成。简单来说,FIFO-Diffusion能够根据文本描述生成无限长度的视频,而且不需要额外的训练...
    新技术# FIFO-Diffusion# 文生视频
    1年前
    04560
    VideoElevator:利用文生图模型来增强文生视频的质量和细节

    VideoElevator:利用文生图模型来增强文生视频的质量和细节

    来自哈尔滨大学和清华大学的研究团队推出VideoElevator,利用文生图模型来增强文生视频的质量和细节,这个过程是无需训练的,可以直接插入现有的模型中使用,还能利用文生图模型来实现风格迁移,非常方...
    新技术# VideoElevator# 文生图模型# 文生视频
    1年前
    05330
    没有了
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Open ASR 排行榜

    Open ASR 排行榜

    Open ASR 排行榜 对 Hugging Face Hub 上的语音识别模型进行排名和评估。我们报告平均 WER(字错误率)(⬇️ 越低越好)和 RTFx(实时因子)(⬆️ 越高越好),模型根据其平均 WER 从低到高进行排名。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    Proxy

    Proxy

    Proxy是一款非常实用的 AI代理工具,虽然它并不完美,但在处理日常琐事方面表现出色。它的核心优势在于简单易用、无需复杂设置,并且能够主动解决问题。对于忙碌的用户来说,Proxy 是一个值得信赖的数字助手,可以显著提高效率。
    通义万象

    通义万象

    通义万象是阿里云旗下的图像及视频生成平台,凭借其强大的多模态生成能力,正在引领生成式 AI 的发展。除了传统的文生图能力,通义万象现已支持文生视频、图生视频等多种功能,并在插画设计、涂鸦作画、局部重绘、短片创作、配乐生成等场景化应用中表现出色。
    Vibe Kanban

    新Vibe Kanban

    Vibe Kanban 不只是一个任务管理面板,它是人与 AI 协作的新界面。它帮助开发者更好地组织、调度和评估 AI 编码代理的工作成果,从而释放人类工程师的最大价值。
    MGX

    MGX

    MGX (MetaGPT X) 是你的专属 AI 软件开发团队,由团队负责人 Mike、产品经理 Emma、架构师 Bob、工程师 Alex 和数据分析师 David 组成,你可以像与工作中真人同事一样与他们协作。
    查看完整榜单