SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    视频模型

    共 166 篇文章
    用于文生视频、图生视频、视频编辑的模型
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型世界模型
    排序
    发布更新浏览点赞
    阿里通义实验室 Wan 团队推出一体化视频编辑框架 VACE

    阿里通义实验室 Wan 团队推出一体化视频编辑框架 VACE

    阿里通义实验室 Wan 团队近日推出了一款专为视频创建和编辑设计的一体化视频编辑框架——VACE。该框架集成了多种视频任务,包括参考到视频生成(R2V)、视频到视频编辑(V2V)和蒙版视频到视频编辑...
    视频模型# VACE# Wan# 通义实验室
    11个月前
    04440
    基于扩散模型的创新技术TrajectoryCrafter :重新定义单目视频中的相机轨迹,能够从单目视频中推断并生成全新的视角

    基于扩散模型的创新技术TrajectoryCrafter :重新定义单目视频中的相机轨迹,能够从单目视频中推断并生成全新的视角

    腾讯和香港中文大学的研究人员推出一项基于扩散模型(diffusion models)的创新技术TrajectoryCrafter ,重新定义单目视频中的相机轨迹,能够从单目视频中推断并生成全新的视角...
    视频模型# TrajectoryCrafter# 相机轨迹
    11个月前
    02780
    腾讯开源混元图生视频模型HunyuanVideo-I2V

    腾讯开源混元图生视频模型HunyuanVideo-I2V

    在腾讯开源其混元视频模型HunyuanVideo之后,经过三个月的等待,腾讯终于推出了专注于图像到视频生成任务的混元图生视频模型HunyuanVideo-I2V。 GitHub:https://git...
    视频模型# HunyuanVideo-I2V# 混元图生视频模型# 腾讯
    11个月前
    03370
    LTX-Video推出0.9.5版本:原生 ComfyUI 支持,关键帧与视频扩展增强可控性

    LTX-Video推出0.9.5版本:原生 ComfyUI 支持,关键帧与视频扩展增强可控性

    时隔近3个月,LTX-Video再次引来更新,随着2025年3月5日发布的v0.9.5版本,LTX-Video带来了多项改进和新特性,进一步增强了用户体验。通过质量提升、功能增强和用户体验改进,LTX...
    视频模型# LTX# LTX Video# 视频生成
    11个月前
    03380
    视频抠像框架MatAnyone:实现高质量、高稳定性的视频抠像

    视频抠像框架MatAnyone:实现高质量、高稳定性的视频抠像

    南洋理工大学和商汤科技研究院的研究人员推出视频抠像(Video Matting)框架MatAnyone,可以实现高质量、高稳定性的视频抠像,即使在复杂的背景和多目标场景中也能保持出色的性能。MatAn...
    视频模型# MatAnyone# 视频抠像
    11个月前
    04300
    Wan2.1 GP:基于阿里视频生成模型Wan 2.1,8G显存即可生成视频

    Wan2.1 GP:基于阿里视频生成模型Wan 2.1,8G显存即可生成视频

    Wan2.1 GP是一个基于阿里视频生成模型Wan 2.1的优化模型,专为普通消费级显卡用户优化,降低资源需求,同时提供强大的视频生成能力。它支持多种生成任务,包括文生视频(T2V)、图生视频(I2V...
    视频模型# Wan 2.1# Wan2.1 GP# 视频生成
    11个月前
    02590
    阿里巴巴通义实验室开源视频生成模型 Wan2.1

    阿里巴巴通义实验室开源视频生成模型 Wan2.1

    在AI技术的浪潮中,视频生成技术正逐渐成为新的热点。阿里巴巴集团通义实验室紧跟技术前沿,于2月21日宣布开源其先进的视频生成模型——WanX 2.1。然而,在发布过程中出现了一个小插曲,模型名称由Wa...
    视频模型# AI视频# Wan2.1# WanX 2.1
    11个月前
    02480
    昆仑万维开源首个面向 AI 短剧创作的视频生成模型 SkyReels-V1和表情动作可控算法 SkyReels-A1

    昆仑万维开源首个面向 AI 短剧创作的视频生成模型 SkyReels-V1和表情动作可控算法 SkyReels-A1

    昆仑万维近日开源了国内首个面向 AI 短剧创作的视频生成模型 SkyReels-V1,以及国内首个 SOTA 级别基于视频基座模型的表情动作可控算法 SkyReels-A1,这款模型已在昆仑万维海外A...
    视频模型# SkyReels-A1# SkyReels-V1# 昆仑万维
    11个月前
    02430
    阶跃星辰开源300 亿参数文生视频模型Step-Video-T2V:能够生成长达 204 帧的高质量视频

    阶跃星辰开源300 亿参数文生视频模型Step-Video-T2V:能够生成长达 204 帧的高质量视频

    由前微软全球副总裁、微软亚洲互联网工程院首席科学家姜大昕创办的AI公司阶跃星辰,开源了一款强大的文生视频模型——Step-Video-T2V。该模型拥有 300 亿参数,能够生成长达 204 帧的高质...
    视频模型# Step-Video-T2V# Step-Video-T2V-Turbo# 文生视频模型
    12个月前
    02980
    新型视频生成技术Magic 1-For-1:通过优化内存消耗和推理延迟,快速生成高质量的视频内容

    新型视频生成技术Magic 1-For-1:通过优化内存消耗和推理延迟,快速生成高质量的视频内容

    北京大学、Hedra和英伟达的研究人员推出新型视频生成技术Magic 1-For-1 ,通过将复杂的文本到视频(T2V)生成任务分解为两个更简单的子任务:文本到图像(T2I)生成和图像到视频( I2V...
    视频模型# Magic 1-For-1# 视频生成
    12个月前
    02240
    字节跳动推出基于修正流Transformer 架构的新型图像和视频生成模型家族Goku

    字节跳动推出基于修正流Transformer 架构的新型图像和视频生成模型家族Goku

    香港大学和字节跳动的研究人员推出新型图像和视频生成模型家族Goku,它基于修正流Transformer 架构,实现了行业领先的图像和视频联合生成性能。Goku 的目标是通过高质量的视觉内容生成,推动媒...
    视频模型# Goku# 字节跳动# 视频生成
    12个月前
    04670
    新型3D感知视频扩散模型Diffusion as Shader:通过3D控制信号实现多样化且精确的视频生成控制

    新型3D感知视频扩散模型Diffusion as Shader:通过3D控制信号实现多样化且精确的视频生成控制

    香港科技大学、浙江大学、香港大学、南洋理工大学、武汉大学和德克萨斯A&M大学的研究人员推出新型3D感知视频扩散模型Diffusion as Shader (DaS) ,旨在通过3D控制信号实现多样化且...
    视频模型# Diffusion as Shader# 视频生成控制
    12个月前
    03090
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    QoderWork

    新QoderWork

    阿里发布旗下首个桌面Agent工具QoderWork,用户无需任何复杂部署工作,输入一句话,QoderWork就能按需调用授权的本地应用,完成文件整理、数据处理、文档生成等任务。
    Clawdbot/Moltbot

    Clawdbot/Moltbot

    Clawdbot 是一款可在您自己的设备上运行的个人 AI 助手。它在您已使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及扩展渠道(如 BlueBubbles、Matrix、Zalo 和 Zalo Personal)上为您提供应答。它可以在 macOS/iOS/Android 上进行语音交谈,并能渲染一个您可控制的实时画布。网关仅是控制平面——核心产品是助手本身。
    Situation Monitor

    Situation Monitor

    Situation Monitor 是由开发者 Reggie James 创建的一个免费、开源的全球风险监测平台。它通过一张交互式地图,实时整合并可视化全球范围内的关键地缘政治与安全信息,帮助用户快速掌握潜在冲突热点和战略动态。
    中国科技云数据胶囊

    中国科技云数据胶囊

    中国科学院旗下的 中国科技云数据胶囊(Data Capsule)提供 20GB 免费存储空间,支持 标准 S3 与 WebDAV 协议,无需手机号绑定,支持微信/QQ/GitHub 第三方登录,非常适合注重隐私、追求开源生态兼容性的科研用户或个人知识管理者。
    Skills.sh

    Skills.sh

    Vercel 近日上线了一个名为 skills.sh 的新站点,专门用于发现、浏览和安装 AI 智能体的“技能”(Skills)。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    查看完整榜单