SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    视频模型

    共 187 篇文章
    用于文生视频、图生视频、视频编辑的模型
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型世界模型
    排序
    发布更新浏览点赞
    阿里旗下PAI项目组开源了视频生成模型Wan 2.1 的控制模型Wan2.1-Fun系列,支持Canny、Depth、Pose、MLSD等多种模式

    阿里旗下PAI项目组开源了视频生成模型Wan 2.1 的控制模型Wan2.1-Fun系列,支持Canny、Depth、Pose、MLSD等多种模式

    阿里旗下PAI项目组开源了视频生成模型Wan 2.1 的控制模型,支持不同的控制条件,如Canny、Depth、Pose、MLSD等,同时支持使用轨迹控制。 模型地址:https://huggingf...
    视频模型# Wan 2.1# Wan2.1-Fun-1.3B-Control# Wan2.1-Fun-1.3B-InP
    1年前
    03320
    AccVideo:通过知识蒸馏技术,将HunyuanVideo模型生成速度提高了 8.5 倍,同时保持生成质量

    AccVideo:通过知识蒸馏技术,将HunyuanVideo模型生成速度提高了 8.5 倍,同时保持生成质量

    视频扩散模型是一种强大的生成模型,能够生成高质量的视频内容。然而,传统的视频扩散模型在生成视频时需要大量的迭代去噪步骤,这使得生成过程非常缓慢且计算成本高昂。例如,HunyuanVideo 模型在单个...
    视频模型# AccVideo# HunyuanVideo# 知识蒸馏
    1年前
    05330
    通用视频生成控制模型PP-VCtrl:引入辅助条件编码器,能够灵活对接各类控制模块

    通用视频生成控制模型PP-VCtrl:引入辅助条件编码器,能够灵活对接各类控制模块

    在数字创意蓬勃发展的当下,视频生成技术已成为内容创作的核心驱动力之一。然而,尽管文本到视频的扩散模型取得了显著进展,但在精确控制生成内容的时空特征方面仍存在诸多挑战。广告创意、影视后期制作、直播带货...
    视频模型# PP-VCtrl# 视频生成控制模型
    1年前
    05780
    用于生成自然动态“说话肖像”视频的新型框架KDTalker

    用于生成自然动态“说话肖像”视频的新型框架KDTalker

    利物浦大学、蚂蚁集团、西交利物浦大学、昆山杜克大学和理光软件研究中心推出新型框架 KDTalker,用于从单张图像和音频生成自然且动态的“说话肖像”(talking portrait)视频。该框架结合...
    视频模型
    1年前
    02920
    用于从单张图像生成灵活视角 3D 场景的框架FlexWorld:从单张图像生成具有灵活视角(如 360° 旋转和缩放)的高质量 3D 场景

    用于从单张图像生成灵活视角 3D 场景的框架FlexWorld:从单张图像生成具有灵活视角(如 360° 旋转和缩放)的高质量 3D 场景

    中国人民大学、北京市大数据重点实验室、清华大学、北京师范大学和字节跳动的研究人员推出一种用于从单张图像生成灵活视角 3D 场景的框架FlexWorld,从单张图像生成具有灵活视角(如 360° 旋转和...
    视频模型# 3D 场景# FlexWorld
    1年前
    04730
    阶跃星辰开源图生视频模型 Step-Video-TI2V:30B参数,运动幅度和镜头运动可控

    阶跃星辰开源图生视频模型 Step-Video-TI2V:30B参数,运动幅度和镜头运动可控

    在2025年2月,阶跃星辰开源了两款Step系列多模态大模型——Step-Video-T2V视频生成模型和Step-Audio语音模型。现在,阶跃星辰进一步扩展其开源贡献,推出了基于30B参数Step...
    视频模型# Step-Video-TI2V# 图生视频模型# 阶跃星辰
    1年前
    02090
    英伟达推出世界生成与自适应多模态控制Cosmos-Transfer1

    英伟达推出世界生成与自适应多模态控制Cosmos-Transfer1

    英伟达推出了一个名为 Cosmos World Foundation Model Platform 的平台,旨在为 Physical AI(物理人工智能)提供定制化的世界模型(World Founda...
    视频模型# Cosmos-Transfer1# 英伟达
    1年前
    04110
    阿里通义实验室推出新型模型LHM:能够在几秒钟内从单张图像重建出可动画化的人体三维模型

    阿里通义实验室推出新型模型LHM:能够在几秒钟内从单张图像重建出可动画化的人体三维模型

    阿里通义实验室推出新型模型LHM,能够在几秒钟内从单张图像重建出可动画化的人体三维模型。该模型利用多模态变换器架构,有效融合了人体位置特征和图像特征,通过注意力机制实现了几何和视觉领域的联合推理。 项...
    视频模型# LHM# 阿里通义实验室
    1年前
    06090
    潞晨科技开源视频生成模型 Open-Sora 2.0,号称性能接近 OpenAI Sora

    潞晨科技开源视频生成模型 Open-Sora 2.0,号称性能接近 OpenAI Sora

    潞晨科技宣布推出开源视频生成模型 Open-Sora 2.0,并全面开源模型权重、推理代码及分布式训练全流程。这款模型仅用 20 万美元(相当于 224 张 GPU 的计算成本)便成功训练出商业级 1...
    视频模型# Open-Sora 2.0# OpenAI# Sora
    1年前
    03840
    阿里通义实验室 Wan 团队推出一体化视频编辑框架 VACE

    阿里通义实验室 Wan 团队推出一体化视频编辑框架 VACE

    阿里通义实验室 Wan 团队近日推出了一款专为视频创建和编辑设计的一体化视频编辑框架——VACE。该框架集成了多种视频任务,包括参考到视频生成(R2V)、视频到视频编辑(V2V)和蒙版视频到视频编辑...
    视频模型# VACE# Wan# 通义实验室
    1年前
    05220
    基于扩散模型的创新技术TrajectoryCrafter :重新定义单目视频中的相机轨迹,能够从单目视频中推断并生成全新的视角

    基于扩散模型的创新技术TrajectoryCrafter :重新定义单目视频中的相机轨迹,能够从单目视频中推断并生成全新的视角

    腾讯和香港中文大学的研究人员推出一项基于扩散模型(diffusion models)的创新技术TrajectoryCrafter ,重新定义单目视频中的相机轨迹,能够从单目视频中推断并生成全新的视角...
    视频模型# TrajectoryCrafter# 相机轨迹
    1年前
    02830
    腾讯开源混元图生视频模型HunyuanVideo-I2V

    腾讯开源混元图生视频模型HunyuanVideo-I2V

    在腾讯开源其混元视频模型HunyuanVideo之后,经过三个月的等待,腾讯终于推出了专注于图像到视频生成任务的混元图生视频模型HunyuanVideo-I2V。 GitHub:https://git...
    视频模型# HunyuanVideo-I2V# 混元图生视频模型# 腾讯
    1年前
    03970
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Meshy

    Meshy

    Meshy 是一款非常适合初学者和专业用户的 3D 模型生成工具。无论是快速建模、3D 打印还是动画设计,它都能轻松应对。如果你对 3D 模型创建感兴趣,不妨试试 Meshy,让生成式 AI 为你的创意插上翅膀!
    Flova

    新Flova

    Flova AI 最近宣布集成字节跳动最新的视频生成模型——Seedance 2.0。这不仅仅是一个新模型的上线,更意味着普通创作者现在也能轻松制作出长达 60 至 90 秒、角色稳定、剧情连贯的电影级短剧。
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    即梦 CLI

    即梦 CLI

    即梦 CLI (Jimeng CLI) 是字节跳动官方推出的面向 AI Agent 的命令行工具包。它打破了图形界面的限制,让任何 AI 智能体(如基于 OpenClaw 的助手)都能直接调用即梦强大的 Seedance 2.0 旗舰模型,实现图片与视频的自动化生成。
    BuildCores

    BuildCores

    BuildCores 是一款集 3D 组装预览、智能兼容性检测、全球比价 于一体的在线装机工具。无论你是首次装机的新手,还是追求极致性能的发烧友,都能在手机或电脑上轻松规划、验证并优化你的 PC 配置。
    查看完整榜单