SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    视频模型

    共 153 篇文章
    用于文生视频、图生视频、视频编辑的模型
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型
    排序
    发布更新浏览点赞
    智谱AI发布 Kaleido:通过多参考图像生成主体一致视频的 S2V 框架

    新智谱AI发布 Kaleido:通过多参考图像生成主体一致视频的 S2V 框架

    在主体到视频(Subject-to-Video, S2V)生成任务中,目标是根据用户提供的多张目标主体参考图像和文本提示,合成一段主体身份一致、动作自然、背景可控的视频。尽管近期 S2V 模型取得进展...
    视频模型# Kaleido# 智谱AI
    2天前
    070
    智谱AI提出 SSVAE:通过谱结构优化提升视频VAE“可扩散性”的新方法

    新智谱AI提出 SSVAE:通过谱结构优化提升视频VAE“可扩散性”的新方法

    在基于扩散模型的视频生成系统中,视频变分自编码器(VAE) 扮演着关键角色:它将像素空间视频压缩到潜在空间,供扩散模型高效训练。然而,现有视频 VAE 的设计往往过度聚焦于重建保真度,却忽视了一个更根...
    视频模型# SSVAE# 智谱AI
    2天前
    040
    智谱AI发布面向生产级角色动画的生成框架 SCAIL:通过3D一致姿态表征实现影棚级角色动画

    新智谱AI发布面向生产级角色动画的生成框架 SCAIL:通过3D一致姿态表征实现影棚级角色动画

    高质量角色动画长期以来依赖昂贵的动作捕捉设备、繁琐的手动绑定和大量人力修型。尽管近年视频生成模型取得进展,但在复杂动作、风格化角色、多角色交互等场景下,现有方法仍普遍存在结构失真、时间不连贯、身份泄漏...
    视频模型# SCAIL# 智谱AI# 角色动画
    2天前
    090
    智谱AI开源 RealVideo:基于自回归扩散的实时流式对话视频系统

    新智谱AI开源 RealVideo:基于自回归扩散的实时流式对话视频系统

    随着多模态生成技术的发展,用户对虚拟角色的期待已从“能说话”升级为“能自然表达、实时互动、持续存在”。为此,智谱AI推出了 RealVideo —— 一个端到端实时流式视频对话系统,能够将文本对话实时...
    视频模型# RealVideo# 数字人# 智谱AI
    2天前
    070
    AnyTalker:用单人数据生成自然互动的多人对话视频

    新AnyTalker:用单人数据生成自然互动的多人对话视频

    多人对话视频的自动生成,长期以来受限于两个关键难题:一是高质量多人视频数据极难获取,二是多个角色之间的互动行为难以建模。为解决这些问题,来自香港科技大学、Video Rebirth、浙江大学和北京交通...
    视频模型# AnyTalker
    2天前
    060
    巨人网络AI实验室推出YingVideo-MV:音乐驱动的多阶段视频生成框架,让 AI 会“演”一首歌

    巨人网络AI实验室推出YingVideo-MV:音乐驱动的多阶段视频生成框架,让 AI 会“演”一首歌

    巨人网络AI实验室推出 YingVideo-MV,这是一个用于音乐驱动的多阶段视频生成框架,能够从音频信号中自动生成高质量的音乐表演视频。YingVideo-MV 集成了音频语义分析、可解释的镜头规划...
    视频模型# YingVideo-MV
    2周前
    0100
    STARFlow-V:苹果推出标准化流视频生成模型,挑战扩散模型主流地位

    STARFlow-V:苹果推出标准化流视频生成模型,挑战扩散模型主流地位

    苹果最新发布的 STARFlow-V 为视频生成领域带来了全新技术路径——作为一款基于标准化流(Normalizing Flows)的端到端模型,它打破了当前扩散模型主导的格局,凭借全局-局部架构、因...
    视频模型# STARFlow-V# 流视频生成模型# 苹果
    2周前
    0410
    SteadyDancer:用 I2V 范式解决首帧失真,生成身份一致的高保真人像动画

    SteadyDancer:用 I2V 范式解决首帧失真,生成身份一致的高保真人像动画

    人体图像动画技术迎来颠覆性突破!南京大学、腾讯与上海AI实验室联合推出的SteadyDancer框架,通过彻底摒弃传统参考图到视频(R2V)范式,转向图像到视频(I2V)全新思路,从根源上解决了长期困...
    视频模型# SteadyDancer
    2周前
    0700
    腾讯开源HunyuanVideo-1.5:83亿参数实现顶级画质,14G显存消费级显卡即可运行

    腾讯开源HunyuanVideo-1.5:83亿参数实现顶级画质,14G显存消费级显卡即可运行

    在视频生成模型多追求大参数堆料的当下,腾讯混元项目组推出的HunyuanVideo-1.5走出了一条“小而精”的差异化路线。这款仅搭载83亿参数的轻量级视频生成模型,不仅实现了开源领域顶尖的视觉质量与...
    视频模型# HunyuanVideo-1.5# 腾讯
    2周前
    0380
    Kandinsky 5.0 全系列开源:190亿参数视频Pro+轻量版,支持中俄双语+5-10秒HD生成

    Kandinsky 5.0 全系列开源:190亿参数视频Pro+轻量版,支持中俄双语+5-10秒HD生成

    来自俄罗斯的AI企业Sber AI,正式推出新一代扩散模型家族 Kandinsky 5.0,以“全场景覆盖+开源开放”为核心亮点,涵盖视频生成(T2V/I2V)、图像生成(T2I)、图像编辑三大核心能...
    图像模型视频模型# Kandinsky 5.0
    2周前
    0290
    美团 LongCat 团队发布 LongCat-Video:高效长视频生成的开源新标杆

    美团 LongCat 团队发布 LongCat-Video:高效长视频生成的开源新标杆

    美团LongCat团队推出 LongCat-Video,这是一个基础视频生成模型,拥有 13.6B 参数,在文本到视频、图像到视频以及视频续接生成任务中表现出色。它特别擅长高效且高质量的长视频生成,标...
    视频模型# LongCat# LongCat-Video# 美团
    1个月前
    0160
    FlashVSR:首个实时扩散视频超分框架,17 FPS 处理 1408p 视频

    FlashVSR:首个实时扩散视频超分框架,17 FPS 处理 1408p 视频

    视频超分辨率(Video Super-Resolution, VSR)的目标是将低分辨率视频高质量地重建为高分辨率版本。近年来,扩散模型在图像和视频恢复任务中展现出强大能力,但其高延迟、高计算开销和对...
    视频模型# FlashVSR# 视频超分辨率框架
    1个月前
    0170
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Grok

    Grok

    Grok是一款先进的对话式人工智能。Grok 旨在提供高效、准确且自然的对话交互体验,适用于多种应用场景,包括客户服务、虚拟助手、教育辅导等。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    OiiOii AI

    OiiOii AI

    OiiOii.ai 是一个基于多智能体架构的动画生成平台,其核心目标是将动画制作从线性协作流程,转变为端到端的自动化生成。用户只需上传一张图片或输入一段文字描述,系统即可自动完成剧本生成、分镜设计、角色建模、镜头调度、配乐合成与最终渲染,输出一段完整动画视频。
    查看完整榜单