SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    视频模型

    共 148 篇文章
    用于文生视频、图生视频、视频编辑的模型
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型
    排序
    发布更新浏览点赞
    PUSA V1.0:以500 美元成本超越 WAN-I2V-14B 的高效视频生成模型

    PUSA V1.0:以500 美元成本超越 WAN-I2V-14B 的高效视频生成模型

    由香港城市大学、华为研究院、腾讯、岭南大学等机构联合提出,PUSA V1.0 是一个基于矢量化时间步适应(VTA) 的新型视频扩散模型,实现了极低资源消耗下的高质量视频生成能力。 项目主页:https...
    视频模型# PUSA V1.0# WAN-I2V-14B# 视频生成模型
    5个月前
    04380
    清华大学推出SketchColour:基于扩散变换器的高效 2D 动画自动上色方案

    清华大学推出SketchColour:基于扩散变换器的高效 2D 动画自动上色方案

    清华大学的研究人员提出了一种全新的 2D 动画着色方法——SketchColour。该方法基于扩散变换器(DiT)架构,能够将黑白草图序列自动转换为连贯的彩色动画,显著提升动画制作效率。 项目主页:h...
    视频模型# 2D 动画自动上色# SketchColour
    5个月前
    01440
    StreamDiT:实现实时流式文本到视频生成的新一代扩散模型

    StreamDiT:实现实时流式文本到视频生成的新一代扩散模型

    近年来,随着基于变换器(Transformer)的扩散模型向数十亿参数扩展,文本到视频(Text-to-Video, T2V)生成技术取得了显著进展。尽管当前模型已能生成高质量视频内容,但它们通常只能...
    视频模型# StreamDiT# 流式视频生成模型
    5个月前
    02960
    LTX Studio为其开源视频生成模型 LTX Video 推出三款全新 LoRA控制模型,为开源视频模型带来前所未有的控制力

    LTX Studio为其开源视频生成模型 LTX Video 推出三款全新 LoRA控制模型,为开源视频模型带来前所未有的控制力

    LTX Studio 为其开源视频生成模型 LTX Video 推出了三项全新的 LoRA 控制模块,让 AI 视频创作进入一个更具操控性与表现力的新阶段。 Depth Control: LTX-Vi...
    视频模型# LTX Studio# LTX Video
    5个月前
    01280
    DLoRAL:一种兼顾细节与时间一致性的视频超分辨率新方法

    DLoRAL:一种兼顾细节与时间一致性的视频超分辨率新方法

    在现实世界视频超分辨率(Real-VSR)任务中,如何从低质量(LQ)视频中恢复出既细节丰富又时间连贯的高质量(HQ)视频,是一个极具挑战性的问题。尤其是在使用预训练扩散模型(如 Stable Dif...
    视频模型# DLoRAL# 视频超分辨率
    5个月前
    03210
    Character.AI 推出 TalkingMachines:音频驱动的实时视频生成模型,打造“FaceTime 风格”AI 视频交互

    Character.AI 推出 TalkingMachines:音频驱动的实时视频生成模型,打造“FaceTime 风格”AI 视频交互

    知名 AI 角色平台 Character.AI 发布了一项引人注目的研究成果——TalkingMachines,一个基于扩散模型的新型自回归视频生成系统。该系统仅需一张静态图像和一段语音输入,即可生成...
    视频模型# Character.AI# TalkingMachines
    5个月前
    01710
    中科大 & 港科大联合推出 LongAnimation :实现长动画自动上色的新框架

    中科大 & 港科大联合推出 LongAnimation :实现长动画自动上色的新框架

    来自中国科学技术大学与香港科技大学的研究团队联合提出了一种名为 LongAnimation 的新型动画着色框架。该框架旨在实现长动画序列的自动化着色,并在整个动画过程中保持长期的颜色一致性。 项目主页...
    视频模型# LongAnimation# 动画自动上色
    5个月前
    01800
    UltraVideo 与 UltraWAN:首个支持原生 UHD 视频生成的开源数据集与模型

    UltraVideo 与 UltraWAN:首个支持原生 UHD 视频生成的开源数据集与模型

    随着高质量视频内容需求的快速增长,如电影级超高清(UHD)制作、沉浸式媒体和短视频创作,对文本到视频(T2V)模型的能力提出了更高要求。 然而,现有公开数据集在分辨率、图像质量及字幕细节方面存在明显不...
    视频模型# UltraVideo# UltraWAN# UltraWanComfy
    6个月前
    03430
    EdgeTAM:Meta 与南洋理工等联合推出可在手机运行的视频分割模型,比 SAM 2 快 22 倍

    EdgeTAM:Meta 与南洋理工等联合推出可在手机运行的视频分割模型,比 SAM 2 快 22 倍

    由 Meta Reality 实验室、南洋理工大学 和 上海人工智能实验室 联合提出的新模型 EdgeTAM 引起了广泛关注。该模型是对 Segment Anything Model 2(SAM 2...
    视频模型# EdgeTAM# SAM 2# 视频分割模型
    6个月前
    02330
    Midjourney 正式发布 V1 视频模型:从文本到视频,AI创作迈入新阶段

    Midjourney 正式发布 V1 视频模型:从文本到视频,AI创作迈入新阶段

    6月18日,Midjourney 宣布正式推出其首款视频生成模型 V1,标志着这家以图像生成闻名的 AI 公司,正式进军视频内容创作领域。 这一更新不仅打通了原有的图文生成生态,还实现了从文本直接生成...
    视频模型# Midjourney
    6个月前
    01110
    MiniMax正式发布Hailuo 02:全球首个能生成高复杂度体操动作的视频模型

    MiniMax正式发布Hailuo 02:全球首个能生成高复杂度体操动作的视频模型

    MiniMax宣布推出全新视频生成模型——Hailuo 02,这是目前全球唯一一个能够高质量生成如“体操运动”这类高复杂度场景的AI视频模型。 地址:https://hailuoai.com/crea...
    视频模型# Hailuo 02# MiniMax
    6个月前
    01880
    字节跳动提出MAGREF:支持多参考图像和文本提示的高质量视频生成框架

    字节跳动提出MAGREF:支持多参考图像和文本提示的高质量视频生成框架

    近年来,随着扩散模型等深度生成技术的发展,视频生成能力取得了显著进步。然而,在涉及多个参考主体的场景中,如何保证各主体之间的视觉一致性、身份一致性和生成稳定性,依然是一个重大挑战。 为了解决这一问题...
    视频模型# MAGREF# 字节跳动# 视频生成框架
    6个月前
    02240
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    OpenStock

    OpenStock

    OpenStock 是昂贵市场平台的开源替代品。追踪实时价格、设置个性化提醒并探索详细的公司洞察——公开构建,为所有人服务,永久免费。
    Phota Labs

    Phota Labs

    PhotaLabs不是通用世界的幻象制造机,而是专属于你的个人视觉模型。它学习你的真实照片和视频,理解你的外貌、关系、环境与审美,然后以此为基础,帮你重新看见、延伸并重温那些只属于你的时刻。
    Next AI Draw.io

    Next AI Draw.io

    Next AI Draw.io 是一个基于 Next.js 的 Web 应用,将大语言模型(LLM)与 draw.io 的强大图表能力深度集成。用户可通过自然语言指令创建、修改和增强专业图表,无需手动拖拽。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Figma Make

    Figma Make

    Figma Make是一款类似的AI驱动工具,更侧重于创意构思和原型设计。用户可以通过输入提示词创建Web应用原型。这一原型应用支持协作,用户可以通过提示助手更改或添加特定元素。如果团队中有开发者,他们可以直接修改代码以进行必要的调整。
    ZenMux

    ZenMux

    ZenMux 是全球首个企业级模型聚合平台,提供 AI 模型保险服务。我们不仅为开发者提供统一的 API 来访问全球领先的大型语言模型,还通过智能路由算法自动选择最佳模型,并提供保险支持的 AI 输出质量保障(即将推出),全面解决企业对 AI 幻觉和输出不稳定的担忧。通过 ZenMux,开发者可以通过单一接口调用来自 OpenAI、Anthropic、Google 和 DeepSeek 等提供商的模型,同时受益于智能路由、故障转移以及保险支持的质量保障服务。
    查看完整榜单