SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    视频模型

    共 148 篇文章
    用于文生视频、图生视频、视频编辑的模型
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型
    排序
    发布更新浏览点赞
    用于从单张图像生成灵活视角 3D 场景的框架FlexWorld:从单张图像生成具有灵活视角(如 360° 旋转和缩放)的高质量 3D 场景

    用于从单张图像生成灵活视角 3D 场景的框架FlexWorld:从单张图像生成具有灵活视角(如 360° 旋转和缩放)的高质量 3D 场景

    中国人民大学、北京市大数据重点实验室、清华大学、北京师范大学和字节跳动的研究人员推出一种用于从单张图像生成灵活视角 3D 场景的框架FlexWorld,从单张图像生成具有灵活视角(如 360° 旋转和...
    视频模型# 3D 场景# FlexWorld
    9个月前
    03540
    LIFT:利用人类反馈进行文生视频模型对齐的新型微调方法

    LIFT:利用人类反馈进行文生视频模型对齐的新型微调方法

    文本到视频(T2V)生成模型近年来取得了显著进展,能够生成高质量的合成视频。然而,这些模型在将合成视频与人类偏好(例如,准确反映文本描述)对齐方面仍然存在不足。复旦大学、上海人工智能科学院和阿德莱德大...
    视频模型# LIFT# 微调# 文生视频模型
    10个月前
    03520
    StableAvatar:首个端到端生成无限长度虚拟人视频的扩散模型

    StableAvatar:首个端到端生成无限长度虚拟人视频的扩散模型

    你是否曾想过,仅凭一张静态照片和一段语音,就能让照片中的人物“开口说话”,并持续数分钟自然表达?这正是音频驱动虚拟人视频生成(Audio-Driven Talking Head Generation...
    视频模型# StableAvatar# 虚拟人
    4个月前
    03430
    UltraVideo 与 UltraWAN:首个支持原生 UHD 视频生成的开源数据集与模型

    UltraVideo 与 UltraWAN:首个支持原生 UHD 视频生成的开源数据集与模型

    随着高质量视频内容需求的快速增长,如电影级超高清(UHD)制作、沉浸式媒体和短视频创作,对文本到视频(T2V)模型的能力提出了更高要求。 然而,现有公开数据集在分辨率、图像质量及字幕细节方面存在明显不...
    视频模型# UltraVideo# UltraWAN# UltraWanComfy
    6个月前
    03430
    阿里淘天 推出基于 DiT 的生成式视频修复方法Vivid-VR:概念蒸馏 + 双分支控制实现高纹理与时间连贯

    阿里淘天 推出基于 DiT 的生成式视频修复方法Vivid-VR:概念蒸馏 + 双分支控制实现高纹理与时间连贯

    老旧视频模糊、噪点多、细节丢失,能否通过 AI 实现自然且真实的画质增强? 传统视频修复方法往往在提升分辨率的同时,引入伪影、纹理失真或帧间抖动。而基于扩散模型的新一代生成技术,虽然具备强大的细节生成...
    视频模型# Vivid-VR# 视频修复
    3个月前
    03350
    CogVideoX-Fun-V1.1-Reward-LoRAs:通过奖励反向传播技术训练Lora,以优化CogVideoX-Fun-V1.1生成的视频

    CogVideoX-Fun-V1.1-Reward-LoRAs:通过奖励反向传播技术训练Lora,以优化CogVideoX-Fun-V1.1生成的视频

    CogVideoX-Fun-V1.1-Reward-LoRAs是通过奖励反向传播技术训练Lora,以优化CogVideoX-Fun-V1.1生成的视频,使其更好地与人类偏好保持一致。 地址:https...
    视频模型# CogVideoX-Fun-V1.1# CogVideoX-Fun-V1.1-Reward-LoRAs
    10个月前
    03350
    LTX-Video推出0.9.5版本:原生 ComfyUI 支持,关键帧与视频扩展增强可控性

    LTX-Video推出0.9.5版本:原生 ComfyUI 支持,关键帧与视频扩展增强可控性

    时隔近3个月,LTX-Video再次引来更新,随着2025年3月5日发布的v0.9.5版本,LTX-Video带来了多项改进和新特性,进一步增强了用户体验。通过质量提升、功能增强和用户体验改进,LTX...
    视频模型# LTX# LTX Video# 视频生成
    9个月前
    03320
    腾讯开源混元图生视频模型HunyuanVideo-I2V

    腾讯开源混元图生视频模型HunyuanVideo-I2V

    在腾讯开源其混元视频模型HunyuanVideo之后,经过三个月的等待,腾讯终于推出了专注于图像到视频生成任务的混元图生视频模型HunyuanVideo-I2V。 GitHub:https://git...
    视频模型# HunyuanVideo-I2V# 混元图生视频模型# 腾讯
    9个月前
    03290
    新型视频法线估计模型 NormalCrafter :能够从任意长度的开放世界视频中生成具有时间一致性和细粒度细节的法线序列

    新型视频法线估计模型 NormalCrafter :能够从任意长度的开放世界视频中生成具有时间一致性和细粒度细节的法线序列

    香港理工大学、腾讯 PCG ARC 实验室、香港城市大学和华中科技大学的研究人员推出新型视频法线估计模型 NormalCrafter ,它能够从任意长度的开放世界视频中生成具有时间一致性和细粒度细节的...
    视频模型# NormalCrafter# 视频法线估计模型
    7个月前
    03230
    ltx-video-0.9-vae-finetune:基于 LTX Video 0.9 VAE 进行的微调VAE模型

    ltx-video-0.9-vae-finetune:基于 LTX Video 0.9 VAE 进行的微调VAE模型

    ltx-video-0.9-vae-finetune 是由开发者 spacepxl 基于 LTX Video 0.9 VAE 进行的微调VAE模型,旨在解决该模型中常见的棋盘伪影问题。通过专注于解码器...
    视频模型# ltx-video-0.9-vae-finetune# VAE模型
    10个月前
    03220
    新型自回归视频生成模型NOVA:能够在无需向量量化的情况下,高效地生成视频

    新型自回归视频生成模型NOVA:能够在无需向量量化的情况下,高效地生成视频

    北京邮电大学、中国科学院计算技术研究所、大连理工大学和北京智源研究院的研究人员提出了一种名为 NOVA 的新型自回归视频生成模型。该模型能够在无需向量量化的情况下,通过重新表述视频生成问题,实现了在时...
    视频模型# NOVA# 自回归视频生成模型
    10个月前
    03220
    DLoRAL:一种兼顾细节与时间一致性的视频超分辨率新方法

    DLoRAL:一种兼顾细节与时间一致性的视频超分辨率新方法

    在现实世界视频超分辨率(Real-VSR)任务中,如何从低质量(LQ)视频中恢复出既细节丰富又时间连贯的高质量(HQ)视频,是一个极具挑战性的问题。尤其是在使用预训练扩散模型(如 Stable Dif...
    视频模型# DLoRAL# 视频超分辨率
    5个月前
    03210
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    OpenStock

    OpenStock

    OpenStock 是昂贵市场平台的开源替代品。追踪实时价格、设置个性化提醒并探索详细的公司洞察——公开构建,为所有人服务,永久免费。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    YouMind

    YouMind

    YouMind 是一款重新构想的 AI 写作工具,帮助每个人轻松开启创作之旅。捕捉灵感、收集素材、撰写草稿,并将其转化为精炼的文章、播客、视频等丰富内容。
    On-Device AI

    On-Device AI

    On-Device AI 为苹果用户提供了一种全新的 AI 使用方式,无需网络连接,即可随时随地享受 AI 的强大功能。它不仅保护了您的隐私,还通过本地运行提升了性能和效率。
    Poe

    Poe

    Poe 不仅仅是一个聊天应用,它是一个集成了多模型互动、自定义应用创建和多样化工具的综合性平台。无论是希望通过多种 AI 模型解决问题的用户,还是希望探索 AI 创造力的开发者,Poe 都提供了丰富的可能性。
    FLORA

    FLORA

    FLORA 是一款创意图像和视频创作工具,接入了顶级 AI 绘画和视频模型。它通过优雅的交互设计,帮助创意团队构建结构化、可扩展的工作流,提升创作速度和控制力,支持多人实时协作。
    查看完整榜单