SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    视频生成模型

    共 32 篇文章
    排序
    发布更新浏览点赞
    亚马逊推出视频生成模型Nova Reel 1.1:生成长达 2 分钟的视频内容

    亚马逊推出视频生成模型Nova Reel 1.1:生成长达 2 分钟的视频内容

    亚马逊于去年 12 月推出了 Nova,这是一套基于 Amazon Bedrock 的基础模型,涵盖了多种功能。其中,Reel 模型专注于视频生成。最初,Reel 只能生成最长 6 秒的视频,但随着最...
    早报# Nova Reel# 亚马逊# 视频生成模型
    8个月前
    02180
    基于Wan2.1-T2V-1.3B的微调模型,能够生成视觉效果更好的视频

    基于Wan2.1-T2V-1.3B的微调模型,能够生成视觉效果更好的视频

    对于低显存的朋友,Wan2.1-T2V-1.3B模型是个不错的视频生成模型,开发者Evados为大家精心微调了一系列适合ComfyUI的Wan2.1-T2V-1.3B模型,这些模型经过实验优化,能够带...
    工作流# Wan2.1-T2V-1.3B# 视频生成模型
    8个月前
    04880
    Runway 发布新一代视频生成模型 Gen-4,聚焦图像生成视频与世界一致性

    Runway 发布新一代视频生成模型 Gen-4,聚焦图像生成视频与世界一致性

    AI 初创公司 Runway 于周一正式发布其新一代生成式 AI 模型 Gen-4,声称这是有史以来最高保真度的视频生成模型之一。Gen-4 已经向 Runway 的个人付费和企业客户推出,其强大的功...
    早报# Gen-4# Runway# 视频生成模型
    9个月前
    03200
    ComfyUI 宣布已原生支持阿里开源视频生成模型Wan2.1

    ComfyUI 宣布已原生支持阿里开源视频生成模型Wan2.1

    阿里巴巴集团通义实验室于 2025 年 2 月 25 日正式开源了其最新一代视频生成模型 Wan2.1。该模型能够根据文本、图像或其他控制信号生成高质量的视频内容,适用于创意设计、影视制作和教育领域等...
    工作流# ComfyUI# Wan2.1# 视频生成模型
    9个月前
    07990
    高通AI研究院推出一个为移动设备优化的视频生成模型MobileVD

    高通AI研究院推出一个为移动设备优化的视频生成模型MobileVD

    高通AI研究院推出了一个为移动设备优化的视频生成模型Mobile Video Diffusion(MobileVD),该模型的目标是在保持生成视频的质量和控制力的同时,显著降低计算需求,使得在移动设备...
    新技术# MobileVD# 视频生成模型
    1年前
    03820
    无需训练的视频细化框架VideoRepair:自动识别和修复文生视频模型生成中的细粒度不对齐问题

    无需训练的视频细化框架VideoRepair:自动识别和修复文生视频模型生成中的细粒度不对齐问题

    最近的文生视频模型在生成高质量视频方面取得了显著进展,但这些模型生成的视频往往与文本提示存在不对齐的情况,尤其是在处理包含多个对象和属性的复杂场景时。为了解决这一问题,北卡罗来纳大学教堂山分校的研究人...
    新技术# VideoRepair# 视频生成模型
    1年前
    03230
    Lightricks推出开源视频生成模型LTX Video,ComfyUI 已原生支持

    Lightricks推出开源视频生成模型LTX Video,ComfyUI 已原生支持

    Lightricks隆重推出全新的开源、社区驱动的视频生成模型LTX Video,ComfyUI也在第一时间宣布支持该模型,LTX-Video 是一个仅20亿参数的基于DiT的视频生成模型,能够实时生...
    工作流# ComfyUI# Lightricks# LTX Video
    1年前
    02,7250
    智谱AI推出CogVideoX 开源模型的升级版本CogVideoX1.5-5B

    智谱AI推出CogVideoX 开源模型的升级版本CogVideoX1.5-5B

    智谱技术团队对于旗下开源视频生成模型CogVideoX进行了升级,今天释出了CogVideoX1.5-5B 系列模型,相比于原有模型,CogVideoX v1.5 将包含 5/10 秒、768P、16...
    视频模型# CogVideoX1.5-5B# 智谱AI# 智谱清影
    10个月前
    06160
    新型视频生成模型家族MarDini:通过将掩码自回归(MAR)技术与扩散模型(DM)相结合,开创了一种高效的视频生成方法

    新型视频生成模型家族MarDini:通过将掩码自回归(MAR)技术与扩散模型(DM)相结合,开创了一种高效的视频生成方法

    Meta AI与阿卜杜拉国王科技大学的研究人员推出了一种新型视频生成模型家族——MarDini。这一模型家族通过将掩码自回归(MAR)技术与扩散模型(DM)相结合,开创了一种高效的视频生成方法。Mar...
    新技术# MarDini# 视频生成模型
    1年前
    03860
    Genmo推出开源视频生成模型天花板Mochi 1,型需 4 块英伟达H100 显卡才可运行

    Genmo推出开源视频生成模型天花板Mochi 1,型需 4 块英伟达H100 显卡才可运行

    Genmo是一家专注于视频生成的AI初创公司,之前都是默默无闻,其官方视频生成产品也是半死不活,但他们在昨天突然放大招开源了一款视频生成模型Mochi 1,号称其性能可与领先的闭源/专有竞争对手(如R...
    视频模型# Genmo# Mochi 1# 视频生成模型
    10个月前
    04840
    Rhymes AI开源视频生成模型Allegro:从简单的文本提示生成高质量的 6 秒视频

    Rhymes AI开源视频生成模型Allegro:从简单的文本提示生成高质量的 6 秒视频

    Rhymes AI在推出多模态原生模型Aria后,又在昨天开源了视频生成模型Allegro,Allegro 使用户能够从简单的文本提示生成高质量的 6 秒视频,帧率为 15 帧每秒,分辨率为 720P...
    视频模型# Allegro# Rhymes AI# 视频生成模型
    10个月前
    04350
    新型视频生成模型Pyramidal Flow:提高视频生成的效率,同时保持生成视频的高质量

    新型视频生成模型Pyramidal Flow:提高视频生成的效率,同时保持生成视频的高质量

    北京大学、快手科技和北京邮电大学的研究人员推出新型视频生成模型Pyramidal Flow,这个模型的目的是提高视频生成的效率,同时保持生成视频的高质量。可以想象一下,你想制作一个视频,里面有一只小猫...
    视频模型# Pyramidal Flow# 视频生成模型
    10个月前
    04780
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Grok

    Grok

    Grok是一款先进的对话式人工智能。Grok 旨在提供高效、准确且自然的对话交互体验,适用于多种应用场景,包括客户服务、虚拟助手、教育辅导等。
    Flowith

    Flowith

    Flowith 是一个基于 AI 的工具,适合深度工作和内容创作。它提供一个直观的画布界面,让用户可以轻松生成长文本、组织知识和协作。它的 AI 代理 Oracle 可以自动规划复杂任务,无需手动提示工程,并支持多种顶级 AI 模型如 GPT-4o 和 Claude 3.5 sonnet。
    ClickHelp AI

    ClickHelp AI

    ClickHelp 正式推出 ClickHelp AI 套件,标志着ClickHelp迈向智能化文档管理的新阶段。这一套件将多个 AI 功能整合为统一平台,旨在为技术写作团队提供更强的生产力和更高的可扩展性。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Dex Camera

    Dex Camera

    这款设备以“现实互动+AI辅助”为核心,让孩子在拍照探索中自然学外语,目前已完成480万美元融资,支持多语言及方言,同时通过多重安全设计与隐私政策保障儿童使用。
    MemU

    MemU

    MemU 是一个开源的 AI 伴侣记忆框架,具有高准确性、快速检索和低成本的特点。它作为一个智能的“记忆文件夹”,能够适应不同的 AI 伴侣应用场景。通过 MemU,你可以构建真正记住你的 AI 伴侣。它们能够学习你的身份、关注点,并在每次互动中与你共同成长。
    查看完整榜单