SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航

    视频生成框架

    共 7 篇文章
    排序
    发布更新浏览点赞
    字节跳动提出MAGREF:支持多参考图像和文本提示的高质量视频生成框架

    字节跳动提出MAGREF:支持多参考图像和文本提示的高质量视频生成框架

    近年来,随着扩散模型等深度生成技术的发展,视频生成能力取得了显著进步。然而,在涉及多个参考主体的场景中,如何保证各主体之间的视觉一致性、身份一致性和生成稳定性,依然是一个重大挑战。 为了解决这一问题...
    视频模型# MAGREF# 字节跳动# 视频生成框架
    4周前
    0640
    字节跳动推出全新视频生成框架 ATI:用“画轨迹”控制视频运动,对象、视角、局部变形一应俱全!

    字节跳动推出全新视频生成框架 ATI:用“画轨迹”控制视频运动,对象、视角、局部变形一应俱全!

    字节跳动 AI 实验室发布了一项令人眼前一亮的视频生成技术 —— ATI(Any Trajectory Instruction),它让普通人也能通过“画轨迹”的方式,精准控制视频中物体的运动、镜头的移...
    视频模型# ATI# ATI-Wan2.1 14B# 字节跳动
    2个月前
    01000
    视频生成框架RepVideo:通过重新思考跨层表示来提高文生视频模型的性能

    视频生成框架RepVideo:通过重新思考跨层表示来提高文生视频模型的性能

    南洋理工大学和上海人工智能实验室的研究人员推出视频生成框架RepVideo,旨在通过重新思考跨层表示来提高文本到视频(Text-to-Video, T2V)扩散模型的性能。该框架通过积累邻近层的特征来...
    新技术# RepVideo# 视频生成框架
    6个月前
    01550
    端到端的高质量ID一致性人类跳舞视频生成新框架StableAnimator

    端到端的高质量ID一致性人类跳舞视频生成新框架StableAnimator

    近年来,人像动画生成模型在图像和视频领域取得了显著进展,但它们在身份一致性(ID一致性)方面仍然面临挑战。传统的扩散模型虽然能够生成高质量的视频,但在长时间序列中保持人物的身份特征(如面部表情、发型等...
    新技术# StableAnimator# 视频生成框架
    7个月前
    02100
    新型视频生成框架VideoGuide:改善视频生成模型在时间连续性方面的性能,同时保持甚至提高生成视频的图像质量

    新型视频生成框架VideoGuide:改善视频生成模型在时间连续性方面的性能,同时保持甚至提高生成视频的图像质量

    韩国科学技术研究院推出新型框架VideoGuide,它能够改善视频生成模型在时间连续性方面的性能,同时保持甚至提高生成视频的图像质量。这就意味着,使用VideoGuide,可以让现有的视频生成模型在不...
    新技术# VideoGuide# 视频生成框架
    9个月前
    03290
    新型视频生成框架MovieDreamer:专门用于制作长篇视频内容,比如电影

    新型视频生成框架MovieDreamer:专门用于制作长篇视频内容,比如电影

    浙江大学和阿里巴巴的研究人员推出新型视频生成框架MovieDreamer,专门用于制作长篇视频内容,比如电影。与传统的短时视频生成技术不同,MovieDreamer能够处理复杂的叙事结构和情节发展,同...
    新技术# MovieDreamer# 视频生成框架
    12个月前
    06460
    阿里推出新型视频生成框架I4VGen:无需训练且即插即用的视频扩散推理框架

    阿里推出新型视频生成框架I4VGen:无需训练且即插即用的视频扩散推理框架

    阿里推出新型视频生成框架I4VGen,这是一个无需训练(training-free)且即插即用(plug-and-play)的视频扩散推理框架,它通过强化图像技术来提升文本到视频(text-to-vi...
    新技术# I4VGen# 视频生成框架
    1年前
    05060
    没有了
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Open ASR 排行榜

    Open ASR 排行榜

    Open ASR 排行榜 对 Hugging Face Hub 上的语音识别模型进行排名和评估。我们报告平均 WER(字错误率)(⬇️ 越低越好)和 RTFx(实时因子)(⬆️ 越高越好),模型根据其平均 WER 从低到高进行排名。
    TTSMaker

    TTSMaker

    TTSMaker是一款在线文本转语音工具,也称为AI语音生成器,它可以将文本转换为音频,并且可以播放或下载音频文件。
    BabelDOC

    BabelDOC

    BabelDOC 是新一代智能 PDF 翻译工具,采用先进的排版保持技术,为您提供专业级的双语对照翻译体验。无论是前沿学术论文,还是商业分析报告,BabelDOC 都能帮您轻松跨越语言藩篱,同时完美呈现原文档的精致排版。
    Poe

    Poe

    Poe 不仅仅是一个聊天应用,它是一个集成了多模型互动、自定义应用创建和多样化工具的综合性平台。无论是希望通过多种 AI 模型解决问题的用户,还是希望探索 AI 创造力的开发者,Poe 都提供了丰富的可能性。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    Reddit Answers

    Reddit Answers

    Reddit Answers 是一款基于 AI 的对话式搜索工具,允许用户提出问题并获得简洁的回答。这些回答是从相关社区(subreddits)中的真实用户帖子中提取的信息,并以简明的格式呈现,类似于 ChatGPT 或 Perplexity 等工具的回答风格。
    查看完整榜单