SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    视频生成

    共 48 篇文章
    排序
    发布更新浏览点赞
    Wan2.1 GP:基于阿里视频生成模型Wan 2.1,8G显存即可生成视频

    Wan2.1 GP:基于阿里视频生成模型Wan 2.1,8G显存即可生成视频

    Wan2.1 GP是一个基于阿里视频生成模型Wan 2.1的优化模型,专为普通消费级显卡用户优化,降低资源需求,同时提供强大的视频生成能力。它支持多种生成任务,包括文生视频(T2V)、图生视频(I2V...
    视频模型# Wan 2.1# Wan2.1 GP# 视频生成
    9个月前
    02330
    OpenAI计划将视频生成工具Sora引入ChatGPT,拓展AI创作能力

    OpenAI计划将视频生成工具Sora引入ChatGPT,拓展AI创作能力

    在本周五的一次Discord办公时间会议上,OpenAI的高管透露了其计划将AI视频生成工具 Sora 集成到广受欢迎的消费者聊天机器人 ChatGPT 中。这一举措标志着OpenAI正致力于进一步扩...
    早报# OpenAI# Sora# 视频生成
    9个月前
    02250
    字节跳动推出统一的视频生成框架Phantom :通过跨模态对齐实现主体一致性的视频生成

    字节跳动推出统一的视频生成框架Phantom :通过跨模态对齐实现主体一致性的视频生成

    字节跳动的研究人员推出一个统一的视频生成框架Phantom ,通过跨模态对齐实现主体一致性的视频生成(Subject-to-Video, S2V),用于单主体和多主体参考,构建在现有的文本到视频和图像...
    新技术# Phantom# 字节跳动# 视频生成
    8个月前
    02750
    Adobe 推出全新 Firefly 应用程序,扩展生成式 AI 产品线

    Adobe 推出全新 Firefly 应用程序,扩展生成式 AI 产品线

    Adobe发布了全新的Firefly 应用程序,这是一款集生成图像、矢量和视频于一体的全面创意工具。它不仅提供了无与伦比的创意控制能力,还与 Adobe Creative Cloud 应用程序深度集成...
    早报# Adobe# Firefly# 视频生成
    10个月前
    02650
    新型图生视频模型VidCRAFT3:能够同时控制相机运动、物体运动和光照方向

    新型图生视频模型VidCRAFT3:能够同时控制相机运动、物体运动和光照方向

    复旦大学、浙江大学、华为诺亚方舟实验室、西湖大学的研究人员推出新型高质量图像到视频生成模型VidCRAFT3 ,能够同时控制相机运动、物体运动和光照方向。它通过解耦这些视觉元素的控制,实现了对生成视频...
    新技术# VidCRAFT3# 视频生成
    10个月前
    03640
    新型视频生成技术Magic 1-For-1:通过优化内存消耗和推理延迟,快速生成高质量的视频内容

    新型视频生成技术Magic 1-For-1:通过优化内存消耗和推理延迟,快速生成高质量的视频内容

    北京大学、Hedra和英伟达的研究人员推出新型视频生成技术Magic 1-For-1 ,通过将复杂的文本到视频(T2V)生成任务分解为两个更简单的子任务:文本到图像(T2I)生成和图像到视频( I2V...
    视频模型# Magic 1-For-1# 视频生成
    10个月前
    02180
    字节跳动推出基于修正流Transformer 架构的新型图像和视频生成模型家族Goku

    字节跳动推出基于修正流Transformer 架构的新型图像和视频生成模型家族Goku

    香港大学和字节跳动的研究人员推出新型图像和视频生成模型家族Goku,它基于修正流Transformer 架构,实现了行业领先的图像和视频联合生成性能。Goku 的目标是通过高质量的视觉内容生成,推动媒...
    视频模型# Goku# 字节跳动# 视频生成
    10个月前
    04150
    字节跳动推出新型身份保持视频生成方法EchoVideo

    字节跳动推出新型身份保持视频生成方法EchoVideo

    字节跳动推出新型身份保持视频生成方法EchoVideo ,旨在通过多模态特征融合解决传统方法中存在的“复制粘贴”现象和身份相似度低的问题。该方法能够生成高质量、连贯且一致的视频内容,同时保持人物的身份...
    新技术# EchoVideo# 视频生成
    10个月前
    02480
    新型视频生成框架GS-DiT:通过伪4D高斯场实现对视频内容的精确4D控制

    新型视频生成框架GS-DiT:通过伪4D高斯场实现对视频内容的精确4D控制

    香港中文大学多媒体实验室、博智感知交互研究中心和Avolution AI的研究人员推出新型视频生成框架GS-DiT,旨在通过伪4D高斯场实现对视频内容的精确4D控制。GS-DiT通过构建伪4D高斯场并...
    新技术# GS-DiT# 视频生成
    11个月前
    03020
    新型3D感知视频扩散方法DaS:实现对视频生成过程的多样化和精确控制

    新型3D感知视频扩散方法DaS:实现对视频生成过程的多样化和精确控制

    香港科技大学、浙江大学、香港大学、南洋理工大学、武汉大学和德克萨斯农工大学的研究人员推出新型3D感知视频扩散方法“Diffusion as Shader(DaS)”,旨在实现对视频生成过程的多样化和精...
    新技术# DaS# 视频生成
    11个月前
    03080
    基于扩散模型的人类视频生成框架AnchorCrafter:用于创建高保真度的主播风格产品推广视频。

    基于扩散模型的人类视频生成框架AnchorCrafter:用于创建高保真度的主播风格产品推广视频。

    自动生成锚点风格的产品推广视频在在线商务、广告和消费者互动中展现出巨大的潜力。然而,尽管姿态引导的人类视频生成技术取得了显著进展,这一任务仍然充满挑战。特别是将人-物交互(Human-Object I...
    新技术# AnchorCrafter# 视频生成
    1年前
    03030
    Free^2Guide:无梯度框架提升文本到视频(T2V)生成中的文本对齐

    Free^2Guide:无梯度框架提升文本到视频(T2V)生成中的文本对齐

    扩散模型在文本到图像(T2I)和文本到视频(T2V)合成等生成任务中取得了显著成果。然而,在T2V生成中,实现准确的文本对齐仍然是一个具有挑战性的问题,尤其是在处理帧间复杂的时序依赖性时。现有的基于强...
    新技术# Free^2Guide# 视频生成
    1年前
    03080
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Next AI Draw.io

    Next AI Draw.io

    Next AI Draw.io 是一个基于 Next.js 的 Web 应用,将大语言模型(LLM)与 draw.io 的强大图表能力深度集成。用户可通过自然语言指令创建、修改和增强专业图表,无需手动拖拽。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    查看完整榜单