SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    视频生成

    共 53 篇文章
    排序
    发布更新浏览点赞
    新型视频生成框架Tora:基于DiT框架构建,专门用于生成受轨迹指导的视频内容

    新型视频生成框架Tora:基于DiT框架构建,专门用于生成受轨迹指导的视频内容

    阿里巴巴推出新型视频生成框架Tora,它基于DiT(Diffusion Transformer)框架构建,专门用于生成受轨迹指导的视频内容。简而言之,Tora能够根据文本、图像、轨迹或这些元素的组合来...
    新技术# Tora# 视频生成
    2年前
    05480
    新型视频生成方法TRF:控制视频内容在给定的起始和结束帧之间进行生成

    新型视频生成方法TRF:控制视频内容在给定的起始和结束帧之间进行生成

    来自马克斯·普朗克智能系统研究所、Adob​​e和加州大学圣地亚哥分校的研究团队推出新型视频生成方法Time Reversal Fusion(时间反转融合,简称TRF),它能够控制视频内容在给定的起始...
    新技术# TRF# 视频生成
    2年前
    05410
    新型框架Uni3C:通过3D增强技术实现对视频生成中相机和人体运动的精确控制

    新型框架Uni3C:通过3D增强技术实现对视频生成中相机和人体运动的精确控制

    阿里达摩院、复旦大学和湖畔实验室的研究人员推出新型框架Uni3C,旨在通过3D增强技术实现对视频生成中相机和人体运动的精确控制。Uni3C通过将相机控制和人体运动控制统一到一个框架中,解决了现有方法中...
    新技术# Uni3C# 人体运动# 视频生成
    9个月前
    05360
    ComfyUI原生支持视频生成模型Mochi,12G显存即可进行生成

    ComfyUI原生支持视频生成模型Mochi,12G显存即可进行生成

    随着技术的不断进步,视频生成领域也在持续创新。近日,ComfyUI 在其最新的 v0.2.7 版本中加入了对 Mochi 模型的原生支持,这标志着 ComfyUI 社区迎来了一次重大升级,即便是使用消...
    工作流# ComfyUI# Mochi# 视频生成
    1年前
    05070
    视频生成通用世界模型WorldDreamer:可以完成自然场景和自动驾驶场景多种视频生成任务

    视频生成通用世界模型WorldDreamer:可以完成自然场景和自动驾驶场景多种视频生成任务

    来自清华和极佳科技的研究人员联手推出了全新的视频生成通用世界模型WorldDreamer。它可以完成自然场景和自动驾驶场景多种视频生成任务,例如文生视频、图生视频、视频编辑、动作序列生视频等。 项目主...
    新技术# WorldDreamer# 视频生成
    2年前
    04980
    新型视频生成方法TrackGo:根据用户的输入精确控制视频中对象的运动

    新型视频生成方法TrackGo:根据用户的输入精确控制视频中对象的运动

    北京航空航天大学和爱诗科技的研究人员推出新型视频生成方法TrackGo,它能够根据用户的输入精确控制视频中对象的运动。这项技术允许用户通过自由形式的遮罩(masks)和箭头来指定目标对象或部分,以及它...
    新技术# TrackGo# 视频生成
    1年前
    04800
    字节跳动推出基于修正流Transformer 架构的新型图像和视频生成模型家族Goku

    字节跳动推出基于修正流Transformer 架构的新型图像和视频生成模型家族Goku

    香港大学和字节跳动的研究人员推出新型图像和视频生成模型家族Goku,它基于修正流Transformer 架构,实现了行业领先的图像和视频联合生成性能。Goku 的目标是通过高质量的视觉内容生成,推动媒...
    视频模型# Goku# 字节跳动# 视频生成
    12个月前
    04670
    新型视频生成框架CustomCrafter:根据文本提示和主题参考图像生成高质量视频

    新型视频生成框架CustomCrafter:根据文本提示和主题参考图像生成高质量视频

    浙江大学、腾讯人工智能实验室和腾讯 PCG ARC 实验室的研究人员推出新型视频生成框架CustomCrafter,它可以根据文本提示和主题参考图像生成高质量视频。这项技术的目标是让用户能够自定义视频...
    新技术# CustomCrafter# 视频生成
    1年前
    04670
    可控图像到视频生成框架SG-I2V:用于在图像到视频的生成过程中实现对象和相机运动的控制

    可控图像到视频生成框架SG-I2V:用于在图像到视频的生成过程中实现对象和相机运动的控制

    图像到视频生成技术已经取得了显著的进步,能够生成高度逼真的视频。然而,调整生成视频中的特定元素,如物体运动或相机移动,通常需要繁琐的试错过程,例如使用不同的随机种子重新生成视频。最近的技术通过微调预训...
    新技术# SG-I2V# 视频生成
    1年前
    04660
    无需预先训练框架MotionClone:通过复制参考视频中的动作来指挥文本导向的视频生成

    无需预先训练框架MotionClone:通过复制参考视频中的动作来指挥文本导向的视频生成

    中国科学技术大学、上海交通大学、香港中文大学和上海人工智能实验室的研究人员推出无需预先训练框架MotionClone,它能够实现一种无需训练的运动克隆,用于可控的视频生成。简单来说,这项技术可以让一个...
    新技术# MotionClone# 视频生成
    2年前
    04550
    新型视频生成技术Dr. Mo:提高视频生成的效率,同时保持或提升视频质量

    新型视频生成技术Dr. Mo:提高视频生成的效率,同时保持或提升视频质量

    新型视频生成技术Dr. Mo(Diffusion Reuse MOtion),这项技术的核心在于提高视频生成的效率,同时保持或提升视频质量。研究团队的关键发现是,在早期去噪步骤中的粗粒度噪声在连续视频...
    新技术# Dr. Mo# 视频生成
    1年前
    04470
    视频生成框架ReCamMaster:能够根据新的相机轨迹重新渲染输入视频的动态场景

    视频生成框架ReCamMaster:能够根据新的相机轨迹重新渲染输入视频的动态场景

    浙江大学、快手科技、中国香港中文大学、华中科技大学的研究人员推出一种创新的视频生成框架ReCamMaster,能够根据新的相机轨迹重新渲染输入视频的动态场景。该技术的核心在于通过预训练的文本到视频(t...
    新技术# ReCamMaster# 动态场景# 视频生成
    11个月前
    04070
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Clawdbot/Moltbot

    Clawdbot/Moltbot

    Clawdbot 是一款可在您自己的设备上运行的个人 AI 助手。它在您已使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及扩展渠道(如 BlueBubbles、Matrix、Zalo 和 Zalo Personal)上为您提供应答。它可以在 macOS/iOS/Android 上进行语音交谈,并能渲染一个您可控制的实时画布。网关仅是控制平面——核心产品是助手本身。
    Skills.sh

    Skills.sh

    Vercel 近日上线了一个名为 skills.sh 的新站点,专门用于发现、浏览和安装 AI 智能体的“技能”(Skills)。
    Situation Monitor

    Situation Monitor

    Situation Monitor 是由开发者 Reggie James 创建的一个免费、开源的全球风险监测平台。它通过一张交互式地图,实时整合并可视化全球范围内的关键地缘政治与安全信息,帮助用户快速掌握潜在冲突热点和战略动态。
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Awesome Clawdbot(Moltbot) Skills

    新Awesome Clawdbot(Moltbot) Skills

    社区维护了一份名为 Awesome Clawdbot (Moltbot) Skills 的精选技能集合。该列表收录了 565 项以上 来自 ClawdHub(Moltbot 官方公共技能注册表)的技能,并按功能类别组织,便于浏览与安装。
    查看完整榜单