SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 942 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    多视角视频生成新技术SynCamMaster:能够从不同的视点生成同步的、一致性高的动态场景视频

    多视角视频生成新技术SynCamMaster:能够从不同的视点生成同步的、一致性高的动态场景视频

    浙江大学、快手科技、清华大学和香港中文大学的研究人员推出一种用于多视角视频生成的技术SynCamMaster,能够从不同的视点生成同步的、一致性高的动态场景视频。这项技术特别适用于虚拟拍摄等应用,它通...
    新技术# SynCamMaster# 多视角视频
    1年前
    03320
    用于组合式文生图新框架GraPE:将复杂的多步生成任务分解为三个独立的步骤

    用于组合式文生图新框架GraPE:将复杂的多步生成任务分解为三个独立的步骤

    文本到图像(T2I)生成任务的目标是从文本提示生成逼真的图像。尽管扩散模型在这一领域取得了显著进展,但现有方法在处理复杂的多步推理和组合性提示时仍面临挑战。特别是,当文本提示包含多个对象及其属性之间的...
    新技术# GraPE# 文生图
    1年前
    03240
    ObjCtrl-2.5D:用于图像到视频(I2V)生成中的训练无关对象控制技术

    ObjCtrl-2.5D:用于图像到视频(I2V)生成中的训练无关对象控制技术

    图像到视频(I2V)生成任务的目标是从单张图像生成一段连贯的视频,通常涉及对目标对象进行空间移动或变形。现有的方法大多依赖于2D轨迹来表示对象的运动,这虽然简单但存在局限性: 无法捕捉用户意图:2D轨...
    新技术# ObjCtrl-2.5D# 图生视频
    1年前
    03010
    用于主题-风格条件图像生成新技术LoRA.rar:通过使用超网络(hypernetworks)来学习合并内容和风格的LoRAs,从而实现个性化图像的快速生成

    用于主题-风格条件图像生成新技术LoRA.rar:通过使用超网络(hypernetworks)来学习合并内容和风格的LoRAs,从而实现个性化图像的快速生成

    三星和帕多瓦大学的研究人员推出一种用于主题-风格条件图像生成技术LoRA.rar,通过使用超网络(hypernetworks)来学习合并内容(subject)和风格(style)的低秩适应参数(LoR...
    新技术# LoRA.rar
    1年前
    02530
    专为DiT架构模型设计的运动转移方法DiTFlow

    专为DiT架构模型设计的运动转移方法DiTFlow

    牛津大学、Snap和MBZUAI的研究人员介绍了一种名为DiTFlow的方法,它是一种专为DiT架构模型设计的运动转移方法。DiTFlow通过分析参考视频,提取出一种名为注意力运动流(Attentio...
    新技术# DiTFlow# DiT模型
    1年前
    03490
    高通AI研究院推出专为移动设备优化的视频编辑模型MoViE:能够在手机上实现每秒12帧的快速视频编辑

    高通AI研究院推出专为移动设备优化的视频编辑模型MoViE:能够在手机上实现每秒12帧的快速视频编辑

    高通AI研究院推出一个专为移动设备优化的视频编辑模型MoViE,能够在手机上实现每秒12帧的快速视频编辑。MoViE通过一系列优化,使得在移动设备上进行视频编辑变得可行,这些优化包括架构优化、轻量级自...
    新技术# MoViE# 视频编辑模型# 高通
    1年前
    03060
    高通AI研究院推出一个为移动设备优化的视频生成模型MobileVD

    高通AI研究院推出一个为移动设备优化的视频生成模型MobileVD

    高通AI研究院推出了一个为移动设备优化的视频生成模型Mobile Video Diffusion(MobileVD),该模型的目标是在保持生成视频的质量和控制力的同时,显著降低计算需求,使得在移动设备...
    新技术# MobileVD# 视频生成模型
    1年前
    03960
    解决图像生成与编辑任务的统一框架UniReal

    解决图像生成与编辑任务的统一框架UniReal

    图像生成和编辑任务在计算机视觉领域中具有广泛的应用,如图像合成、风格迁移、图像修复等。然而,现有的解决方案通常针对特定任务设计,缺乏一个统一的框架来处理多种图像级任务。香港大学和Adobe Resea...
    新技术# UniReal# 图像生成# 图像编辑
    1年前
    02940
    ACDIT:介于自回归模型和扩散模型之间的插值方法,用于处理视觉信息

    ACDIT:介于自回归模型和扩散模型之间的插值方法,用于处理视觉信息

    清华大学和字节跳动的研究人员推出ACDIT,它是一种介于自回归模型和扩散模型之间的插值方法,用于处理视觉信息。ACDIT的核心思想是将自回归建模扩展到块级别,而不是单个文本标记,使得每个块的生成可以基...
    新技术# ACDIT
    1年前
    02700
    苹果推出用于文本和图像条件下的视频生成新方法STIV

    苹果推出用于文本和图像条件下的视频生成新方法STIV

    苹果公司介绍了一个名为STIV(Scalable Text and Image Conditioned Video Generation)的系统,它是一种用于文本和图像条件下的视频生成方法。STIV系...
    新技术# STIV# 苹果
    1年前
    02770
    新型文本到图像生成系统NIRVANA:利用近似缓存技术,高效地服务基于扩散模型的文本到图像生成任务

    新型文本到图像生成系统NIRVANA:利用近似缓存技术,高效地服务基于扩散模型的文本到图像生成任务

    Adobe和伊利诺伊大学厄巴纳-香槟分校的研究人员介绍了一种名为NIRVANA的新型文本到图像生成系统,它利用了一种称为近似缓存(Approximate Caching)的技术,旨在高效地服务基于扩散...
    新技术# NIRVANA# 文生图
    1年前
    03390
    华为诺亚方舟实验室推出多模态大语言模型ILLUME

    华为诺亚方舟实验室推出多模态大语言模型ILLUME

    华为诺亚方舟实验室发布多模态大语言模型ILLUME,旨在无缝集成图像和文本的理解与生成。ILLUME凭借其创新的架构和训练策略,在显著减少预训练所需数据量的同时,达到了最先进的性能。ILLUME基于统...
    新技术# ILLUME# 华为诺亚方舟实验室# 多模态大语言模型
    1年前
    02760
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    人生 K 线

    人生 K 线

    人生 K 线(Life Destiny K-Line)是一个结合传统八字命理与现代大语言模型(LLM)的轻量级可视化工具。它将一个人从 1 岁到 100 岁的运势走势,以类似股票 K 线图的形式呈现,试图用数据可视化的方式“翻译”命理推演结果。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    互联网大厂模拟器

    互联网大厂模拟器

    《互联网大厂模拟器》或许不会改变现实,但它提供了一个出口:在虚拟世界里,我们可以安全地体验“另一种职场人生”,然后笑着关掉页面,继续面对明天的站会。
    MiroFish

    MiroFish

    MiroFish 是一款基于多智能体技术的新一代 AI 预测引擎。通过提取现实世界的种子信息(如突发新闻、政策草案、金融信号),自动构建出高保真的平行数字世界。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    查看完整榜单