SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 947 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    高度灵活的组合式时尚图像生成模型FashionComposer

    高度灵活的组合式时尚图像生成模型FashionComposer

    在时尚设计和虚拟试穿领域,传统的图像生成方法往往受限于单一的输入模式(如仅支持文本提示或单个参考图像),并且难以处理复杂的个性化需求,如多件服装的组合、多样化的姿势和人体形态。为了克服这些局限性,香港...
    新技术# FashionComposer# 虚拟试穿
    1年前
    03350
    基于视频扩散模型的上色工具AniDoc:用于自动化2D动画制作流程中的线稿着色

    基于视频扩散模型的上色工具AniDoc:用于自动化2D动画制作流程中的线稿着色

    自动化视频线稿上色是简化动画制作流程、降低劳动力成本的关键技术。然而,传统方法面临多个挑战: 角色设计艺术与线稿草图对齐问题:确保颜色信息准确地映射到线稿中。 时间一致性需求:保证动画帧之间的颜色和风...
    新技术# AniDoc# 线稿着色
    1年前
    03000
    零样本多实例视频编辑框架MIVE:能够对视频中的多个独立对象进行精确编辑,而不影响视频中的其他部分

    零样本多实例视频编辑框架MIVE:能够对视频中的多个独立对象进行精确编辑,而不影响视频中的其他部分

    近年来,基于人工智能的视频编辑技术取得了显著进展,用户可以通过简单的文本提示轻松编辑视频。然而,现有的零样本视频编辑方法主要集中在全局或单一对象的编辑上,这可能导致视频其他部分发生意外变化。当需要对多...
    新技术# MIVE# 视频编辑
    1年前
    03380
    Adobe推出以主题驱动的零样本视频定制新方法SUGAR

    Adobe推出以主题驱动的零样本视频定制新方法SUGAR

    Adobe介绍了一个名为SUGAR(Subject-Driven Video Customization in a Zero-Shot Manner)的新技术,它是一种零样本(zero-shot)方法...
    新技术# SUGAR
    1年前
    02700
    视觉-语言模型加速技术FEATHER:实现了超过5倍的性能提升

    视觉-语言模型加速技术FEATHER:实现了超过5倍的性能提升

    最近的研究表明,尽管视觉信息被高度压缩,视觉-语言模型(VLMs)依然能在多种任务中保持出色的性能。本研究聚焦于一种流行的加速方法——早期修剪视觉标记,并揭示了其成功背后的关键原因。研究人员发现,许多...
    新技术# FEATHER
    1年前
    02580
    通过实现空间可扩展和全景动态场景合成的创新框架DynamicScaler:用于生成高质量、可扩展的全景动态场景视频

    通过实现空间可扩展和全景动态场景合成的创新框架DynamicScaler:用于生成高质量、可扩展的全景动态场景视频

    随着对沉浸式 AR/VR 应用和空间智能需求的增加,生成高质量的场景级和 360° 全景视频变得尤为重要。然而,大多数视频扩散模型受限于分辨率和宽高比,限制了它们在场景级动态内容合成中的应用。为了解决...
    新技术# DynamicScaler
    1年前
    03170
    新型扩散模型框架VividFace:专门为视频换脸而设计

    新型扩散模型框架VividFace:专门为视频换脸而设计

    视频换脸技术近年来在各种应用中变得越来越流行,但现有方法主要集中在静态图像上,难以应对视频换脸中的时间一致性和复杂场景问题。为了解决这些问题,香港中文大学 MMLab、商汤科技研究院和 InnoHK ...
    新技术# VividFace# 视频换脸
    1年前
    02940
    字节推出CausalFusion:基于解码器的变换器,旨在统一自回归(AR)和扩散模型的生成范式

    字节推出CausalFusion:基于解码器的变换器,旨在统一自回归(AR)和扩散模型的生成范式

    字节跳动介绍了一个名为CausalFusion的模型,它是一个基于解码器的变换器(decoder-only transformer),旨在统一自回归(AR)和扩散模型(diffusion models...
    新技术# CausalFusion
    1年前
    03580
    新型图像编辑方法FluxSpace:基于修正流变换器(如Flux)来实现文本引导的图像编辑

    新型图像编辑方法FluxSpace:基于修正流变换器(如Flux)来实现文本引导的图像编辑

    校正流模型(如 Flux)在图像生成中已成为主导方法,展示了高质量图像合成的卓越能力。然而,尽管它们在视觉生成中表现出色,校正流模型在图像的解耦编辑方面往往表现不佳。这一限制阻碍了在不影响图像无关部分...
    新技术# FLUX# FluxSpace# 图像编辑
    1年前
    03570
    多模态音乐生成系统VMB:够从多种输入模态(如文本、图像和视频)中生成音乐

    多模态音乐生成系统VMB:够从多种输入模态(如文本、图像和视频)中生成音乐

    多模态音乐生成旨在从多种输入模态(如文本、视频和图像)中生成音乐。尽管现有方法通过使用通用嵌入空间进行多模态融合,在其他任务中表现出色,但在多模态音乐生成中仍面临以下挑战: 数据稀缺:高质量的多模态音...
    新技术# VMB# 音乐生成
    1年前
    03060
    ObjectMate:能够在无需微调的情况下,实现对象插入和主题驱动的图像生成

    ObjectMate:能够在无需微调的情况下,实现对象插入和主题驱动的图像生成

    对象插入和主体驱动生成是计算机视觉中的两个重要任务,旨在将给定的对象合成到由图像或文本指定的场景中。具体来说: 对象插入:将一个对象无缝地插入到目标场景中,要求合成后的图像在姿态、光照等方面看起来逼真...
    新技术# ObjectMate# 图像编辑
    1年前
    04430
    无需微调的推理范式FreeScale:通过 尺度融合 实现更高分辨率的图片生成

    无需微调的推理范式FreeScale:通过 尺度融合 实现更高分辨率的图片生成

    视觉扩散模型(Diffusion Models)在图像和视频生成领域取得了显著进展,但由于缺乏高分辨率数据和计算资源的限制,它们通常只能在有限的分辨率下进行训练。这阻碍了其生成高保真图像或视频的能力...
    新技术# FreeScale
    1年前
    02660
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    YouMind

    YouMind

    YouMind 是一款重新构想的 AI 写作工具,帮助每个人轻松开启创作之旅。捕捉灵感、收集素材、撰写草稿,并将其转化为精炼的文章、播客、视频等丰富内容。
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    OpenClaw(Clawdbot/Moltbot)

    OpenClaw(Clawdbot/Moltbot)

    Clawdbot 是一款可在您自己的设备上运行的个人 AI 助手。它在您已使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及扩展渠道(如 BlueBubbles、Matrix、Zalo 和 Zalo Personal)上为您提供应答。它可以在 macOS/iOS/Android 上进行语音交谈,并能渲染一个您可控制的实时画布。网关仅是控制平面——核心产品是助手本身。
    OpenClaw汉化发行版

    OpenClaw汉化发行版

    OpenClaw汉化发行版已上线——不仅将CLI命令行、Dashboard网页控制台全部深度汉化,还能每小时自动同步OpenClaw官方更新,汉化版延迟低于1小时,既保留原版全部功能,又适配国内用户的使用习惯,3步即可完成安装部署,零基础也能快速上手。
    Sync Vault

    Sync Vault

    Sync Vault是一个 Obsidian 插件,让 Obsidian 像访问本地文件一样轻松使用多种云服务上的资源,释放本地存储和同步压力。
    OpenClaw 一键部署工具

    OpenClaw 一键部署工具

    OpenClaw 一键部署工具是一款专为 AI 爱好者和开发者打造的私人 AI 助手一键部署工具,支持多模型、多消息渠道接入,提供图形界面与命令行两种部署方式,无需复杂的手动配置,就能快速搭建属于自己的跨平台 AI 助手,兼具灵活性与实用性。
    查看完整榜单