SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜
    • 网址提交

    新技术

    共 942 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    通用图像超分辨率智能体4KAgent:将任意类型的低分辨率图像(包括自然图像、卫星图像、医学图像、AI生成内容等)提升至4K分辨率

    通用图像超分辨率智能体4KAgent:将任意类型的低分辨率图像(包括自然图像、卫星图像、医学图像、AI生成内容等)提升至4K分辨率

    德克萨斯农工大学、斯坦福大学、科罗拉多大学博尔德分校、德克萨斯大学奥斯汀分校、加州理工学院、加州大学默塞德分校、Snap公司和Topaz Labs公司的研究人员推出通用图像超分辨率智能体4KAgent...
    新技术# 4KAgent# 图像超分辨率
    6个月前
    01690
    X-Planner:基于 MLLM 的图像编辑任务规划系统,让复杂指令也能精准执行

    X-Planner:基于 MLLM 的图像编辑任务规划系统,让复杂指令也能精准执行

    在图像编辑领域,用户常常需要执行诸如“将这张照片转换为赛博朋克风格”或“让图中的动物看起来像是在庆祝圣诞节”这样的复杂操作。这些任务不仅要求模型理解抽象指令,还需准确定位并修改图像中的特定区域。 然而...
    新技术# X-Planner# 图像编辑
    6个月前
    03030
    MUVERA:让多向量检索像单向量一样快的新一代高效算法

    MUVERA:让多向量检索像单向量一样快的新一代高效算法

    在 RAG(Retrieval-Augmented Generation)系统中,信息检索是决定整体性能的关键环节。传统的单向量搜索(如基于 ElasticSearch 或 FAISS 的 MIPS...
    新技术# MUVERA# 向量检索
    6个月前
    03550
    Qwen3 MoE Fused:显著提升 Qwen3 推理速度的融合专家计算方案

    Qwen3 MoE Fused:显著提升 Qwen3 推理速度的融合专家计算方案

    Qwen3 MoE Fused 是一个面向 Qwen3 MoE 模型 的高性能推理优化项目,由开发者 woct0rdho 发起并实现。该项目通过重构 MoE(Mixture of Experts)中专...
    新技术# Qwen3 MoE Fused
    6个月前
    03540
    Dynamics Lab 发布全球首个 AI 原生 UGC 游戏引擎 Mirage

    Dynamics Lab 发布全球首个 AI 原生 UGC 游戏引擎 Mirage

    游戏的未来不再依赖专业设计师逐帧构建,而是由每一位玩家通过想象、生成与体验来共同塑造。 今天,Dynamics Lab 正式推出 Mirage —— 全球首个AI原生、实时生成的用户生成内容(UGC...
    新技术# Dynamics Lab# Mirage
    6个月前
    04030
    字节跳动Pico团队推出新型框架EX-4D:从单目视频生成高质量的极端视角 4D 视频

    字节跳动Pico团队推出新型框架EX-4D:从单目视频生成高质量的极端视角 4D 视频

    字节跳动Pico团队推出新型框架EX-4D,旨在从单目视频生成高质量的极端视角 4D 视频。该框架通过深度防水网格(Depth Watertight Mesh, DW-Mesh)表示法,有效处理边界遮...
    新技术# EX-4D# 字节跳动
    6个月前
    02260
    字节跳动推出 X-UniMotion:首个能精准复刻手部动作的视频生成模型

    字节跳动推出 X-UniMotion:首个能精准复刻手部动作的视频生成模型

    字节跳动研究团队发布了一项令人瞩目的视频生成新成果 —— X-UniMotion。该模型能够基于参考人物和驱动动作视频,实现对全身动作(尤其是复杂手部动作)的高精度复现,几乎看不出瑕疵,尤其在手部细节...
    新技术# X-UniMotion# 字节跳动
    6个月前
    03790
    突破负引导瓶颈:萨里大学提出新型扩散模型控制机制 NAG

    突破负引导瓶颈:萨里大学提出新型扩散模型控制机制 NAG

    萨里大学与 NetMind.AI 的研究人员联合提出了一种名为 Normalized Attention Guidance(NAG) 的新技术,解决扩散模型中“负引导”(negative guidan...
    新技术# NAG
    7个月前
    01960
    英伟达推出视频重光照技术UniRelight:通过对单张图像或视频进行光照条件的修改,实现场景在不同光照下的视觉效果呈现

    英伟达推出视频重光照技术UniRelight:通过对单张图像或视频进行光照条件的修改,实现场景在不同光照下的视觉效果呈现

    英伟达、多伦多大学和Vector 研究所的研究人员发布视频重光照(relighting)技术UniRelight,通过对单张图像或视频进行光照条件的修改,实现场景在不同光照下的视觉效果呈现。 项目主页...
    新技术# UniRelight# 视频重光照技术
    7个月前
    02930
    新型训练自由高分辨率图像生成方法HiWave:利用预训练的扩散模型生成高质量的高分辨率图像

    新型训练自由高分辨率图像生成方法HiWave:利用预训练的扩散模型生成高质量的高分辨率图像

    苏黎世联邦理工学院和迪斯尼研究院的研究人员推出新型训练自由(training-free)高分辨率图像生成方法HiWave,利用预训练的扩散模型生成高质量的高分辨率图像。 论文地址:https://ar...
    新技术# HiWave# 高分辨率
    7个月前
    01880
    用于生成 4D 场景(即包含时间和空间维度的视频)框架4Real-Video-V2 :从文本提示中创建 4D 场景

    用于生成 4D 场景(即包含时间和空间维度的视频)框架4Real-Video-V2 :从文本提示中创建 4D 场景

    Snap和阿卜杜拉国王科技大学的研究人员推出 4Real-Video-V2 框架,用于生成 4D 场景(即包含时间和空间维度的视频)。该框架能够从文本提示中创建 4D 场景,通过结合扩散模型直接生成同...
    新技术# 4Real-Video-V2
    7个月前
    02110
    SimpleGVR:轻量高效视频超分辨率模型,让低清视频也能高清呈现

    SimpleGVR:轻量高效视频超分辨率模型,让低清视频也能高清呈现

    由澳门大学智慧城市物联网国家重点实验室、中国科学院深圳先进技术研究院、清华大学、快手科技和深圳理工大学联合研究团队提出了一种新型视频超分辨率(Video Super-Resolution, VSR)模...
    新技术# SimpleGVR# 视频超分辨率模型
    7个月前
    03770
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    UUP dump

    UUP dump

    UUPDump是一个第三方网站,允许用户直接从微软的 Windows Update 服务器下载统一更新平台 (UUP) 文件,从而创建 Windows 10、11 和 Server 版本的自定义 ISO 镜像。它特别适用于访问最新预览体验版本或功能更新,这些更新可能无法通过官方渠道轻松获取。
     PSprices 

     PSprices 

    PSprices是一个以玩家需求为中心的价格监控系统。它用自动化通知解决“忘记查价”的痛点,用历史数据帮助你判断“是否该买”,用跨平台整合减少信息碎片。
    NotebookLM

    NotebookLM

    NotebookLM是谷歌推出的一款个性化AI协作工具,旨在帮助用户更高效地进行信息整理和笔记记录。利用强大的语言模型帮助用户更快地从各种文本、图像以及网页中提取主要信息。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    查看完整榜单