SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 943 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    Video-RTS:一种高效视频推理框架,用强化学习+动态推理策略打破数据依赖

    Video-RTS:一种高效视频推理框架,用强化学习+动态推理策略打破数据依赖

    北卡罗来纳大学教堂山分校的研究人员提出了一种全新的视频推理方法——Video-RTS(Reinforcement Learning with Test-time Scaling),旨在解决当前视频理解...
    新技术# Video-RTS# 视频推理框架
    7个月前
    01470
    通用图像超分辨率智能体4KAgent:将任意类型的低分辨率图像(包括自然图像、卫星图像、医学图像、AI生成内容等)提升至4K分辨率

    通用图像超分辨率智能体4KAgent:将任意类型的低分辨率图像(包括自然图像、卫星图像、医学图像、AI生成内容等)提升至4K分辨率

    德克萨斯农工大学、斯坦福大学、科罗拉多大学博尔德分校、德克萨斯大学奥斯汀分校、加州理工学院、加州大学默塞德分校、Snap公司和Topaz Labs公司的研究人员推出通用图像超分辨率智能体4KAgent...
    新技术# 4KAgent# 图像超分辨率
    7个月前
    01750
    X-Planner:基于 MLLM 的图像编辑任务规划系统,让复杂指令也能精准执行

    X-Planner:基于 MLLM 的图像编辑任务规划系统,让复杂指令也能精准执行

    在图像编辑领域,用户常常需要执行诸如“将这张照片转换为赛博朋克风格”或“让图中的动物看起来像是在庆祝圣诞节”这样的复杂操作。这些任务不仅要求模型理解抽象指令,还需准确定位并修改图像中的特定区域。 然而...
    新技术# X-Planner# 图像编辑
    7个月前
    03140
    MUVERA:让多向量检索像单向量一样快的新一代高效算法

    MUVERA:让多向量检索像单向量一样快的新一代高效算法

    在 RAG(Retrieval-Augmented Generation)系统中,信息检索是决定整体性能的关键环节。传统的单向量搜索(如基于 ElasticSearch 或 FAISS 的 MIPS...
    新技术# MUVERA# 向量检索
    7个月前
    03710
    Qwen3 MoE Fused:显著提升 Qwen3 推理速度的融合专家计算方案

    Qwen3 MoE Fused:显著提升 Qwen3 推理速度的融合专家计算方案

    Qwen3 MoE Fused 是一个面向 Qwen3 MoE 模型 的高性能推理优化项目,由开发者 woct0rdho 发起并实现。该项目通过重构 MoE(Mixture of Experts)中专...
    新技术# Qwen3 MoE Fused
    7个月前
    03640
    Dynamics Lab 发布全球首个 AI 原生 UGC 游戏引擎 Mirage

    Dynamics Lab 发布全球首个 AI 原生 UGC 游戏引擎 Mirage

    游戏的未来不再依赖专业设计师逐帧构建,而是由每一位玩家通过想象、生成与体验来共同塑造。 今天,Dynamics Lab 正式推出 Mirage —— 全球首个AI原生、实时生成的用户生成内容(UGC...
    新技术# Dynamics Lab# Mirage
    7个月前
    04250
    字节跳动Pico团队推出新型框架EX-4D:从单目视频生成高质量的极端视角 4D 视频

    字节跳动Pico团队推出新型框架EX-4D:从单目视频生成高质量的极端视角 4D 视频

    字节跳动Pico团队推出新型框架EX-4D,旨在从单目视频生成高质量的极端视角 4D 视频。该框架通过深度防水网格(Depth Watertight Mesh, DW-Mesh)表示法,有效处理边界遮...
    新技术# EX-4D# 字节跳动
    7个月前
    02500
    字节跳动推出 X-UniMotion:首个能精准复刻手部动作的视频生成模型

    字节跳动推出 X-UniMotion:首个能精准复刻手部动作的视频生成模型

    字节跳动研究团队发布了一项令人瞩目的视频生成新成果 —— X-UniMotion。该模型能够基于参考人物和驱动动作视频,实现对全身动作(尤其是复杂手部动作)的高精度复现,几乎看不出瑕疵,尤其在手部细节...
    新技术# X-UniMotion# 字节跳动
    7个月前
    03830
    突破负引导瓶颈:萨里大学提出新型扩散模型控制机制 NAG

    突破负引导瓶颈:萨里大学提出新型扩散模型控制机制 NAG

    萨里大学与 NetMind.AI 的研究人员联合提出了一种名为 Normalized Attention Guidance(NAG) 的新技术,解决扩散模型中“负引导”(negative guidan...
    新技术# NAG
    7个月前
    02160
    英伟达推出视频重光照技术UniRelight:通过对单张图像或视频进行光照条件的修改,实现场景在不同光照下的视觉效果呈现

    英伟达推出视频重光照技术UniRelight:通过对单张图像或视频进行光照条件的修改,实现场景在不同光照下的视觉效果呈现

    英伟达、多伦多大学和Vector 研究所的研究人员发布视频重光照(relighting)技术UniRelight,通过对单张图像或视频进行光照条件的修改,实现场景在不同光照下的视觉效果呈现。 项目主页...
    新技术# UniRelight# 视频重光照技术
    7个月前
    03130
    新型训练自由高分辨率图像生成方法HiWave:利用预训练的扩散模型生成高质量的高分辨率图像

    新型训练自由高分辨率图像生成方法HiWave:利用预训练的扩散模型生成高质量的高分辨率图像

    苏黎世联邦理工学院和迪斯尼研究院的研究人员推出新型训练自由(training-free)高分辨率图像生成方法HiWave,利用预训练的扩散模型生成高质量的高分辨率图像。 论文地址:https://ar...
    新技术# HiWave# 高分辨率
    7个月前
    01930
    用于生成 4D 场景(即包含时间和空间维度的视频)框架4Real-Video-V2 :从文本提示中创建 4D 场景

    用于生成 4D 场景(即包含时间和空间维度的视频)框架4Real-Video-V2 :从文本提示中创建 4D 场景

    Snap和阿卜杜拉国王科技大学的研究人员推出 4Real-Video-V2 框架,用于生成 4D 场景(即包含时间和空间维度的视频)。该框架能够从文本提示中创建 4D 场景,通过结合扩散模型直接生成同...
    新技术# 4Real-Video-V2
    7个月前
    02130
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Clawdbot/Moltbot

    Clawdbot/Moltbot

    Clawdbot 是一款可在您自己的设备上运行的个人 AI 助手。它在您已使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及扩展渠道(如 BlueBubbles、Matrix、Zalo 和 Zalo Personal)上为您提供应答。它可以在 macOS/iOS/Android 上进行语音交谈,并能渲染一个您可控制的实时画布。网关仅是控制平面——核心产品是助手本身。
    Situation Monitor

    Situation Monitor

    Situation Monitor 是由开发者 Reggie James 创建的一个免费、开源的全球风险监测平台。它通过一张交互式地图,实时整合并可视化全球范围内的关键地缘政治与安全信息,帮助用户快速掌握潜在冲突热点和战略动态。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    QoderWork

    新QoderWork

    阿里发布旗下首个桌面Agent工具QoderWork,用户无需任何复杂部署工作,输入一句话,QoderWork就能按需调用授权的本地应用,完成文件整理、数据处理、文档生成等任务。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    查看完整榜单