SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 943 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    阿里Qwen项目组推出新型强化学习算法GSPO:用于训练最新 Qwen3 模型

    阿里Qwen项目组推出新型强化学习算法GSPO:用于训练最新 Qwen3 模型

    阿里Qwen项目组推出新型强化学习算法 Group Sequence Policy Optimization (GSPO),用于训练大型语言模型(LLMs)。与以往基于单个标记(token)重要性比率...
    新技术# GSPO# Qwen3
    6个月前
    03470
    如何让AI“不生成某物”?UBC研究人员提出轻量级负提示新方案VSF

    如何让AI“不生成某物”?UBC研究人员提出轻量级负提示新方案VSF

    在文本到图像生成中,如何让模型“不生成某样东西”——例如“一只没有翅膀的鸟”或“一辆没有轮子的自行车”——始终是一个挑战。尽管正向提示可以引导生成内容,但负提示(negative prompt)的执行...
    新技术# VSF# 负面提示
    6个月前
    01720
    混合递归(MoR):用“动态思考”提升大模型推理效率

    混合递归(MoR):用“动态思考”提升大模型推理效率

    在大模型追求极致规模的浪潮中,一种新的架构正试图从“智能调度”而非“堆叠参数”的角度,重新定义效率。 由 KAIST AI 与 Mila 联合提出的新框架——混合递归(Mixture-of-Recur...
    新技术# MoR# 混合递归
    6个月前
    0930
    Snap Research 推出 Zero-Shot Dynamic Concept:无需微调,即可实现视频级动态个性化

    Snap Research 推出 Zero-Shot Dynamic Concept:无需微调,即可实现视频级动态个性化

    Snap Research 发布了一项名为 Zero-Shot Dynamic Concept 的新方法,为文本到视频生成模型中的动态概念个性化提供了全新的解决方案。该技术基于网格化 LoRA 架构...
    新技术# Snap Research# Zero-Shot Dynamic Concept
    6个月前
    01080
    首尔大学研究团队提出推理加速框架 RALU:无需训练的混合分辨率采样,加速DIT架构模型推理最高达7倍

    首尔大学研究团队提出推理加速框架 RALU:无需训练的混合分辨率采样,加速DIT架构模型推理最高达7倍

    DIT架构模型凭借其卓越的可扩展性,正逐步取代传统的 U-Net 架构,成为高保真图像与视频生成的主流模型。然而,其高昂的计算成本严重制约了在移动端、实时应用和大规模部署中的实用性。 为解决这一瓶颈...
    新技术# DiT架构模型# RALU# 首尔大学
    6个月前
    01070
    索尼与韩国科学技术院联合推出 DesignLab:一种全新的AI驱动幻灯片优化框架

    索尼与韩国科学技术院联合推出 DesignLab:一种全新的AI驱动幻灯片优化框架

    对大多数人而言,制作一份美观、专业、信息清晰的演示文稿是一项令人头疼的任务。 排版混乱、配色突兀、字体不协调——这些问题并非源于内容不足,而是设计决策的复杂性超出了非专业人士的能力范围。 尽管已有不少...
    新技术# DesignLab# PPT
    6个月前
    02630
    Gemini 2.5 实现对话式图像分割,用语言精准“圈出”图像中的目标

    Gemini 2.5 实现对话式图像分割,用语言精准“圈出”图像中的目标

    AI在视觉理解领域正不断突破边界。从最初的物体检测,到像素级语义分割,再到开放词汇识别,AI 对图像的理解能力持续进化。如今,谷歌 Gemini 2.5 带来了一个更具交互性的能力——对话式图像分割...
    新技术# Gemini 2.5# 图像分割
    6个月前
    02690
    CSD-VAR:从一张图中分离内容与风格的新方法

    CSD-VAR:从一张图中分离内容与风格的新方法

    高通AI研究和MovianAI的研究人员推出新方法CSD-VAR,用于从单张图像中分离内容(content)和风格(style),即内容风格分解(Content-Style Decomposition...
    新技术# CSD-VAR
    6个月前
    01900
    一种更接近人类思维的推理模型架构HRM

    一种更接近人类思维的推理模型架构HRM

    在AI领域,“推理”始终是衡量智能水平的核心指标。真正的推理,不只是回答问题,而是设计并执行通向目标的复杂行动序列——就像人在解一道数独时,会先观察整体格局,再逐步填入数字;在走迷宫时,会先判断大致方...
    新技术# HRM# 推理模型架构
    6个月前
    02300
    自回归生成多视图图像方法 MVAR:从人类指令(如文本、参考图像和几何形状)生成多视角一致的图像

    自回归生成多视图图像方法 MVAR:从人类指令(如文本、参考图像和几何形状)生成多视角一致的图像

    北京大学医学技术研究所、百度视觉、北京大学未来技术学院生物医学工程系、北京大学国家生物医学影像中心和清华大学的研究人员开发了一种自回归生成多视图图像的方法 MVAR 。其目的是确保在生成当前视图的过程...
    新技术# MVAR# 多视图
    7个月前
    01500
    CanonSwap:通过规范空间调制实现高保真且一致的视频人脸交换

    CanonSwap:通过规范空间调制实现高保真且一致的视频人脸交换

    在AI与计算机视觉领域,视频人脸交换(Video Face Swapping)是一项极具挑战性的任务。它不仅要将一个人的身份特征“移植”到另一段视频中,还要保持目标人物的表情、动作和口型等动态信息不变...
    新技术# CanonSwap# 视频换脸
    7个月前
    01910
    LoongX:基于多模态神经信号驱动的无接触图像编辑新范式

    LoongX:基于多模态神经信号驱动的无接触图像编辑新范式

    由新加坡国立大学、浙江大学、罗切斯特理工学院、南京大学、中国科学技术大学、曼苏里大学人工智能学院、上海人工智能实验室和SII联合提出的新方法 LoongX,首次将多模态脑机接口(BCI)信号引入扩散模...
    新技术# LoongX# 图像编辑
    7个月前
    02510
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Clawdbot/Moltbot

    Clawdbot/Moltbot

    Clawdbot 是一款可在您自己的设备上运行的个人 AI 助手。它在您已使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及扩展渠道(如 BlueBubbles、Matrix、Zalo 和 Zalo Personal)上为您提供应答。它可以在 macOS/iOS/Android 上进行语音交谈,并能渲染一个您可控制的实时画布。网关仅是控制平面——核心产品是助手本身。
    QoderWork

    新QoderWork

    阿里发布旗下首个桌面Agent工具QoderWork,用户无需任何复杂部署工作,输入一句话,QoderWork就能按需调用授权的本地应用,完成文件整理、数据处理、文档生成等任务。
    Situation Monitor

    Situation Monitor

    Situation Monitor 是由开发者 Reggie James 创建的一个免费、开源的全球风险监测平台。它通过一张交互式地图,实时整合并可视化全球范围内的关键地缘政治与安全信息,帮助用户快速掌握潜在冲突热点和战略动态。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    查看完整榜单