SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 943 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    OPPO 发布 OAgents:一个模块化、可复现的基础智能体框架

    OPPO 发布 OAgents:一个模块化、可复现的基础智能体框架

    随着“智能体(Agentic AI)”成为 AI 发展的重要方向,各类框架层出不穷。然而,当前研究普遍存在评估标准不一、实现细节不透明、结果难以复现等问题,导致不同系统之间缺乏公平比较的基础。 为应对...
    新技术# OAgents# OPPO# 智能体框架
    6个月前
    01610
    字节跳动Seed团队发布WideSearch:首个面向大规模信息收集的智能体评估基准

    字节跳动Seed团队发布WideSearch:首个面向大规模信息收集的智能体评估基准

    在信息过载的时代,获取“更多”并不等于“更有效”。真正制约效率的,往往不是找不到某个具体答案,而是面对海量目标时的系统性整理能力——比如,为一个行业筛选出上百家公司数据,或从成千上万条招聘信息中精准匹...
    新技术# WideSearch# 字节跳动# 智能体评估基准
    6个月前
    04790
    Agentic Web:通过AI智能体(AI Agents)来构建下一代互联网

    Agentic Web:通过AI智能体(AI Agents)来构建下一代互联网

    上海交通大学、香港科技大学(广州)、利物浦大学、加州大学伯克利分校、上海创新学院、加州大学戴维斯分校、弗吉尼亚理工大学和伦敦大学学院的研究人员发布Agentic Web(智能体网络),它探讨了如何通过...
    新技术# Agentic Web
    6个月前
    01380
    NXN Labs推出新型虚拟试穿框架Voost:通过一个统一的扩散变换器同时实现虚拟试穿(试穿目标服装)和虚拟试脱(从人像中重建原始服装)功能

    NXN Labs推出新型虚拟试穿框架Voost:通过一个统一的扩散变换器同时实现虚拟试穿(试穿目标服装)和虚拟试脱(从人像中重建原始服装)功能

    NXN Labs推出新型虚拟试穿框架Voost,通过一个统一的扩散变换器(Diffusion Transformer)同时实现虚拟试穿(试穿目标服装)和虚拟试脱(从人像中重建原始服装)功能。 项目主页...
    新技术# Voost# 虚拟试穿
    6个月前
    02800
     LaTCoder:将网页设计图像自动转换为代码

     LaTCoder:将网页设计图像自动转换为代码

    华中科技大学和重庆大学的研究人员提出了一种名为 LaTCoder 的新方法,将网页设计图像自动转换为代码(即设计到代码,design-to-code)。这种方法通过引入“布局即思考”(Layout-a...
    新技术# LaTCoder
    6个月前
    02510
    微软推出 Agent Lightning:打通智能体开发与模型优化的“最后一公里”

    微软推出 Agent Lightning:打通智能体开发与模型优化的“最后一公里”

    在 AI 智能体(Agent)技术快速发展的当下,开发者已经可以通过 LangChain、AutoGen、OpenAI Agent SDK 等框架,快速构建具备工具调用、多轮对话和任务编排能力的智能系...
    新技术# Agent Lightning# 微软# 智能体
    6个月前
    01370
    R-Zero:首个完全自进化的推理增强框架,无需数据即可提升大模型能力

    R-Zero:首个完全自进化的推理增强框架,无需数据即可提升大模型能力

    由腾讯 AI 西雅图实验室、圣路易斯华盛顿大学、马里兰大学帕克分校与德克萨斯大学达拉斯分校联合提出的新框架 R-Zero,正在挑战当前大语言模型训练范式的边界。 项目主页:https://chengs...
    新技术# R-Zero# 推理增强框架
    6个月前
    05960
    基于二维高斯分布的图像表示方法Image-GS:通过自适应地分配和优化一组二维高斯分布来重建图像

    基于二维高斯分布的图像表示方法Image-GS:通过自适应地分配和优化一组二维高斯分布来重建图像

    纽约大学、英特尔和AMD的研究人员推出一种基于二维高斯分布的图像表示方法Image-GS,它通过自适应地分配和优化一组二维高斯分布来重建图像。这种方法旨在为图像和纹理提供一种高效、灵活且硬件友好的表示...
    新技术# Image-GS# 图像表示方法
    6个月前
    01810
    DAEDAL:无需训练的动态长度生成,释放扩散大模型新潜力

    DAEDAL:无需训练的动态长度生成,释放扩散大模型新潜力

    在大语言模型(LLM)领域,扩散型大语言模型(Diffusion Large Language Models, DLLMs)正凭借其并行生成能力与全局上下文建模优势,成为传统自回归模型(AR)的有力竞...
    新技术# DAEDAL# 扩散大模型
    6个月前
    02290
    加速DiT架构模型推理速度的新方法TaylorSeer:通过预测未来时间步的特征来加速扩散模型

    加速DiT架构模型推理速度的新方法TaylorSeer:通过预测未来时间步的特征来加速扩散模型

    上海交通大学、山东大学、电子科技大学和香港科技大学的研究人员推出加速DiT架构模型推理速度的新方法TaylorSeer,扩散模型在图像和视频生成任务中表现出色,但其计算需求较高,限制了实时应用的可行性...
    新技术# TaylorSeer
    6个月前
    01780
    Radial Attention:用“物理直觉”突破长视频生成的计算瓶颈

    Radial Attention:用“物理直觉”突破长视频生成的计算瓶颈

    近年来,视频生成模型在质量上取得了显著进步。然而,一个根本性挑战始终存在: 时序维度的引入,使计算成本呈指数级增长。 标准扩散模型中的稠密注意力机制(Dense Attention)在处理长视频时面临...
    新技术# Radial Attention
    6个月前
    01990
    阿里Qwen项目组推出新型强化学习算法GSPO:用于训练最新 Qwen3 模型

    阿里Qwen项目组推出新型强化学习算法GSPO:用于训练最新 Qwen3 模型

    阿里Qwen项目组推出新型强化学习算法 Group Sequence Policy Optimization (GSPO),用于训练大型语言模型(LLMs)。与以往基于单个标记(token)重要性比率...
    新技术# GSPO# Qwen3
    6个月前
    03470
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Clawdbot/Moltbot

    Clawdbot/Moltbot

    Clawdbot 是一款可在您自己的设备上运行的个人 AI 助手。它在您已使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及扩展渠道(如 BlueBubbles、Matrix、Zalo 和 Zalo Personal)上为您提供应答。它可以在 macOS/iOS/Android 上进行语音交谈,并能渲染一个您可控制的实时画布。网关仅是控制平面——核心产品是助手本身。
    QoderWork

    新QoderWork

    阿里发布旗下首个桌面Agent工具QoderWork,用户无需任何复杂部署工作,输入一句话,QoderWork就能按需调用授权的本地应用,完成文件整理、数据处理、文档生成等任务。
    Situation Monitor

    Situation Monitor

    Situation Monitor 是由开发者 Reggie James 创建的一个免费、开源的全球风险监测平台。它通过一张交互式地图,实时整合并可视化全球范围内的关键地缘政治与安全信息,帮助用户快速掌握潜在冲突热点和战略动态。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    查看完整榜单