SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 947 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    大模型 RL 加速新方案:FlashRL 实现无损量化 rollout

    大模型 RL 加速新方案:FlashRL 实现无损量化 rollout

    在大模型强化学习(RL)训练中,rollout 生成是耗时最长的环节之一。以 DAPO-32B 为例,rollout 阶段占据了约 70% 的总训练时间。这一瓶颈使得整个训练流程效率低下,尤其在大规模...
    新技术# FlashRL
    6个月前
    03860
     Echo-4o :通过利用 GPT-4o 生成的合成图像数据来提升多模态生成模型的性能

     Echo-4o :通过利用 GPT-4o 生成的合成图像数据来提升多模态生成模型的性能

    上海人工智能实验室、中山大学、香港中文大学和北京大学的研究人员推出 Echo-4o 系统,通过利用 GPT-4o 生成的合成图像数据来提升多模态生成模型(如文本到图像生成、多参考图像生成等任务)的性能...
    新技术# Echo-4o# GPT-4o# 多模态生成模型
    6个月前
    02830
    模型变强了,内部表示就更好了吗?MIT等提出“碎片化纠缠表示(FER)”假说

    模型变强了,内部表示就更好了吗?MIT等提出“碎片化纠缠表示(FER)”假说

    当我们看到大模型在各种任务上不断刷新性能纪录时,一个隐含的信念常常浮现:性能提升 = 内部表示更优。这种观点被称为“表示乐观主义”(Representational Optimism)——即认为随着模...
    新技术# FER# 碎片化纠缠表示
    6个月前
    03020
    DynamicFace:一种面向图像与视频的高保真人脸交换方法

    DynamicFace:一种面向图像与视频的高保真人脸交换方法

    人脸交换(Face Swapping)技术旨在将一个人的身份特征迁移到另一个人的面部图像或视频中,同时保留目标人物的表情、姿态、发型和背景等属性。近年来,随着生成模型的发展,人脸交换已能生成高度逼真的...
    新技术# DynamicFace# 人脸交换
    6个月前
    03800
    OPPO 发布 OAgents:一个模块化、可复现的基础智能体框架

    OPPO 发布 OAgents:一个模块化、可复现的基础智能体框架

    随着“智能体(Agentic AI)”成为 AI 发展的重要方向,各类框架层出不穷。然而,当前研究普遍存在评估标准不一、实现细节不透明、结果难以复现等问题,导致不同系统之间缺乏公平比较的基础。 为应对...
    新技术# OAgents# OPPO# 智能体框架
    6个月前
    01690
    字节跳动Seed团队发布WideSearch:首个面向大规模信息收集的智能体评估基准

    字节跳动Seed团队发布WideSearch:首个面向大规模信息收集的智能体评估基准

    在信息过载的时代,获取“更多”并不等于“更有效”。真正制约效率的,往往不是找不到某个具体答案,而是面对海量目标时的系统性整理能力——比如,为一个行业筛选出上百家公司数据,或从成千上万条招聘信息中精准匹...
    新技术# WideSearch# 字节跳动# 智能体评估基准
    6个月前
    04820
    Agentic Web:通过AI智能体(AI Agents)来构建下一代互联网

    Agentic Web:通过AI智能体(AI Agents)来构建下一代互联网

    上海交通大学、香港科技大学(广州)、利物浦大学、加州大学伯克利分校、上海创新学院、加州大学戴维斯分校、弗吉尼亚理工大学和伦敦大学学院的研究人员发布Agentic Web(智能体网络),它探讨了如何通过...
    新技术# Agentic Web
    6个月前
    01400
    NXN Labs推出新型虚拟试穿框架Voost:通过一个统一的扩散变换器同时实现虚拟试穿(试穿目标服装)和虚拟试脱(从人像中重建原始服装)功能

    NXN Labs推出新型虚拟试穿框架Voost:通过一个统一的扩散变换器同时实现虚拟试穿(试穿目标服装)和虚拟试脱(从人像中重建原始服装)功能

    NXN Labs推出新型虚拟试穿框架Voost,通过一个统一的扩散变换器(Diffusion Transformer)同时实现虚拟试穿(试穿目标服装)和虚拟试脱(从人像中重建原始服装)功能。 项目主页...
    新技术# Voost# 虚拟试穿
    6个月前
    03170
     LaTCoder:将网页设计图像自动转换为代码

     LaTCoder:将网页设计图像自动转换为代码

    华中科技大学和重庆大学的研究人员提出了一种名为 LaTCoder 的新方法,将网页设计图像自动转换为代码(即设计到代码,design-to-code)。这种方法通过引入“布局即思考”(Layout-a...
    新技术# LaTCoder
    6个月前
    02660
    微软推出 Agent Lightning:打通智能体开发与模型优化的“最后一公里”

    微软推出 Agent Lightning:打通智能体开发与模型优化的“最后一公里”

    在 AI 智能体(Agent)技术快速发展的当下,开发者已经可以通过 LangChain、AutoGen、OpenAI Agent SDK 等框架,快速构建具备工具调用、多轮对话和任务编排能力的智能系...
    新技术# Agent Lightning# 微软# 智能体
    6个月前
    01380
    R-Zero:首个完全自进化的推理增强框架,无需数据即可提升大模型能力

    R-Zero:首个完全自进化的推理增强框架,无需数据即可提升大模型能力

    由腾讯 AI 西雅图实验室、圣路易斯华盛顿大学、马里兰大学帕克分校与德克萨斯大学达拉斯分校联合提出的新框架 R-Zero,正在挑战当前大语言模型训练范式的边界。 项目主页:https://chengs...
    新技术# R-Zero# 推理增强框架
    7个月前
    06410
    基于二维高斯分布的图像表示方法Image-GS:通过自适应地分配和优化一组二维高斯分布来重建图像

    基于二维高斯分布的图像表示方法Image-GS:通过自适应地分配和优化一组二维高斯分布来重建图像

    纽约大学、英特尔和AMD的研究人员推出一种基于二维高斯分布的图像表示方法Image-GS,它通过自适应地分配和优化一组二维高斯分布来重建图像。这种方法旨在为图像和纹理提供一种高效、灵活且硬件友好的表示...
    新技术# Image-GS# 图像表示方法
    7个月前
    01870
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    OpenClaw

    OpenClaw

    OpenClaw 是一个个人 AI 助手,可在您自己的设备上运行。它通过您已经使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及 BlueBubbles、Matrix、Zalo 和 Zalo Personal 等扩展渠道与您交流。它可以在 macOS/iOS/Android 上说话和聆听,并能渲染一个您控制的实时画布。网关只是控制平面——产品本身才是助手。
    OpenClaw(Clawdbot/Moltbot)

    OpenClaw(Clawdbot/Moltbot)

    Clawdbot 是一款可在您自己的设备上运行的个人 AI 助手。它在您已使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及扩展渠道(如 BlueBubbles、Matrix、Zalo 和 Zalo Personal)上为您提供应答。它可以在 macOS/iOS/Android 上进行语音交谈,并能渲染一个您可控制的实时画布。网关仅是控制平面——核心产品是助手本身。
    A股智能分析系统

    A股智能分析系统

    A股智能分析系统是基于 AI 大模型的 A 股自选股智能分析系统,每日自动分析并推送「决策仪表盘」到企业微信/飞书/Telegram/邮箱
    3D Arena

    3D Arena

    Hugging Face 推出的 3D Arena 是生成式 3D 领域的一项重要进展。它首次实现了大规模、结构化的人类偏好数据收集,并通过 ELO 排名系统提供可靠、可解释的模型评估结果。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Fireplexity

    Fireplexity

    Fireplexity v2 是一个基于 Next.js 构建的 AI 驱动搜索引擎,结合了网络爬取、新闻聚合和图像搜索功能,并提供对话式 AI 响应。系统通过多个外部 API 处理用户查询,并通过类似聊天的界面以实时流式传输方式呈现结果。
    查看完整榜单