SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜
    • 网址提交

    新技术

    共 942 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    潜在分区网络(LZN):以共享高斯潜在空间,统一生成、表示与分类的机器学习新框架

    潜在分区网络(LZN):以共享高斯潜在空间,统一生成、表示与分类的机器学习新框架

    在机器学习领域,生成模型(如 DALL・E 生成图像、ChatGPT 生成文本)、表示学习(如 CLIP 实现图文表示匹配)、分类模型(如 ResNet 进行图像分类)是三大核心方向,且各自都已取得成...
    新技术# LZN# 潜在分区网络
    4个月前
    0930
    BranchGRPO:树状分支重构,破解GRPO图像视频生成对齐的效率与稳定性难题

    BranchGRPO:树状分支重构,破解GRPO图像视频生成对齐的效率与稳定性难题

    在图像、视频生成领域,“让模型输出与人类偏好对齐”是关键目标——无论是生成符合审美标准的图像,还是帧间连贯的视频,都需要通过算法优化缩小模型输出与人类期望的差距。群体相对策略优化(GRPO)是近年常用...
    新技术# BranchGRPO
    4个月前
    0940
    RPG:一种用于统一且可扩展代码库生成的存储库规划图

    RPG:一种用于统一且可扩展代码库生成的存储库规划图

    微软、清华大学和加州大学圣地亚哥分校的研究人员推出一个名为 Repository Planning Graph (RPG) 的框架,用于从头开始生成完整的软件仓库。它通过将软件的功能规划和实现规划统一...
    新技术# RPG# 代码库生成
    4个月前
    0910
    ST-AR:让自回归图像生成学会“先理解,再生成”

    ST-AR:让自回归图像生成学会“先理解,再生成”

    自回归模型(Autoregressive, AR)因其强大的序列建模能力,最初在自然语言处理中取得成功,随后被引入图像生成领域。这类模型将图像视为“视觉词元”序列,通过逐个预测 token 的方式重建...
    新技术# ST-AR# 自回归图像生成
    4个月前
    01630
    局部性从何而来?MIT与丰田研究所揭示扩散模型中的数据驱动机制

    局部性从何而来?MIT与丰田研究所揭示扩散模型中的数据驱动机制

    在图像生成领域,扩散模型已成为主流架构之一。其训练过程基于一个理论上的“最优去噪器”——即在给定噪声水平下,能够最小化重建误差的理想函数。有趣的是,这一最优解虽然数学上可定义,却只能复现训练集中的样本...
    新技术# 图像扩散模型
    4个月前
    0770
    艾伦AI研究所推出Fluid Benchmarking:为每个语言模型定制最合适的考题

    艾伦AI研究所推出Fluid Benchmarking:为每个语言模型定制最合适的考题

    在当前的语言模型评测中,我们通常采用“统一试卷”模式: 无论模型是刚起步的小型模型,还是千亿参数的顶尖系统,都使用同一套固定题目进行打分。 这就像让小学生和博士生做同一份数学卷子——看似公平,实则难以...
    新技术# Fluid Benchmarking# 流动基准测试# 艾伦AI研究所
    4个月前
    01040
    蚂蚁集团发布针对多跳问答任务的增强型检索-生成(RAG)框架HANRAG

    蚂蚁集团发布针对多跳问答任务的增强型检索-生成(RAG)框架HANRAG

    蚂蚁集团发布新型框架HANRAG,这是一个针对多跳问答任务的增强型检索-生成(RAG)框架,通过结合启发式方法和强大的“启示者”(Revelator)主代理,高效处理各种复杂性的问题,提高多跳问答系统...
    新技术# HANRAG# 蚂蚁集团
    4个月前
    0980
    开源机器人学习框架Ark:简化机器人软件开发和部署而设计

    开源机器人学习框架Ark:简化机器人软件开发和部署而设计

    达姆施塔特工业大学、华为诺亚方舟、伦敦帝国理工学院、牛津大学和伦敦大学学院的研究人员推出开源机器人学习框架Ark,通过提供一个基于 Python 的、易于使用的环境来加速机器人学习的研究和商业部署。 ...
    新技术# Ark# 机器人学习框架
    4个月前
    0620
    新型强化学习算法框架EMPG:提升了智能体在长时域任务中的性能与稳定性

    新型强化学习算法框架EMPG:提升了智能体在长时域任务中的性能与稳定性

    在复杂任务中,如网页购物、虚拟环境导航或深度信息检索,大语言模型(LLM)作为智能体的表现正日益受到关注。然而,一个长期困扰研究者的难题是:这些任务往往只在最终成功或失败时给出奖励信号——中间成百上千...
    新技术# EMPG# 强化学习算法
    4个月前
    01660
    RewardDance:用生成式奖励重塑视觉强化学习,让AI生成的图像和视频真正“理解”你的需求

    RewardDance:用生成式奖励重塑视觉强化学习,让AI生成的图像和视频真正“理解”你的需求

    在视觉生成领域,强化学习(Reinforcement Learning, RL)正成为提升模型表现的关键手段。其中,奖励模型(Reward Model, RM)作为引导生成方向的核心组件,直接影响最终...
    新技术# RewardDance# 字节跳动
    4个月前
    01160
    Meta FAIR提出 Darling:用强化学习平衡大语言模型生成质量与语义多样性

    Meta FAIR提出 Darling:用强化学习平衡大语言模型生成质量与语义多样性

    由 Meta FAIR、卡内基梅隆大学与约翰霍普金斯大学联合提出的新框架 Darling(Diversity-Aware Reinforcement Learning for Generation...
    新技术# Darling# Meta FAIR# 大语言模型
    4个月前
    01690
    清华大学等提出UPGE框架:用统一视角重构大模型后训练

    清华大学等提出UPGE框架:用统一视角重构大模型后训练

    在大语言模型(LLM)的训练流程中,“后训练”(post-training)是连接预训练与实际应用的关键阶段。当前主流方法主要包括两类:监督微调(SFT)和强化学习(RL)。前者依赖高质量演示数据,强...
    新技术# UPGE# 大模型后训练
    4个月前
    01360
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    人生 K 线

    人生 K 线

    人生 K 线(Life Destiny K-Line)是一个结合传统八字命理与现代大语言模型(LLM)的轻量级可视化工具。它将一个人从 1 岁到 100 岁的运势走势,以类似股票 K 线图的形式呈现,试图用数据可视化的方式“翻译”命理推演结果。
    Planning with Files

    新Planning with Files

    Planning with Files 是一个轻量但极具启发性的实践——它不依赖新模型,而是用老技术(文件系统)解决新问题(AI 健忘)。对于追求效率与可控性的开发者、研究者和知识工作者而言,值得一试。
    NotebookLM

    NotebookLM

    NotebookLM是谷歌推出的一款个性化AI协作工具,旨在帮助用户更高效地进行信息整理和笔记记录。利用强大的语言模型帮助用户更快地从各种文本、图像以及网页中提取主要信息。
    Grok

    Grok

    Grok是一款先进的对话式人工智能。Grok 旨在提供高效、准确且自然的对话交互体验,适用于多种应用场景,包括客户服务、虚拟助手、教育辅导等。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    查看完整榜单