新技术

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

清华大学等提出UPGE框架：用统一视角重构大模型后训练

在大语言模型（LLM）的训练流程中，“后训练”（post-training）是连接预训练与实际应用的关键阶段。当前主流方法主要包括两类：监督微调（SFT）和强化学习（RL）。前者依赖高质量演示数据，强...

新技术 # UPGE # 大模型后训练

5个月前

01440

PractiLight：基于基础扩散模型实现实用光照控制，兼顾泛化与效率

在图像生成领域，精准控制光照一直是颇具挑战性的任务 —— 改变场景光照不仅要调整直接光源效果，还需协调反射、阴影、高光等连锁反应，涉及全图像及多频率范围的复杂关系。现有方法多依赖大规模特定领域数据集训...

新技术 # PractiLight # 光照控制

5个月前

01760

TRKT：用关系感知与时序增强提升弱监督场景图生成

在视频理解任务中，如何让机器“看懂”复杂的视觉场景？不仅要知道画面中有哪些对象，还要理解它们之间的互动关系——这正是动态场景图生成（Dynamic Scene Graph Generation, DS...

新技术 # TRKT # 场景图生成

5个月前

01480

RealDevWorld：首个面向 AI 开发的生产级软件工程基准

随着 AI 编程能力的快速演进，越来越多的模型可以“一键生成”完整应用。但一个问题随之而来：我们该如何判断这些 AI 生成的应用，是否真的可用？传统的代码评测方法，如 LeetCode 式的算法题或...

新技术 # RealDevWorld # 软件工程基准

5个月前

01300

腾讯推出 Think in Games (TiG) 框架：通过强化学习结合大语言模型来提升模型在游戏环境中的决策和推理能力

腾讯推出 Think in Games (TiG) 框架，通过强化学习（Reinforcement Learning, RL）结合大语言模型（LLMs）来提升模型在游戏环境中的决策和推理能力。TiG ...

新技术 # Think in Games # 腾讯

5个月前

02090

新型辅助训练目标Token Order Prediction (TOP)：用于改进语言模型中的下一个词预测（NTP）任务

MBZUAI推出新型辅助训练目标Token Order Prediction (TOP)，用于改进语言模型中的下一个词预测（Next-Token Prediction, NTP）任务。TOP 通过预测...

新技术 # TOP # 辅助训练目标

5个月前

0890

字节跳动推出 UltraMemV2：在低内存访问下，追平8专家MoE性能

在大模型稀疏化架构的演进中，效率与性能的权衡始终是核心挑战。 MoE（Mixture of Experts）通过仅激活部分专家实现高效推理，但其频繁的跨专家参数访问带来了高昂的内存开销。为解决这一问题...

新技术 # UltraMemV2 # 字节跳动

5个月前

0840

Beyond Memorization：通过不同的架构和训练方法来提升大语言模型多步推理能力

阿联酋MBZUAI、莫斯科物理技术学院、莫斯科AIRI和伦敦数学科学研究所的研究人员推出Beyond Memorization，通过不同的架构和训练方法来提升大语言模型（LLMs）多步推理能力。作者们...

新技术 # Beyond Memorization # 大语言模型

5个月前

0910

应对 95% AI 试点失败！Salesforce 发布 CRMArena-Pro，模拟真实业务环境

企业AI的一大痛点是“演示时亮眼，落地时拉胯”——MIT最新报告显示，95%的企业生成式AI试点无法推进至生产阶段，Salesforce自身研究也发现，仅依赖大语言模型（LLM）的AI代理在复杂业务场...

新技术 # CRMArena-Pro # Salesforce

5个月前

01430

Sakana AI 新算法 M2N2：无需重新训练，让 AI 模型 “进化” 得更强

日本 AI 实验室 Sakana AI 近期推出一项突破性技术 ——自然生态位模型合并（M2N2），彻底改变了 AI 模型的优化逻辑。与传统依赖昂贵算力和海量数据的 “重新训练”“微调” 不同，M2...

新技术 # M2N2 # Sakana AI

5个月前

01300

Mixture of Contexts (MoC) ：新型注意力机制模块来解决长视频生成中的长期记忆问题

斯坦福大学、字节跳动、约翰·霍普金斯大学和香港中文大学的研究人员推出一种名为 Mixture of Contexts (MoC) 的新型注意力机制模块来解决长视频生成中的长期记忆问题。长视频生成的关键...

新技术 # MoC # 长视频生成

5个月前

01170

TKG-DM：无需微调，让扩散模型精准生成色键背景图像

当前扩散模型已能生成高真实感、高文本忠实度的图像，但主流大规模文本到图像模型（如 Stable Diffusion）面临一大局限——难以生成“前景对象置于色键背景”的图像，若要分离前景与背景元素，往往...

新技术 # TKG-DM

5个月前

01280

加载更多

清华大学等提出UPGE框架：用统一视角重构大模型后训练

PractiLight：基于基础扩散模型实现实用光照控制，兼顾泛化与效率

TRKT：用关系感知与时序增强提升弱监督场景图生成

RealDevWorld：首个面向 AI 开发的生产级软件工程基准

腾讯推出 Think in Games (TiG) 框架：通过强化学习结合大语言模型来提升模型在游戏环境中的决策和推理能力

新型辅助训练目标Token Order Prediction (TOP)：用于改进语言模型中的下一个词预测（NTP）任务

字节跳动推出 UltraMemV2：在低内存访问下，追平8专家MoE性能

Beyond Memorization：通过不同的架构和训练方法来提升大语言模型多步推理能力

应对 95% AI 试点失败！Salesforce 发布 CRMArena-Pro，模拟真实业务环境

Sakana AI 新算法 M2N2：无需重新训练，让 AI 模型 “进化” 得更强

Mixture of Contexts (MoC) ：新型注意力机制模块来解决长视频生成中的长期记忆问题

TKG-DM：无需微调，让扩散模型精准生成色键背景图像

Clawdbot/Moltbot

Situation Monitor

Higgsfield AI

Fogsight (雾象)

CivitAI

ITELLOU

新技术

网址

Clawdbot/Moltbot

Situation Monitor

Higgsfield AI

Fogsight (雾象)

CivitAI

ITELLOU