面向代码修复与优化任务的经验驱动型实验框架SWE-Exp在自动化软件工程领域,一个长期存在的挑战是:如何让 AI 代理不仅“能修代码”,还能“会总结、能举一反三”? 上海交通大学、华为、加州大学圣地亚哥分校与西安电子科技大学的联合研究团队近日提出 SWE...大语言模型# SWE-Exp# 软件工程5个月前01990
问小白开源基于反思型生成范式训练的推理模型XBai o4问小白发布了XBai o4,o=open,o4代表其开源的第四代大模型技术。XBai o4在复杂推理能力方面表现出色,在Medium模式下,XBai o4 现已全面超越OpenAI-o3-mini。 ...大语言模型# XBai o4# 问小白5个月前01750
字节跳动Seed项目组推出基于大语言模型(LLM)的自动化定理证明系统 Seed-Prover字节跳动Seed项目组推出基于大语言模型(LLM)的自动化定理证明系统 Seed-Prover,Seed-Prover 通过结合 LLM 的推理能力和形式化语言(如 Lean)的验证能力,实现了对数学...大语言模型# Seed-Prover# 字节跳动# 自动化定理证明5个月前0970
微软推出Phi-Ground:提高计算机界面(GUI)定位(grounding)的准确性微软推出一个名为 Phi-Ground 的模型家族,旨在提高计算机界面(GUI)定位(grounding)的准确性。GUI 定位是计算机使用代理(CUAs)执行实际操作的核心组件,类似于机器人中的机械...大语言模型# Phi-Ground# 微软5个月前01650
字节跳动 Seed 团队推出Seed Diffusion:打破自回归瓶颈,实现 5.4 倍代码生成加速字节跳动 Seed 团队近期发布了一款实验性语言模型——Seed Diffusion 预览版,它采用离散状态扩散机制,专注于代码生成任务,在推理速度上实现了显著突破:最高可达 2,146 token...大语言模型# Seed Diffusion# 字节跳动5个月前01420
Meta发布新型多语言对比语言-图像预训练(CLIP)模型MetaCLIP 2MetaCLIP 2 是一种新型的多语言对比语言-图像预训练(CLIP)模型,旨在从全球范围内的网络数据中学习图像和文本的表示。传统的 CLIP 模型主要基于英语数据进行训练,而 MetaCLIP 2...大语言模型# Meta# MetaCLIP 25个月前01410
阿里推出“会思考”的30B模型Qwen3-30B-A3B-Thinking-2507:复杂任务表现大幅提升阿里通义千问团队再次升级其 30B 级模型线,正式推出 Qwen3-30B-A3B-Thinking-2507。 这并非一次简单迭代,而是针对复杂推理能力的深度优化版本。过去三个月中,项目组重点提升了...大语言模型# Qwen3-30B-A3B-Thinking-2507# 推理模型5个月前03700
阿里推出 Qwen3-Coder-30B-A3B-Instruct:轻量级代码大模型,支持 256K 上下文继发布超大规模的 Qwen3-Coder-480B-A35B-Instruct 后,阿里通义千问团队近日推出一款更轻量但性能强劲的新版本: Qwen3-Coder-30B-A3B-Instruct 这...大语言模型# Qwen3-Coder-30B-A3B-Instruct# 代码大模型5个月前07360
阿里Qwen团队推出 Qwen3-30B-A3B-Instruct-2507:更强、更准、更懂你阿里Qwen团队发布 Qwen3-30B-A3B-Instruct-2507 ——Qwen3 系列中针对非思考模式优化的新一代指令微调模型。 Qwen Chat:https://chat.qwen.a...大语言模型# Qwen3-30B-A3B-Instruct-2507# Qwen团队6个月前08010
新加坡政府科技局发布LionGuard 2:专为新加坡语言生态设计的内容审核防护模型在多语言交织、语码频繁切换的新加坡数字环境中,一句看似无害的“lah”或“leh”,可能暗藏冒犯;一段夹杂中英马来语的对话,对通用内容审核系统而言却是一道难题。 去年,新加坡政府科技局(GovTech...大语言模型# LionGuard 2# 内容审核防护模型6个月前02460
智谱AI正式推出 GLM 系列最新旗舰大模型GLM-4.5 系列:统一推理、编码与代理的全能旗舰模型智谱AI正式推出 GLM-4.5 与 GLM-4.5-Air —— GLM 系列最新旗舰大模型。这两款模型专为代理(Agent)导向应用设计,首次在单一架构中深度融合了复杂推理、高效编码与多工具协同能...大语言模型# GLM-4.5# GLM-4.5-Air# 智谱AI6个月前02910
上海交通大学发布SmallThinker 系列模型:专为设备端部署设计的原生混合专家(MoE)语言模型由上海交通大学 IPADS 实验室、人工智能学院与 Zenergize AI 联合研发的 SmallThinker 系列模型,是一组专为设备端部署设计的原生混合专家(MoE)语言模型。其核心目标是在资...大语言模型# SmallThinker# 上海交通大学6个月前02950