LG开源推理模型EXAONE Deep,在数学与编程方面表现出色LG AI Research正式开源了其最新研发的AI推理模型——EXAONE Deep。这款模型分为2.4B、7.8B和32B三个版本,在多个关键领域展现出卓越性能。据官方称,EXAONE Deep...大语言模型# EXAONE Deep# LG# 推理模型9个月前02000
阿里Qwen团队推出新一代代码大模型 Qwen3-Coder阿里通义Qwen团队发布全新代码大模型系列 Qwen3-Coder,这是目前 Qwen 系列中最具代理(Agent)能力的代码模型。此次发布的最大版本为 Qwen3-Coder-480B-A35B-I...大语言模型# Qwen Code CLI# Qwen3-Coder# 代码大模型5个月前01990
Liquid AI 发布 LFM2:设备端最快的生成式基础模型Liquid AI 正式发布新一代设备端基础模型 LFM2(Liquid Foundation Model 2),重新定义了边缘 AI 推理的速度、效率与部署灵活性。 模型:https://huggi...大语言模型# LFM2# Liquid AI5个月前01990
基于DeepSeek-R1构建的开源高效编码模型DeepCoder-14B由Together AI和Agentica联合推出了一款编码模型DeepCoder-14B,正以其卓越的性能和完全开源的特点,引发AI社区的广泛关注。这款基于DeepSeek-R1构建的模型,在多个编...大语言模型# DeepCoder-14B# DeepSeek-R1# 编码模型8个月前01990
Kimina-Prover:首个实现人类级形式推理的大型定理证明模型由 Numina 与 Kimi 团队联合开发的 Kimina-Prover-72B 正式发布。这是目前在 Lean 4 形式化语言中,首个能够以接近人类方式推理并自动构建数学定理证明的大型神经定理证明...大语言模型# Kimina-Prover# 大型定理证明模型5个月前01980
新型段落排序模型 ReasonRank:通过强大的推理能力提升段落排序任务的性能中国人民大学高岭人工智能学院、百度公司和卡内基梅隆大学的研究人员推出新型段落排序模型 ReasonRank,通过强大的推理能力提升段落排序任务的性能。该模型通过引入推理能力,能够更好地理解查询意图,并...大语言模型# ReasonRank# 段落排序模型4个月前01930
面向代码修复与优化任务的经验驱动型实验框架SWE-Exp在自动化软件工程领域,一个长期存在的挑战是:如何让 AI 代理不仅“能修代码”,还能“会总结、能举一反三”? 上海交通大学、华为、加州大学圣地亚哥分校与西安电子科技大学的联合研究团队近日提出 SWE...大语言模型# SWE-Exp# 软件工程5个月前01930
阿里Qwen团队发布 Qwen3-235B-A22B-Thinking-2507:深度推理能力再升级在持续三个月的优化后,阿里Qwen团队正式推出 Qwen3-235B-A22B-Thinking-2507 版本。该模型在逻辑推理、数学、科学、编程及学术任务上的表现显著提升,进一步巩固了其在开源思维...大语言模型# Qwen3-235B-A22B-Thinking-2507# 推理模型5个月前01910
Gemini Embedding 正式上线:支持多语言、灵活维度,现已全面可用谷歌首个正式版 Gemini Embedding 文本嵌入模型(gemini-embedding-001) 现已在 Gemini API 和 Vertex AI 平台对开发者全面开放使用。 自今年三月...大语言模型# Gemini Embedding# 文本嵌入模型# 谷歌5个月前01910
谷歌发布了新推理模型Gemini 2.5系列:其特色在于回答问题前会进行“思考”过程本周二(2025年3月25日),谷歌发布了新推理模型Gemini 2.5系列,其特色在于回答问题前会进行“思考”过程。为了启动这一系列,谷歌推出了Gemini 2.5 Pro Experimental...大语言模型# Gemini 2.5# 思考模型# 推理模型9个月前01900
微软新推 Mu 模型:专为 Windows 设置代理而生的小而强语言模型微软近日推出了一款全新的小型语言模型——Mu,它专为边缘设备和特定任务设计,在本地运行时展现出卓越性能。目前,Mu 已经在 Copilot+ PC 的 Windows Insider 开发频道中,用于...大语言模型# Mu 模型# 微软6个月前01880
阿里通义实验室推出强化学习框架ZEROSEARCH:通过模拟搜索引擎来提升大语言模型的信息检索能力阿里通义实验室推出一种创新的强化学习框架ZEROSEARCH,通过模拟搜索引擎来提升大语言模型(LLMs)的信息检索能力,而无需与真实搜索引擎进行交互。该框架通过轻量级的监督微调(SFT),将 LLM...大语言模型# ZEROSEARCH# 强化学习框架7个月前01860