清华、普林斯顿等联合推出数学定理证明模型Goedel-Prover-V2:在自动形式化数学证明生成领域树立了新的技术标杆近日,由普林斯顿大学语言与智能实验室、清华大学、英伟达、斯坦福大学、Meta FAIR、亚马逊、上海交通大学和北京大学联合研发的 Goedel-Prover-V2 正式发布。这是一系列开源语言模型,在...大语言模型# Goedel-Prover-V2# 数学定理证明模型7个月前02230
Gemini Embedding 正式上线:支持多语言、灵活维度,现已全面可用谷歌首个正式版 Gemini Embedding 文本嵌入模型(gemini-embedding-001) 现已在 Gemini API 和 Vertex AI 平台对开发者全面开放使用。 自今年三月...大语言模型# Gemini Embedding# 文本嵌入模型# 谷歌7个月前02180
Liquid AI 发布 LFM2:设备端最快的生成式基础模型Liquid AI 正式发布新一代设备端基础模型 LFM2(Liquid Foundation Model 2),重新定义了边缘 AI 推理的速度、效率与部署灵活性。 模型:https://huggi...大语言模型# LFM2# Liquid AI7个月前02320
Mistral AI 推出 Devstral Medium 以及 Devstral Small 的升级版本Mistral AI 推出了 Devstral Medium 以及 Devstral Small 的升级版本。这些模型由 Mistral AI 与 All Hands AI 合作开发,重点在于对不同提...大语言模型# Devstral Medium# Devstral Small# Mistral AI7个月前01980
月之暗面开源智能代理基础模型Kimi K2,参数达 1T,激活参数 32B月之暗面正式发布其新一代 MoE 架构大模型——Kimi K2,并同步开源。该模型具备卓越的代码能力、数学推理能力以及智能代理(Agent)任务处理能力,是目前最适配于构建自主化智能系统的开源基础模型...大语言模型# Kimi K2# 推理模型# 智能代理模型7个月前01310
Reka AI发布推理模型Reka Flash 3.1 :强化学习驱动的高效推理模型升级Reka AI 正式发布了其推理模型 Reka Flash 3.1,这是其 21 亿参数模型 Reka Flash 3 的重要升级版本。该模型在代码生成、智能体任务微调等方面表现尤为突出,并作为 Re...大语言模型# Reka AI# Reka Flash 3.1# 推理模型7个月前01570
Kimina-Prover:首个实现人类级形式推理的大型定理证明模型由 Numina 与 Kimi 团队联合开发的 Kimina-Prover-72B 正式发布。这是目前在 Lean 4 形式化语言中,首个能够以接近人类方式推理并自动构建数学定理证明的大型神经定理证明...大语言模型# Kimina-Prover# 大型定理证明模型7个月前02730
Sarvam AI 发布 Sarvam-Translate:支持印度22种语言的文档级翻译模型Sarvam AI 推出了其最新翻译模型 Sarvam-Translate,一款专注于支持印度 22 种官方语言的高质量、上下文感知翻译系统。该模型基于 Google 的 Gemma3-4B-IT 进...大语言模型# Sarvam AI# Sarvam-Translate# 翻译模型7个月前01430
微软推出 Phi 模型家族的最新成员 — Phi-4-mini-flash-reasoning微软今天宣布推出 Phi 模型家族的最新成员 —— Phi-4-mini-flash-reasoning。这款模型专为计算、内存和延迟受限的场景设计,为边缘设备、移动应用等资源受限环境提供高效的推理能...大语言模型# Phi-4-mini-flash-reasoning# 微软7个月前01050
T5Gemma:谷歌推出全新编码器-解码器 Gemma 模型系列在当前大语言模型(LLM)领域中,解码器独占架构凭借其强大的生成能力成为主流。然而,经典的编码器-解码器架构——如 T5(文本到文本转换变换器)——因其出色的推理效率、灵活的设计以及对输入语义的深度理...大语言模型# T5Gemma# 解码器# 谷歌8个月前04500
字节跳动 & 南大联合推出 CriticLean 框架:让 AI 更准确地翻译数学为代码将自然语言数学语句自动转化为形式化代码(如 Lean 4)是计算数学中的核心挑战之一。尽管已有许多自动化工具尝试解决这一问题,但其准确性仍面临瓶颈,尤其是在需要深入理解语义的复杂场景中。 为此,字节跳...大语言模型# CriticLean# 字节跳动8个月前01740
微软推出 NextCoder:基于 Qwen2.5-Coder 的高效代码编辑模型近年来,软件开发中的代码编辑需求日益增长,尤其是在维护和重构已有项目时。然而,现有的大语言模型在面对多样化的代码修改任务时,往往表现不佳。为了解决这一问题,微软联合相关研究团队提出了一套全新的方法,并...大语言模型# NextCoder# Qwen2.5-Coder# 代码编辑模型8个月前02350