英伟达发布OpenReasoning-Nemotron:多规模推理模型,覆盖数学、科学与编程英伟达近日发布了 OpenReasoning-Nemotron 模型家族,这是一组专为数学、科学和编程推理任务优化的大语言模型。 模型:https://huggingface.co/collectio...大语言模型# OpenReasoning-Nemotron# 英伟达5个月前02680
字节跳动开源 Seed-X:70亿参数的多语言翻译模型,性能媲美 GPT-4 和 Gemini字节跳动推出Seed-X,这是一个开源的多语言翻译模型系列,包括指令模型、强化学习模型和奖励模型,参数规模为 70亿(7B),却在翻译能力上展现出媲美甚至超越超大规模闭源模型(如 Gemini-2.5...大语言模型# SEED-X# 多语言翻译模型# 字节跳动5个月前01100
清华、普林斯顿等联合推出数学定理证明模型Goedel-Prover-V2:在自动形式化数学证明生成领域树立了新的技术标杆近日,由普林斯顿大学语言与智能实验室、清华大学、英伟达、斯坦福大学、Meta FAIR、亚马逊、上海交通大学和北京大学联合研发的 Goedel-Prover-V2 正式发布。这是一系列开源语言模型,在...大语言模型# Goedel-Prover-V2# 数学定理证明模型5个月前01760
Gemini Embedding 正式上线:支持多语言、灵活维度,现已全面可用谷歌首个正式版 Gemini Embedding 文本嵌入模型(gemini-embedding-001) 现已在 Gemini API 和 Vertex AI 平台对开发者全面开放使用。 自今年三月...大语言模型# Gemini Embedding# 文本嵌入模型# 谷歌5个月前01890
Liquid AI 发布 LFM2:设备端最快的生成式基础模型Liquid AI 正式发布新一代设备端基础模型 LFM2(Liquid Foundation Model 2),重新定义了边缘 AI 推理的速度、效率与部署灵活性。 模型:https://huggi...大语言模型# LFM2# Liquid AI5个月前01970
Mistral AI 推出 Devstral Medium 以及 Devstral Small 的升级版本Mistral AI 推出了 Devstral Medium 以及 Devstral Small 的升级版本。这些模型由 Mistral AI 与 All Hands AI 合作开发,重点在于对不同提...大语言模型# Devstral Medium# Devstral Small# Mistral AI5个月前01720
月之暗面开源智能代理基础模型Kimi K2,参数达 1T,激活参数 32B月之暗面正式发布其新一代 MoE 架构大模型——Kimi K2,并同步开源。该模型具备卓越的代码能力、数学推理能力以及智能代理(Agent)任务处理能力,是目前最适配于构建自主化智能系统的开源基础模型...大语言模型# Kimi K2# 推理模型# 智能代理模型5个月前01210
Reka AI发布推理模型Reka Flash 3.1 :强化学习驱动的高效推理模型升级Reka AI 正式发布了其推理模型 Reka Flash 3.1,这是其 21 亿参数模型 Reka Flash 3 的重要升级版本。该模型在代码生成、智能体任务微调等方面表现尤为突出,并作为 Re...大语言模型# Reka AI# Reka Flash 3.1# 推理模型5个月前01360
Kimina-Prover:首个实现人类级形式推理的大型定理证明模型由 Numina 与 Kimi 团队联合开发的 Kimina-Prover-72B 正式发布。这是目前在 Lean 4 形式化语言中,首个能够以接近人类方式推理并自动构建数学定理证明的大型神经定理证明...大语言模型# Kimina-Prover# 大型定理证明模型5个月前01750
Sarvam AI 发布 Sarvam-Translate:支持印度22种语言的文档级翻译模型Sarvam AI 推出了其最新翻译模型 Sarvam-Translate,一款专注于支持印度 22 种官方语言的高质量、上下文感知翻译系统。该模型基于 Google 的 Gemma3-4B-IT 进...大语言模型# Sarvam AI# Sarvam-Translate# 翻译模型5个月前01310
微软推出 Phi 模型家族的最新成员 — Phi-4-mini-flash-reasoning微软今天宣布推出 Phi 模型家族的最新成员 —— Phi-4-mini-flash-reasoning。这款模型专为计算、内存和延迟受限的场景设计,为边缘设备、移动应用等资源受限环境提供高效的推理能...大语言模型# Phi-4-mini-flash-reasoning# 微软5个月前0960
T5Gemma:谷歌推出全新编码器-解码器 Gemma 模型系列在当前大语言模型(LLM)领域中,解码器独占架构凭借其强大的生成能力成为主流。然而,经典的编码器-解码器架构——如 T5(文本到文本转换变换器)——因其出色的推理效率、灵活的设计以及对输入语义的深度理...大语言模型# T5Gemma# 解码器# 谷歌5个月前03100