Mistral AI发布开源模型Mistral Small 3.1，号称在性能上超越了Gemma 3和GPT-4o Mini等同类模型

187 0

MistralAI宣布推出Mistral Small 3.1，这一新模型在性能和功能上均达到了同级别模型中的顶尖水平。作为Mistral Small 3的升级版本，3.1版本不仅在文本性能和多模态理解能力上实现了显著提升，还扩展了上下文窗口至128k令牌，同时保持了每秒150令牌的高效推理速度。这一模型在性能上超越了Gemma 3和GPT-4o Mini等同类模型，并以Apache 2.0许可证开源发布。

模型：https://huggingface.co/mistralai

以下是模型性能的更多细节：

指令性能

文本指令基准测试

多模态指令基准测试

MM-MT-Bench评分范围为0至100。

多语言

长上下文

预训练性能

Mistral还发布了Mistral Small 3.1的预训练基础模型。

使用场景

Mistral Small 3.1是一个多功能模型，设计用于处理广泛的生成式AI任务，包括指令遵循、对话辅助、图像理解和函数调用。它为企业和消费级AI应用提供了坚实的基础。

主要功能与能力

轻量化：Mistral Small 3.1可在单个RTX 4090或配备32GB RAM的Mac上运行。这使其非常适合设备端使用场景。
快速响应的对话辅助：非常适合虚拟助手和其他需要快速、准确响应的应用。
低延迟函数调用：能够在自动化或代理工作流程中快速执行函数。
针对特定领域的微调：Mistral Small 3.1可被微调以专注于特定领域，创建精准的主题专家。这在法律建议、医疗诊断和技术支持等领域尤为有用。
高级推理的基础：我们持续为社区基于开放Mistral模型的构建能力感到惊叹。近几周，我们看到了一些基于Mistral Small 3构建的优秀推理模型，例如Nous Research的DeepHermes 24B。为此，我们发布了Mistral Small 3.1的基础和指令检查点，以支持模型的进一步下游定制。

Mistral Small 3.1可用于需要多模态理解的各种企业和消费者应用，例如文档验证、诊断、设备端图像处理、质量检查的视觉检测、安全系统中的对象检测、基于图像的客户支持以及通用辅助。