Mistral AI发布开源模型Mistral Small 3.1,号称在性能上超越了Gemma 3和GPT-4o Mini等同类模型

MistralAI宣布推出Mistral Small 3.1,这一新模型在性能和功能上均达到了同级别模型中的顶尖水平。作为Mistral Small 3的升级版本,3.1版本不仅在文本性能和多模态理解能力上实现了显著提升,还扩展了上下文窗口至128k令牌,同时保持了每秒150令牌的高效推理速度。这一模型在性能上超越了Gemma 3和GPT-4o Mini等同类模型,并以Apache 2.0许可证开源发布。

Mistral AI发布开源模型Mistral Small 3.1,号称在性能上超越了Gemma 3和GPT-4o Mini等同类模型

以下是模型性能的更多细节:

指令性能

文本指令基准测试

Mistral AI发布开源模型Mistral Small 3.1,号称在性能上超越了Gemma 3和GPT-4o Mini等同类模型

多模态指令基准测试

MM-MT-Bench评分范围为0至100。

Mistral AI发布开源模型Mistral Small 3.1,号称在性能上超越了Gemma 3和GPT-4o Mini等同类模型

多语言

Mistral AI发布开源模型Mistral Small 3.1,号称在性能上超越了Gemma 3和GPT-4o Mini等同类模型

长上下文

Mistral AI发布开源模型Mistral Small 3.1,号称在性能上超越了Gemma 3和GPT-4o Mini等同类模型

预训练性能

Mistral还发布了Mistral Small 3.1的预训练基础模型。

Mistral AI发布开源模型Mistral Small 3.1,号称在性能上超越了Gemma 3和GPT-4o Mini等同类模型

使用场景

Mistral Small 3.1是一个多功能模型,设计用于处理广泛的生成式AI任务,包括指令遵循、对话辅助、图像理解和函数调用。它为企业和消费级AI应用提供了坚实的基础。

主要功能与能力

  • 轻量化:Mistral Small 3.1可在单个RTX 4090或配备32GB RAM的Mac上运行。这使其非常适合设备端使用场景。
  • 快速响应的对话辅助:非常适合虚拟助手和其他需要快速、准确响应的应用。
  • 低延迟函数调用:能够在自动化或代理工作流程中快速执行函数。
  • 针对特定领域的微调:Mistral Small 3.1可被微调以专注于特定领域,创建精准的主题专家。这在法律建议、医疗诊断和技术支持等领域尤为有用。
  • 高级推理的基础:我们持续为社区基于开放Mistral模型的构建能力感到惊叹。近几周,我们看到了一些基于Mistral Small 3构建的优秀推理模型,例如Nous Research的DeepHermes 24B。为此,我们发布了Mistral Small 3.1的基础和指令检查点,以支持模型的进一步下游定制。

Mistral Small 3.1可用于需要多模态理解的各种企业和消费者应用,例如文档验证、诊断、设备端图像处理、质量检查的视觉检测、安全系统中的对象检测、基于图像的客户支持以及通用辅助。

可用性

Mistral Small 3.1可在Hugging Face网站上下载:Mistral Small 3.1 BaseMistral Small 3.1 Instruct。对于需要私有和优化推理基础设施的企业部署,请联系我们。

您还可以从今天起通过Mistral AI的开发者平台La Plateforme上的API试用该模型。该模型也在Google Cloud Vertex AI上可用。Mistral Small 3.1将在未来几周内通过NVIDIA NIM提供。

© 版权声明

相关文章

暂无评论

none
暂无评论...