Mistral OCR 3 发布：手写、表格、低质量扫描件识别全面升级

多模态模型4个月前发布小马良

34 0

Mistral AI 正式推出 Mistral OCR 3，其在复杂文档场景下的识别准确率显著超越前代模型与主流竞品。该模型专注于真实业务环境中的多样化文档——从手写批注、低质量扫描件到多层级表格——并以每 1000 页 1–2 美元的定价提供企业级能力。

官方介绍：https://mistral.ai/news/mistral-ocr-3
API：https://console.mistral.ai/build/document-ai/ocr-playground

Mistral推出Mistral OCR：帮助开发者将复杂的 PDF 文档转换为 Markdown 文件

Mistral OCR 3 发布：手写、表格、低质量扫描件识别全面升级

核心升级：74% 胜率，全场景覆盖

在基于真实客户用例构建的内部基准测试中，Mistral OCR 3 相比 Mistral OCR 2 取得 74% 的整体胜率，在以下四类高难度场景中表现尤为突出：

场景	能力提升
手写体识别	可准确解析草书、混合打印/手写内容、覆盖在表单上的批注
表单处理	精准检测复选框、标签、手写字段，适用于发票、收据、政府表格
低质量扫描件	对压缩伪影、倾斜、低 DPI、背景噪点具备强鲁棒性
复杂表格重建	支持合并单元格、多级表头、列层次结构，输出含 `colspan`/`rowspan` 的 HTML 表格

所有语言和文档格式均获得一致提升，无特定领域偏向。

结构化输出：不止于文本

Mistral OCR 3 不仅提取文本，更保留文档结构：

默认输出格式：Markdown（含图像引用）
表格输出：HTML 标签（完整保留布局语义）
可选 JSON 模式：通过 Document AI Playground 获取结构化字段（如发票金额、日期、供应商）

这种结构化能力使下游系统（如 RAG、智能体、知识图谱）不仅能“读内容”，还能“理解布局”。

Mistral OCR 3 发布：手写、表格、低质量扫描件识别全面升级

定价与可用性

标准价格：$2 / 1000 页
批量 API 折扣：$1 / 1000 页（50% off）
模型 ID：mistral-ocr-2512
访问方式：
- API：通过 Mistral AI 平台直接调用
- Document AI Playground：Mistral AI Studio 中的拖放式界面，支持 PDF/图像上传并实时预览解析结果

完全向后兼容 Mistral OCR 2，现有集成可无缝升级。

Mistral OCR 3 发布：手写、表格、低质量扫描件识别全面升级

典型应用

Mistral OCR 3 适用于两类主要场景：

▶ 高吞吐企业流水线

自动化发票/收据处理，提取结构化财务字段
公司历史档案数字化
技术报告、科研论文的文本清洗与索引

▶ 交互式智能工作流

为 AI 智能体提供高质量文档上下文
构建端到端文档理解系统（OCR → 摘要 → 问答）
手写笔记转数字知识库

早期客户已用于改进企业搜索、自动化合规审查与科研数据提取。

为什么 OCR 仍是生成式 AI 的关键？

正如 IDC 人工智能研究总监 Tim Law 所指出：

“高效、高保真地提取文本与嵌入图像，是组织从非结构化数据中解锁价值的基础。这为生成式 AI 和智能体提供了更丰富的上下文，从而形成竞争优势。”

Mistral OCR 3 正是这一理念的工程体现——将物理世界或扫描文档中的信息，可靠地转化为 AI 可理解的结构化知识。

多模态模型 # Mistral OCR 3

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

微软推出全新多模态大语言模型家族Florence-VL

微软推出全新多模态大语言模型家族Florence-VL

多模态模型 # Florence-VL # 多模态大语言模型 # 微软

1年前

03170

阿里国际发布多模态大语言模型Ovis2.5：原生分辨率视觉感知与深度推理的双重突破

阿里国际发布多模态大语言模型Ovis2.5：原生分辨率视觉感知与深度推理的双重突破

多模态模型 # Ovis2.5 # 多模态大语言模型 # 阿里国际

8个月前

03290

新型多模态原生模型Aria：专门设计来处理和理解多种类型的信息（文本、代码、图像和视频）

新型多模态原生模型Aria：专门设计来处理和理解多种类型的信息（文本、代码、图像和视频）

多模态模型 # Aria # Rhymes AI # 多模态模型

1年前

05770

复旦联合团队发布首个统一多模态奖励模型UNIFIEDREWARD：图像视频都能评，还能优化视觉生成

复旦联合团队发布首个统一多模态奖励模型UNIFIEDREWARD：图像视频都能评，还能优化视觉生成

多模态模型 # UNIFIEDREWARD # 统一多模态奖励模型

10个月前

04160

暂无评论

none

暂无评论...