随着生成式 AI 的快速发展,企业对高效处理和利用文档数据的需求日益增加。本周四,法国AI初创企业Mistral 推出了一款新的 API——Mistral OCR,旨在帮助开发者将复杂的 PDF 文档转换为 Markdown 文件。Mistral OCR可以以前所未有的准确性和认知能力理解文档中的每个元素,包括媒体、文本、表格和公式等,这一创新工具不仅简化了文档处理流程,还为生成式 AI 的应用提供了更强大的支持。
Mistral OCR 核心亮点
1. 对复杂文档的顶尖理解能力
Mistral OCR 在处理复杂文档方面表现出色,能够准确理解交错的图像、数学表达式、表格以及 LaTeX 格式的高级布局。它不仅提取文本内容,还能识别和处理文档中的图表、图形和公式,确保复杂文档(如科学论文)的完整性和准确性。
2. 原生多语言和多模态支持
Mistral OCR 支持全球数千种文字、字体和语言,能够解析和转录多语言文档。这种多语言能力对于处理全球组织的多语言文档以及服务于利基市场的本地企业至关重要。

3. 一流的基准测试表现
在严格的基准测试中,Mistral OCR 始终优于其他领先的 OCR 模型。它不仅在文档分析的多个方面表现出色,还能从文档中提取嵌入的图像和文本,而其他模型通常不具备此功能。

4. 同类中最快的处理速度
Mistral OCR 比同类模型更轻量,处理速度显著快于竞争对手。单个节点每分钟可处理多达 2000 页文档,确保即使在高吞吐量环境中也能持续学习和改进。
5. 文档即提示,结构化输出
Mistral OCR 引入了“文档即提示”的功能,支持更强大和精确的指令。用户可以从文档中提取特定信息并将其格式化为结构化输出(如 JSON),并将其链接到下游函数调用中,从而构建更智能的系统。
6. 选择性提供自托管选项
对于有严格数据隐私要求的组织,Mistral OCR 提供自托管选项,确保敏感或机密信息在您自己的基础设施中保持安全,符合监管和安全标准。
应用场景
1. 数字化科学研究
领先的研究机构正在使用 Mistral OCR 将科学论文和期刊转换为 AI 就绪格式,使其可被下游智能引擎访问,从而显著加快协作和科学工作流程。
2. 保护历史与文化遗产
作为遗产保管者的组织和非营利机构正在使用 Mistral OCR 数字化历史文档和文物,确保其保存并向更广泛的受众开放。
3. 简化客户服务
客户服务部门正在探索使用 Mistral OCR 将文档和手册转换为索引知识,从而缩短响应时间并提高客户满意度。
4. 使设计、教育、法律等领域的文献 AI 就绪
Mistral OCR 还帮助公司将技术文献、工程图纸、讲义、演示文稿、监管文件等转换为索引化、可回答的格式,释放数百万文档中的智能和生产力。
体验与部署
1. 免费试用
Mistral OCR 功能已在Le Chat 上免费开放试用。用户可以体验其强大的文档处理能力,感受从复杂文档中提取信息的便捷性。
2. API 访问
要试用 API,请访问 la Plateforme。Mistral 提供的 API mistral-ocr-latest 价格为每 1000 页 1 美元(批量推理时每美元可处理的页数约为两倍),适用于各种规模的项目。
3. 本地部署
对于处理高度敏感或机密信息的组织,Mistral 提供本地部署选项,确保数据安全和隐私。