OCRFluxOCRFlux 是一个基于多模态大语言模型的工具包,可以将 PDF 和图像转换为干净、可读的纯 Markdown 文本,显著提升当前技术水平。08570实用工具# Markdown# OCR# OCRFlux
docextdocext 是一个无需 OCR 的工具,用于从发票、护照等文档中提取结构化信息。它利用视觉语言模型(VLMs)从文档图像中准确识别和提取字段数据和表格信息。05490AI工具# docext# OCR# 文档提取