PDF Craft

4周前发布 265 00

PDF Craft是一款专注于扫描版书籍 PDF 转换的开源工具。它利用 DeepSeek OCR 模型,在本地完成从图像型 PDF 到结构化电子书(如 Markdown 或 EPUB)的全流程处理,无需联网,不依赖大语言模型(LLM),适合对隐私、精度与效率有要求的用户。

所在地:
中国
收录时间:
2025-12-20
其他站点:
PDF CraftPDF Craft

PDF Craft是一款专注于扫描版书籍 PDF 转换的开源工具。它利用 DeepSeek OCR 模型,在本地完成从图像型 PDF 到结构化电子书(如 Markdown 或 EPUB)的全流程处理,无需联网,不依赖大语言模型(LLM),适合对隐私、精度与效率有要求的用户。

PDF Craft

项目特别针对低清晰度、双栏排版、含公式表格的学术或技术文档进行了优化,能自动识别正文、过滤页眉页脚,并妥善保留脚注、图片、公式等关键元素。生成的 EPUB 文件还会自动构建目录,提升阅读体验。

核心能力

基于 DeepSeek OCR 的高精度识别

  • 支持模糊、倾斜、低分辨率的扫描件或拍照 PDF
  • 无需网络请求,所有 OCR 计算在本地 GPU 上完成
  • 相比旧版(v0.2.8),转换速度显著提升,稳定性更高

注:v1.0.0 起移除了 LLM 文本后处理功能。若仍需语义纠错,可继续使用 v0.2.8。

智能版面理解与结构还原

  • 自动识别单栏/双栏布局、图文混排、跨页表格
  • 避免因分栏导致的内容错位或截断
  • 保留原始逻辑顺序,确保段落连贯

公式与脚注的完整保留

  • 精准识别 LaTeX 风格的行内与独立数学公式(如 $E=mc^2$ 或 \[ \int_0^1 x^2 dx \]
  • 脚注内容(包括嵌入的图片或符号)会被提取并关联至正文
  • 化学方程式、特殊符号等技术内容亦能正确转写

输出格式

  • Markdown:结构清晰,兼容 Obsidian、Typora 等编辑器
  • EPUB:自动生成目录、章节标题,适配 Kindle、Apple Books 等阅读器
  • 未来计划支持更多格式(如 DOCX、HTML)

部署与使用要求

  • 硬件:建议 NVIDIA RTX 3060 或更高显卡(用于加速 OCR 推理)
  • 运行方式
    • 通过 OOMOL Studio 本地一键启动(推荐)
    • 或直接运行源码(需配置 CUDA 环境)
  • 隐私保障:所有数据处理均在本地完成,无外传风险
PDF Craft

适用场景

用户类型使用场景
研究人员将扫描版论文、教材转为可搜索、可引用的电子文档
知识管理者批量处理 PDF 书籍,构建个人知识库(如 Obsidian)
出版从业者快速提取扫描书内容,用于数字化再排版
开发者通过 API 自动化处理用户上传的 PDF,生成结构化输出

数据统计

相关导航

暂无评论

none
暂无评论...