
Rust LLM from Scratch
Rust LLM from Scratch是一个完全使用纯 Rust 实现的、没有外部机器学习框架的大语言模型。从头构建,仅使用 ndarray 进行矩阵运算。
PDF Craft是一款专注于扫描版书籍 PDF 转换的开源工具。它利用 DeepSeek OCR 模型,在本地完成从图像型 PDF 到结构化电子书(如 Markdown 或 EPUB)的全流程处理,无需联网,不依赖大语言模型(LLM),适合对隐私、精度与效率有要求的用户。
PDF Craft是一款专注于扫描版书籍 PDF 转换的开源工具。它利用 DeepSeek OCR 模型,在本地完成从图像型 PDF 到结构化电子书(如 Markdown 或 EPUB)的全流程处理,无需联网,不依赖大语言模型(LLM),适合对隐私、精度与效率有要求的用户。

项目特别针对低清晰度、双栏排版、含公式表格的学术或技术文档进行了优化,能自动识别正文、过滤页眉页脚,并妥善保留脚注、图片、公式等关键元素。生成的 EPUB 文件还会自动构建目录,提升阅读体验。
注:v1.0.0 起移除了 LLM 文本后处理功能。若仍需语义纠错,可继续使用 v0.2.8。
\[ \int_0^1 x^2 dx \])
| 用户类型 | 使用场景 |
|---|---|
| 研究人员 | 将扫描版论文、教材转为可搜索、可引用的电子文档 |
| 知识管理者 | 批量处理 PDF 书籍,构建个人知识库(如 Obsidian) |
| 出版从业者 | 快速提取扫描书内容,用于数字化再排版 |
| 开发者 | 通过 API 自动化处理用户上传的 PDF,生成结构化输出 |







