
大模型显存与性能计算器
LLM 显存与性能计算器 是一款实用工具,能够帮助用户快速评估不同大语言模型的显存需求和推理性能。无论你是研究人员还是开发者,都可以利用这一工具优化模型部署方案,确保在有限硬件资源下实现最佳性能。
Scanned PDF to Epub Converter 是一款利用百度 PaddleOCR 版面分析 API 打造的开源工具,能智能识别文档结构,将扫描版 PDF 一键转换为章节清晰、排版精美、无干扰的 EPUB 电子书。
你是否曾面对一堆扫描版 PDF 书籍发愁?文字无法复制、排版错乱、页眉页脚干扰阅读,更无法在 Kindle 或手机阅读器上获得舒适的流式阅读体验。
Scanned PDF to Epub Converter 是一款利用百度 PaddleOCR 版面分析 API 打造的开源工具,能智能识别文档结构,将扫描版 PDF 一键转换为章节清晰、排版精美、无干扰的 EPUB 电子书。
依托百度飞桨强大的 PaddleOCR 引擎,工具不仅能识别文字,更能理解文档结构:
无需手动切割文件。工具会根据识别到的标题(如“第一章”、“Part I”、“1.1 绪论”等)自动将书籍分割为独立章节,生成带有完整目录导航的 EPUB 文件,跳转查阅极其方便。
针对大文件处理和 API 调用的不稳定性,工具做了周全的防护:
uv本项目推荐使用现代化的 Python 包管理工具 uv,它能秒级创建环境并安装依赖。
# 1. 克隆项目
git clone https://github.com/yourusername/pdf2epub-paddle.git
cd pdf2epub-paddle
# 2. 设置环境变量 (替换为你的 Token)
export PADDLE_API_TOKEN='你的_api_token'
# 3. 使用 uv 直接运行 (自动处理环境)
uv run pdf2epub_paddle.py /path/to/your/book.pdf
运行结束后,你将在输出目录得到一本精美的 .epub 电子书。
如果你习惯传统方式:
# 创建虚拟环境
python -m venv .venv
source .venv/bin/activate # Windows: .venv\Scripts\activate
# 安装依赖
pip install .
# 运行
export PADDLE_API_TOKEN='你的_api_token'
python pdf2epub_paddle.py /path/to/your/book.pdf
对于特殊需求,你可以修改脚本中的配置项:
CHUNK_SIZE (分块大小):默认 5 页/块。TIMEOUT (超时时间):默认 180 秒。






