Koharu:用 Rust 打造的 AI 漫画翻译工具,全流程自动化
Koharu:用 Rust 打造的 AI 漫画翻译工具,全流程自动化

Koharu:用 Rust 打造的 AI 漫画翻译工具,全流程自动化最新版

官方版无广告8

Koharu是一款AI 驱动的漫画翻译工具,使用 Rust 编写。Koharu 引入了一种全新的漫画翻译工作流,利用 AI 实现全流程自动化。它融合了目标检测、OCR、图像修复(inpainting)和大语言模型(LLM),为用户带来无缝的翻译体验。

更新日期:
2025年12月8日
语言:
中文
平台:

1.59G0 人已下载 手机查看

如果你曾手动翻译过漫画,就知道这项工作有多繁琐:要识别气泡、擦除原文、排版竖排文字、保持语境自然……而 Koharu 正试图用 AI 把这一切变得一键完成。

Koharu

Koharu 是一个完全由 Rust 编写的开源漫画翻译工具,融合计算机视觉与大语言模型,实现从文字检测到最终排版的端到端自动化翻译。前端基于 Tauri 构建,推理引擎使用 candle,兼顾性能、安全与跨平台能力。

Koharu

为什么 Koharu 值得关注?

  • 全流程自动化:从识别到翻译,无需人工干预
  • 原生性能:Rust 编写,无垃圾回收开销,内存安全且高效
  • GPU 加速支持:Windows 上支持 CUDA,macOS 上支持 Metal
  • 专为漫画优化:支持中日韩竖排文字、气泡布局、复杂背景
  • 本地运行:所有处理在本地完成,无需上传图片到云端

核心工作流

Koharu 将漫画翻译拆解为四个关键步骤,每个环节都由专用 AI 模型驱动:

  1. 文字区域检测
    使用 comic-text-detector 精准识别对话气泡与文字块,包括倾斜、重叠或嵌入背景的文本。
  2. OCR 识别
    调用 manga-ocr 模型,专门针对日漫风格字体优化,支持竖排日文、中文简繁体、韩文等。
  3. 图像修复(Inpainting)
    利用 AnimeMangaInpainting 模型智能擦除原文,保留背景纹理与线条,避免“打码感”。
  4. AI 翻译与排版
    通过量化 LLM(如 sakura-galtransl-7b-v3.7)进行上下文感知翻译,并自动适配气泡形状与阅读方向(如日漫右→左)。

所有模型首次运行时自动下载,已转换为 safetensors 格式以提升 Rust 兼容性与加载速度。

高性能推理:candle + GPU 加速

Koharu 底层使用 Hugging Face 开发的 candle 框架进行推理,支持:

  • CUDA 加速(NVIDIA GPU)
    自动解压 CUDA 12.x 与 cuDNN 9.x 动态库,支持计算能力 7.5 及以上 的显卡(如 RTX 20 系列及以上)。
  • Metal 加速(Apple Silicon)
    在 M1、M2 等 Mac 设备上,通过 Metal 实现高效 GPU 推理,显著快于纯 CPU 模式。

即使在 CPU 模式下,得益于 Rust 与 candle 的优化,处理速度仍可满足日常使用。

支持的 LLM 模型

Koharu 通过 GGUF 格式加载量化大模型,当前支持:

  • vntl-llama3-8b-v2:通用翻译模型,语义流畅
  • sakura-galtransl-7b-v3.7:专为日语轻小说/漫画微调,语气更贴合原作风格

模型按需下载,用户可在设置中切换,无需提前配置。

安装与使用

Koharu 为 Windows 和 macOS 提供预编译二进制文件,可直接从 GitHub Releases 下载。

  1. 下载对应平台的 .exe(Windows)或 .app(macOS)
  2. 首次启动后自动下载所需模型(需联网)
  3. 导入漫画图片或 PDF,点击“翻译”,等待处理完成
  4. 导出结果(支持 PNG、JPG 等格式)

所有数据处理均在本地完成,不上传任何图片或文本

开发与构建(可选)

如需从源码编译:

# 前置依赖:Rust 1.85+、Bun 1.0+
bun install
bun run build

编译产物位于 target/release/,支持进一步定制模型或 UI。

适用人群

  • 漫画汉化组:大幅提升翻译效率,减少重复劳动
  • 语言学习者:快速理解日漫/韩漫原文
  • 独立开发者:参考其 Rust + AI + Tauri 架构
  • 隐私敏感用户:拒绝云端 OCR,坚持本地处理

相关软件

GAIA

GAIA - 最新版

GAIA 是由 AMD专为本地运行大语言模型(LLM)设计的AI应用,让开发者和普通用户能够在本地 PC 硬件上快速部署和运行生成式 AI 应用程序。通过结合 Ryzen-AI PC 中的神经处理单元(NPU)和集成显卡(iGPU),GAIA 实现了高效、私密且低延迟的 AI 处理能力,特别适合对数据隐私要求较高的场景。
Swiflow

Swiflow - 最新版

Swiflow 并非零门槛。尤其是 MCP 协议的接入,需要一定的环境配置能力。它更适合愿意花一点时间 setup,换来长期自动化收益的用户。但它也不要求你会编程。大多数功能通过对话即可启用,记忆和工作流的调整也都在可视化界面完成。

暂无评论

none
暂无评论...