告别单页保存!用 ZIM 文件一键下载整个网站,离线浏览维基百科 / 任意网页超简单

工具2周前发布 小马良
10 0

想将一个网站完整“搬回家”,在无网络时随时查阅?浏览器的“另存为”只能保存单页,而ZIM 文件 + Kiwix 提供了一种高效、统一、可搜索的离线存档方案。

什么是 ZIM 文件?

ZIM 是由 OpenZIM 项目 开发的开源归档格式,专为离线存储网站内容设计。它将整个网站(HTML、图片、CSS、导航结构)压缩为单个 .zim 文件,支持全文搜索、书签、目录跳转,体验接近在线浏览。

配合阅读器 Kiwix(免费开源),你可以在任何设备上离线访问这些内容——就像拥有一个私人维基百科或新闻库。

✅ 优势:单文件管理、高压缩率、支持搜索、跨平台
❌ 局限:动态内容(如评论、登录态)无法保存

预制 ZIM 文件:从 Kiwix 库直接下载

Kiwix 官方库(library.kiwix.org)提供大量热门知识站点的预构建 ZIM 文件:

  • 维基百科:英文全量版约 100GB,精简版(“Mini”)约 11GB
  • 古登堡计划:数万本公版电子书
  • Stack OverflowWiktionaryTED 演讲
告别单页保存!用 ZIM 文件一键下载整个网站,离线浏览维基百科 / 任意网页超简单

使用步骤

  1. 访问 Kiwix 下载页,安装 Kiwix Desktop(网盘下载:https://pan.quark.cn/s/94023f3aaaec?pwd=SFqh
  2. 打开 Kiwix,点击左上角 “管理内容”(或文件夹图标)
  3. 浏览或搜索网站,下载 .zim 文件
  4. 下载完成后,直接点击打开即可离线浏览

适合场景:保存维基类静态知识库,无需自行抓取

自定义“打印”任意网站:两种方法

如果你要保存的网站不在 Kiwix 库中(如个人博客、新闻站、论坛),可通过 Zimit 工具将其转换为 ZIM 文件。

方法一:在线生成(简单但慢)

使用 Zimit 网页版

  1. 输入目标网站 URL
  2. 提供邮箱(用于接收下载链接)
  3. 提交后等待处理完成(小型站点约 1–2 小时,大型站点可能长达 24 小时)
  4. 通过邮件链接下载 .zim 文件
告别单页保存!用 ZIM 文件一键下载整个网站,离线浏览维基百科 / 任意网页超简单

⚠️ 注意:

  • 仅支持单任务排队
  • 文件需从网络下载,速度取决于你的带宽
  • 适合偶尔使用、不想配置环境的用户

方法二:本地 Docker 运行(推荐,高效可控)

前提:已安装 Docker Desktop(Windows/Mac)或 Docker Engine(Linux)

步骤 1:测试 Docker 是否正常

docker run hello-world

若看到 “Hello from Docker!” 即表示环境就绪。

步骤 2:运行 Zimit 抓取网站

docker run -v $PWD:/output \
  ghcr.io/openzim/zimit \
  zimit --seeds https://legiblenews.com --name legiblenews

参数说明

  • -v $PWD:/output:将当前目录挂载为输出路径
  • --seeds:要抓取的起始 URL(可多个,用空格分隔)
  • --name:生成的 .zim 文件名(如 legiblenews.zim

步骤 3:限制抓取范围(可选)

为避免抓取过大或无关内容,可添加限制:

--pageLimit 50        # 最多抓取 50 页
--depth 2             # 最多深入 2 层路径(如 /a/b 可抓,/a/b/c 不抓)
--ignoreSubdomains    # 忽略子域名

步骤 4:获取 ZIM 文件

命令完成后,.zim 文件将出现在你运行命令的当前目录。
使用 pwd(Linux/macOS)或 cd(Windows)确认路径。

步骤 5:用 Kiwix 打开

  1. 启动 Kiwix Desktop
  2. 点击 “打开 ZIM 文件” → 选择刚生成的文件
  3. 网站内容立即加载,支持搜索、书签、全文跳转

使用建议

  • 新闻/博客类站点:建议设置 --pageLimit 和 --depth,避免抓取过多归档页
  • 带登录墙的站点:Zimit 无法绕过,仅能抓取公开内容
  • 大站归档:ZIM 文件可能达数 GB,确保磁盘空间充足
  • 自动化脚本:可编写 shell 脚本定期抓取更新内容,构建个人知识库

典型应用场景

  • 学生:离线保存课程网站、参考资料
  • 研究者:归档特定领域博客、技术文档
  • 旅行者:下载目的地维基、攻略站,无网络时使用
  • 数字保存者:为易消失的小众网站创建快照
© 版权声明

相关文章

暂无评论

none
暂无评论...