CraftGPT

2个月前更新 224 00

CraftGPT是一款基于TinyChat数据集训练,专为《我的世界》构建的小型语言模型。CraftGPT 不是为了取代 Hugging Face 上的开源模型,也不是为了挑战 GPT-4。它存在的意义在于:展示红石系统的理论计算能力、探索 AI 推理过程的底层可视化、激发玩家对计算机原理的兴趣。

所在地:
美国
收录时间:
2025-09-30
其他站点:
CraftGPTCraftGPT

你能想象,在一款以搭房子和打怪为主的沙盒游戏中,有人用红石电路构建出一个拥有500万参数的小型语言模型,并让它在游戏中“独立运行”吗?

这不是玩笑,也不是模组黑科技——这是开发者 Sammyuri 的最新项目:CraftGPT

它完全由《我的世界》原版机制中的红石元件搭建而成,占地 1020×260×1656 个方块,总计消耗超过 4.39亿个方块。整个装置如同一座横跨平原的巨型计算机,其内部结构包含分词器、矩阵乘法单元、激活函数模块等,完整实现了从输入到推理的全过程。

CraftGPT

这不仅是一次工程壮举,更是对计算本质的一次极限探索。

什么是 CraftGPT?

CraftGPT 是一个在《我的世界》中纯红石实现的神经网络模型,基于轻量级对话数据集 TinyChat 训练而成。它的目标很明确:

在不使用命令方块、数据包或外部脚本的前提下,让 AI 对话过程在游戏内真实发生。

关键参数如下:

  • 模型参数量:5,087,280(约500万)
  • 嵌入维度:240
  • 词汇表大小:1920 tokens
  • 网络层数:6 层
  • 上下文窗口:64 tokens(仅支持极短对话)

所有权重经过量化处理:

  • 多数为 8 位整数
  • 嵌入层使用 18 位
  • LayerNorm 权重使用 24 位

训练本身在 Python 中完成,但模型的推理过程完全发生在游戏世界中,通过红石信号模拟二进制运算。

如何在游戏里“运行”AI?红石即电路

在《我的世界》中,红石(Redstone)相当于现实世界的电子元件。它可以传递信号、构成逻辑门、触发延迟电路,进而搭建出加法器、寄存器乃至完整的 CPU。

CraftGPT

Sammyuri 正是利用这一机制,将神经网络的每一层计算拆解为:

  • 向量与矩阵的二进制乘法
  • 激活函数(ReLU)的硬件实现
  • 权重存储与寻址系统
  • 序列状态维护(RNN 风格)

整个装置包括以下核心模块:

  1. 分词器(Tokenizer):将输入文本转换为 token ID
  2. 嵌入层(Embedding):查表获取向量表示
  3. Transformer 块:执行注意力与前馈计算
  4. 输出解码器:逐 token 生成回复

视频中展示的航拍镜头跨越数分钟,呈现的是这个“AI超级计算机”的全貌。为了拍摄如此广阔的场景,作者甚至启用了 Distant Horizons 模组来扩展渲染距离。

性能现实:一次回复需数小时

尽管结构完整、功能可达,CraftGPT 并非实用工具,而是一场关于“计算边界”的思想实验。

其最大瓶颈在于速度

即使在普通电脑上,《我的世界》默认每秒仅执行 20 个游戏刻(tick),远远不足以支撑复杂计算。为此,项目依赖于高性能服务器模拟器 MCHPRS ——一个专为极限红石工程优化的定制服务端。

通过 MCHPRS 的 JIT 编译与并行加速,游戏时间可提速约 4万倍。即便如此:

⏳ 生成一条简单回复仍需 2小时左右

而在原版《我的世界》中?估算结果是:超过10年

正如 Sammyuri 在 GitHub 提醒用户的那样:

“请勿抱过高期待。该模型极易偏离主题,生成语法错误或无意义内容。展示视频呈现的是最佳表现,而非平均水准。”

运行条件苛刻:不只是耐心问题

如果你想亲自尝试运行 CraftGPT,以下是硬性要求:

硬件需求

  • 至少 32GB 内存(推荐 64GB 或更高)
  • 强大的多核 CPU(用于 MCHPRS 编译与仿真)

软件配置步骤

  1. 下载并编译 MCHPRS
    修改 ./crates/core/src/plot/mod.rs 中的 plot scale 为 7
  2. 解压 CraftGPT 世界文件至 ./target/release/world
  3. 启动服务端,登录后输入:
    /rp c -io    # 启用优化编译(耗时约10分钟)
    /rtps unlimited
    /wsr 1
    
  4. 设置 RNG 种子(默认为 1):前往坐标 (230,150,1000),通过二进制输入修改
  5. 输入提示词 → 回车 → 等待数小时
  6. 进度条显示当前 token 生成状态,二进制计数器显示已处理数量

📌 注意事项:

  • 无退格键或重置按钮
  • 最快重置方式:重新加载世界
  • 可手动清空缓冲区并触发复位信号进行软重启

技术意义:一场献给计算的致敬

CraftGPT 当然无法与你在手机上使用的聊天机器人相提并论。它没有上下文理解能力,输出质量不稳定,也无法持续对话。

但它证明了一件事:

只要足够复杂的逻辑系统存在,智能的“形式”就可以被模拟出来——哪怕是在一个像素方块的世界里。

此前,《我的世界》中已有诸多令人惊叹的红石成就:

  • 完整的 16 位 CPU(如 QCOM、IRIS)
  • 可运行《毁灭战士》(Doom, 1993)的游戏内计算机
  • 自动化工厂、计算器、甚至图灵机

而 CraftGPT 将这一传统推向了新高度——它不再只是“运行程序”,而是尝试“运行思维”。

数据统计

相关导航

Little Language Lessons

Little Language Lessons

谷歌推出了三项基于其多模态大模型 Gemini 的 AI 实验项目,旨在通过更加个性化、情境化的方式帮助人们提升口语表达能力。些 AI 实验工具为语言学习者提供了全新的视角和方法。无论是通过“微型课程”快速掌握实用短语,还是通过“俚语交流”学习更自然的表达,亦或是利用“单词相机”在实际场景中学习新单词,这些工具都旨在帮助用户更高效地学习新语言。

暂无评论

none
暂无评论...