
AI2(艾伦AI研究所)推出了一项令人瞩目的新项目 —— Genesys(遗传发现系统)。这是一个分布式进化系统,旨在通过 LLM 代理之间的协作与演化,自动发现新颖且达到人类水平的自回归语言模型设计。

Genesys 基于遗传编程理念,结合 LLM 强大的生成能力,构建了一个可扩展、可观测、可管理的自动化模型进化平台。
什么是 Genesys?
Genesys 是一个LLM 驱动的模型设计探索系统,其目标是:
利用大语言模型代理,在无需人工干预的情况下,通过“进化”过程发现高效、创新的语言模型架构。
该系统具备完整的图形用户界面(GUI),支持实验配置、运行监控、结果查看及代理行为分析。虽然也提供命令行接口(CLI),但 GUI 在复杂系统的可观测性与管理能力方面更具优势。

🌐 核心特性
- 分布式异步进化:支持多节点并行执行设计与验证任务。
- 基于代理的遗传编程:由 LLM 代理提出模型设计方案,并进行交叉、变异和选择。
- 可视化交互界面:通过 GUI 可实时观察代理行为、设计输出(如 Markdown、Python 代码)、系统状态等。
- 模块化设计:各阶段(设计、验证、搜索、选择)均可独立测试与调整。
🛠️ 使用方式概览
✅ 是否可以仅使用 CLI?
是的,你可以完全通过 CLI 运行系统。实际上,GUI 内部也是调用 CLI 指令来执行操作。
但需要注意的是,CLI 缺乏对多线程、多节点任务的集中管理能力,也无法直观查看长文本输出(如 Markdown 或 Python 代码)。因此,建议在复杂实验中优先使用 GUI。
⚙️ 主要操作流程
1. 配置实验设置
- GUI 设置:通过 Config 标签配置参数并上传至远程数据库。
- 手动编辑:直接修改实验目录下的配置文件。
- CLI 设置:
genesys cfg [-u] [-d] [-h]
-u:上传本地配置-d:从远程下载配置
⚠️ 提示:务必记得上传配置,否则远程数据库中的旧数据将覆盖你的本地更改。
2. 启动工作节点
genesys node [-i ] [-g ] [-m ] [-n] [-c] [-s]
常用参数说明:
| 参数 | 描述 |
|---|---|
-i | 指定节点 ID(不指定则随机分配) |
-g | 分组 ID(默认为 'default') |
-m | 最大设计线程数(默认 5) |
-n | 节点不接受验证任务 |
-c | 仅使用 CPU |
-s | 静默模式运行 |
你也可以在 GUI 的 Listen 标签中查看节点状态。
3. 运行进化过程
genesys evo [-e ] [-g ] [-r ] [-h]
| 参数 | 描述 |
|---|---|
-e | 指定进化名称(默认 test_evo_000) |
-g | 组 ID(需与节点一致) |
-r | 设计与验证线程比例(默认 4) |
⚠️ 注意:避免在同一用户空间运行多个节点以防止冲突。建议充分利用每个节点的 GPU 资源。
4. 推荐操作流程(GUI)
- 配置实验:在 Config 标签创建或恢复命名空间。
- 估算成本:使用 Verify - Budget Tools 估算资源消耗。
- 测试组件:在 Design / Verify / Search / Select 标签中分别调试各模块。
- 上传配置:确保远程节点可访问最新设置。
- 启动节点:运行
genesys node并在 GUI 查看状态。 - 开始进化:使用 GUI 的 Evolve 标签或 CLI 启动进化。
🖥️ GUI 功能一览
| 标签页 | 功能说明 |
|---|---|
| Config | 实验配置、命名空间管理 |
| Evolve | 启动和管理进化流程 |
| Design | 测试设计引擎 |
| Verify | 验证模型性能 |
| Search | 管理知识库 |
| Select | 调整选择器策略 |
| Viewer | 查看系统状态与结果 |
| Listen | 监控节点状态 |
图标说明:
- 📡:表示当前命名空间是否连接到远程数据库(在线/离线)
- 👁️:点击进入监听页面查看节点详情
🧪 进化机制详解
Genesys 的进化过程由主节点协调,运行两个主要线程:
- 设计线程:由 Design Engine 驱动,负责生成新的模型架构。
- 验证线程:由 Verification Engine 驱动,评估设计质量。
所有节点通过 Firebase 协同工作,形成一个分布式的进化网络。你可以在任意支持 GPU 的环境中运行节点,包括本地机器、云服务器等。
📌 小贴士:运行前检查清单
✅ 配置实验参数
✅ 估算预算与资源消耗
✅ 测试各子模块(设计、验证、搜索、选择)
✅ 上传配置至远程
✅ 启动节点并确认状态
✅ 开始进化任务
数据统计
相关导航


新Craft-Agent

CRISPR-GPT

QuantAgent

Agent S

Midscene.js

II-Agent






