
Reka AI
Reka AI 是一家致力于推进科学和构建生成式 AI 模型的 AI 研究和产品公司,成立于 2022 年,总部位于加利福尼亚州桑尼维尔。该公司由来自 DeepMind、Google Brain 和 FAIR 的前研究人员创立,带来了丰富的 AI 研究经验,旨在开发能够持续学习、推理并执行动作的模型,支持下一代 AI 产品。
VideoGameBench 是一个创新的评估基准,旨在衡量视觉-语言模型(VLMs)在知名视频游戏上的多模态理解与推理能力。通过提供标准化的测试环境,VideoGameBench能够评估大语言模型(LLMs)在游戏理解和交互中的性能,支持多种平台和游戏类型。

VideoGameBench目前支持以下三种主要平台:
此外,对于支持鼠标和键盘操作的游戏,VideoGameBench提供了一个简单界面,帮助模型以通用且正确的方式点击屏幕上的位置。
VideoGameBench涵盖了一系列经典的DOS和Game Boy游戏,这些游戏被精心挑选以覆盖不同的游戏类型和风格。以下是目前支持的游戏列表:
每个游戏在configs/文件夹中都有其对应的配置文件,控制游戏的一些设置。每个游戏有一个以其命名的文件夹,例如configs/game/,其中包含一个config.yaml文件和一些可选文件:
game.html,它将覆盖默认的JS-DOS HTML。preload.txt中填写动作和延迟。这在许多DOS游戏有难度选择菜单时特别有用。要添加新游戏,除了创建上述配置文件外,还需编辑src/consts.py文件:
ROM_FILE_MAP,将--game标志的游戏名称映射到您放入roms/文件夹的ROM文件名。GAME_URL_MAP中更新JSDOS文件链接。






