谷歌正式推出 Gemini CLI v0.9.0,最大亮点是新增内置交互式 Shell,开发者现在可直接在 CLI 内运行 vim、top、htop、git rebase -i 等依赖终端交互的命令,无需切换到外部终端。

为什么这很重要?
此前,Gemini CLI 无法处理需要伪终端(PTY) 的交互式命令——用户必须退出 CLI 才能编辑文件或处理交互式 Git 流程,导致上下文断裂、效率降低。
v0.9.0 通过集成 node-pty 库,彻底解决了这一问题。
技术实现:像原生终端一样工作
- 伪终端(PTY)支持:在后台创建真实终端会话,让命令按其设计方式运行
- 实时终端状态流:通过“快照”机制,持续捕获并传输文本、颜色、光标位置等状态
- 全双向交互:
- 键盘输入实时传递给运行中的进程
- 窗口大小调整会触发应用重绘(如
vim自动适配) - 支持 ANSI 颜色、控制码等终端特性
- 快捷聚焦:按
Ctrl+F即可将焦点切换到终端区域
支持的典型场景
- 使用
vim/nvim/nano编辑代码 - 执行交互式 Git 操作(如
git add -p、rebase -i) - 运行语言 REPL(Python、Node.js 等)
- 监控系统:
top、htop、iotop - 全屏终端应用:
mc(Midnight Commander) - 交互式脚手架:
npm init、ng new、create-react-app - 响应
gcloud、aws等 CLI 工具的交互提示
如何升级?
npm install -g @google/gemini-cli@latest
升级后,交互式 Shell 默认启用,无需额外配置。

定位与意义
Gemini CLI 正从“AI 命令代理”演进为完整的开发者终端环境。此次更新显著提升了工作流连续性,减少上下文切换,尤其适合重度依赖命令行的开发者。
谷歌表示将持续优化跨平台兼容性与输入处理,并欢迎社区反馈。
提示:该功能已在主流 macOS、Linux 和 Windows(WSL/PowerShell)环境中验证可用。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...















