
Grok CLI
Grok CLI是一个开源的 AI 代理,将 Grok 的强大功能直接带入您的终端,具备智能文本编辑功能和工具使用能力。
GeminiCLI to API 是一个高性能、高可用的 API 代理服务,同时暴露 OpenAI 兼容端点与 Gemini 原生端点,并自动检测与转换请求格式,让开发者无需修改一行代码即可调用 Gemini。
当前,许多工具和框架(如 LangChain、LlamaIndex、ComfyUI)默认使用 OpenAI API 格式,但 Google 的 Gemini 原生 API 采用 contents 结构,两者不兼容。若想在现有系统中无缝接入 Gemini,通常需大量代码适配。
GeminiCLI to API 解决了这一痛点:它是一个高性能、高可用的 API 代理服务,同时暴露 OpenAI 兼容端点与 Gemini 原生端点,并自动检测与转换请求格式,让开发者无需修改一行代码即可调用 Gemini。
/v1/chat/completions、/v1/modelsmessages 结构(role: system/user/assistant)system 消息转换为 user(Gemini 不支持 system)stream: true)完全兼容/v1/models/{model}:generateContent、streamGenerateContentcontents + parts 结构自动格式检测:系统根据请求体结构(
messagesvscontents)或路径自动识别格式,无需手动切换。
每个 Google OAuth 凭证默认享有 1000 次/天的 gemini-2.5-pro 调用额度。为突破单凭证限制,GeminiCLI to API 提供企业级凭证管理系统:
client_secret_xxx.json)支持 GCLI_CREDS_ 环境变量*(Base64 编码),Docker 部署友好。
所有模型均支持 1M token 上下文窗口,并提供以下专用变体:
| 模型类型 | 示例 | 功能 |
|---|---|---|
| 基础模型 | gemini-2.5-pro | 标准生成 |
| 思维模型 | gemini-2.5-pro-maxthinking | 启用最大推理预算 |
gemini-2.5-pro-nothinking | 禁用思维链,加速响应 | |
| 搜索增强 | gemini-2.5-pro-search | 集成实时网络搜索 |
| 抗截断模式 | 流式抗截断/gemini-2.5-pro | 自动检测截断并重试 |
| 假流式模式 | gemini-2.5-pro-假流式 | 模拟流式响应(兼容旧客户端) |
系统自动解析模型名称中的前缀/后缀,透明启用对应功能,支持组合使用(如
流式抗截断/gemini-2.5-pro-假流式)。
/v1/chat/completions)Authorization: Bearer <token>x-goog-api-key: xxx?key=xxx






