Ollama 正式上线图像生成实验性功能,目前已在 macOS 系统开放使用,Windows 和 Linux 版本也即将推出。该功能无需复杂配置,仅需一行终端命令就能调用文生图模型生成图像,支持直接在兼容终端内预览效果,还提供尺寸、步数、负向提示词等自定义参数,同时适配 Z-Image Turbo(阿里通义)和 FLUX.2 Klein(Black Forest Labs)两款主流模型,覆盖照片级生成、文本渲染、UI 设计等多样化创作需求。

核心使用方式:一行命令,快速生成图像
Ollama 图像生成功能的使用门槛极低,无需额外安装依赖,直接通过终端调用即可:
ollama run x/z-image-turbo "您的提示词"
- 生成的图像默认保存到终端当前目录;
- 支持内联预览的终端(Ghostty、iTerm2 等)可直接在界面中查看图像,无需额外打开文件;
- 切换终端目录后再执行命令,可自定义图像保存位置。

两款核心模型:各有侧重,适配不同创作场景
Ollama 首批接入的两款图像生成模型覆盖“逼真生成”和“文本/UI 设计”两大核心需求,参数与授权方式也适配不同使用场景:
1. Z-Image Turbo(阿里通义实验室)
核心定位:60亿参数双语文生图模型,主打逼真照片级生成+中英文本渲染
| 关键特性 | 详细说明 | 适用场景 |
|---|---|---|
| 输出效果 | 擅长生成逼真照片、肖像、场景,还原度高 | 人像创作、实景场景生成、产品摄影风格创作 |
| 文本渲染 | 精准渲染英文/中文文本,支持书法、字体等文本类创作 | 包含文字的海报、书法作品、带文字的场景生成 |
| 授权方式 | Apache 2.0 开源协议 | 可无限制用于商业用途 |
调用命令:
ollama run x/z-image-turbo
经典示例:
- 逼真肖像:
年轻女子在舒适的咖啡馆中,自然窗光,身穿奶油色针织衫,手持陶瓷杯,背景为带有温暖环境光的柔和焦外模糊,抓拍瞬间,35mm胶片拍摄

- 中国书法:
传统中国书法风格,宣纸上以优雅黑墨书写“山高水长”字样,角落有红色印章,极简构图

- 创意构图:
超现实双重曝光肖像,女性剪影中盛开着樱花树,柔和的粉白花瓣飘浮,梦幻空灵氛围

2. FLUX.2 Klein(Black Forest Labs)
核心定位:轻量级高速模型,主打可读文本渲染+UI 设计,提供4B/9B两种参数版本
| 关键特性 | 详细说明 | 适用场景 |
|---|---|---|
| 速度优势 | Black Forest Labs 迄今最快的图像生成模型 | 快速迭代的设计草稿、批量生成素材 |
| 文本渲染 | 擅长处理图像中可读文本,排版精准 | UI 设计、带文字的标识/招牌、排版类设计 |
| 授权方式 | 4B版(Apache 2.0,完全开源商用);9B版(FLUX 非商业许可证 v2.1) | 商业用途优先选4B版,非商业创作可选9B版提升效果 |
调用命令:
ollama run x/flux2-klein
经典示例:
- 文本渲染:
霓虹灯牌显示“24小时营业”,夜晚雨中的城市小巷,湿漉漉的人行道上的倒影

- 产品摄影:
磨砂黑咖啡杯放在木桌上,晨光投下长影,热气升腾,商业产品拍摄

自定义配置:4大参数,精准控制生成效果
Ollama 提供灵活的参数调整方式,满足不同创作需求,核心配置项如下:
- 图像尺寸:通过
/set width和/set height命令修改宽高,尺寸越小生成速度越快、内存占用越低; - 迭代步数:控制模型运行的迭代次数,步数越少生成越快但细节不足,步数过多易出现伪影,默认使用模型推荐步数;
- 随机种子:设置固定种子可复现相同生成结果,便于迭代创作或共享效果;不同种子即使提示词相同,输出也会不同;
- 负向提示词:指定需要排除的内容(如“模糊、低分辨率、水印”),指导模型规避不想要的效果。

后续计划:功能持续拓展,覆盖全平台
Ollama 图像生成功能目前仅面向 macOS 用户开放,后续将逐步完善:
- 适配 Windows 和 Linux 系统,实现全平台支持;
- 接入更多图像生成模型,丰富创作选择;
- 新增图像编辑功能,从“生成”延伸到“编辑”,形成完整创作闭环。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...















