OpenAI 开放升级版图像生成器 API,开发者迎来全新创作工具

早报2个月前发布 小马良
117 0

OpenAI 在周三宣布,将其 ChatGPT 中新的和改进的图像生成功能背后的技术引入其 API,允许开发者将其集成到他们的应用程序和服务中。这一举措不仅为开发者提供了强大的工具,也为用户带来了更丰富的视觉体验。

OpenAI 开放升级版图像生成器 API,开发者迎来全新创作工具

图像生成器的亮点

OpenAI 的新图像生成器于 3 月下旬推出,迅速因其创建逼真的吉卜力风格照片和“AI 玩偶”的能力而走红。这一功能不仅为 ChatGPT 带来了数百万新用户注册,也极大地考验了公司的承载能力。在工具上线的第一个星期,超过 1.3 亿 ChatGPT 用户创建了超过 7 亿张图像。

gpt-image-1:强大的多模态模型

在 OpenAI 的 API 中,图像生成功能由一个名为“gpt-image-1”的 AI 模型驱动。作为一个原生多模态模型,gpt-image-1 具备以下特点:

  1. 跨风格图像创建:gpt-image-1 可以跨不同风格创建图像,从逼真的照片到卡通风格,满足多样化的视觉需求。
  2. 遵循自定义指南:开发者可以根据具体需求设置生成图像的风格和内容,确保图像符合特定的视觉标准。
  3. 利用世界知识:模型能够结合世界知识进行图像生成,使生成的图像更具真实感和逻辑性。
  4. 文本渲染:gpt-image-1 可以在图像中渲染文本,进一步增强图像的表达能力。

开发者控制与安全措施

开发者可以使用 gpt-image-1 一次生成多张图像,并控制生成质量,以及相应的速度。此外,gpt-image-1 采用了与 ChatGPT 中的图像生成相同的安全保护措施,包括限制模型生成违反公司政策的内容的保障措施。

  • 审核敏感度控制:开发者可以设置审核敏感度,选择“自动”进行标准过滤,或选择“低”进行限制较少的过滤。低过滤会限制较少类别的潜在不适龄内容。
  • 元数据水印:所有使用 gpt-image-1 创建的图像都带有 C2PA 元数据水印,以便受支持的平台和应用程序可以将其识别为 AI 生成的图像。

定价与成本

OpenAI 提供的定价方案如下:

  • 文本输入:每百万输入 token 5 美元。
  • 图像输入:每百万输入 token 10 美元。
  • 图像输出:每百万 token 40 美元。

根据 OpenAI 的数据,这分别转化为低、中、高质量方形图像每张大约 2 美分、7 美分和 19 美分。这种灵活的定价方案使得开发者可以根据自己的需求选择合适的质量级别。

官方全文翻译:

在 API 中引入我们最新的图像生成模型

上个月我们在 ChatGPT 中引入图像生成功能时,它迅速成为我们最受欢迎的功能之一:全球超过 1.3 亿用户在短短第一个星期内创建了超过 7 亿张图像。

今天,我们将驱动 ChatGPT 中这种体验的原生多模态模型通过 gpt-image-1 引入 API,使开发者和企业能够轻松地将高质量、专业级的图像生成直接集成到他们自己的工具和平台中。该模型的多功能性使其能够跨不同风格创建图像,忠实地遵循自定义指南,利用世界知识并准确地渲染文本——从而在多个领域释放无数实际应用。

包括创意工具、电子商务、教育、企业软件和游戏等行业的领先企业和初创公司已经在其产品和体验中使用图像生成。我们很高兴在下面分享一些示例。

OpenAI 开放升级版图像生成器 API,开发者迎来全新创作工具

我们还继续与开发者和企业合作,以发现 API 中的图像生成可以服务于他们用例的更多方式,包括:

  • 设计和编辑: Canva 正在探索集成 OpenAI 的 gpt-image-1 的方法,以推动其 Canva AI 和 Magic Studio 工具中设计生成和编辑的界限。通过 gpt-image-1 的功能,例如将粗略草图转换为令人惊叹的图形元素并实现高保真视觉编辑,Canva 将进一步赋能其 2.3 亿用户以全新的方式将他们的想法变为现实。
  • 创建和编辑徽标: GoDaddy 正在积极试验集成图像生成,以便客户可以轻松创建可编辑、移除背景和生成专业排版的徽标。此外,作为 GoDaddy Airo® 的新体验,该团队正致力于让客户创建反映其独特品牌标识的社交媒体帖子和营销素材,用于从提示创建的原创产品和品牌内容。
  • 构建营销材料: HubSpot 正在探索 OpenAI 的新 AI 图像生成功能如何帮助客户创建营销和销售材料。随着 HubSpot 继续为扩展业务添加新的 AI 驱动工具,这些图像生成功能有可能改变客户为社交媒体、电子邮件营销和着陆页生成高质量图像的方式,而无需专业的设计专业知识。
  • 生成食谱和购物清单: Instacart 正在测试使用 API 进行图像生成的新方法,包括食谱和购物清单的图像。
  • 编辑视频: Invideo 使数百万用户能够使用 AI 将他们的想法转化为视频。通过集成 gpt-image-1,该平台现在提供改进的文本生成、精细的编辑控制和高级样式指导。

安全

API 中的 gpt-image-1 模型采用了与 ChatGPT 中的 4o 图像生成相同的安全保护措施,包括限制模型生成有害图像的保障措施以及在生成的图像中包含 C2PA 元数据——您可以在我们之前的博客文章中阅读更多相关信息。此外,开发者还可以使用 moderation 参数控制审核敏感度,该参数可以设置为 auto(默认)进行标准过滤,也可以设置为 low 进行限制较少的过滤。请在我们的文档中了解更多信息。

默认情况下,我们绝不会使用客户 API 数据进行训练,并且所有图像输入和输出都受我们的 API 使用政策约束。

定价

gpt-image-1 的使用按 token 定价,文本和图像 token 的定价不同:

  • 文本输入 token(提示文本):每 100 万 token 5 美元
  • 图像输入 token(输入图像):每 100 万 token 10 美元
  • 图像输出 token(生成的图像):每 100 万 token 40 美元

实际上,这分别转化为低、中、高质量方形图像每张大约 0.02 美元、0.07 美元和 0.19 美元。有关按图像质量和尺寸划分的详细定价,请参阅文档。

开始使用

gpt-image-1 模型现已通过 Images API 在全球范围内提供,Responses API 的支持即将推出。一些开发者可能需要在能够使用该模型之前验证他们的组织。请查看组织设置以查看您是否已拥有访问权限。

要开始使用,请在 playground 中探索模型的功能,并查看我们的图像生成指南。我们期待看到您构建的内容。

© 版权声明

相关文章

暂无评论

none
暂无评论...