OpenAI 推出基准测试SWE-Lancer:评估 AI 模型在真实软件工程任务中的表现OpenAI 最近推出了 SWE-Lancer,这是一个基于真实世界软件工程任务的基准测试平台。SWE-Lancer 包含超过 1400 个来自 Upwork 的自由软件工程任务,这些任务的总报酬价值...新技术# OpenAI# SWE-Lancer# 基准测试1年前03050
因发生严重问题!OpenAI再次推迟开源模型发布OpenAI宣布将无限期推迟其开源模型的发布。这一决定由公司首席执行官萨姆·奥尔特曼(Sam Altman)在社交平台X上公开,他表示需要更多时间进行深入的安全测试和高风险领域的审查。 这并非首次延期...早报# OpenAI# 开源模型9个月前03010
OpenAI 推出AI 编程智能体Codex:通过云端运行的沙盒环境,为开发者提供实时、高效的代码生成和任务处理能力OpenAI在今天正式发布了 Codex 的研究预览,这是该公司迄今为止最强大的 AI 编程智能体。Codex通过云端运行的沙盒环境,为开发者提供实时、高效的代码生成和任务处理能力。这款工具不仅标志着...早报# AI 编程智能体# Codex# codex-111个月前02940
OpenAI 的 o3 模型运行成本可能比最初估计的更高当 OpenAI 在去年 12 月推出其 o3“推理”模型时,它与 ARC-AGI 的创建者合作,通过这一基准测试来展示 o3 的强大能力。然而,几个月后,随着测试结果的修订,o3 的运行成本似乎比最...早报# o3# OpenAI1年前02930
OpenAI升级ChatGPT高级语音模式对话体验:减少打断、支持暂停思考在本周一,OpenAI宣布了针对其AI语音助手功能——高级语音模式(Advanced Voice Mode)的重要更新。这次更新主要集中在改善用户体验方面,特别是减少了用户在使用语音助手时被打断的情况...早报# ChatGPT# OpenAI# 高级语音模式1年前02930
前 OpenAI 首席技术官创立新 AI 初创公司Thinking Machines Lab,聚焦人类与 AI 协作一家名为 Thinking Machines Lab 的新AI公司正在迅速崛起。该公司由前 OpenAI 首席技术官 Mira Murati 创立,并已招募了二十多名前 OpenAI 员工,目标是开发...早报# Mira Murati# OpenAI# Thinking Machines Lab1年前02930
OpenAI 计划推出专业 AI“代理”,定价高达每月 20,000 美元根据The Information的报道,OpenAI正考虑对其即将推出的专门设计用于不同应用场景的专业AI“代理”收取高额月费。这一举措反映了公司在扩展其服务范围和盈利能力上的新尝试。 价格与功能 ...早报# AI代理# OpenAI1年前02910
萨姆·奥尔特曼证实:Meta曾以1亿美元年薪挖角OpenAI人才,但无人接受OpenAI首席执行官萨姆·奥尔特曼在与其弟弟杰克·奥尔特曼共同主持的一期播客中,首次公开回应了有关Meta试图以巨额薪酬挖角OpenAI顶尖AI人才的传闻。 据此前媒体报道,Meta CEO 马克...早报# Meta# OpenAI# 萨姆·奥尔特曼10个月前02890
OpenAI 推出两款新型 AI 推理模型:o3 和 o4-miniOpenAI 在周四宣布推出两款新型 AI 推理模型——o3 和 o4-mini。这两款模型的设计目标是在回答问题前能够暂停并深入思考,从而提供更准确、更可靠的答案。 o3:最先进的推理模型 o3 是...早报# o3# o4-mini# OpenAI12个月前02890
亚马逊计划推出「推理模型」,挑战 OpenAI 和 DeepSeek据 Business Insider 报道,亚马逊正在开发自己的推理模型,以在 AI 市场中与 OpenAI、Anthropic 和 DeepSeek 等公司展开竞争。这一新模型将通过亚马逊的 AWS...早报# DeepSeek# OpenAI# 亚马逊1年前02880
OpenAI 开源航空客服 AI 演示项目:展示 Agents SDK 多智能体协作能力近日,OpenAI 在其官方 GitHub 上开源了一个基于 Agents SDK 的演示项目,模拟了 AI 接管航空公司客服系统的场景。该项目旨在展示如何利用 Agents SDK 快速构建多智能体...早报# Agents SDK# OpenAI10个月前02850
OpenAI 测试新工具 “Study Together”,ChatGPT 迈向教育场景的重要一步OpenAI 正在测试一项名为 “Study Together” 的全新功能,作为 ChatGPT 的一个实验性模块,它旨在通过互动式学习引导用户深入理解知识,而不仅仅是提供答案。 目前该功能已开始在...早报# ChatGPT# OpenAI# Study Together9个月前02840