新OpenAI o3模型基准测试结果引发争议,得分低于OpenAI最初暗示的水平OpenAI的o3 模型在基准测试中的表现引发了广泛关注和讨论。该公司最初声称的高分与实际测试结果之间的差异,引发了人们对公司透明度和模型测试实践的质疑。 OpenAI的初步声明与实际表现的差异 当O...早报# o3模型# OpenAI# 基准测试7小时前060
新你的礼貌可能会让OpenAI付出代价最近,一条关于OpenAI的讨论在社交媒体上引发了热议。一位X用户提出了一个看似随意但引人深思的问题:“我想知道OpenAI因为人们对他们的模型说‘请’和‘谢谢’而浪费了多少电费?”这个问题很快得到了...早报# OpenAI8小时前060
新微信上线元宝AI助手:聊天、解析文档、识别图片一应俱全微信最近推出了全新的AI助手——元宝聊天机器人,这款工具可以直接在微信中使用,功能强大且实用。无论是总结公众号文章、识别图片内容,还是解析PDF、Word等文档,元宝都能轻松应对。更重要的是,它已经可...早报# 元宝AI助手# 微信8小时前050
新Meta强化AI年龄检测,Instagram青少年保护再升级Meta正在加大其在Instagram上使用AI检测青少年用户的方式,甚至会覆盖账户设置。这一举措旨在更好地保护青少年用户,确保他们在平台上的安全和隐私。 早在2024年,Instagram就宣布引入...早报# Instagram# Meta8小时前050
新ChatGPT新增“记忆搜索”功能,个性化网络搜索的新尝试OpenAI再次对ChatGPT的功能进行了升级,这次的重点是将“记忆”功能与网络搜索相结合。这一更新不仅增强了ChatGPT的个性化能力,也进一步巩固了其在竞争激烈的AI聊天机器人市场中的地位。 ...早报# ChatGPT# OpenAI# 搜索3天前0270
新OpenAI新推理模型o3和o4-mini:性能提升,幻觉问题却更严重OpenAI最近推出的o3和o4-mini AI模型在性能上展现了许多突破性进展,尤其是在编码和数学任务中表现优异。然而,这些新模型的“幻觉”问题——即编造不存在的事实或内容——却比以往的模型更加严重...早报# o3# o4-mini# OpenAI3天前01000
谷歌为美国大学生提供一年免费的Gemini Advanced服务谷歌正在采取积极措施推广其Gemini平台,特别是在教育领域。根据最新消息,谷歌将为所有美国大学生提供为期一年的Gemini Advanced免费访问权限。这一举措不仅旨在吸引更多用户,还希望在学术界...早报# Gemini Advanced# 谷歌3天前0200
AI基准测试平台Chatbot Arena成立新公司Arena Intelligence Inc.据彭博社报道,Chatbot Arena——这一被主要AI实验室依赖用于测试和推广其AI模型的众包基准测试项目,正在组建一家名为Arena Intelligence Inc.的新公司。 新公司的使命与...早报# Arena Intelligence# Chatbot Arena# 基准测试4天前0210
OpenAI推出Flex处理:更便宜、更慢的API新选择为了在激烈的市场竞争中更好地应对谷歌等竞争对手,OpenAI近日推出了名为“Flex处理模式”的新API服务。这一服务通过牺牲响应速度和资源稳定性,为用户提供更优惠的模型使用价格。 定价策略: o3模...早报# API# Flex# OpenAI4天前0700
AI开盒?OpenAI最新模型可以通过照片进行“反向位置搜索”一种令人担忧的新趋势正在社交媒体上迅速传播:人们利用最新版本的ChatGPT(尤其是o3和o4-mini模型)通过照片进行“反向位置搜索”,从而识别照片中显示的具体地点。这种能力不仅引发了对隐私安全的...早报# AI开盒# o3# o4-mini4天前0240
彭博社爆料:OpenAI拟以约30亿美元收购AI编程工具公司Windsurf彭博社爆料,OpenAI 正在洽谈以约 30 亿美元收购AI辅助编码工具 Windsurf,这将是该公司迄今为止最大规模的一次收购行动。这笔交易可能帮助 OpenAI 在 AI 驱动的编码助手市场中...早报# OpenAI# Windsurf# 彭博社5天前0180
OpenAI 推出两款新型 AI 推理模型:o3 和 o4-miniOpenAI 在周四宣布推出两款新型 AI 推理模型——o3 和 o4-mini。这两款模型的设计目标是在回答问题前能够暂停并深入思考,从而提供更准确、更可靠的答案。 o3:最先进的推理模型 o3 是...早报# o3# o4-mini# OpenAI5天前0600