ChatGPT测试记忆搜索功能,GPT-5.2发布传闻升温,OpenAI迎战市场竞争
在谷歌Gemini 3发布后引发的市场竞争压力下,OpenAI正加速功能迭代与模型更新:不仅为ChatGPT测试“记忆搜索”新功能,优化海量记忆条目的检索效率,更有传闻称其将提前推出GPT-5.2作为...
Perplexity 发布面向浏览器AI智能体的安全评估基准 BrowseSafe-Benchmark
Perplexity正式发布 BrowseSafe-Benchmark(简称 BrowseSafe-Bench),这是一款专为浏览器AI智能体打造的安全评估基准与微调检测模型。该工具面向研究人员、浏览...
谷歌 Gemini在行业基准测试中赶超 ChatGPT,OpenAI 宣布进入“红色警戒”状态
据《华尔街日报》报道,OpenAI 首席执行官萨姆·奥尔特曼近日向全体员工发出内部备忘录,宣布公司进入“红色警戒”(Red Alert)状态——所有非核心项目暂停,资源全力聚焦于提升 ChatGPT...
OpenAI 澄清:ChatGPT 的“Peloton 推荐”不是广告,而是未优化的功能
近日,一张 ChatGPT 在无关对话中弹出“寻找健身课程 › 连接 Peloton”提示的截图在社交平台广泛传播,引发大量用户担忧:ChatGPT 是否已开始向免费甚至付费用户展示广告? 尤其令 P...
Anthropic 或抢先 OpenAI 上市,有望获得资金优势
AI领域 OpenAI 的主要竞争对手之一是拥有 Claude 系列模型的 Anthropic。目前有传言称,Anthropic 已启动早期筹备,最早可能于明年启动首次公开募股,并有望成为规模最大的 ...
STARFlow-V:苹果推出标准化流视频生成模型,挑战扩散模型主流地位
苹果最新发布的 STARFlow-V 为视频生成领域带来了全新技术路径——作为一款基于标准化流(Normalizing Flows)的端到端模型,它打破了当前扩散模型主导的格局,凭借全局-局部架构、因...
阶跃星辰开源Step-Audio-R1:首个支持测试时计算扩展的音频大语言模型,“越想越准”比肩Gemini 3
阶跃星辰开源的 Step-Audio-R1 打破了传统音频模型的性能瓶颈,成为首个支持“测试时计算扩展”的音频大语言模型。它通过创新的模态落地推理蒸馏技术,让模型直接基于声学特征进行链式思考,而非依赖...
Mistral AI正式发布Mistral 3系列模型:开源多模态模型家族,覆盖从边缘到企业级场景
Mistral AI 正式推出新一代模型系列 Mistral 3,此次发布不仅包含适配边缘场景的 Ministral 3 系列小型密集模型,更带来了性能顶尖的稀疏专家混合模型 Mistral Larg...
阿里开源Ovis-Image:7B 参数实现高质量文本渲染的文生图模型,海报 / UI 设计秒生成
Ovis-Image 是由阿里巴巴国际数字商务团队开发的 70亿参数 文本到图像(Text-to-Image)生成模型,专注于解决文生图系统中长期存在的文本模糊、拼写错误、排版失真等痛点。该模型在保持...
阿里开源Marco-Voice:说话人-情感独立调控,语音克隆相似度0.8275碾压同类
阿里巴巴国际数字商务团队推出的开源语音合成框架 Marco-Voice,以“说话人-情感解耦”为核心创新,整合语音克隆、情感可控合成、跨语言生成三大功能,构建了统一且高效的文本转语音系统。该框架通过批...















