谷歌正式推出Gemini 3 Deep Think的重大升级,这款专门打造的推理模式,核心目标是突破现有智能边界,精准应对科学、研究与工程领域的各类现代挑战,为相关从业者提供更具专业性的智能支持。

在研发过程中,谷歌团队与全球范围内的科学家、研究人员深度联动、紧密协作,针对科研领域的核心痛点优化升级Gemini 3 Deep Think。科研场景中,许多棘手问题往往缺乏明确的指导框架,不存在唯一正确的解决方案,且所需的数据常常呈现杂乱、不完整的状态,这些都给研究和工程落地带来了诸多阻碍。
而此次升级的Deep Think,最大的突破的是将深度科学知识与日常工程实用性深度融合,跳出抽象理论的局限,聚焦实际应用落地,真正帮助科研人员、工程师破解工作中的难点、堵点问题。
关于访问渠道,目前新的Deep Think模式已正式在Gemini应用中,向Google AI Ultra订阅用户开放使用;同时,谷歌首次通过Gemini API,向特定的研究人员、工程师及企业开放该功能,有需求的从业者可通过官方渠道表达对早期访问的兴趣,提前体验其核心能力。
在正式开放前,谷歌已邀请一批早期测试者体验最新版Deep Think,其应用场景和核心表现已逐步清晰,具体可分为以下三个核心方向,每一项都贴合实际科研与工程需求:
以数学和算法的严谨性,突破推理能力上限
早在去年,谷歌就曾展示过Deep Think的特定版本,当时该版本已能成功应对诸多高难度推理挑战,在数学和编程世界锦标赛中达到金牌标准,展现出极强的逻辑推理能力。近期,Deep Think进一步赋能专门的智能体,助力其开展研究级别的数学探索,推动数学领域的创新研究。

此次升级后的Deep Think模式,持续突破智能前沿,在多项最严苛的学术基准测试中创下新高,用实打实的数据证明其推理实力,具体表现如下:
- 在Humanity's Last Exam基准测试中树立新标准,无需借助任何工具,最终得分达48.4%,该基准测试的核心目的就是检验现代前沿模型的能力极限;
- 在ARC-AGI-2基准测试中取得84.6%的前所未有的成绩,该结果已通过ARC Prize基金会官方验证,可信度拉满;
- 在包含各类竞争性编程挑战的Codeforces基准测试中,达到3455 Elo等级分的惊人成绩,展现出顶尖的编程推理能力;
- 在2025年国际数学奥林匹克竞赛中,表现达到金牌级别,具备应对世界级数学难题的实力。
全面覆盖复杂科学领域,助力科研突破
除了在数学和竞争性编程领域的突出表现,Gemini 3 Deep Think此次升级后,已实现对更广泛科学领域的覆盖,尤其在化学、物理等核心学科中展现出出色的能力,成为科研人员的得力助手。

在2025年国际物理奥林匹克竞赛和国际化学奥林匹克竞赛的理论部分,更新后的Deep Think模式均展现出金牌级别的表现,精准应对各类学科难题;同时,在高级理论物理学领域,它也展现出极高的熟练度,在CMT-Benchmark基准测试中获得50.5%的分数,为理论物理研究提供有力支撑。
聚焦实际应用,加速现实世界工程落地
Deep Think的核心价值,不仅在于顶尖的性能表现,更在于其能够真正落地到实际场景,为科研和工程工作提速增效。它可以帮助研究人员快速解读杂乱、复杂的科研数据,提炼核心信息,减少无效工作量;同时,也能助力工程师通过代码,精准对物理系统进行建模,优化工程设计流程。
谷歌表示,目前正全力推动Deep Think在核心用户群体中的普及,优先向最需要它的研究人员、工程师和实践者开放,而Gemini API平台的开放,正是这一布局的重要一步。
访问渠道说明
- Google AI Ultra订阅用户:自即日起,可直接在Gemini应用中,访问更新后的Deep Think模式,无需额外申请;
- 研究人员、工程师及企业:可通过官方渠道,表达对早期访问计划的兴趣,审核通过后,可通过Gemini API测试Deep Think的各项功能,提前享受其带来的高效便利。














