谷歌发布Gemini 3 Deep Think：解锁科研工程推理新高度

18 0

谷歌正式推出Gemini 3 Deep Think的重大升级，这款专门打造的推理模式，核心目标是突破现有智能边界，精准应对科学、研究与工程领域的各类现代挑战，为相关从业者提供更具专业性的智能支持。

在研发过程中，谷歌团队与全球范围内的科学家、研究人员深度联动、紧密协作，针对科研领域的核心痛点优化升级Gemini 3 Deep Think。科研场景中，许多棘手问题往往缺乏明确的指导框架，不存在唯一正确的解决方案，且所需的数据常常呈现杂乱、不完整的状态，这些都给研究和工程落地带来了诸多阻碍。

而此次升级的Deep Think，最大的突破的是将深度科学知识与日常工程实用性深度融合，跳出抽象理论的局限，聚焦实际应用落地，真正帮助科研人员、工程师破解工作中的难点、堵点问题。

关于访问渠道，目前新的Deep Think模式已正式在Gemini应用中，向Google AI Ultra订阅用户开放使用；同时，谷歌首次通过Gemini API，向特定的研究人员、工程师及企业开放该功能，有需求的从业者可通过官方渠道表达对早期访问的兴趣，提前体验其核心能力。

在正式开放前，谷歌已邀请一批早期测试者体验最新版Deep Think，其应用场景和核心表现已逐步清晰，具体可分为以下三个核心方向，每一项都贴合实际科研与工程需求：

以数学和算法的严谨性，突破推理能力上限

早在去年，谷歌就曾展示过Deep Think的特定版本，当时该版本已能成功应对诸多高难度推理挑战，在数学和编程世界锦标赛中达到金牌标准，展现出极强的逻辑推理能力。近期，Deep Think进一步赋能专门的智能体，助力其开展研究级别的数学探索，推动数学领域的创新研究。

此次升级后的Deep Think模式，持续突破智能前沿，在多项最严苛的学术基准测试中创下新高，用实打实的数据证明其推理实力，具体表现如下：

在Humanity's Last Exam基准测试中树立新标准，无需借助任何工具，最终得分达48.4%，该基准测试的核心目的就是检验现代前沿模型的能力极限；
在ARC-AGI-2基准测试中取得84.6%的前所未有的成绩，该结果已通过ARC Prize基金会官方验证，可信度拉满；
在包含各类竞争性编程挑战的Codeforces基准测试中，达到3455 Elo等级分的惊人成绩，展现出顶尖的编程推理能力；
在2025年国际数学奥林匹克竞赛中，表现达到金牌级别，具备应对世界级数学难题的实力。

全面覆盖复杂科学领域，助力科研突破

除了在数学和竞争性编程领域的突出表现，Gemini 3 Deep Think此次升级后，已实现对更广泛科学领域的覆盖，尤其在化学、物理等核心学科中展现出出色的能力，成为科研人员的得力助手。

在2025年国际物理奥林匹克竞赛和国际化学奥林匹克竞赛的理论部分，更新后的Deep Think模式均展现出金牌级别的表现，精准应对各类学科难题；同时，在高级理论物理学领域，它也展现出极高的熟练度，在CMT-Benchmark基准测试中获得50.5%的分数，为理论物理研究提供有力支撑。

聚焦实际应用，加速现实世界工程落地

Deep Think的核心价值，不仅在于顶尖的性能表现，更在于其能够真正落地到实际场景，为科研和工程工作提速增效。它可以帮助研究人员快速解读杂乱、复杂的科研数据，提炼核心信息，减少无效工作量；同时，也能助力工程师通过代码，精准对物理系统进行建模，优化工程设计流程。

谷歌表示，目前正全力推动Deep Think在核心用户群体中的普及，优先向最需要它的研究人员、工程师和实践者开放，而Gemini API平台的开放，正是这一布局的重要一步。

访问渠道说明

Google AI Ultra订阅用户：自即日起，可直接在Gemini应用中，访问更新后的Deep Think模式，无需额外申请；
研究人员、工程师及企业：可通过官方渠道，表达对早期访问计划的兴趣，审核通过后，可通过Gemini API测试Deep Think的各项功能，提前享受其带来的高效便利。

文章版权归作者所有，未经允许请勿转载。

微软推出 Copilot 3D 实验功能，瞄准创意与设计领域

早报 # Copilot 3D # 微软

9个月前

04150

谷歌发布全新音乐模型 Lyria 3：已集成到Gemini，输入文字或图片，30 秒生成原创音乐

早报语音模型 # Lyria 3 # 谷歌 # 音乐模型

1个月前

0310

阿里通义团队在海外市场推出Qwen Chat：支持全系列 Qwen 模型

早报 # Qwen Chat # 阿里通义

1年前

02700

微软 Copilot 上线“提醒”功能，免费用户也能用

早报 # Copilot # 微软 # 提醒

2个月前

0470

暂无评论

暂无评论...

谷歌发布Gemini 3 Deep Think：解锁科研工程推理新高度

以数学和算法的严谨性，突破推理能力上限

全面覆盖复杂科学领域，助力科研突破

聚焦实际应用，加速现实世界工程落地

访问渠道说明

Facebook 一口气推出三项AI新功能：动态头像、照片重塑、文本背景

MiniMax正式发布MiniMax M2.5 ：更快、更强、更智能，专为现实生产力打造

相关文章

微软推出 Copilot 3D 实验功能，瞄准创意与设计领域

谷歌发布全新音乐模型 Lyria 3：已集成到Gemini，输入文字或图片，30 秒生成原创音乐

阿里通义团队在海外市场推出Qwen Chat：支持全系列 Qwen 模型

微软 Copilot 上线“提醒”功能，免费用户也能用

暂无评论

文章

提升开源 AI 视频生成模型（Wan 2.1 和混元模型）效果的提示词技巧

Yandex Research推出分层蒸馏框架SWD：加速扩散模型（如FLUX和SD3.5）的生成过程

MiniMax 发布 M2.7：首个实现“自我进化”的 Agent 模型，研发效率提升 50%

daVinci-MagiHuman：单流架构重塑音视频生成，1080p 仅需 38 秒的开源新标杆

ComfyUI-DaVinci-MagiHuman：150 亿参数音视频生成模型，消费级显卡也能跑 1080p！

AI绘画革命！如何为Stable Diffusion模型选择合适的电脑配置？

OpenMAIC

S.H.I.T

抓虾吧

Accio Work

PDF夜间模式

ShadowBroker

谷歌发布Gemini 3 Deep Think：解锁科研工程推理新高度

以数学和算法的严谨性，突破推理能力上限

全面覆盖复杂科学领域，助力科研突破

聚焦实际应用，加速现实世界工程落地

访问渠道说明

Facebook 一口气推出三项AI新功能：动态头像、照片重塑、文本背景

MiniMax正式发布MiniMax M2.5 ：更快、更强、更智能，专为现实生产力打造

相关文章

文章

标签云

网址

OpenMAIC

S.H.I.T

抓虾吧

Accio Work

PDF夜间模式

ShadowBroker