DeepSeek-V3.1-Terminus 正式上线：支持双模式推理，输出更稳定

122 0

深度求索（DeepSeek）于昨晚完成线上模型升级，发布 DeepSeek-V3.1-Terminus 版本。此次更新已同步至官方 App、网页端、小程序及 API 接口，用户可立即体验。

Hugging Face：https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus
ModelScope：https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus

新版本在保持原有性能的基础上，针对语言一致性、Agent 能力等用户反馈问题进行了重点优化，整体输出更加稳定可靠。

版本概览：双模式支持，上下文长度达 128K

DeepSeek-V3.1-Terminus 提供两种运行模式，适配不同任务需求：

模式	对应 API 名称	默认输出长度	最大输出长度	典型用途
非思考模式	`deepseek-chat`	4K tokens	8K tokens	日常对话、快速响应
思考模式	`deepseek-reasoner`	32K tokens	64K tokens	复杂推理、代码生成、长链任务

两种模式均支持 128K 上下文长度，适用于处理超长文档、日志分析、多轮交互等场景。

DeepSeek-V3.1-Terminus 正式上线：支持双模式推理，输出更稳定

核心改进点

语言一致性提升

显著缓解中英文混杂输出问题；
减少异常字符、乱码或格式错乱现象；
在多语言混合输入下表现更可控。

这一改进提升了模型在正式写作、跨语言翻译辅助等场景中的可用性。

Agent 能力进一步优化

针对开发者高频使用的智能代理功能：

Code Agent：代码生成准确性提高，对边缘语法和库调用理解更准确；
Search Agent：信息检索逻辑更清晰，引用来源组织更合理；

优化后，模型在需要工具调用、外部查询的任务中响应更精准，失败率降低。

性能表现：稳定性增强

官方表示，Terminus 版本经过多轮内部压力测试与线上灰度验证，在以下方面表现更优：

响应延迟波动减少；
长文本生成连贯性提升；
极端提示下的“崩溃”或无限循环概率下降。

虽然未引入全新架构，但通过数据微调与推理流程优化，实现了体验层面的实质性进步。

定价信息（按 API 使用）

对于通过 API 调用的用户，当前计费标准如下（单位：人民币）：

项目	价格（每百万 tokens）
输入（缓存命中）	¥0.5 元
输入（缓存未命中）	¥4.0 元
输出	¥12.0 元

💡 缓存机制说明：若请求内容与历史上下文高度相似，系统可能命中缓存，大幅降低计算开销与成本。

该定价延续了 DeepSeek 系列在性价比方面的优势，尤其适合高频率、中低长度输出的应用场景。

早报 # DeepSeek-V3.1-Terminus

文章版权归作者所有，未经允许请勿转载。

百度发布文心大模型 4.5 Turbo 和 X1 Turbo：性能超GPT4 o，价格低于DeepSeek-V3

早报 # Deepseek V3 # X1 Turbo # 文心大模型 4.5 Turbo

12个月前

04040

Reddit计划加强验证，以对抗类人AI机器人

早报 # AI机器人 # Reddit

11个月前

02190

因平台内容被支付服务商拉黑！CivitAI发文求用户支持

早报 # Civitai

11个月前

02810

Luma AI正式上线Ray2模型图生视频功能

早报 # Luma AI # Ray2模型 # 图生视频

1年前

02530

暂无评论

暂无评论...

DeepSeek-V3.1-Terminus 正式上线：支持双模式推理，输出更稳定

版本概览：双模式支持，上下文长度达 128K

核心改进点

语言一致性提升

Agent 能力进一步优化

性能表现：稳定性增强

定价信息（按 API 使用）

唱片公司指控 Suno 规避 YouTube 技术措施训练 AI 音乐模型

Ollama 新调度系统上线：内存管理更精准，性能全面提升

相关文章

百度发布文心大模型 4.5 Turbo 和 X1 Turbo：性能超GPT4 o，价格低于DeepSeek-V3

Reddit计划加强验证，以对抗类人AI机器人

因平台内容被支付服务商拉黑！CivitAI发文求用户支持

Luma AI正式上线Ray2模型图生视频功能

暂无评论

文章

新面壁智能发布 VoxCPM2：20亿参数、无离散 Tokenizer 的开源语音合成新标杆

Illustrious XL v2.0正式发布，支持1024x1536原生分辨率生成

ComfyUI 原生支持 Wan2.2 Fun：首尾帧控制与多模态视频生成全面集成

美团开源 5677 亿参数 LongCat-Flash-Prover：专攻数学证明，MiniF2F 通过率高达 97.1%

新Physion Labs推出Galileo-0：迈向可扩展的世界模型评判器

LMArena 最新排名出炉！阿里千问杀入全球前五，Qwen3.5-Max-Preview 力压豆包、Kimi 成国产最强

S.H.I.T

Tripo

ITELLOU

新Flova

waoo

TapNow

DeepSeek-V3.1-Terminus 正式上线：支持双模式推理，输出更稳定

版本概览：双模式支持，上下文长度达 128K

核心改进点

语言一致性提升

Agent 能力进一步优化

性能表现：稳定性增强

定价信息（按 API 使用）

唱片公司指控 Suno 规避 YouTube 技术措施训练 AI 音乐模型

Ollama 新调度系统上线：内存管理更精准，性能全面提升

相关文章

文章

标签云

网址

S.H.I.T

Tripo

ITELLOU

新Flova

waoo

TapNow