深度求索(DeepSeek)于昨晚完成线上模型升级,发布 DeepSeek-V3.1-Terminus 版本。此次更新已同步至官方 App、网页端、小程序及 API 接口,用户可立即体验。
- Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus
- ModelScope:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus
新版本在保持原有性能的基础上,针对语言一致性、Agent 能力等用户反馈问题进行了重点优化,整体输出更加稳定可靠。
版本概览:双模式支持,上下文长度达 128K
DeepSeek-V3.1-Terminus 提供两种运行模式,适配不同任务需求:
| 模式 | 对应 API 名称 | 默认输出长度 | 最大输出长度 | 典型用途 |
|---|---|---|---|---|
| 非思考模式 | deepseek-chat | 4K tokens | 8K tokens | 日常对话、快速响应 |
| 思考模式 | deepseek-reasoner | 32K tokens | 64K tokens | 复杂推理、代码生成、长链任务 |
两种模式均支持 128K 上下文长度,适用于处理超长文档、日志分析、多轮交互等场景。

核心改进点
语言一致性提升
- 显著缓解中英文混杂输出问题;
- 减少异常字符、乱码或格式错乱现象;
- 在多语言混合输入下表现更可控。
这一改进提升了模型在正式写作、跨语言翻译辅助等场景中的可用性。
Agent 能力进一步优化
针对开发者高频使用的智能代理功能:
- Code Agent:代码生成准确性提高,对边缘语法和库调用理解更准确;
- Search Agent:信息检索逻辑更清晰,引用来源组织更合理;
优化后,模型在需要工具调用、外部查询的任务中响应更精准,失败率降低。
性能表现:稳定性增强
官方表示,Terminus 版本经过多轮内部压力测试与线上灰度验证,在以下方面表现更优:
- 响应延迟波动减少;
- 长文本生成连贯性提升;
- 极端提示下的“崩溃”或无限循环概率下降。
虽然未引入全新架构,但通过数据微调与推理流程优化,实现了体验层面的实质性进步。
定价信息(按 API 使用)
对于通过 API 调用的用户,当前计费标准如下(单位:人民币):
| 项目 | 价格(每百万 tokens) |
|---|---|
| 输入(缓存命中) | ¥0.5 元 |
| 输入(缓存未命中) | ¥4.0 元 |
| 输出 | ¥12.0 元 |
💡 缓存机制说明:若请求内容与历史上下文高度相似,系统可能命中缓存,大幅降低计算开销与成本。
该定价延续了 DeepSeek 系列在性价比方面的优势,尤其适合高频率、中低长度输出的应用场景。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...















