继此前开源大尺寸模型后,腾讯混元团队近日推出四款全新小尺寸开源模型,参数量分别为 0.5B、1.8B、4B 和 7B。这些模型专为低功耗、资源受限场景设计,可在消费级显卡、笔记本电脑、手机、智能座舱及智能家居设备上高效运行,标志着大模型从“云端巨兽”向“端侧智能”的进一步下沉。
Github
- Hunyuan-0.5B:https://github.com/Tencent-Hunyuan/Hunyuan-0.5B
- Hunyuan-1.8B:https://github.com/Tencent-Hunyuan/Hunyuan-1.8B
- Hunyuan-4B:https://github.com/Tencent-Hunyuan/Hunyuan-4B
- Hunyuan-7B:https://github.com/Tencent-Hunyuan/Hunyuan-7B
HuggingFace
- Hunyuan-0.5B:https://huggingface.co/tencent/Hunyuan-0.5B-Instruct
- Hunyuan-1.8B:https://huggingface.co/tencent/Hunyuan-1.8B-Instruct
- Hunyuan-4B:https://huggingface.co/tencent/Hunyuan-4B-Instruct
- Hunyuan-7B:https://huggingface.co/tencent/Hunyuan-7B-Instruct
目前,四个模型已全面上线 GitHub 与 Hugging Face 等主流开源社区,并获得 Arm、高通、英特尔、联发科技等多家终端芯片厂商的部署支持,为跨平台 AI 应用落地提供了坚实基础。

核心特性:小而强,兼顾性能与效率
融合推理架构,支持“快慢思考”
新开源的四款模型属于融合推理模型,具备灵活的推理模式切换能力:
- 快思考模式:适用于简单问答、指令响应等场景,输出简洁高效,延迟低。
- 慢思考模式:针对复杂任务(如数学推导、逻辑推理),启用多步深度推理,确保结果的完整性与准确性。
这种设计让用户可根据实际需求在速度与深度之间自由权衡,提升使用体验。
小尺寸,高性能
尽管参数规模较小,但模型在多个关键能力上达到业界同尺寸领先水平:
- 语言理解:在通用语义理解任务中表现稳健
- 数学能力:在 GSM8K 等数学推理基准上得分优异
- 逻辑推理:支持多跳推理与因果分析
在公开测试集中,各项指标均与同类模型对标甚至反超,展现出出色的性价比。

强大的 Agent 能力
与此前开源的 Hunyuan-A13B 一脉相承,新模型在 Agent 能力上表现突出,得益于精心构建的训练数据与强化学习奖励机制,具备:
- 任务规划与分解
- 工具调用(如搜索、计算器、代码执行)
- 复杂决策与自我反思
这使得模型在实际应用中可胜任:
- 深度网络搜索
- Excel 表格自动化处理
- 旅行路线与预算规划
原生支持 256K 超长上下文
一个关键亮点是,所有四款模型均支持 256K 原生上下文长度,相当于:
- 一次性处理 40 万中文字符 或 50 万英文单词
- 相当于连续读完三本《哈利·波特》并记住所有人物关系与剧情细节
在此基础上,模型能:
- 对整本书籍进行摘要与问答
- 分析完整会议录音或技术文档
- 基于长篇内容生成续写或评论
为长文本处理类应用提供了强大支撑。

部署友好:轻量、开放、易集成
✅ 单卡即可部署
所有模型均可在单张消费级 GPU 上运行,部分 0.5B/1.8B 模型甚至可在移动端直接部署,满足端侧低延迟需求。
🔧 全面支持主流框架
- 推理框架:SGLang、vLLM、TensorRT-LLM 等均已完成适配
- 量化格式:支持 INT4、FP16 等多种量化方案,进一步降低显存占用
开发者可快速将其集成至现有系统,无需额外适配成本。
实际应用:已在腾讯多业务线落地
这四款小尺寸模型并非仅限于研究用途,已在腾讯内部多个产品中实现规模化应用。
云端长文本处理
- 微信读书 AI 问书:基于 256K 上下文,实现对整本书籍的“读懂、记清、答准”。
- 腾讯会议 AI 小助手:可一次性分析整场会议录音,生成纪要、提炼待办事项。
端侧智能交互
- 腾讯智能座舱助手:采用“双模型协作”架构,一个负责快速响应,一个处理复杂指令,兼顾低功耗与高智能。
- 搜狗输入法:利用多模态联合训练机制,在嘈杂语音环境下显著提升识别准确率。
- 腾讯地图:通过意图分类 + 推理模型,优化用户查询理解与交互体验。
- 微信输入法「问 AI」:实现输入框内“即问即答”,无缝衔接输入与 AI 服务。
垂直行业定制
- 金融 AI 助手:通过 Prompt 优化与少量数据微调,意图识别准确率超 95%,满足金融级可靠性要求。
- 游戏与 NPC 交互:
- 游戏翻译系统:支持多语言、方言精准互译
- QQ 飞车手游 NPC:实现拟人化对话与情境响应
开源历程:持续构建完整生态
腾讯混元在开源领域已形成多层次布局:
| 模型类型 | 代表模型 | 特点 |
|---|---|---|
| 大模型 | Hunyuan-Large(52B) | 高性能通用基座 |
| 混合推理 MoE | Hunyuan-A13B | 支持快慢思考,Agent 能力强 |
| 小尺寸系列 | 0.5B / 1.8B / 4B / 7B | 端侧友好,低功耗部署 |
| 多模态能力 | 文生图、视频生成、3D 生成 | 全链路开源,衍生模型超 3000 个 |
| 最新发布 | 混元 3D 世界模型 1.0 | 上周开源,支持 3D 场景生成 |
通过持续开源,混元正为社区提供一套从通用到专用、从云端到端侧、从文本到多模态的完整基座模型体系。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...















