腾讯混元发布四款小尺寸开源模型,端侧 AI 应用迎来新选择

大语言模型4个月前发布 小马良
366 0

继此前开源大尺寸模型后,腾讯混元团队近日推出四款全新小尺寸开源模型,参数量分别为 0.5B、1.8B、4B 和 7B。这些模型专为低功耗、资源受限场景设计,可在消费级显卡、笔记本电脑、手机、智能座舱及智能家居设备上高效运行,标志着大模型从“云端巨兽”向“端侧智能”的进一步下沉。

Github

HuggingFace

目前,四个模型已全面上线 GitHub 与 Hugging Face 等主流开源社区,并获得 Arm、高通、英特尔、联发科技等多家终端芯片厂商的部署支持,为跨平台 AI 应用落地提供了坚实基础。

腾讯混元发布四款小尺寸开源模型,端侧 AI 应用迎来新选择

核心特性:小而强,兼顾性能与效率

融合推理架构,支持“快慢思考”

新开源的四款模型属于融合推理模型,具备灵活的推理模式切换能力:

  • 快思考模式:适用于简单问答、指令响应等场景,输出简洁高效,延迟低。
  • 慢思考模式:针对复杂任务(如数学推导、逻辑推理),启用多步深度推理,确保结果的完整性与准确性。

这种设计让用户可根据实际需求在速度与深度之间自由权衡,提升使用体验。

小尺寸,高性能

尽管参数规模较小,但模型在多个关键能力上达到业界同尺寸领先水平:

  • 语言理解:在通用语义理解任务中表现稳健
  • 数学能力:在 GSM8K 等数学推理基准上得分优异
  • 逻辑推理:支持多跳推理与因果分析

在公开测试集中,各项指标均与同类模型对标甚至反超,展现出出色的性价比。

腾讯混元发布四款小尺寸开源模型,端侧 AI 应用迎来新选择

强大的 Agent 能力

与此前开源的 Hunyuan-A13B 一脉相承,新模型在 Agent 能力上表现突出,得益于精心构建的训练数据与强化学习奖励机制,具备:

  • 任务规划与分解
  • 工具调用(如搜索、计算器、代码执行)
  • 复杂决策与自我反思

这使得模型在实际应用中可胜任:

  • 深度网络搜索
  • Excel 表格自动化处理
  • 旅行路线与预算规划

原生支持 256K 超长上下文

一个关键亮点是,所有四款模型均支持 256K 原生上下文长度,相当于:

  • 一次性处理 40 万中文字符 或 50 万英文单词
  • 相当于连续读完三本《哈利·波特》并记住所有人物关系与剧情细节

在此基础上,模型能:

  • 对整本书籍进行摘要与问答
  • 分析完整会议录音或技术文档
  • 基于长篇内容生成续写或评论

为长文本处理类应用提供了强大支撑。

腾讯混元发布四款小尺寸开源模型,端侧 AI 应用迎来新选择

部署友好:轻量、开放、易集成

✅ 单卡即可部署

所有模型均可在单张消费级 GPU 上运行,部分 0.5B/1.8B 模型甚至可在移动端直接部署,满足端侧低延迟需求。

🔧 全面支持主流框架

  • 推理框架:SGLang、vLLM、TensorRT-LLM 等均已完成适配
  • 量化格式:支持 INT4、FP16 等多种量化方案,进一步降低显存占用

开发者可快速将其集成至现有系统,无需额外适配成本。

实际应用:已在腾讯多业务线落地

这四款小尺寸模型并非仅限于研究用途,已在腾讯内部多个产品中实现规模化应用。

云端长文本处理

  • 微信读书 AI 问书:基于 256K 上下文,实现对整本书籍的“读懂、记清、答准”。
  • 腾讯会议 AI 小助手:可一次性分析整场会议录音,生成纪要、提炼待办事项。

端侧智能交互

  • 腾讯智能座舱助手:采用“双模型协作”架构,一个负责快速响应,一个处理复杂指令,兼顾低功耗与高智能。
  • 搜狗输入法:利用多模态联合训练机制,在嘈杂语音环境下显著提升识别准确率。
  • 腾讯地图:通过意图分类 + 推理模型,优化用户查询理解与交互体验。
  • 微信输入法「问 AI」:实现输入框内“即问即答”,无缝衔接输入与 AI 服务。

垂直行业定制

  • 金融 AI 助手:通过 Prompt 优化与少量数据微调,意图识别准确率超 95%,满足金融级可靠性要求。
  • 游戏与 NPC 交互
    • 游戏翻译系统:支持多语言、方言精准互译
    • QQ 飞车手游 NPC:实现拟人化对话与情境响应

开源历程:持续构建完整生态

腾讯混元在开源领域已形成多层次布局:

模型类型代表模型特点
大模型Hunyuan-Large(52B)高性能通用基座
混合推理 MoEHunyuan-A13B支持快慢思考,Agent 能力强
小尺寸系列0.5B / 1.8B / 4B / 7B端侧友好,低功耗部署
多模态能力文生图、视频生成、3D 生成全链路开源,衍生模型超 3000 个
最新发布混元 3D 世界模型 1.0上周开源,支持 3D 场景生成

通过持续开源,混元正为社区提供一套从通用到专用、从云端到端侧、从文本到多模态的完整基座模型体系。

© 版权声明

相关文章

暂无评论

none
暂无评论...