腾讯推出全新MoE模型Hunyuan-A13B:小参数、高性能的AI新选择在大模型持续演进的过程中,如何在提升性能的同时控制资源消耗,成为行业面临的关键挑战。腾讯最新推出的 Hunyuan-A13B 模型,正是这一问题的创新性解决方案。该模型采用混合专家(MoE)架构,在仅...大语言模型# Hunyuan-A13B# 腾讯6个月前01510
Salesforce 推出 CoAct-1:能写代码的智能体,让自动化迈入新阶段在AI智能体普遍还在“点击屏幕”完成任务的今天,Salesforce 与南加州大学联合研发的 CoAct-1 正在打破这一局限。这款新型计算机操作智能体不仅能识别界面、模拟鼠标点击,更能在任务执行过程...大语言模型# CoAct-1# 智能体4个月前01480
Multiverse:全球首个开源的非自回归并行推理框架,推理速度提升2倍卡内基梅隆大学与英伟达联合推出了一项具有突破性的生成模型框架——Multiverse。这是全球首个开源的非自回归(Non-Autoregressive)并行推理框架,在保持与主流自回归模型(AR-LL...大语言模型# Multiverse# 推理框架6个月前01480
阿里正式发布 Qwen3 Embedding和Reranker 系列模型:专为文本表征与检索排序设计今天凌晨,阿里巴巴正式开源 Qwen3 Embedding 系列模型,作为 Qwen 模型家族的最新成员,该系列专注于文本语义表征、信息检索与排序任务,在多语言理解、跨语言检索和代码相关性建模等方面展...大语言模型# Qwen3 Embedding# Qwen3 Reranker# 阿里7个月前01440
字节跳动 Seed 团队推出Seed Diffusion:打破自回归瓶颈,实现 5.4 倍代码生成加速字节跳动 Seed 团队近期发布了一款实验性语言模型——Seed Diffusion 预览版,它采用离散状态扩散机制,专注于代码生成任务,在推理速度上实现了显著突破:最高可达 2,146 token...大语言模型# Seed Diffusion# 字节跳动5个月前01400
DeepSeek 发布DeepSeek-V3.2-Exp:首次引入细粒度稀疏注意力,API 成本直降 50%+在国庆节假期前夕,DeepSeek 正式推出 DeepSeek-V3.2-Exp ——一个面向未来架构演进的实验性(Experimental)版本。该模型并非最终发布版,而是通向新一代高效架构的关键中...大语言模型# DeepSeek# DeepSeek-V3.2-Exp3个月前01390
FastMTP:通过增强多令牌预测提升大模型推理效率在大语言模型(LLM)的实际应用中,推理速度是影响用户体验和部署成本的关键因素。尽管模型能力不断提升,但逐个生成 token 的方式带来了较高的延迟和计算开销。推测解码(Speculative Dec...大语言模型# FastMTP# 推理模型3个月前01390
腾讯优图实验室发布Youtu-agent:开源、高性能的自主智能体框架,开箱即用多场景能力腾讯优图实验室近期推出了自主智能体框架 Youtu-agent——一款以“灵活、高性能、低成本”为核心的工具,不仅能支持自主智能体的构建、运行与评估,还在多项权威基准测试中表现突出。更重要的是,它针对...大语言模型# Youtu-agent# 智能体框架4个月前01390
Reka AI发布推理模型Reka Flash 3.1 :强化学习驱动的高效推理模型升级Reka AI 正式发布了其推理模型 Reka Flash 3.1,这是其 21 亿参数模型 Reka Flash 3 的重要升级版本。该模型在代码生成、智能体任务微调等方面表现尤为突出,并作为 Re...大语言模型# Reka AI# Reka Flash 3.1# 推理模型5个月前01390
艾伦AI研究所发布Olmo 3系列模型:完全开放的推理模型,训练数据与中间步骤全透明在开源AI领域,“开放”往往局限于最终模型权重的分享,而模型训练的数据、流程、中间检查点等核心环节仍处于“黑箱”状态。Ai2(艾伦人工智能研究所)最新发布的 Olmo 3 系列模型,彻底打破了这一现状...大语言模型# Olmo 3# 艾伦AI研究所4周前01370
美团 LongCat 团队发布 LongCat-Flash-Thinking:具备形式化与智能体推理能力的新一代高效推理模型美团 LongCat 团队正式推出 LongCat-Flash-Thinking——一款专注于高复杂度任务推理的大型语言模型(LRM)。该模型在保持前代 LongCat-Flash-Chat 高效响应...大语言模型# LongCat-Flash-Thinking# 推理模型# 美团3个月前01370
Meta发布新型多语言对比语言-图像预训练(CLIP)模型MetaCLIP 2MetaCLIP 2 是一种新型的多语言对比语言-图像预训练(CLIP)模型,旨在从全球范围内的网络数据中学习图像和文本的表示。传统的 CLIP 模型主要基于英语数据进行训练,而 MetaCLIP 2...大语言模型# Meta# MetaCLIP 25个月前01350