Qwen3.5 小模型系列重磅发布:0.8B 至 9B 全覆盖,原生多模态与强化学习赋能边缘智能通义千问(Qwen)家族再添新成员!Qwen3.5 小模型系列今日正式发布,涵盖 0.8B、2B、4B、9B 四种参数量级。这一系列模型不仅继承了 Qwen3.5 大模型的强大基因,更在效率与性能的平...大语言模型# Qwen3.51个月前0830
Perplexity 开源两款高性能嵌入模型:4B 参数支持二进制量化,检索效果超越 Gemini 与 Qwen在检索增强生成(RAG)和大规模语义搜索领域,嵌入模型(Embedding Model)的性能与成本往往难以兼得。今日,AI搜索引擎 Perplexity AI 发布了专为互联网规模检索任务打造的两款...大语言模型# Perplexity# pplx-embed-context-v1# pplx-embed-v11个月前0240
Inception Labs 发布 Mercury 2:扩散式 LLM 打破自回归瓶颈,推理速度提升 10 倍在大型语言模型(LLM)领域,自回归(Autoregressive)架构长期占据主导地位,但其“逐字生成”的特性已成为高延迟场景的痛点。今日,Inception Labs 正式推出 Mercury 2...大语言模型# Inception Labs# Mercury 2# 扩散式 LLM1个月前0410
西班牙“准独角兽”Multiverse 发布免费压缩模型Hypernova-60B-2602:60B 参数仅占 32GB,性能比肩 Mistral Large 3大型语言模型(LLM)虽强,但“大”往往意味着高昂的部署成本和难以逾越的硬件门槛。西班牙巴斯克地区的初创公司 Multiverse Computing 正试图打破这一僵局。 今日,该公司正式发布了 H...大语言模型# Hypernova-60B-2602# Multiverse1个月前0780
Qwen3.5 中型模型系列重磅开源:35B 越级挑战 235B,架构效率重塑 AI 新标杆在基础大模型的竞赛中,参数规模曾是衡量智能的唯一标尺。但今天,阿里 Qwen 项目组用最新发布的 Qwen3.5 中型模型系列 证明:推动智能进步的,不再仅仅是更大的参数,而是更优的架构、更精的数据和...大语言模型# Qwen3.5-122B-A10B# Qwen3.5-27B# Qwen3.5-35B-A3B1个月前0810
LiquidAI 发布 LFM2-24B-A2B:240 亿参数 MoE 模型,仅需 20 亿激活即可在 32GB 内存笔记本上流畅运行大模型是否只能存在于云端集群?LiquidAI 给出了否定的答案。 LiquidAI 正式发布了 LFM2-24B-A2B,这是其 LFM2 家族中规模最大的早期模型。这款稀疏混合专家(MoE)模型拥...大语言模型# LFM2-24B-A2B# LiquidAI1个月前07000
Guide Labs发布Steerling-8B:首个“内在可解释”大模型,让 AI 决策彻底透明化在大模型领域,“黑盒”一直是悬在开发者头顶的达摩克利斯之剑。我们深知模型强大,却往往不知其为何强大,更难以精准控制其行为。 今天,Guide Labs 正式发布了 Steerling-8B——全球首个...大语言模型# Guide Labs# Steerling-8B1个月前0410
谷歌发布 Gemini 3.1 Pro:专为处理最复杂任务打造的更强智能模型当简单的答案已不足以应对挑战时,我们需要更深层的智能。 上周,谷歌针对科学、研究和工程领域的现代难题,对 Gemini 3 Deep Think 进行了重大更新。今天,谷歌正式发布了支撑这些突破的升级...大语言模型早报# Gemini 3 Deep Think# Gemini 3.1 Pro# 谷歌2个月前0330
Anthropic 重磅发布 Sonnet 4.6:100 万上下文窗口 + 类人操作电脑,免费用户直接升级今日,Anthropic 正式发布了 Claude Sonnet 4.6,这是其中型模型系列的最新力作。不仅保持了公司标志性的四个月更新周期,更带来了令人瞩目的性能飞跃:100 万 Token 的超长...大语言模型早报# Anthropic# Claude Sonnet 4.6# Sonnet 4.62个月前0240
Cohere 重磅开源 Tiny Aya:33 亿参数撬动 70+ 语言,手机离线也能跑的“多语言神器”在多语言 AI 领域,长期存在一个悖论:要么模型巨大无比、依赖云端算力,只能覆盖主流语言;要么模型轻量但能力孱弱,无法处理复杂的小语种任务。 今日,在印度 AI 峰会期间,企业级 AI 独角兽 Coh...大语言模型# Cohere# Tiny Aya2个月前0380
阿里发布Qwen3.5 系列大模型:两大旗舰模型登场,多项评测超越国际一线今天下午,阿里并未进行大规模宣传,而是在其官方对话页面chat.qwen.ai上低调上线了Qwen3.5系列的两款全新大语言模型——Qwen3.5-Plus与Qwen3.5-397B-A17B。 项目...大语言模型早报# Qwen3.5# Qwen3.5-397B-A17B# Qwen3.5-Plus2个月前0680
京东开源 JoyAI-LLM-Flash:3B 激活参数 MoE 模型,专为智能体与高吞吐场景优化京东在 Hugging Face 正式开源其最新大语言模型 JoyAI-LLM-Flash,标志着其在高效、低成本、智能体友好型 AI 基础模型领域的重大进展。 模型:https://huggingf...大语言模型# JoyAI-LLM-Flash# 京东2个月前0500