大语言模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

Qwen3.5 小模型系列重磅发布：0.8B 至 9B 全覆盖，原生多模态与强化学习赋能边缘智能

通义千问（Qwen）家族再添新成员！Qwen3.5 小模型系列今日正式发布，涵盖 0.8B、2B、4B、9B 四种参数量级。这一系列模型不仅继承了 Qwen3.5 大模型的强大基因，更在效率与性能的平...

大语言模型 # Qwen3.5

1个月前

0830

Perplexity 开源两款高性能嵌入模型：4B 参数支持二进制量化，检索效果超越 Gemini 与 Qwen

在检索增强生成（RAG）和大规模语义搜索领域，嵌入模型（Embedding Model）的性能与成本往往难以兼得。今日，AI搜索引擎 Perplexity AI 发布了专为互联网规模检索任务打造的两款...

大语言模型 # Perplexity # pplx-embed-context-v1 # pplx-embed-v1

1个月前

0240

Inception Labs 发布 Mercury 2：扩散式 LLM 打破自回归瓶颈，推理速度提升 10 倍

在大型语言模型（LLM）领域，自回归（Autoregressive）架构长期占据主导地位，但其“逐字生成”的特性已成为高延迟场景的痛点。今日，Inception Labs 正式推出 Mercury 2...

大语言模型 # Inception Labs # Mercury 2 # 扩散式 LLM

1个月前

0410

西班牙“准独角兽”Multiverse 发布免费压缩模型Hypernova-60B-2602：60B 参数仅占 32GB，性能比肩 Mistral Large 3

大型语言模型（LLM）虽强，但“大”往往意味着高昂的部署成本和难以逾越的硬件门槛。西班牙巴斯克地区的初创公司 Multiverse Computing 正试图打破这一僵局。今日，该公司正式发布了 H...

大语言模型 # Hypernova-60B-2602 # Multiverse

1个月前

0780

Qwen3.5 中型模型系列重磅开源：35B 越级挑战 235B，架构效率重塑 AI 新标杆

在基础大模型的竞赛中，参数规模曾是衡量智能的唯一标尺。但今天，阿里 Qwen 项目组用最新发布的 Qwen3.5 中型模型系列证明：推动智能进步的，不再仅仅是更大的参数，而是更优的架构、更精的数据和...

大语言模型 # Qwen3.5-122B-A10B # Qwen3.5-27B # Qwen3.5-35B-A3B

1个月前

0810

LiquidAI 发布 LFM2-24B-A2B：240 亿参数 MoE 模型，仅需 20 亿激活即可在 32GB 内存笔记本上流畅运行

大模型是否只能存在于云端集群？LiquidAI 给出了否定的答案。 LiquidAI 正式发布了 LFM2-24B-A2B，这是其 LFM2 家族中规模最大的早期模型。这款稀疏混合专家（MoE）模型拥...

大语言模型 # LFM2-24B-A2B # LiquidAI

1个月前

07000

Guide Labs发布Steerling-8B：首个“内在可解释”大模型，让 AI 决策彻底透明化

在大模型领域，“黑盒”一直是悬在开发者头顶的达摩克利斯之剑。我们深知模型强大，却往往不知其为何强大，更难以精准控制其行为。今天，Guide Labs 正式发布了 Steerling-8B——全球首个...

大语言模型 # Guide Labs # Steerling-8B

1个月前

0410

谷歌发布 Gemini 3.1 Pro：专为处理最复杂任务打造的更强智能模型

当简单的答案已不足以应对挑战时，我们需要更深层的智能。上周，谷歌针对科学、研究和工程领域的现代难题，对 Gemini 3 Deep Think 进行了重大更新。今天，谷歌正式发布了支撑这些突破的升级...

大语言模型早报 # Gemini 3 Deep Think # Gemini 3.1 Pro # 谷歌

2个月前

0330

Anthropic 重磅发布 Sonnet 4.6：100 万上下文窗口 + 类人操作电脑，免费用户直接升级

今日，Anthropic 正式发布了 Claude Sonnet 4.6，这是其中型模型系列的最新力作。不仅保持了公司标志性的四个月更新周期，更带来了令人瞩目的性能飞跃：100 万 Token 的超长...

大语言模型早报 # Anthropic # Claude Sonnet 4.6 # Sonnet 4.6

2个月前

0240

Cohere 重磅开源 Tiny Aya：33 亿参数撬动 70+ 语言，手机离线也能跑的“多语言神器”

在多语言 AI 领域，长期存在一个悖论：要么模型巨大无比、依赖云端算力，只能覆盖主流语言；要么模型轻量但能力孱弱，无法处理复杂的小语种任务。今日，在印度 AI 峰会期间，企业级 AI 独角兽 Coh...

大语言模型 # Cohere # Tiny Aya

2个月前

0380

阿里发布Qwen3.5 系列大模型：两大旗舰模型登场，多项评测超越国际一线

今天下午，阿里并未进行大规模宣传，而是在其官方对话页面chat.qwen.ai上低调上线了Qwen3.5系列的两款全新大语言模型——Qwen3.5-Plus与Qwen3.5-397B-A17B。项目...

大语言模型早报 # Qwen3.5 # Qwen3.5-397B-A17B # Qwen3.5-Plus

2个月前

0680

京东开源 JoyAI-LLM-Flash：3B 激活参数 MoE 模型，专为智能体与高吞吐场景优化

京东在 Hugging Face 正式开源其最新大语言模型 JoyAI-LLM-Flash，标志着其在高效、低成本、智能体友好型 AI 基础模型领域的重大进展。模型：https://huggingf...

大语言模型 # JoyAI-LLM-Flash # 京东

2个月前

0500

加载更多

Qwen3.5 小模型系列重磅发布：0.8B 至 9B 全覆盖，原生多模态与强化学习赋能边缘智能

Perplexity 开源两款高性能嵌入模型：4B 参数支持二进制量化，检索效果超越 Gemini 与 Qwen

Inception Labs 发布 Mercury 2：扩散式 LLM 打破自回归瓶颈，推理速度提升 10 倍

西班牙“准独角兽”Multiverse 发布免费压缩模型Hypernova-60B-2602：60B 参数仅占 32GB，性能比肩 Mistral Large 3

Qwen3.5 中型模型系列重磅开源：35B 越级挑战 235B，架构效率重塑 AI 新标杆

LiquidAI 发布 LFM2-24B-A2B：240 亿参数 MoE 模型，仅需 20 亿激活即可在 32GB 内存笔记本上流畅运行

Guide Labs发布Steerling-8B：首个“内在可解释”大模型，让 AI 决策彻底透明化

谷歌发布 Gemini 3.1 Pro：专为处理最复杂任务打造的更强智能模型

Anthropic 重磅发布 Sonnet 4.6：100 万上下文窗口 + 类人操作电脑，免费用户直接升级

Cohere 重磅开源 Tiny Aya：33 亿参数撬动 70+ 语言，手机离线也能跑的“多语言神器”

阿里发布Qwen3.5 系列大模型：两大旗舰模型登场，多项评测超越国际一线

京东开源 JoyAI-LLM-Flash：3B 激活参数 MoE 模型，专为智能体与高吞吐场景优化

S.H.I.T

Tripo

ITELLOU

waoo

Flova

TapNow

大语言模型

网址

S.H.I.T

Tripo

ITELLOU

waoo

Flova

TapNow