大语言模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型

排序

发布更新浏览点赞

Mistral发布首款推理模型Magistral，挑战Gemini 2.5 Pro与Claude Opus

法国AI实验室 Mistral AI 正式发布了其首个推理模型家族——Magistral，标志着这家以开源著称的AI公司正式进军高阶推理领域。该系列包括两个版本： Magistral Small（2...

6个月前

01270

新加坡国立大学等提出 SparseD：让扩散语言模型在长上下文场景高效运行的稀疏注意力新方案

扩散语言模型（Diffusion Language Models, DLMs）因其支持并行生成文本的能力，被视为自回归模型（AR）之外的一条重要技术路径。然而，其高昂的推理延迟严重制约了实际应用，尤其...

大语言模型 # SparseD # 稀疏注意力 # 长上下文场景

3个月前

01260

百度推出轻量级推理模型ERNIE-4.5-21B-A3B-Thinking：原生支持函数调用，可联网查天气、调数据库

百度推出ERNIE-4.5-21B-A3B-Thinking，一款专为复杂推理任务优化的轻量级 MoE（Mixture of Experts）大模型。该模型在原有 ERNIE-4.5 基础上显著提升了...

大语言模型 # ERNIE-4.5-21B-A3B-Thinking # 百度

3个月前

01260

Instinct：由 Continue 打造的全球首个开放 Next Edit 模型

在代码编辑中，真正消耗时间的往往不是“写代码”，而是重构、调整、维护与迭代。传统自动补全工具只能在光标处插入文本，面对复杂的多行修改仍需手动操作，打断开发节奏。为此，开发工具团队 Continue ...

大语言模型 # Continue # Instinct # Next Edit 模型

3个月前

01260

字节跳动发布UI-TARS-2：一个面向真实GUI交互的原生代理模型

在图形用户界面（GUI）日益复杂的背景下，如何让AI代理像人类一样流畅操作系统、完成多步骤任务，是自动化与智能体研究的重要方向。然而，当前自主GUI代理的发展仍面临诸多挑战：训练数据难以规模化获取、多...

大语言模型 # UI-TARS-2

3个月前

01260

DMind AI 推出专为 Web3 生态系统优化的领域专用大模型 DMind-1 和 DMind-1-mini

Web3 技术的迅猛发展，尤其是区块链、去中心化金融（DeFi）和智能合约的广泛应用，催生了对专门的大型语言模型（LLM）的迫切需求。这些领域需要精准的领域适配和高级推理能力，而通用 LLM 往往在特...

大语言模型 # DMind AI # DMind-1 # DMind-1-mini

7个月前

01260

Katanemo Labs发布1.5B 路由模型Arch-Router-1.5B：实现 93% 准确率，无需昂贵微调

在 LLM（大语言模型）应用场景日益复杂的背景下，如何将用户查询智能路由到最合适的模型，成为提升效率和体验的关键挑战。近日，Katanemo Labs 推出了一个创新的解决方案 —— Arch-Ro...

大语言模型 # Arch-Router-1.5B # 路由模型

5个月前

01250

月之暗面开源智能代理基础模型Kimi K2，参数达 1T，激活参数 32B

月之暗面正式发布其新一代 MoE 架构大模型——Kimi K2，并同步开源。该模型具备卓越的代码能力、数学推理能力以及智能代理（Agent）任务处理能力，是目前最适配于构建自主化智能系统的开源基础模型...

大语言模型 # Kimi K2 # 推理模型 # 智能代理模型

5个月前

01210

Mistral AI 发布 Mistral Small 3.2：小幅迭代，体验提升

Mistral AI 推出了其中型模型系列的新版本——Mistral Small 3.2。这是对上一版 Mistral Small 3.1 的一次轻量级升级，在多个关键使用场景中带来了显著优化。模型...

大语言模型 # Mistral AI # Mistral Small 3.2

6个月前

01200

Cognition 发布 SWE-1.5：950 tok/s 高速编码模型，Windsurf 现已可用

Cognition 正式推出软件工程专用模型家族新成员——SWE-1.5。作为一款拥有数千亿参数的前沿规模模型，它不仅实现了接近当前最佳水平（SOTA）的编程性能，更在速度上打破现有标准：通过与 Ce...

大语言模型 # Cognition # SWE-1.5 # 编程模型

2个月前

01150

蚂蚁集团发布全球首个开源万亿参数推理大模型 Ring-1T-preview

在大模型迈向“深度思考”的关键阶段，蚂蚁集团迈出重要一步：其自研的万亿参数自然语言推理大模型 Ring-1T-preview 正式上线 Hugging Face，成为全球首个开源的万亿参数级推理专用大...

大语言模型 # Ring-1T-preview # 推理大模型 # 蚂蚁集团

3个月前

01130

字节跳动开源 Seed-X：70亿参数的多语言翻译模型，性能媲美 GPT-4 和 Gemini

字节跳动推出Seed-X，这是一个开源的多语言翻译模型系列，包括指令模型、强化学习模型和奖励模型，参数规模为 70亿（7B），却在翻译能力上展现出媲美甚至超越超大规模闭源模型（如 Gemini-2.5...

大语言模型 # SEED-X # 多语言翻译模型 # 字节跳动

5个月前

01100

加载更多

Mistral发布首款推理模型Magistral，挑战Gemini 2.5 Pro与Claude Opus

新加坡国立大学等提出 SparseD：让扩散语言模型在长上下文场景高效运行的稀疏注意力新方案

百度推出轻量级推理模型ERNIE-4.5-21B-A3B-Thinking：原生支持函数调用，可联网查天气、调数据库

Instinct：由 Continue 打造的全球首个开放 Next Edit 模型

字节跳动发布UI-TARS-2：一个面向真实GUI交互的原生代理模型

DMind AI 推出专为 Web3 生态系统优化的领域专用大模型 DMind-1 和 DMind-1-mini

Katanemo Labs发布1.5B 路由模型Arch-Router-1.5B：实现 93% 准确率，无需昂贵微调

月之暗面开源智能代理基础模型Kimi K2，参数达 1T，激活参数 32B

Mistral AI 发布 Mistral Small 3.2：小幅迭代，体验提升

Cognition 发布 SWE-1.5：950 tok/s 高速编码模型，Windsurf 现已可用

蚂蚁集团发布全球首个开源万亿参数推理大模型 Ring-1T-preview

字节跳动开源 Seed-X：70亿参数的多语言翻译模型，性能媲美 GPT-4 和 Gemini

朱雀大模型检测

Fogsight (雾象)

Tripo

新人生 K 线

秒哒

Google AI Studio

大语言模型

网址

朱雀大模型检测

Fogsight (雾象)

Tripo

新人生 K 线

秒哒

Google AI Studio