大语言模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

阿里Qwen团队推出强化学习增强的推理模型QwQ-32B

阿里云的Qwen团队最近宣布了一项重要进展，他们通过整合大规模强化学习（RL）技术来提升大语言模型的智能水平，并推出了新的推理模型QwQ-32B。这款拥有320亿参数的模型，在性能上能够与具有6710...

12个月前

03280

360推出Light-R1-32B：通过SFT和DPO以低成本超越DeepSeek-R1-Distill-Qwen-32B

在数学竞赛 AIME24 上，尽管许多研究者尝试在 72B 或更小的模型上复现 DeepSeek-R1-Distill-Qwen-32B 的 72.6 分，但一直未能成功。模型集成模型推出日期 ...

大语言模型 # 360 # Light-R1-32B # 推理模型

12个月前

03820

Prompt-to-Leaderboard (P2L)：为特定使用场景量身定制的大语言模型排行榜

LMArena 推出了 Prompt-to-Leaderboard（P2L），这是一种创新方法，旨在通过自然语言提示生成针对特定使用场景的实时大语言模型（LLM）排行榜。P2L 的核心思想是训练一个大...

大语言模型 # P2L # 大语言模型

12个月前

04930

OpenAI推出最新模型GPT-4.5，这是迄今为止该公司发布的最大模型

OpenAI 于北京时间2月28日正式推出其最新模型 GPT-4.5，这是迄今为止该公司发布的最大模型，使用的计算能力和数据量均超过以往任何模型。然而，尽管规模庞大，OpenAI 并未将 GPT-4...

大语言模型 # GPT-4.5 # OpenAI

12个月前

04440

Qodo推出代码嵌入模型Qodo-Embed-1：专为软件开发领域设计，在优化自然语言到代码和代码到代码的检索任务

在软件开发领域，代码嵌入模型正逐渐成为提升开发效率和代码质量的关键工具。今天，Qodo 宣布推出其最新的代码嵌入模型系列 Qodo-Embed-1，该系列在保持较小模型体积的同时，实现了最先进的性能...

大语言模型 # Qodo # Qodo-Embed-1 # Qodo-Embed-1-1.5B

12个月前

05390

腾讯推出新一代快思考模型混元 Turbo S

腾讯混元团队发布了其自研的快思考模型 Turbo S ，并在腾讯云官网上架，开发者和企业用户可通过 API 调用体验。同时，该模型从今天起在腾讯元宝平台灰度上线，供广大用户体验。 GitHub：htt...

大语言模型 # 混元 Turbo S # 腾讯

12个月前

02800

微软发布 Phi 系列两款新模型：Phi-4-multimodal 和 Phi-4-mini

微软在今天宣布推出 Phi 系列小型语言模型（SLM）的两款新成员——Phi-4-multimodal 和 Phi-4-mini。这两款模型旨在为开发者提供更强大的 AI 功能，分别在多模态处理和文本...

大语言模型 # Phi-4-mini # Phi-4-multimodal # 微软

12个月前

04390

Anthropic推出首款“混合推理模型”Claude 3.7 Sonnet和代理编码工具Claude Code

Anthropic在今天推出全新模型Claude 3.7 Sonnet，号称业界首个“混合AI推理模型”。它不仅能实时回答问题，还能像人类一样“深度思考”，提供更精准的答案！用户可以自由选择让模型“思...

大语言模型 # Anthropic # Claude 3.7 Sonnet # Claude Code

1年前

03510

月之暗面发布Moonlight：使用 Muon 优化器训练的混合专家 (MoE) 模型

月之暗面（Moonshot AI）和加州大学洛杉矶分校的研究团队联合发布了 Moonlight，这是一款基于 Muon 优化器训练的混合专家（MoE）模型。该模型包含两种配置：一种具有 30 亿激活参...

大语言模型 # Moonlight # Moonshot AI # Muon 优化器

1年前

02310

不影响性能！Perplexity 开源基于DeepSeek-R1推出的无审查版本R1 1776

R1 1776是Perplexity基于DeepSeek-R1推出的无审查版本，该模型号称提供公正、准确和真实的信息，同时保持高推理能力。目前，用户可以在 HuggingFace 上下载该模型，或者通...

大语言模型 # DeepSeek-R1 # Perplexity # R1 1776

1年前

07220

卷麻了！阿里在除夕夜推出超大规模的 MoE 模型 Qwen2.5-Max

过去，有一种观点认为，持续增加数据规模和模型参数可能是通向人工通用智能（AGI）的一条可行路径。然而，无论是对于稠密模型还是MoE（Mixture of Experts）模型而言，整个大模型社区在训练...

大语言模型 # MoE # Qwen2.5-Max # 阿里

1年前

03030

艾伦AI研究所推出Tülu 3 405B：超越 DeepSeek V3 的性能表现

艾伦AI研究所在成功推出Tülu 3之后，又在昨天宣布推出Tülu 3 405B——这是首次将完全开放的后训练方法应用于最大规模的开放权重模型。此次发布不仅展示了艾伦AI研究所在大规模参数模型上的可扩...

大语言模型 # Tülu 3 # Tülu 3 405B # 艾伦AI研究所

1年前

02740

加载更多

阿里Qwen团队推出强化学习增强的推理模型QwQ-32B

360推出Light-R1-32B：通过SFT和DPO以低成本超越DeepSeek-R1-Distill-Qwen-32B

Prompt-to-Leaderboard (P2L)：为特定使用场景量身定制的大语言模型排行榜

OpenAI推出最新模型GPT-4.5，这是迄今为止该公司发布的最大模型

Qodo推出代码嵌入模型Qodo-Embed-1：专为软件开发领域设计，在优化自然语言到代码和代码到代码的检索任务

腾讯推出新一代快思考模型混元 Turbo S

微软发布 Phi 系列两款新模型：Phi-4-multimodal 和 Phi-4-mini

Anthropic推出首款“混合推理模型”Claude 3.7 Sonnet和代理编码工具Claude Code

月之暗面发布Moonlight：使用 Muon 优化器训练的混合专家 (MoE) 模型

不影响性能！Perplexity 开源基于DeepSeek-R1推出的无审查版本R1 1776

卷麻了！阿里在除夕夜推出超大规模的 MoE 模型 Qwen2.5-Max

艾伦AI研究所推出Tülu 3 405B：超越 DeepSeek V3 的性能表现

YouMind

CutCut

OpenClaw（Clawdbot/Moltbot）

OpenClaw 一键部署工具

OpenClaw汉化发行版

可灵 AI

大语言模型

网址

YouMind

CutCut

OpenClaw（Clawdbot/Moltbot）

OpenClaw 一键部署工具

OpenClaw汉化发行版

可灵 AI