大语言模型

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

字节跳动 Seed 团队推出Seed Diffusion：打破自回归瓶颈，实现 5.4 倍代码生成加速

字节跳动 Seed 团队近期发布了一款实验性语言模型——Seed Diffusion 预览版，它采用离散状态扩散机制，专注于代码生成任务，在推理速度上实现了显著突破：最高可达 2,146 token...

6个月前

01420

Meta发布新型多语言对比语言-图像预训练（CLIP）模型MetaCLIP 2

MetaCLIP 2 是一种新型的多语言对比语言-图像预训练（CLIP）模型，旨在从全球范围内的网络数据中学习图像和文本的表示。传统的 CLIP 模型主要基于英语数据进行训练，而 MetaCLIP 2...

大语言模型 # Meta # MetaCLIP 2

6个月前

01410

阿里推出“会思考”的30B模型Qwen3-30B-A3B-Thinking-2507：复杂任务表现大幅提升

阿里通义千问团队再次升级其 30B 级模型线，正式推出 Qwen3-30B-A3B-Thinking-2507。这并非一次简单迭代，而是针对复杂推理能力的深度优化版本。过去三个月中，项目组重点提升了...

大语言模型 # Qwen3-30B-A3B-Thinking-2507 # 推理模型

6个月前

03810

阿里推出 Qwen3-Coder-30B-A3B-Instruct：轻量级代码大模型，支持 256K 上下文

继发布超大规模的 Qwen3-Coder-480B-A35B-Instruct 后，阿里通义千问团队近日推出一款更轻量但性能强劲的新版本： Qwen3-Coder-30B-A3B-Instruct 这...

大语言模型 # Qwen3-Coder-30B-A3B-Instruct # 代码大模型

6个月前

07510

阿里Qwen团队推出 Qwen3-30B-A3B-Instruct-2507：更强、更准、更懂你

阿里Qwen团队发布 Qwen3-30B-A3B-Instruct-2507 ——Qwen3 系列中针对非思考模式优化的新一代指令微调模型。 Qwen Chat：https://chat.qwen.a...

大语言模型 # Qwen3-30B-A3B-Instruct-2507 # Qwen团队

6个月前

08170

新加坡政府科技局发布LionGuard 2：专为新加坡语言生态设计的内容审核防护模型

在多语言交织、语码频繁切换的新加坡数字环境中，一句看似无害的“lah”或“leh”，可能暗藏冒犯；一段夹杂中英马来语的对话，对通用内容审核系统而言却是一道难题。去年，新加坡政府科技局（GovTech...

大语言模型 # LionGuard 2 # 内容审核防护模型

6个月前

02740

智谱AI正式推出 GLM 系列最新旗舰大模型GLM-4.5 系列：统一推理、编码与代理的全能旗舰模型

智谱AI正式推出 GLM-4.5 与 GLM-4.5-Air —— GLM 系列最新旗舰大模型。这两款模型专为代理（Agent）导向应用设计，首次在单一架构中深度融合了复杂推理、高效编码与多工具协同能...

大语言模型 # GLM-4.5 # GLM-4.5-Air # 智谱AI

6个月前

03390

上海交通大学发布SmallThinker 系列模型：专为设备端部署设计的原生混合专家（MoE）语言模型

由上海交通大学 IPADS 实验室、人工智能学院与 Zenergize AI 联合研发的 SmallThinker 系列模型，是一组专为设备端部署设计的原生混合专家（MoE）语言模型。其核心目标是在资...

大语言模型 # SmallThinker # 上海交通大学

6个月前

03050

中国科学院发布“磐石”操作系统与 S1-Base 科学大模型：开启“AI for Science”新范式

在AI加速推动科学研究变革的背景下，中国科学院正式推出 “磐石”（ScienceOne） —— 一个面向前沿科学发现与技术创新的“AI+科学”操作系统。作为其核心引擎，磐石科学基础大模型（S1-Bas...

大语言模型 # 中国科学院 # 磐石科学基础大模型

6个月前

03120

阶跃星辰发布 Step 3：开源最强多模态推理模型，推动“模芯”生态共建

在2025世界人工智能大会（WAIC）开幕前夕，中国大模型企业阶跃星辰于今日在上海正式发布其新一代基础大模型——Step 3。该模型定位为“推理时代最适合应用的基座模型”，将于7月31日面向全球开源...

大语言模型 # Step 3 # 多模态推理模型 # 阶跃星辰

6个月前

01370

阿里Qwen团队发布 Qwen3-235B-A22B-Thinking-2507：深度推理能力再升级

在持续三个月的优化后，阿里Qwen团队正式推出 Qwen3-235B-A22B-Thinking-2507 版本。该模型在逻辑推理、数学、科学、编程及学术任务上的表现显著提升，进一步巩固了其在开源思维...

大语言模型 # Qwen3-235B-A22B-Thinking-2507 # 推理模型

6个月前

02550

阿里通义千问推出机器翻译模型Qwen-MT：92种语言互译，打造高效智能翻译新体验

阿里通义千问团队近日通过Qwen API平台正式发布机器翻译模型Qwen-MT的最新升级版本——qwen-mt-turbo。该模型基于强大的Qwen3架构，结合超大规模多语言翻译数据与强化学习技术，在...

大语言模型 # Qwen-MT # 翻译模型

6个月前

04670

加载更多

字节跳动 Seed 团队推出Seed Diffusion：打破自回归瓶颈，实现 5.4 倍代码生成加速

Meta发布新型多语言对比语言-图像预训练（CLIP）模型MetaCLIP 2

阿里推出“会思考”的30B模型Qwen3-30B-A3B-Thinking-2507：复杂任务表现大幅提升

阿里推出 Qwen3-Coder-30B-A3B-Instruct：轻量级代码大模型，支持 256K 上下文

阿里Qwen团队推出 Qwen3-30B-A3B-Instruct-2507：更强、更准、更懂你

新加坡政府科技局发布LionGuard 2：专为新加坡语言生态设计的内容审核防护模型

智谱AI正式推出 GLM 系列最新旗舰大模型GLM-4.5 系列：统一推理、编码与代理的全能旗舰模型

上海交通大学发布SmallThinker 系列模型：专为设备端部署设计的原生混合专家（MoE）语言模型

中国科学院发布“磐石”操作系统与 S1-Base 科学大模型：开启“AI for Science”新范式

阶跃星辰发布 Step 3：开源最强多模态推理模型，推动“模芯”生态共建

阿里Qwen团队发布 Qwen3-235B-A22B-Thinking-2507：深度推理能力再升级

阿里通义千问推出机器翻译模型Qwen-MT：92种语言互译，打造高效智能翻译新体验

新QoderWork

Clawdbot/Moltbot

中国科技云数据胶囊

ITELLOU

Situation Monitor

Fogsight (雾象)

大语言模型

网址

新QoderWork

Clawdbot/Moltbot

中国科技云数据胶囊

ITELLOU

Situation Monitor

Fogsight (雾象)