模型 | 第46页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

Cohere 推出 Command A Vision：专为企业打造的高效多模态 AI

今天，AI 不再只是“读文字”的工具。越来越多的企业需要系统能“看懂”图像——从产品手册、工程图纸到财务报表、现场照片。为此，Cohere 正式发布 Command A Vision —— 一款专为...

多模态模型 # Cohere # Command A Vision

8个月前

01260

阿里推出“会思考”的30B模型Qwen3-30B-A3B-Thinking-2507：复杂任务表现大幅提升

阿里通义千问团队再次升级其 30B 级模型线，正式推出 Qwen3-30B-A3B-Thinking-2507。这并非一次简单迭代，而是针对复杂推理能力的深度优化版本。过去三个月中，项目组重点提升了...

大语言模型 # Qwen3-30B-A3B-Thinking-2507 # 推理模型

8个月前

04040

阿里推出 Qwen3-Coder-30B-A3B-Instruct：轻量级代码大模型，支持 256K 上下文

继发布超大规模的 Qwen3-Coder-480B-A35B-Instruct 后，阿里通义千问团队近日推出一款更轻量但性能强劲的新版本： Qwen3-Coder-30B-A3B-Instruct 这...

大语言模型 # Qwen3-Coder-30B-A3B-Instruct # 代码大模型

8个月前

07890

黑森林实验室联合 KREA AI 发布 FLUX.1 Krea [dev]：实现更真实、更自然的图像生成

黑森林实验室（Black Forest Labs, BFL）与创意 AI 平台 KREA AI 正式宣布推出 FLUX.1 Krea [dev] —— 一个全新的开源文本到图像生成模型，也是 Krea...

图像模型 # FLUX.1 Krea [dev]# 图像生成 # 黑森林实验室

8个月前

05930

腾讯混元提出 X-Omni：用强化学习突破离散自回归图像生成瓶颈

在当前多模态生成模型的发展中，研究者始终在探索一个统一的建模范式：能否用类似语言模型“预测下一个词”的方式，来生成图像？这种被称为“下一令牌预测（next-token prediction）”的自回归...

图像模型 # X-Omni # 腾讯混元

8个月前

05090

阿里Qwen团队推出 Qwen3-30B-A3B-Instruct-2507：更强、更准、更懂你

阿里Qwen团队发布 Qwen3-30B-A3B-Instruct-2507 ——Qwen3 系列中针对非思考模式优化的新一代指令微调模型。 Qwen Chat：https://chat.qwen.a...

大语言模型 # Qwen3-30B-A3B-Instruct-2507 # Qwen团队

8个月前

08570

新加坡政府科技局发布LionGuard 2：专为新加坡语言生态设计的内容审核防护模型

在多语言交织、语码频繁切换的新加坡数字环境中，一句看似无害的“lah”或“leh”，可能暗藏冒犯；一段夹杂中英马来语的对话，对通用内容审核系统而言却是一道难题。去年，新加坡政府科技局（GovTech...

大语言模型 # LionGuard 2 # 内容审核防护模型

8个月前

03460

腾讯ARC实验室发布 ARC-Hunyuan-Video-7B：专为短视频理解而生的多模态模型

在微信视频号、TikTok 等平台上，每天有数亿条用户生成的短视频被上传。这些视频内容多样、节奏快、信息密度高，往往融合了画面、语音、音效、文字甚至情绪表达。如何让AI真正“理解”这些视频，而不仅仅是...

多模态模型 # ARC-Hunyuan-Video-7B # 多模态模型 # 腾讯ARC实验室

8个月前

05690

清华团队提出3D场景生成新框架ScenePainter：解决3D生成中的语义漂移难题

从一张街景照片出发，AI能否自动“走”过整条街道，生成沿途连续、风格统一的3D视图？这不仅是虚拟现实、自动驾驶仿真的基础需求，也是生成式AI在空间理解上的重要挑战。然而，当前主流方法在生成长序列3D...

3D模型 # 3D生成 # ScenePainter

8个月前

03710

新型歌曲生成模型JAM：让歌词精准变成完整歌曲

你有没有想过，输入一段歌词，再标上每个词该在什么时候唱，就能自动生成一首旋律自然、节奏准确、风格统一的完整歌曲？这不是未来设想，而是已经实现的技术突破。新加坡科技设计大学（SUTD）与 Lambd...

语音模型 # JAM # 歌曲生成模型

9个月前

01300

智谱AI正式推出 GLM 系列最新旗舰大模型GLM-4.5 系列：统一推理、编码与代理的全能旗舰模型

智谱AI正式推出 GLM-4.5 与 GLM-4.5-Air —— GLM 系列最新旗舰大模型。这两款模型专为代理（Agent）导向应用设计，首次在单一架构中深度融合了复杂推理、高效编码与多工具协同能...

大语言模型 # GLM-4.5 # GLM-4.5-Air # 智谱AI

9个月前

04710

阿里 WAN 项目组正式推出 Wan2.2：MoE 架构 + 高压缩设计，开源视频生成再进化

阿里 WAN 项目组正式推出 Wan2.2，这是对 WAN 系列视频生成模型的一次重大升级。本次发布涵盖多个模型变体，全面支持文本到视频（T2V）、图像到视频（I2V）以及混合输入（TI2V）任务，在...

视频模型 # Wan2.2 # 视频生成模型

9个月前

01,1160

加载更多

模型

Cohere 推出 Command A Vision：专为企业打造的高效多模态 AI

阿里推出“会思考”的30B模型Qwen3-30B-A3B-Thinking-2507：复杂任务表现大幅提升

阿里推出 Qwen3-Coder-30B-A3B-Instruct：轻量级代码大模型，支持 256K 上下文

黑森林实验室联合 KREA AI 发布 FLUX.1 Krea [dev]：实现更真实、更自然的图像生成

腾讯混元提出 X-Omni：用强化学习突破离散自回归图像生成瓶颈

阿里Qwen团队推出 Qwen3-30B-A3B-Instruct-2507：更强、更准、更懂你

新加坡政府科技局发布LionGuard 2：专为新加坡语言生态设计的内容审核防护模型

腾讯ARC实验室发布 ARC-Hunyuan-Video-7B：专为短视频理解而生的多模态模型

清华团队提出3D场景生成新框架ScenePainter：解决3D生成中的语义漂移难题

新型歌曲生成模型JAM：让歌词精准变成完整歌曲

智谱AI正式推出 GLM 系列最新旗舰大模型GLM-4.5 系列：统一推理、编码与代理的全能旗舰模型

阿里 WAN 项目组正式推出 Wan2.2：MoE 架构 + 高压缩设计，开源视频生成再进化

S.H.I.T

Tripo

同事.skill

Joker of Academics（小丑学术期刊）

waoo

ITELLOU

模型

网址

S.H.I.T

Tripo

同事.skill

Joker of Academics（小丑学术期刊 ）

waoo

ITELLOU

Joker of Academics（小丑学术期刊）