Cohere 推出 Command A Vision:专为企业打造的高效多模态 AI今天,AI 不再只是“读文字”的工具。越来越多的企业需要系统能“看懂”图像——从产品手册、工程图纸到财务报表、现场照片。 为此,Cohere 正式发布 Command A Vision —— 一款专为...多模态模型# Cohere# Command A Vision8个月前01260
阿里推出“会思考”的30B模型Qwen3-30B-A3B-Thinking-2507:复杂任务表现大幅提升阿里通义千问团队再次升级其 30B 级模型线,正式推出 Qwen3-30B-A3B-Thinking-2507。 这并非一次简单迭代,而是针对复杂推理能力的深度优化版本。过去三个月中,项目组重点提升了...大语言模型# Qwen3-30B-A3B-Thinking-2507# 推理模型8个月前04040
阿里推出 Qwen3-Coder-30B-A3B-Instruct:轻量级代码大模型,支持 256K 上下文继发布超大规模的 Qwen3-Coder-480B-A35B-Instruct 后,阿里通义千问团队近日推出一款更轻量但性能强劲的新版本: Qwen3-Coder-30B-A3B-Instruct 这...大语言模型# Qwen3-Coder-30B-A3B-Instruct# 代码大模型8个月前07890
黑森林实验室联合 KREA AI 发布 FLUX.1 Krea [dev]: 实现更真实、更自然的图像生成黑森林实验室(Black Forest Labs, BFL)与创意 AI 平台 KREA AI 正式宣布推出 FLUX.1 Krea [dev] —— 一个全新的开源文本到图像生成模型,也是 Krea...图像模型# FLUX.1 Krea [dev]# 图像生成# 黑森林实验室8个月前05930
腾讯混元提出 X-Omni:用强化学习突破离散自回归图像生成瓶颈在当前多模态生成模型的发展中,研究者始终在探索一个统一的建模范式:能否用类似语言模型“预测下一个词”的方式,来生成图像?这种被称为“下一令牌预测(next-token prediction)”的自回归...图像模型# X-Omni# 腾讯混元8个月前05090
阿里Qwen团队推出 Qwen3-30B-A3B-Instruct-2507:更强、更准、更懂你阿里Qwen团队发布 Qwen3-30B-A3B-Instruct-2507 ——Qwen3 系列中针对非思考模式优化的新一代指令微调模型。 Qwen Chat:https://chat.qwen.a...大语言模型# Qwen3-30B-A3B-Instruct-2507# Qwen团队8个月前08570
新加坡政府科技局发布LionGuard 2:专为新加坡语言生态设计的内容审核防护模型在多语言交织、语码频繁切换的新加坡数字环境中,一句看似无害的“lah”或“leh”,可能暗藏冒犯;一段夹杂中英马来语的对话,对通用内容审核系统而言却是一道难题。 去年,新加坡政府科技局(GovTech...大语言模型# LionGuard 2# 内容审核防护模型8个月前03460
腾讯ARC实验室发布 ARC-Hunyuan-Video-7B:专为短视频理解而生的多模态模型在微信视频号、TikTok 等平台上,每天有数亿条用户生成的短视频被上传。这些视频内容多样、节奏快、信息密度高,往往融合了画面、语音、音效、文字甚至情绪表达。如何让AI真正“理解”这些视频,而不仅仅是...多模态模型# ARC-Hunyuan-Video-7B# 多模态模型# 腾讯ARC实验室8个月前05690
清华团队提出3D场景生成新框架ScenePainter:解决3D生成中的语义漂移难题从一张街景照片出发,AI能否自动“走”过整条街道,生成沿途连续、风格统一的3D视图?这不仅是虚拟现实、自动驾驶仿真的基础需求,也是生成式AI在空间理解上的重要挑战。 然而,当前主流方法在生成长序列3D...3D模型# 3D生成# ScenePainter8个月前03710
新型歌曲生成模型JAM:让歌词精准变成完整歌曲你有没有想过,输入一段歌词,再标上每个词该在什么时候唱,就能自动生成一首旋律自然、节奏准确、风格统一的完整歌曲? 这不是未来设想,而是已经实现的技术突破。 新加坡科技设计大学(SUTD)与 Lambd...语音模型# JAM# 歌曲生成模型9个月前01300
智谱AI正式推出 GLM 系列最新旗舰大模型GLM-4.5 系列:统一推理、编码与代理的全能旗舰模型智谱AI正式推出 GLM-4.5 与 GLM-4.5-Air —— GLM 系列最新旗舰大模型。这两款模型专为代理(Agent)导向应用设计,首次在单一架构中深度融合了复杂推理、高效编码与多工具协同能...大语言模型# GLM-4.5# GLM-4.5-Air# 智谱AI9个月前04710
阿里 WAN 项目组正式推出 Wan2.2:MoE 架构 + 高压缩设计,开源视频生成再进化阿里 WAN 项目组正式推出 Wan2.2,这是对 WAN 系列视频生成模型的一次重大升级。本次发布涵盖多个模型变体,全面支持文本到视频(T2V)、图像到视频(I2V)以及混合输入(TI2V)任务,在...视频模型# Wan2.2# 视频生成模型9个月前01,1160