Meta AI发布SAM 3:支持文本/图像双提示,图像视频分割性能翻Meta 近日推出 Segment Anything 系列新一代模型——SAM 3,首次实现文本、图像示例双提示驱动的开放式概念分割,可精准识别并分割“带红色条纹的雨伞”等细粒度概念,在图像与视频分割...多模态模型# Meta AI# SAM 3# 分割模型6天前060
Meta AI发布SAM 3D:单图生成3D模型,开源全工具链+商业落地同步推进Meta AI近日推出 Segment Anything 模型家族的全新成员——SAM 3D,这是首个具备常识级 3D 理解能力的模型,可直接将普通 2D 照片转化为细节丰富的 3D 重建结果。此次发...3D模型# Meta AI# SAM 3D6天前0170
SteadyDancer:用 I2V 范式解决首帧失真,生成身份一致的高保真人像动画人体图像动画技术迎来颠覆性突破!南京大学、腾讯与上海AI实验室联合推出的SteadyDancer框架,通过彻底摒弃传统参考图到视频(R2V)范式,转向图像到视频(I2V)全新思路,从根源上解决了长期困...视频模型# SteadyDancer1周前0570
685B参数DeepSeekMath-V2开源!IMO/CMO金牌+Putnam近满分,颠覆数学推理范式数学推理领域迎来里程碑式突破!DeepSeek AI 正式发布开源数学模型 DeepSeekMath-V2,这款基于 685B 参数专家混合(MoE)架构的模型,不仅在 IMO 2025、CMO 20...大语言模型# DeepSeek# DeepSeekMath-V2# 深度求索1周前0110
阿里通义发布Z-Image-Turbo:60 亿参数高效图像模型,支持中英双语文本渲染与亚秒级生成在图像生成模型多依赖“大参数堆料”的行业趋势下,阿里通义MAX项目组推出的Z-Image,以60亿参数的轻量化体量实现了颠覆性突破。这款通过系统性优化打造的图像生成基础模型,不仅在照片级真实感生成、中...图像模型# Z-Image-Turbo1周前01280
腾讯开源HunyuanOCR:以1B参数覆盖9大场景,支持百种语言在OCR领域常陷入“大参数换高性能”的内卷时,腾讯混元于11月25日开源的HunyuanOCR,以1B的轻量化参数实现了颠覆性突破。这款依托混元原生多模态架构打造的端到端OCR专家模型,不仅在多项权威...多模态模型# HunyuanOCR1周前080
腾讯开源HunyuanVideo-1.5:83亿参数实现顶级画质,14G显存消费级显卡即可运行在视频生成模型多追求大参数堆料的当下,腾讯混元项目组推出的HunyuanVideo-1.5走出了一条“小而精”的差异化路线。这款仅搭载83亿参数的轻量级视频生成模型,不仅实现了开源领域顶尖的视觉质量与...视频模型# HunyuanVideo-1.5# 腾讯1周前0310
Kandinsky 5.0 全系列开源:190亿参数视频Pro+轻量版,支持中俄双语+5-10秒HD生成来自俄罗斯的AI企业Sber AI,正式推出新一代扩散模型家族 Kandinsky 5.0,以“全场景覆盖+开源开放”为核心亮点,涵盖视频生成(T2V/I2V)、图像生成(T2I)、图像编辑三大核心能...图像模型视频模型# Kandinsky 5.01周前0220
黑森林实验室发布FLUX.2 :支持400万像素编辑+10图参考,开放权重模型刷新视觉AI上限在视觉AI领域,能够真正适配现实世界创意工作流的工具,往往比单纯的“演示级模型”更具价值。近日,黑森林实验室正式推出新一代视觉智能系统 FLUX.2,不仅在图像生成质量、细节还原度上实现突破,更以多参...图像模型# FLUX.2# 黑森林实验室1周前0250
微软推出Fara - 7B模型:70亿参数本地运行,专为计算机使用代理 (CUA) 设计的小型语言模型微软正式推出首款专为计算机使用代理(CUA)设计的小型语言模型Fara - 7B。这款仅70亿参数的模型跳出了对大规模云端模型的依赖,凭借可本地运行的特性,在降低延迟的同时筑牢数据隐私防线,更以独特的...大语言模型# Fara - 7B# 微软# 计算机使用代理2周前080
Anthropic 发布 Claude Opus 4.5:宣称全球最佳编程模型,API 降价+多平台同步上线Anthropic 今日正式发布旗舰级 AI 模型 Claude Opus 4.5,聚焦编程、代理任务与计算机使用场景,凭借多项核心突破重塑行业标杆。该模型不仅在 SWE-bench Verified...大语言模型# Anthropic# Claude Opus 4.5# 编程模型2周前070
艾伦AI研究所发布Olmo 3系列模型:完全开放的推理模型,训练数据与中间步骤全透明在开源AI领域,“开放”往往局限于最终模型权重的分享,而模型训练的数据、流程、中间检查点等核心环节仍处于“黑箱”状态。Ai2(艾伦人工智能研究所)最新发布的 Olmo 3 系列模型,彻底打破了这一现状...大语言模型# Olmo 3# 艾伦AI研究所2周前01080