谷歌 Jules 智能体将支持定时任务与主动代码监控,迈向自主开发助手
谷歌正为其 AI 编程助手 Jules 引入两项关键能力:定时任务 与 主动代码监控模式。这标志着 Jules 从“被动响应指令”向“主动维护项目”迈出关键一步,目标是成为支持手动与自主双模式的工程助...
SteadyDancer:用 I2V 范式解决首帧失真,生成身份一致的高保真人像动画
人体图像动画技术迎来颠覆性突破!南京大学、腾讯与上海AI实验室联合推出的SteadyDancer框架,通过彻底摒弃传统参考图到视频(R2V)范式,转向图像到视频(I2V)全新思路,从根源上解决了长期困...
685B参数DeepSeekMath-V2开源!IMO/CMO金牌+Putnam近满分,颠覆数学推理范式
数学推理领域迎来里程碑式突破!DeepSeek AI 正式发布开源数学模型 DeepSeekMath-V2,这款基于 685B 参数专家混合(MoE)架构的模型,不仅在 IMO 2025、CMO 20...
阿里通义发布Z-Image-Turbo:60 亿参数高效图像模型,支持中英双语文本渲染与亚秒级生成
在图像生成模型多依赖“大参数堆料”的行业趋势下,阿里通义MAX项目组推出的Z-Image,以60亿参数的轻量化体量实现了颠覆性突破。这款通过系统性优化打造的图像生成基础模型,不仅在照片级真实感生成、中...
腾讯开源HunyuanOCR:以1B参数覆盖9大场景,支持百种语言
在OCR领域常陷入“大参数换高性能”的内卷时,腾讯混元于11月25日开源的HunyuanOCR,以1B的轻量化参数实现了颠覆性突破。这款依托混元原生多模态架构打造的端到端OCR专家模型,不仅在多项权威...
腾讯开源HunyuanVideo-1.5:83亿参数实现顶级画质,14G显存消费级显卡即可运行
在视频生成模型多追求大参数堆料的当下,腾讯混元项目组推出的HunyuanVideo-1.5走出了一条“小而精”的差异化路线。这款仅搭载83亿参数的轻量级视频生成模型,不仅实现了开源领域顶尖的视觉质量与...
Kandinsky 5 视频生成落地 ComfyUI!T2V/I2V 工作流一键加载,12GB GPU 可运行
Kandinsky 5 系列已正式适配 ComfyUI,官方提供完整的视频生成工作流,支持文本生视频(T2V)和图像生视频(I2V)双模式。无论是想快速体验 5-10 秒短视频生成,还是需要精细化调整...
Kandinsky 5.0 全系列开源:190亿参数视频Pro+轻量版,支持中俄双语+5-10秒HD生成
来自俄罗斯的AI企业Sber AI,正式推出新一代扩散模型家族 Kandinsky 5.0,以“全场景覆盖+开源开放”为核心亮点,涵盖视频生成(T2V/I2V)、图像生成(T2I)、图像编辑三大核心能...
ComfyUI 首发支持 FLUX.2:本地/云端/合作节点三重方案,开箱即用
黑森林实验室刚刚开源了 FLUX.2。ComfyUI 的首发日支持现已上线!FLUX.2 是下一代图像模型,可生成高达 400 万像素的照片级真实感输出,在光照、皮肤、织物和手部细节方面表现大幅提升...
FLUX.2发布:联手英伟达优化RTX GPU,FP8版本显存与性能双提效40%
专注视觉生成式AI的黑森林实验室,正式推出新一代尖端图像生成模型系列 FLUX.2。此次发布的核心亮点的是,该模型与英伟达、ComfyUI 达成深度合作,针对 RTX GPU 推出 FP8 量化优化版...















