模型 | 第12页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

阿里重磅发布Qwen-Image-2.0 ：支持 1K token 指令生成专业信息图，生图编辑一体化

阿里全新推出新一代图像生成基础模型Qwen-Image-2.0，凭借专业文字渲染、细腻真实质感、超强语义遵循、轻量模型架构四大核心特色，实现生图与编辑功能的一体化融合，在文生图和图生图双赛道均展现出优...

图像模型 # Qwen-Image-2.0

2个月前

0450

Cursor 发布 Composer 1.5：强化学习提升 20 倍，支持复杂代码推理

Cursor 团队近日正式推出其智能编程模型 Composer 1.5，作为对前代 Composer 1 的重大升级。新版本聚焦于复杂、多步骤编程任务的处理能力，在推理深度、上下文管理和响应效率上均实...

2个月前

0610

Linacodec：12.5 令牌/秒的高压缩音频分词器，支持 48kHz 高清语音

在 AI 语音模型（TTS/ASR）领域，音频分词器（Audio Tokenizer）的效率直接决定训练速度、推理延迟与生成质量。传统方案如 EnCodec、DAC 虽能压缩音频，但令牌率高、采样率低...

语音模型 # Linacodec # 音频分词器

2个月前

0220

Helcyon-Mercury-12B-v3.0：基于 Mistral Nemo 的高情感智能对话模型

在本地大模型（Local LLM）生态中，大多数模型追求的是“能回答问题”或“会写代码”。但 Helcyon-Mercury-12B-v3.0 的目标截然不同——它不满足于做一台“聊天机器”，而是试图...

大语言模型 # Helcyon-Mercury-12B-v3.0

2个月前

0330

Voyage AI 推出Voyage 4 系列模型：共享嵌入空间 + 专家混合架构，重新定义文本嵌入效率

Voyage AI 正式推出 Voyage 4 系列文本嵌入模型，带来两项行业首创技术：统一的共享嵌入空间与首个生产级 MoE（专家混合）嵌入模型。这一系列不仅在检索精度上树立新标杆，更通过灵活的...

大语言模型 # Voyage 4 # Voyage AI # voyage-4-nano

2个月前

0440

VideoMaMa：基于扩散模型的视频抠图新SOTA，粗糙掩码一键生成高精度Alpha遮罩

高丽大学、Adobe Research 与 KAIST AI 联合提出 VideoMaMa（Video Mask-to-Matte Model），一种基于 Stable Video Diffusion...

视频模型 # VideoMaMa # 视频抠图

2个月前

0210

速度提升 25%，支持全栈开发！OpenAI发布GPT-5.3-Codex ：从代码生成到全场景工程智能体，性能与安全双突破

OpenAI 正式推出全新旗舰级编程智能体模型 GPT-5.3-Codex，作为迄今为止最强大的编码智能体，该模型融合 GPT-5.2-Codex 的前沿编码能力与 GPT-5.2 的通用推理、专业领...

大语言模型 # GPT-5.3-Codex # OpenAI

2个月前

01380

Claude Opus 4.6正式发布：编程能力跃升，支持百万令牌上下文，办公协同全面升级

Anthropic正式推出全新的Claude Opus 4.6大模型，作为其旗舰级智能模型的重磅升级版本，该模型在编程能力、长上下文处理、多任务推理等核心维度实现全面突破，同时首次在Opus系列中开放...

大语言模型 # Anthropic # Claude Opus 4.6

2个月前

0180

Mistral AI 发布 Voxtral Transcribe 2：开源实时模型 + 高性价比批量转录，全面支持多语言语音应用

Mistral AI 推出全新 Voxtral Transcribe 2 系列语音转文本（ASR）模型，包含面向批量离线处理的 Voxtral Mini Transcribe V2 和专为低延迟实时场...

语音模型 # Mistral AI # Voxtral Mini Transcribe V2 # Voxtral Realtime

2个月前

0480

清华大学与 VAST 联合推出 SkinTokens：用离散令牌统一建模 3D 绑定（Rigging）

在生成式 3D 模型快速发展的背景下，绑定（Rigging）——即为静态 3D 模型添加骨骼与蒙皮权重以支持动画——已成为自动化流程中的关键瓶颈。现有方法通常将蒙皮（Skinning）视为一个高维、不...

3D模型 # SkinTokens # VAST # 清华大学

2个月前

0690

Anima：20亿参数动漫专属文生图模型，ComfyUI原生支持，专注插画艺术创作

CircleStone Labs 与 Comfy Org 联合打造的Anima文生图模型正式推出预览版，这款拥有20亿参数（2B）的模型专为动漫艺术打造，聚焦动漫概念、角色与风格创作，同时可生成各类非...

图像模型 # Anima # ComfyUI # 动漫

4周前

02870

上海AI实验室发布 Intern-S1-Pro：万亿参数 MoE 多模态科学推理模型

上海AI实验室推出 Intern-S1-Pro —— 一款面向科学发现的万亿级混合专家（MoE）多模态大模型。该模型在保持强大通用能力的同时，专为 AI for Science（AI4Science...

多模态模型 # Intern-S1-Pro # 上海AI实验室 # 书生科学多模态大模型

2个月前

0350

加载更多

模型

阿里重磅发布Qwen-Image-2.0 ：支持 1K token 指令生成专业信息图，生图编辑一体化

Cursor 发布 Composer 1.5：强化学习提升 20 倍，支持复杂代码推理

Linacodec：12.5 令牌/秒的高压缩音频分词器，支持 48kHz 高清语音

Helcyon-Mercury-12B-v3.0：基于 Mistral Nemo 的高情感智能对话模型

Voyage AI 推出Voyage 4 系列模型：共享嵌入空间 + 专家混合架构，重新定义文本嵌入效率

VideoMaMa：基于扩散模型的视频抠图新SOTA，粗糙掩码一键生成高精度Alpha遮罩

速度提升 25%，支持全栈开发！OpenAI发布GPT-5.3-Codex ：从代码生成到全场景工程智能体，性能与安全双突破

Claude Opus 4.6正式发布：编程能力跃升，支持百万令牌上下文，办公协同全面升级

Mistral AI 发布 Voxtral Transcribe 2：开源实时模型 + 高性价比批量转录，全面支持多语言语音应用

清华大学与 VAST 联合推出 SkinTokens：用离散令牌统一建模 3D 绑定（Rigging）

Anima：20亿参数动漫专属文生图模型，ComfyUI原生支持，专注插画艺术创作

上海AI实验室发布 Intern-S1-Pro：万亿参数 MoE 多模态科学推理模型

新Flova

S.H.I.T

Tripo

ITELLOU

Meshy

即梦 CLI

模型

网址

新Flova

S.H.I.T

Tripo

ITELLOU

Meshy

即梦 CLI