模型 | 第9页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

Qwen3.5 中型模型系列重磅开源：35B 越级挑战 235B，架构效率重塑 AI 新标杆

在基础大模型的竞赛中，参数规模曾是衡量智能的唯一标尺。但今天，阿里 Qwen 项目组用最新发布的 Qwen3.5 中型模型系列证明：推动智能进步的，不再仅仅是更大的参数，而是更优的架构、更精的数据和...

1个月前

0810

LiquidAI 发布 LFM2-24B-A2B：240 亿参数 MoE 模型，仅需 20 亿激活即可在 32GB 内存笔记本上流畅运行

大模型是否只能存在于云端集群？LiquidAI 给出了否定的答案。 LiquidAI 正式发布了 LFM2-24B-A2B，这是其 LFM2 家族中规模最大的早期模型。这款稀疏混合专家（MoE）模型拥...

大语言模型 # LFM2-24B-A2B # LiquidAI

1个月前

06940

Guide Labs发布Steerling-8B：首个“内在可解释”大模型，让 AI 决策彻底透明化

在大模型领域，“黑盒”一直是悬在开发者头顶的达摩克利斯之剑。我们深知模型强大，却往往不知其为何强大，更难以精准控制其行为。今天，Guide Labs 正式发布了 Steerling-8B——全球首个...

大语言模型 # Guide Labs # Steerling-8B

1个月前

0380

ZUNA：开源 3.8 亿参数脑电图基础模型，支持去噪、重建与上采样

脑电图（EEG）研究长期面临着一个棘手难题：信号噪声大、电极脱落导致数据缺失、以及高密度采集成本高昂。传统处理方法往往依赖复杂的数学插值或手工设计的滤波器，不仅效果有限，还难以适应多变的实际场景。 Z...

多模态模型 # ZUNA

1个月前

0400

MioCodec v2 发布：仅需 341 bps 即可重建 44.1kHz 高保真音频，TTS 模型无缝升级神器

在口语语言建模（Speech Language Modeling）领域，我们长期面临着一个两难选择：是要高压缩率以降低计算成本，还是要高保真度以确保音质清晰？传统的神经音频编解码器往往难以兼得，且常常...

语音模型 # MioCodec

1个月前

0140

谷歌发布 Gemini 3.1 Pro：专为处理最复杂任务打造的更强智能模型

当简单的答案已不足以应对挑战时，我们需要更深层的智能。上周，谷歌针对科学、研究和工程领域的现代难题，对 Gemini 3 Deep Think 进行了重大更新。今天，谷歌正式发布了支撑这些突破的升级...

大语言模型早报 # Gemini 3 Deep Think # Gemini 3.1 Pro # 谷歌

2个月前

0330

Mistral AI 发布 Voxtral Mini 4B Realtime 2602：40 亿参数开源实时语音模型，延迟低至 500ms 且支持中文

在实时语音处理领域，准确性与低延迟往往难以兼得。传统的开源模型（如 Whisper）虽然精度高，但通常需要收集完整音频片段后才能开始转写，导致显著的延迟，无法满足实时字幕或即时语音助手的需求。模型...

语音模型 # Mistral AI # Voxtral Mini 4B Realtime 2602

2个月前

0260

中国多所高校联合推出 DeepGen 1.0：50 亿参数小模型逆袭，图像生成与编辑能力媲美 800 亿巨无霸

在AI领域，“大力出奇迹”似乎已成为一种默认法则：模型参数越大，效果越好。然而，由上海创智学院、复旦大学、中国科学技术大学、上海交通大学、浙江大学、西湖大学、南京大学以及南加州大学的研究人员共同推出的...

图像模型 # DeepGen 1.0 # 多模态模型

2个月前

0810

谷歌发布全新音乐模型 Lyria 3：已集成到Gemini，输入文字或图片，30 秒生成原创音乐

谷歌周三正式宣布，其旗舰 AI 助手 Gemini 迎来重大功能升级——集成音乐生成能力。这一新功能由谷歌旗下 DeepMind 团队最新研发的 Lyria 3 模型驱动，目前正处于测试阶段，面向全球...

早报语音模型 # Lyria 3 # 谷歌 # 音乐模型

2个月前

0370

Anthropic 重磅发布 Sonnet 4.6：100 万上下文窗口 + 类人操作电脑，免费用户直接升级

今日，Anthropic 正式发布了 Claude Sonnet 4.6，这是其中型模型系列的最新力作。不仅保持了公司标志性的四个月更新周期，更带来了令人瞩目的性能飞跃：100 万 Token 的超长...

大语言模型早报 # Anthropic # Claude Sonnet 4.6 # Sonnet 4.6

2个月前

0240

Cohere 重磅开源 Tiny Aya：33 亿参数撬动 70+ 语言，手机离线也能跑的“多语言神器”

在多语言 AI 领域，长期存在一个悖论：要么模型巨大无比、依赖云端算力，只能覆盖主流语言；要么模型轻量但能力孱弱，无法处理复杂的小语种任务。今日，在印度 AI 峰会期间，企业级 AI 独角兽 Coh...

大语言模型 # Cohere # Tiny Aya

2个月前

0360

Capybara：统一视觉创作模型，一个模型搞定文生图、视频生成与全能编辑

在当前的 AI 视觉创作领域，我们正陷入一种“工具碎片化”的困境：生成图片用 Midjourney，生成视频换 Runway，修图得开 Photoshop，剪视频又要另一套流程。这些工具不仅接口割裂...

视频模型 # Capybara # 统一视觉创作模型

2个月前

0910

加载更多

模型

Qwen3.5 中型模型系列重磅开源：35B 越级挑战 235B，架构效率重塑 AI 新标杆

LiquidAI 发布 LFM2-24B-A2B：240 亿参数 MoE 模型，仅需 20 亿激活即可在 32GB 内存笔记本上流畅运行

Guide Labs发布Steerling-8B：首个“内在可解释”大模型，让 AI 决策彻底透明化

ZUNA：开源 3.8 亿参数脑电图基础模型，支持去噪、重建与上采样

MioCodec v2 发布：仅需 341 bps 即可重建 44.1kHz 高保真音频，TTS 模型无缝升级神器

谷歌发布 Gemini 3.1 Pro：专为处理最复杂任务打造的更强智能模型

Mistral AI 发布 Voxtral Mini 4B Realtime 2602：40 亿参数开源实时语音模型，延迟低至 500ms 且支持中文

中国多所高校联合推出 DeepGen 1.0：50 亿参数小模型逆袭，图像生成与编辑能力媲美 800 亿巨无霸

谷歌发布全新音乐模型 Lyria 3：已集成到Gemini，输入文字或图片，30 秒生成原创音乐

Anthropic 重磅发布 Sonnet 4.6：100 万上下文窗口 + 类人操作电脑，免费用户直接升级

Cohere 重磅开源 Tiny Aya：33 亿参数撬动 70+ 语言，手机离线也能跑的“多语言神器”

Capybara：统一视觉创作模型，一个模型搞定文生图、视频生成与全能编辑

新Flova

S.H.I.T

Meshy

Tripo

即梦 CLI

ITELLOU

模型

网址

新Flova

S.H.I.T

Meshy

Tripo

即梦 CLI

ITELLOU