模型 | 第4页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

Inception Labs 发布 Mercury 2：扩散式 LLM 打破自回归瓶颈，推理速度提升 10 倍

在大型语言模型（LLM）领域，自回归（Autoregressive）架构长期占据主导地位，但其“逐字生成”的特性已成为高延迟场景的痛点。今日，Inception Labs 正式推出 Mercury 2...

大语言模型 # Inception Labs # Mercury 2 # 扩散式 LLM

3周前

0360

西班牙“准独角兽”Multiverse 发布免费压缩模型Hypernova-60B-2602：60B 参数仅占 32GB，性能比肩 Mistral Large 3

大型语言模型（LLM）虽强，但“大”往往意味着高昂的部署成本和难以逾越的硬件门槛。西班牙巴斯克地区的初创公司 Multiverse Computing 正试图打破这一僵局。今日，该公司正式发布了 H...

大语言模型 # Hypernova-60B-2602 # Multiverse

3周前

0660

LoRWeB：AI 图像编辑新范式，只需“看一眼”就能学会任何修图技巧

想象这样一个场景：你看到朋友的照片戴着一副酷炫的墨镜，效果极佳。你也想给自己的照片加上同款墨镜，但你既不会使用复杂的 Photoshop，也难以用文字精确描述“想要什么样的墨镜、戴在什么位置、光影如何...

图像模型 # LoRWeB # 图像编辑

3周前

0560

Qwen3.5 中型模型系列重磅开源：35B 越级挑战 235B，架构效率重塑 AI 新标杆

在基础大模型的竞赛中，参数规模曾是衡量智能的唯一标尺。但今天，阿里 Qwen 项目组用最新发布的 Qwen3.5 中型模型系列证明：推动智能进步的，不再仅仅是更大的参数，而是更优的架构、更精的数据和...

大语言模型 # Qwen3.5-122B-A10B # Qwen3.5-27B # Qwen3.5-35B-A3B

3周前

0710

LiquidAI 发布 LFM2-24B-A2B：240 亿参数 MoE 模型，仅需 20 亿激活即可在 32GB 内存笔记本上流畅运行

大模型是否只能存在于云端集群？LiquidAI 给出了否定的答案。 LiquidAI 正式发布了 LFM2-24B-A2B，这是其 LFM2 家族中规模最大的早期模型。这款稀疏混合专家（MoE）模型拥...

大语言模型 # LFM2-24B-A2B # LiquidAI

3周前

06030

Guide Labs发布Steerling-8B：首个“内在可解释”大模型，让 AI 决策彻底透明化

在大模型领域，“黑盒”一直是悬在开发者头顶的达摩克利斯之剑。我们深知模型强大，却往往不知其为何强大，更难以精准控制其行为。今天，Guide Labs 正式发布了 Steerling-8B——全球首个...

大语言模型 # Guide Labs # Steerling-8B

3周前

0200

ZUNA：开源 3.8 亿参数脑电图基础模型，支持去噪、重建与上采样

脑电图（EEG）研究长期面临着一个棘手难题：信号噪声大、电极脱落导致数据缺失、以及高密度采集成本高昂。传统处理方法往往依赖复杂的数学插值或手工设计的滤波器，不仅效果有限，还难以适应多变的实际场景。 Z...

多模态模型 # ZUNA

3周前

0360

MioCodec v2 发布：仅需 341 bps 即可重建 44.1kHz 高保真音频，TTS 模型无缝升级神器

在口语语言建模（Speech Language Modeling）领域，我们长期面临着一个两难选择：是要高压缩率以降低计算成本，还是要高保真度以确保音质清晰？传统的神经音频编解码器往往难以兼得，且常常...

语音模型 # MioCodec

3周前

0120

谷歌发布 Gemini 3.1 Pro：专为处理最复杂任务打造的更强智能模型

当简单的答案已不足以应对挑战时，我们需要更深层的智能。上周，谷歌针对科学、研究和工程领域的现代难题，对 Gemini 3 Deep Think 进行了重大更新。今天，谷歌正式发布了支撑这些突破的升级...

大语言模型早报 # Gemini 3 Deep Think # Gemini 3.1 Pro # 谷歌

4周前

0270

Mistral AI 发布 Voxtral Mini 4B Realtime 2602：40 亿参数开源实时语音模型，延迟低至 500ms 且支持中文

在实时语音处理领域，准确性与低延迟往往难以兼得。传统的开源模型（如 Whisper）虽然精度高，但通常需要收集完整音频片段后才能开始转写，导致显著的延迟，无法满足实时字幕或即时语音助手的需求。模型...

语音模型 # Mistral AI # Voxtral Mini 4B Realtime 2602

4周前

0230

中国多所高校联合推出 DeepGen 1.0：50 亿参数小模型逆袭，图像生成与编辑能力媲美 800 亿巨无霸

在AI领域，“大力出奇迹”似乎已成为一种默认法则：模型参数越大，效果越好。然而，由上海创智学院、复旦大学、中国科学技术大学、上海交通大学、浙江大学、西湖大学、南京大学以及南加州大学的研究人员共同推出的...

图像模型 # DeepGen 1.0 # 多模态模型

4周前

0550

谷歌发布全新音乐模型 Lyria 3：已集成到Gemini，输入文字或图片，30 秒生成原创音乐

谷歌周三正式宣布，其旗舰 AI 助手 Gemini 迎来重大功能升级——集成音乐生成能力。这一新功能由谷歌旗下 DeepMind 团队最新研发的 Lyria 3 模型驱动，目前正处于测试阶段，面向全球...

早报语音模型 # Lyria 3 # 谷歌 # 音乐模型

4周前

0250

加载更多

模型