模型 | 第7页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

大语言模型多模态模型图像模型语音模型 3D模型 Flux衍生视频模型世界模型

排序

发布更新浏览点赞

浪潮开源源 3.0 Ultra：1515B 参数巨无霸瘦身至 68B 激活，企业级 RAG 与表格理解全面超越 GPT-4o

“大模型的未来不在于无限堆砌参数，而在于如何让每一分算力都产生价值。” 浪潮旗下 YuanLab.ai 团队正式开源源 3.0 Ultra (Yuan3.0 Ultra)。这是一款从零开始预训练的超...

1个月前

01000

微软发布 Phi-4-Reasoning-Vision-15B：150 亿参数的“小而美”多模态推理专家

在视觉语言模型（VLM）竞相追逐千亿参数、万亿训练词元的今天，微软反其道而行之，发布了 Phi-4-reasoning-vision-15B。官方介绍：https://www.microsoft.c...

多模态模型 # Phi-4-Reasoning-Vision-15B # 微软

1个月前

0230

Ai2 发布 Olmo Hybrid：混合架构的“效率革命”，用一半数据训练出同等能力的 7B 模型

“如果 Transformer 是记忆大师，线性 RNN 是状态追踪者，那么混合模型就是集两者之大成的‘全能选手’。” 艾伦AI研究所（Ai2）今日正式发布了 Olmo Hybrid，这是一个全新的 ...

大语言模型 # Olmo Hybrid # 艾伦AI研究所

1个月前

0290

印度SarvamAI 开源 30B/105B 推理模型，全栈自研挑战全球巨头

印度初创公司 SarvamAI 开源了其旗舰推理模型系列：Sarvam 30B 和 Sarvam 105B。这两个模型不仅是目前印度本土构建的最大规模开源模型，更代表了全球范围内罕见的全栈自研（Ful...

大语言模型 # Sarvam 105B # Sarvam 30B # SarvamAI

1个月前

01290

Luma 发布统一推理图像模型UNI-1：终结“理解”与“生成”的割裂，首个统一推理视觉模型登场

“过去的 AI 是‘先看懂，再画出来’的两个步骤；现在的 UNI-1 是‘边想边画，画即是想’的一个过程。” Luma AI 今日正式推出 UNI-1，这是业界首个将视觉理解与图像生成深度融合的统一推...

图像模型早报 # Luma # UNI-1

1个月前

0550

OpenAI 发布 GPT-5.4：原生“计算机使用”能力觉醒，智能体正式接管复杂工作流

“它不再只是陪你聊天的机器人，而是能真正操作你电脑、编写并调试代码、处理复杂报表的数字员工。” OpenAI 正式推出 GPT-5.4，这是 GPT-5 系列中迄今为止最强大的通用模型。它不仅继承了 ...

大语言模型早报 # GPT-5.4 # OpenAI # 智能体

1个月前

0190

Lightricks 双重重磅发布：LTX-2.3 模型进化与 LTX Desktop 开源编辑器，本地视频生成时代正式来临

Lightricks 今日宣布同步推出两项里程碑式产品：LTX-2.3，一个经过实战打磨、架构全面升级的视频生成模型；以及 LTX Desktop，一款直接构建于该引擎之上的生产级本地视频编辑器。这...

早报视频模型 # Lightricks # LTX Desktop # LTX-2.3

1个月前

02070

小红书开源FireRed-Image-Edit 1.1：引入智能体工作流，支持 10+ 元素融合与专业级人像精修

小红书智能创作基础技术团队正式推出 FireRed-Image-Edit-1.1。作为前代通用图像编辑模型的升级版，1.1 版本在保留强大编辑能力的基础上，重点攻克了身份一致性、多图像复杂控制及领域专...

图像模型 # FireRed-Image-Edit 1.1 # 小红书

1个月前

0970

谷歌 Gemini 3.1 Flash-Lite 发布：首字速度快 2.5 倍，每百万输入仅$0.25，重新定义高性价比 AI

在 AI 模型竞相追求更大参数、更强能力的今天，谷歌反其道而行之，推出了 Gemini 3.1 Flash-Lite。这款专为高容量、低延迟、低成本场景打造的新模型，旨在证明：在速度与效率的赛道上，轻...

大语言模型早报 # Gemini 3.1 Flash-Lite # 谷歌

1个月前

0380

OpenAI 推出 GPT-5.3 Instant：告别“说教式”拒答，幻觉率最高直降 27%，重塑日常对话体验

OpenAI 今日正式向 ChatGPT 所有用户及 API 开发者推送 GPT-5.3 Instant 更新。将作为ChatGPT的默认模型，此次升级并未追求参数量或新能力的爆发，而是专注于打磨日常...

大语言模型早报 # GPT-5.3 Instant # OpenAI

1个月前

0240

OmniLottie：全球首个端到端多模态矢量动画生成器，文字/图片/视频一键转可编辑 Lottie

在数字设计领域，动画是灵魂，但高质量动画的制作门槛却高不可攀。现有的 AI 视频生成工具大多输出“死视频”（MP4/GIF）——无法放大、无法修改颜色、无法提取元素。而设计师钟爱的 Lottie 矢量...

多模态模型 # Lottie # OmniLottie # 矢量动画

1个月前

0420

Helios：北大与字节联手打造 14B 实时长视频模型，单卡 19.5 FPS 刷新生成速度纪录

在 AI 视频生成领域，长期存在一个“不可能三角”：生成速度快、视频时长长、画面质量高，三者往往难以兼得。主流模型要么只能生成几秒的短视频，要么需要数十分钟才能渲染出几秒钟的画面，且长视频极易出现人物...

视频模型 # Helios # 实时长视频模型

1个月前

01870

加载更多

模型

浪潮开源源 3.0 Ultra：1515B 参数巨无霸瘦身至 68B 激活，企业级 RAG 与表格理解全面超越 GPT-4o

微软发布 Phi-4-Reasoning-Vision-15B：150 亿参数的“小而美”多模态推理专家

Ai2 发布 Olmo Hybrid：混合架构的“效率革命”，用一半数据训练出同等能力的 7B 模型

印度SarvamAI 开源 30B/105B 推理模型，全栈自研挑战全球巨头

Luma 发布统一推理图像模型UNI-1：终结“理解”与“生成”的割裂，首个统一推理视觉模型登场

OpenAI 发布 GPT-5.4：原生“计算机使用”能力觉醒，智能体正式接管复杂工作流

Lightricks 双重重磅发布：LTX-2.3 模型进化与 LTX Desktop 开源编辑器，本地视频生成时代正式来临

小红书开源FireRed-Image-Edit 1.1：引入智能体工作流，支持 10+ 元素融合与专业级人像精修

谷歌 Gemini 3.1 Flash-Lite 发布：首字速度快 2.5 倍，每百万输入仅$0.25，重新定义高性价比 AI

OpenAI 推出 GPT-5.3 Instant：告别“说教式”拒答，幻觉率最高直降 27%，重塑日常对话体验

OmniLottie：全球首个端到端多模态矢量动画生成器，文字/图片/视频一键转可编辑 Lottie

Helios：北大与字节联手打造 14B 实时长视频模型，单卡 19.5 FPS 刷新生成速度纪录

新Flova

S.H.I.T

Meshy

Tripo

BuildCores

CutCut

模型

网址

新Flova

S.H.I.T

Meshy

Tripo

BuildCores

CutCut