SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    模型

    共 1179 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型世界模型
    排序
    发布更新浏览点赞
    EffectMaker:腾讯混元新作,无需微调即可“克隆”电影级特效,让普通人也能做 VFX 大师

    EffectMaker:腾讯混元新作,无需微调即可“克隆”电影级特效,让普通人也能做 VFX 大师

    “好莱坞大片里那些令人震撼的火焰、冰霜、能量波,曾经需要数百万美元和数年训练才能制作。现在,只需一段参考视频和一张照片,AI 就能为你‘克隆’出同样的奇迹。” 由 腾讯混元 (Tencent HunY...
    视频模型# AI特效# EffectMaker
    1周前
    0130
    腾讯开源 Penguin-VL:抛弃 CLIP,用大语言模型初始化视觉编码器,重塑多模态效率极限

    腾讯开源 Penguin-VL:抛弃 CLIP,用大语言模型初始化视觉编码器,重塑多模态效率极限

    “当所有人都在堆砌数据和参数时,腾讯选择了一条更本质的路:重新设计视觉编码器,让‘看’和‘想’在同一个空间里对话。” 在视觉语言模型(VLM)领域,主流范式长期依赖通过大规模对比学习(如 CLIP、S...
    多模态模型# Penguin-VL# Penguin-VL-2B# Penguin-VL-8B
    1周前
    0260
    浪潮开源源 3.0 Ultra:1515B 参数巨无霸瘦身至 68B 激活,企业级 RAG 与表格理解全面超越 GPT-4o

    浪潮开源源 3.0 Ultra:1515B 参数巨无霸瘦身至 68B 激活,企业级 RAG 与表格理解全面超越 GPT-4o

    “大模型的未来不在于无限堆砌参数,而在于如何让每一分算力都产生价值。” 浪潮旗下 YuanLab.ai 团队正式开源 源 3.0 Ultra (Yuan3.0 Ultra)。这是一款从零开始预训练的超...
    多模态模型# Yuan3.0 Ultra# 浪潮# 源 3.0 Ultra
    1周前
    0720
    微软发布 Phi-4-Reasoning-Vision-15B:150 亿参数的“小而美”多模态推理专家

    微软发布 Phi-4-Reasoning-Vision-15B:150 亿参数的“小而美”多模态推理专家

    在视觉语言模型(VLM)竞相追逐千亿参数、万亿训练词元的今天,微软反其道而行之,发布了 Phi-4-reasoning-vision-15B。 官方介绍:https://www.microsoft.c...
    多模态模型# Phi-4-Reasoning-Vision-15B# 微软
    1周前
    0200
    Ai2 发布 Olmo Hybrid:混合架构的“效率革命”,用一半数据训练出同等能力的 7B 模型

    Ai2 发布 Olmo Hybrid:混合架构的“效率革命”,用一半数据训练出同等能力的 7B 模型

    “如果 Transformer 是记忆大师,线性 RNN 是状态追踪者,那么混合模型就是集两者之大成的‘全能选手’。” 艾伦AI研究所(Ai2)今日正式发布了 Olmo Hybrid,这是一个全新的 ...
    大语言模型# Olmo Hybrid# 艾伦AI研究所
    1周前
    0190
    印度SarvamAI 开源 30B/105B 推理模型,全栈自研挑战全球巨头

    印度SarvamAI 开源 30B/105B 推理模型,全栈自研挑战全球巨头

    印度初创公司 SarvamAI 开源了其旗舰推理模型系列:Sarvam 30B 和 Sarvam 105B。这两个模型不仅是目前印度本土构建的最大规模开源模型,更代表了全球范围内罕见的全栈自研(Ful...
    大语言模型# Sarvam 105B# Sarvam 30B# SarvamAI
    1周前
    0410
    Luma 发布统一推理图像模型UNI-1:终结“理解”与“生成”的割裂,首个统一推理视觉模型登场

    Luma 发布统一推理图像模型UNI-1:终结“理解”与“生成”的割裂,首个统一推理视觉模型登场

    “过去的 AI 是‘先看懂,再画出来’的两个步骤;现在的 UNI-1 是‘边想边画,画即是想’的一个过程。” Luma AI 今日正式推出 UNI-1,这是业界首个将视觉理解与图像生成深度融合的统一推...
    图像模型早报# Luma# UNI-1
    1周前
    0390
    OpenAI 发布 GPT-5.4:原生“计算机使用”能力觉醒,智能体正式接管复杂工作流

    OpenAI 发布 GPT-5.4:原生“计算机使用”能力觉醒,智能体正式接管复杂工作流

    “它不再只是陪你聊天的机器人,而是能真正操作你电脑、编写并调试代码、处理复杂报表的数字员工。” OpenAI 正式推出 GPT-5.4,这是 GPT-5 系列中迄今为止最强大的通用模型。它不仅继承了 ...
    大语言模型早报# GPT-5.4# OpenAI# 智能体
    1周前
    0160
    Lightricks 双重重磅发布:LTX-2.3 模型进化与 LTX Desktop 开源编辑器,本地视频生成时代正式来临

    Lightricks 双重重磅发布:LTX-2.3 模型进化与 LTX Desktop 开源编辑器,本地视频生成时代正式来临

    Lightricks 今日宣布同步推出两项里程碑式产品:LTX-2.3,一个经过实战打磨、架构全面升级的视频生成模型;以及 LTX Desktop,一款直接构建于该引擎之上的生产级本地视频编辑器。 这...
    早报视频模型# Lightricks# LTX Desktop# LTX-2.3
    2周前
    01540
    小红书开源FireRed-Image-Edit 1.1:引入智能体工作流,支持 10+ 元素融合与专业级人像精修

    小红书开源FireRed-Image-Edit 1.1:引入智能体工作流,支持 10+ 元素融合与专业级人像精修

    小红书智能创作基础技术团队正式推出 FireRed-Image-Edit-1.1。作为前代通用图像编辑模型的升级版,1.1 版本在保留强大编辑能力的基础上,重点攻克了身份一致性、多图像复杂控制及领域专...
    图像模型# FireRed-Image-Edit 1.1# 小红书
    2周前
    0830
    谷歌 Gemini 3.1 Flash-Lite 发布:首字速度快 2.5 倍,每百万输入仅$0.25,重新定义高性价比 AI

    谷歌 Gemini 3.1 Flash-Lite 发布:首字速度快 2.5 倍,每百万输入仅$0.25,重新定义高性价比 AI

    在 AI 模型竞相追求更大参数、更强能力的今天,谷歌反其道而行之,推出了 Gemini 3.1 Flash-Lite。这款专为高容量、低延迟、低成本场景打造的新模型,旨在证明:在速度与效率的赛道上,轻...
    大语言模型早报# Gemini 3.1 Flash-Lite# 谷歌
    2周前
    0300
    OpenAI 推出 GPT-5.3 Instant:告别“说教式”拒答,幻觉率最高直降 27%,重塑日常对话体验

    OpenAI 推出 GPT-5.3 Instant:告别“说教式”拒答,幻觉率最高直降 27%,重塑日常对话体验

    OpenAI 今日正式向 ChatGPT 所有用户及 API 开发者推送 GPT-5.3 Instant 更新。将作为ChatGPT的默认模型,此次升级并未追求参数量或新能力的爆发,而是专注于打磨日常...
    大语言模型早报# GPT-5.3 Instant# OpenAI
    2周前
    0190
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    360 安全龙虾

    新360 安全龙虾

    60安全龙虾目前已接入16家国内主流大模型,覆盖文本生成、编程开发、多模态创作等多种能力。同时内置100余个高频技能,可直接用于文档生成、数据分析、PPT制作、会议转写等常见办公场景。
    ArkClaw

    ArkClaw

    字节旗下火山引擎正式上线 ArkClaw, 开箱即用的云上 SaaS 版 OpenClaw。无需任何复杂配置,打开网页即可使用 7×24 小时在线的 AI 助手。
    JVSClaw

    JVSClaw

    里云正式推出基于该框架打造的下一代 AI 助理平台——JVSClaw。目前,该产品已开启内测,主打“开箱即用”与“自进化能力”,让普通用户和开发者都能轻松“快乐养虾”。
    Vidu

    Vidu

    Vidu 是一款由生数科技与清华大学合作开发的 AI 视频生成工具,2024 年推出,专注于从文本和图像生成高清视频。它支持文本转视频、图像转视频和参考转视频模式,适合社交媒体、广告和电影制作。
    Clarifai

    Clarifai

    Clarifai宣布推出其全新自研的 推理引擎(Inference Engine),专为应对当前高负载、多步骤的 AI 推理任务而设计。该公司声称,该引擎可在相同硬件条件下,实现 推理速度提升一倍,同时将单位计算成本 降低 40%。
    查看完整榜单