SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    模型

    共 1179 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型世界模型
    排序
    发布更新浏览点赞
    智谱AI正式发布GLM-5:744B参数+28.5T数据,长周期智能体能力登顶开源第一

    智谱AI正式发布GLM-5:744B参数+28.5T数据,长周期智能体能力登顶开源第一

    智谱AI正式推出新一代通用大模型——GLM-5,这款模型在设计之初就明确了核心定位:面向复杂系统工程和长周期智能体任务,致力于打破基础模型“只能聊天、难以落地”的局限,实现从“氛围编程”到“智能体工程...
    大语言模型# GLM-5# 智谱AI
    1个月前
    0360
    SoulX-Singer:42,000 小时训练的零样本歌声合成模型,支持 MIDI 与旋律双模式控制

    SoulX-Singer:42,000 小时训练的零样本歌声合成模型,支持 MIDI 与旋律双模式控制

    Soul AI Lab(中国)联合吉利汽车研究院、天津大学及西北工业大学,共同发布了一款高保真、零样本歌声合成模型——SoulX-Singer。这款模型的核心优势的是,无需对未见歌手进行任何微调,就能...
    语音模型# SoulX-Singer# 歌声合成模型
    1个月前
    0310
    阿里重磅发布Qwen-Image-2.0 :支持 1K token 指令生成专业信息图,生图编辑一体化

    阿里重磅发布Qwen-Image-2.0 :支持 1K token 指令生成专业信息图,生图编辑一体化

    阿里全新推出新一代图像生成基础模型Qwen-Image-2.0,凭借专业文字渲染、细腻真实质感、超强语义遵循、轻量模型架构四大核心特色,实现生图与编辑功能的一体化融合,在文生图和图生图双赛道均展现出优...
    图像模型# Qwen-Image-2.0
    1个月前
    0370
    Cursor 发布 Composer 1.5:强化学习提升 20 倍,支持复杂代码推理

    Cursor 发布 Composer 1.5:强化学习提升 20 倍,支持复杂代码推理

    Cursor 团队近日正式推出其智能编程模型 Composer 1.5,作为对前代 Composer 1 的重大升级。新版本聚焦于复杂、多步骤编程任务的处理能力,在推理深度、上下文管理和响应效率上均实...
    大语言模型# Composer 1.5# Cursor
    1个月前
    0500
    Linacodec:12.5 令牌/秒的高压缩音频分词器,支持 48kHz 高清语音

    Linacodec:12.5 令牌/秒的高压缩音频分词器,支持 48kHz 高清语音

    在 AI 语音模型(TTS/ASR)领域,音频分词器(Audio Tokenizer)的效率直接决定训练速度、推理延迟与生成质量。传统方案如 EnCodec、DAC 虽能压缩音频,但令牌率高、采样率低...
    语音模型# Linacodec# 音频分词器
    1个月前
    0160
    Helcyon-Mercury-12B-v3.0:基于 Mistral Nemo 的高情感智能对话模型

    Helcyon-Mercury-12B-v3.0:基于 Mistral Nemo 的高情感智能对话模型

    在本地大模型(Local LLM)生态中,大多数模型追求的是“能回答问题”或“会写代码”。但 Helcyon-Mercury-12B-v3.0 的目标截然不同——它不满足于做一台“聊天机器”,而是试图...
    大语言模型# Helcyon-Mercury-12B-v3.0
    1个月前
    0250
    Voyage AI 推出Voyage 4 系列模型:共享嵌入空间 + 专家混合架构,重新定义文本嵌入效率

    Voyage AI 推出Voyage 4 系列模型:共享嵌入空间 + 专家混合架构,重新定义文本嵌入效率

    Voyage AI 正式推出 Voyage 4 系列文本嵌入模型,带来两项行业首创技术:统一的共享嵌入空间 与 首个生产级 MoE(专家混合)嵌入模型。这一系列不仅在检索精度上树立新标杆,更通过灵活的...
    大语言模型# Voyage 4# Voyage AI# voyage-4-nano
    1个月前
    0330
    VideoMaMa:基于扩散模型的视频抠图新SOTA,粗糙掩码一键生成高精度Alpha遮罩

    VideoMaMa:基于扩散模型的视频抠图新SOTA,粗糙掩码一键生成高精度Alpha遮罩

    高丽大学、Adobe Research 与 KAIST AI 联合提出 VideoMaMa(Video Mask-to-Matte Model),一种基于 Stable Video Diffusion...
    视频模型# VideoMaMa# 视频抠图
    1个月前
    0200
    速度提升 25%,支持全栈开发!OpenAI发布GPT-5.3-Codex :从代码生成到全场景工程智能体,性能与安全双突破

    速度提升 25%,支持全栈开发!OpenAI发布GPT-5.3-Codex :从代码生成到全场景工程智能体,性能与安全双突破

    OpenAI 正式推出全新旗舰级编程智能体模型 GPT-5.3-Codex,作为迄今为止最强大的编码智能体,该模型融合 GPT-5.2-Codex 的前沿编码能力与 GPT-5.2 的通用推理、专业领...
    大语言模型# GPT-5.3-Codex# OpenAI
    1个月前
    01140
    Claude Opus 4.6正式发布:编程能力跃升,支持百万令牌上下文,办公协同全面升级

    Claude Opus 4.6正式发布:编程能力跃升,支持百万令牌上下文,办公协同全面升级

    Anthropic正式推出全新的Claude Opus 4.6大模型,作为其旗舰级智能模型的重磅升级版本,该模型在编程能力、长上下文处理、多任务推理等核心维度实现全面突破,同时首次在Opus系列中开放...
    大语言模型# Anthropic# Claude Opus 4.6
    1个月前
    0180
    Mistral AI 发布 Voxtral Transcribe 2:开源实时模型 + 高性价比批量转录,全面支持多语言语音应用

    Mistral AI 发布 Voxtral Transcribe 2:开源实时模型 + 高性价比批量转录,全面支持多语言语音应用

    Mistral AI 推出全新 Voxtral Transcribe 2 系列语音转文本(ASR)模型,包含面向批量离线处理的 Voxtral Mini Transcribe V2 和专为低延迟实时场...
    语音模型# Mistral AI# Voxtral Mini Transcribe V2# Voxtral Realtime
    1个月前
    0430
    清华大学与 VAST 联合推出 SkinTokens:用离散令牌统一建模 3D 绑定(Rigging)

    清华大学与 VAST 联合推出 SkinTokens:用离散令牌统一建模 3D 绑定(Rigging)

    在生成式 3D 模型快速发展的背景下,绑定(Rigging)——即为静态 3D 模型添加骨骼与蒙皮权重以支持动画——已成为自动化流程中的关键瓶颈。现有方法通常将蒙皮(Skinning)视为一个高维、不...
    3D模型# SkinTokens# VAST# 清华大学
    1个月前
    0410
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    ArkClaw

    ArkClaw

    字节旗下火山引擎正式上线 ArkClaw, 开箱即用的云上 SaaS 版 OpenClaw。无需任何复杂配置,打开网页即可使用 7×24 小时在线的 AI 助手。
    JVSClaw

    JVSClaw

    里云正式推出基于该框架打造的下一代 AI 助理平台——JVSClaw。目前,该产品已开启内测,主打“开箱即用”与“自进化能力”,让普通用户和开发者都能轻松“快乐养虾”。
    360 安全龙虾

    新360 安全龙虾

    60安全龙虾目前已接入16家国内主流大模型,覆盖文本生成、编程开发、多模态创作等多种能力。同时内置100余个高频技能,可直接用于文档生成、数据分析、PPT制作、会议转写等常见办公场景。
    FLORA

    FLORA

    FLORA 是一款创意图像和视频创作工具,接入了顶级 AI 绘画和视频模型。它通过优雅的交互设计,帮助创意团队构建结构化、可扩展的工作流,提升创作速度和控制力,支持多人实时协作。
    Vidu

    Vidu

    Vidu 是一款由生数科技与清华大学合作开发的 AI 视频生成工具,2024 年推出,专注于从文本和图像生成高清视频。它支持文本转视频、图像转视频和参考转视频模式,适合社交媒体、广告和电影制作。
    查看完整榜单