SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    模型

    共 1181 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型世界模型
    排序
    发布更新浏览点赞
    FlashLabs推出Chroma 1.0:首个开源实时语音对话模型,支持低延迟个性化语音克隆

    FlashLabs推出Chroma 1.0:首个开源实时语音对话模型,支持低延迟个性化语音克隆

    在虚拟人交互与语音合成领域,兼顾低延迟、高保真语音克隆、多轮对话理解的模型一直是技术难点。由FlashLabs开发的 Chroma 1.0 正是一款突破性的多模态因果语言模型,它不仅能直接处理音频输入...
    语音模型# Chroma# FlashLabs# 实时语音对话模型
    2个月前
    04620
    智谱发布 GLM-4.7-Flash:30B 级 MoE 模型,本地部署首选编码与代理助手

    智谱发布 GLM-4.7-Flash:30B 级 MoE 模型,本地部署首选编码与代理助手

    智谱 AI 正式推出 GLM-4.7-Flash——一款基于 30B 总参数、激活 3B(A3B)的稀疏混合专家(MoE)架构 的大语言模型。它在高性能与高效率之间取得出色平衡,成为本地部署场景下理想...
    大语言模型# GLM-4.7-Flash# 智谱
    2个月前
    0450
    Liquid AI发布LFM2.5系列模型:新一代设备端AI,开放权重+多模态+边缘高效部署

    Liquid AI发布LFM2.5系列模型:新一代设备端AI,开放权重+多模态+边缘高效部署

    Liquid AI 正式推出 LFM2.5 系列模型,这是该团队针对边缘 AI 部署打造的新一代旗舰产品,基于 LFM2 设备优化架构升级而来,实现了 1B 级模型能力边界的重大突破。此次发布覆盖基础...
    大语言模型# LFM2.5# Liquid AI
    2个月前
    0280
    Liquid AI 发布 LFM2.5-1.2B-Thinking:900MB 内存即可运行的设备端推理模型

    Liquid AI 发布 LFM2.5-1.2B-Thinking:900MB 内存即可运行的设备端推理模型

    两年前,复杂的推理任务还需要依赖数据中心。如今,Liquid AI 发布的 LFM2.5-1.2B-Thinking 模型,让这一切在任何拥有 900MB 可用内存的手机上成为可能。 地址:https...
    大语言模型# LFM2.5-1.2B-Thinking# Liquid AI
    2个月前
    0370
    HeartMuLa:开源音乐基础模型家族,支持歌词识别、高保真生成与细粒度控制

    HeartMuLa:开源音乐基础模型家族,支持歌词识别、高保真生成与细粒度控制

    如果你曾幻想过——只需输入一段歌词和一句描述(如“一首欢快的流行歌,吉他伴奏,副歌要有电子音效”),AI 就能生成一首结构完整、音质高保真的歌曲——那么 HeartMuLa 项目正将这一愿景变为现实...
    语音模型# HeartMuLa# 音乐模型
    2个月前
    02020
    FrankenMotion:首个支持身体部位级精细控制的文本驱动人体动作生成框架

    FrankenMotion:首个支持身体部位级精细控制的文本驱动人体动作生成框架

    在虚拟角色、游戏动画或人机交互中,如何让 AI 根据自然语言描述生成逼真且可控的人体动作,一直是计算机图形学与 AI 领域的挑战。现有方法大多只能生成整体动作(如“走路”“跳舞”),难以对手臂、腿部...
    3D模型# FrankenMotion# 人体动作
    2个月前
    0760
    谷歌开源新翻译模型TranslateGemma:4B 到 27B 全覆盖,支持 55 种语言

    谷歌开源新翻译模型TranslateGemma:4B 到 27B 全覆盖,支持 55 种语言

    谷歌发布 TranslateGemma —— 一套基于 Gemma 3 构建的全新开源翻译模型家族,包含 4B、12B 和 27B 三种参数规模,支持 55 种语言 的高质量互译。更重要的是,它在效率...
    大语言模型# TranslateGemma# 翻译模型# 谷歌
    2个月前
    0950
    黑森林实验室发布 FLUX.2 [klein]:统一生成与编辑的最快开源模型

    黑森林实验室发布 FLUX.2 [klein]:统一生成与编辑的最快开源模型

    黑森林实验室(Black Forest Labs)今日正式推出 FLUX.2 [klein] 模型系列——这是目前速度最快、体积最小的高质量图像生成模型家族。它将文生图、图像编辑与多参考图生成统一于单...
    图像模型# FLUX.2 [klein]# 黑森林实验室
    2个月前
    01980
    智谱AI开源GLM-TTS:LLM驱动的高质量TTS系统,支持零样本克隆与情感增强

    智谱AI开源GLM-TTS:LLM驱动的高质量TTS系统,支持零样本克隆与情感增强

    智谱AI推出的GLM-TTS是一款基于大语言模型的文本到语音合成系统,创新性采用LLM+Flow模型的两阶段架构,不仅实现了零样本语音克隆、流式推理等实用功能,还通过多奖励强化学习框架,大幅提升了语音...
    语音模型# GLM-TTS# 智谱AI
    2个月前
    0510
    智谱AI开源GLM-Image:自回归+扩散混合架构,攻克知识密集型图像生成难题

    智谱AI开源GLM-Image:自回归+扩散混合架构,攻克知识密集型图像生成难题

    智谱AI正式推出GLM-Image——业界首个开源的工业级离散自回归图像生成模型。这款模型创新性地采用自回归模块+扩散解码器的混合架构,既继承了自回归模型对复杂语义的精准理解能力,又兼具扩散模型高保真...
    图像模型# GLM-Image# 智谱AI
    2个月前
    01860
    腾讯优图实验室推出 Youtu-LLM:持 128K 上下文、本地运行,专为端侧 AI 设计

    腾讯优图实验室推出 Youtu-LLM:持 128K 上下文、本地运行,专为端侧 AI 设计

    在大模型普遍走向百亿、千亿参数的今天,腾讯优图实验室推出了一款仅 1.96B 参数的轻量级语言模型——Youtu-LLM。它不追求规模堆砌,而是以 STEM 能力与原生智能体(Agentic)能力为核...
    多模态模型# Youtu-LLM# 腾讯优图实验室
    2个月前
    0410
    ElevenLabs 推出 Scribe v2:支持 90+ 语言的高精度批量转录模型

    ElevenLabs 推出 Scribe v2:支持 90+ 语言的高精度批量转录模型

    ElevenLabs 正式发布 Scribe v2——一款专为大规模音视频内容处理设计的新一代语音转文字模型。与主打低延迟的 Scribe v2 Realtime 不同,Scribe v2 面向批量转...
    语音模型# ElevenLabs# Scribe v2
    2个月前
    01850
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    悟空

    新悟空

    阿里巴巴发布全球首个企业级AI原生工作平台——“悟空”,让每个团队、每家公司,都能拥有一支24h工作的“龙虾军团”。悟空是一款独立应用,即日起开启邀测,也将直接内置到超2000万企业组织的钉钉之中。
    ArkClaw

    ArkClaw

    字节旗下火山引擎正式上线 ArkClaw, 开箱即用的云上 SaaS 版 OpenClaw。无需任何复杂配置,打开网页即可使用 7×24 小时在线的 AI 助手。
    Joker of Academics(小丑学术期刊 )

    Joker of Academics(小丑学术期刊 )

    Joker 🤡 of Academics(小丑学术期刊 ) 是一本完全经过同行评审的开放获取期刊,致力于严肃研究非严肃的学术成果。我们发表敢于风趣的严谨研究、不知何故居然行得通的荒诞主义方法论,以及应用于可能并不需要它的领域的批判理论。
    QClaw

    QClaw

    腾讯推出QClaw ,这是基于 OpenClaw 进行深度产品化封装的“官方一键安装包”。它的目标非常明确:让强大的 AI Agent 能力,像安装普通软件一样简单,并直接融入中国人的国民级应用——微信和 QQ。
    360 安全龙虾

    新360 安全龙虾

    60安全龙虾目前已接入16家国内主流大模型,覆盖文本生成、编程开发、多模态创作等多种能力。同时内置100余个高频技能,可直接用于文档生成、数据分析、PPT制作、会议转写等常见办公场景。
    查看完整榜单