SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    模型

    共 1051 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型
    排序
    发布更新浏览点赞
    B站推出IndexTTS2:自回归 TTS 模型的持续时间控制与情感表达新突破

    B站推出IndexTTS2:自回归 TTS 模型的持续时间控制与情感表达新突破

    在大规模文本转语音(TTS)模型的发展中,自回归与非自回归系统各有优劣。自回归模型虽然在语音自然度方面表现优异,但其逐标记生成机制难以实现对语音持续时间的精确控制。这一缺陷在视频配音等需要严格音画同步...
    语音模型# B站# IndexTTS2
    4个月前
    04910
    Liquid AI 发布 LFM2:设备端最快的生成式基础模型

    Liquid AI 发布 LFM2:设备端最快的生成式基础模型

    Liquid AI 正式发布新一代设备端基础模型 LFM2(Liquid Foundation Model 2),重新定义了边缘 AI 推理的速度、效率与部署灵活性。 模型:https://huggi...
    大语言模型# LFM2# Liquid AI
    6个月前
    02110
    Mistral AI 推出 Devstral Medium 以及 Devstral Small 的升级版本

    Mistral AI 推出 Devstral Medium 以及 Devstral Small 的升级版本

    Mistral AI 推出了 Devstral Medium 以及 Devstral Small 的升级版本。这些模型由 Mistral AI 与 All Hands AI 合作开发,重点在于对不同提...
    大语言模型# Devstral Medium# Devstral Small# Mistral AI
    6个月前
    01830
    月之暗面开源智能代理基础模型Kimi K2,参数达 1T,激活参数 32B

    月之暗面开源智能代理基础模型Kimi K2,参数达 1T,激活参数 32B

    月之暗面正式发布其新一代 MoE 架构大模型——Kimi K2,并同步开源。该模型具备卓越的代码能力、数学推理能力以及智能代理(Agent)任务处理能力,是目前最适配于构建自主化智能系统的开源基础模型...
    大语言模型# Kimi K2# 推理模型# 智能代理模型
    6个月前
    01280
    Reka AI发布推理模型Reka Flash 3.1 :强化学习驱动的高效推理模型升级

    Reka AI发布推理模型Reka Flash 3.1 :强化学习驱动的高效推理模型升级

    Reka AI 正式发布了其推理模型 Reka Flash 3.1,这是其 21 亿参数模型 Reka Flash 3 的重要升级版本。该模型在代码生成、智能体任务微调等方面表现尤为突出,并作为 Re...
    大语言模型# Reka AI# Reka Flash 3.1# 推理模型
    6个月前
    01440
    Kimina-Prover:首个实现人类级形式推理的大型定理证明模型

    Kimina-Prover:首个实现人类级形式推理的大型定理证明模型

    由 Numina 与 Kimi 团队联合开发的 Kimina-Prover-72B 正式发布。这是目前在 Lean 4 形式化语言中,首个能够以接近人类方式推理并自动构建数学定理证明的大型神经定理证明...
    大语言模型# Kimina-Prover# 大型定理证明模型
    6个月前
    02440
    Sarvam AI 发布 Sarvam-Translate:支持印度22种语言的文档级翻译模型

    Sarvam AI 发布 Sarvam-Translate:支持印度22种语言的文档级翻译模型

    Sarvam AI 推出了其最新翻译模型 Sarvam-Translate,一款专注于支持印度 22 种官方语言的高质量、上下文感知翻译系统。该模型基于 Google 的 Gemma3-4B-IT 进...
    大语言模型# Sarvam AI# Sarvam-Translate# 翻译模型
    6个月前
    01370
    清华大学推出SketchColour:基于扩散变换器的高效 2D 动画自动上色方案

    清华大学推出SketchColour:基于扩散变换器的高效 2D 动画自动上色方案

    清华大学的研究人员提出了一种全新的 2D 动画着色方法——SketchColour。该方法基于扩散变换器(DiT)架构,能够将黑白草图序列自动转换为连贯的彩色动画,显著提升动画制作效率。 项目主页:h...
    视频模型# 2D 动画自动上色# SketchColour
    6个月前
    01470
    微软推出 Phi 模型家族的最新成员 — Phi-4-mini-flash-reasoning

    微软推出 Phi 模型家族的最新成员 — Phi-4-mini-flash-reasoning

    微软今天宣布推出 Phi 模型家族的最新成员 —— Phi-4-mini-flash-reasoning。这款模型专为计算、内存和延迟受限的场景设计,为边缘设备、移动应用等资源受限环境提供高效的推理能...
    大语言模型# Phi-4-mini-flash-reasoning# 微软
    6个月前
    0990
    谷歌推出开源医疗 AI 模型系列MedGemma及轻量级图像编码器 MedSigLIP

    谷歌推出开源医疗 AI 模型系列MedGemma及轻量级图像编码器 MedSigLIP

    谷歌近日宣布推出其最新的开源医疗 AI 模型系列——MedGemma,并同时发布了轻量级图像编码器 MedSigLIP。这是继健康 AI 开发者基础(HAI-DEF)项目之后,谷歌在医疗 AI 领域迈...
    多模态模型# MedGemma# MedSigLIP# 谷歌
    6个月前
    01520
    T5Gemma:谷歌推出全新编码器-解码器 Gemma 模型系列

    T5Gemma:谷歌推出全新编码器-解码器 Gemma 模型系列

    在当前大语言模型(LLM)领域中,解码器独占架构凭借其强大的生成能力成为主流。然而,经典的编码器-解码器架构——如 T5(文本到文本转换变换器)——因其出色的推理效率、灵活的设计以及对输入语义的深度理...
    大语言模型# T5Gemma# 解码器# 谷歌
    6个月前
    03840
     OmniPart:用于生成具有明确部件结构的 3D 对象的框架

     OmniPart:用于生成具有明确部件结构的 3D 对象的框架

    香港大学、哈尔滨大学、VAST和浙江大学的研究人员推出 OmniPart,这是一个用于生成具有明确部件结构的 3D 对象的框架。OmniPart 通过将复杂的 3D 对象分解为可控制的部件,并在保持语...
    3D模型# OmniPart
    6个月前
    04160
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    人生 K 线

    人生 K 线

    人生 K 线(Life Destiny K-Line)是一个结合传统八字命理与现代大语言模型(LLM)的轻量级可视化工具。它将一个人从 1 岁到 100 岁的运势走势,以类似股票 K 线图的形式呈现,试图用数据可视化的方式“翻译”命理推演结果。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    MiroFish

    MiroFish

    MiroFish 是一款基于多智能体技术的新一代 AI 预测引擎。通过提取现实世界的种子信息(如突发新闻、政策草案、金融信号),自动构建出高保真的平行数字世界。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    查看完整榜单