SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    模型

    共 1020 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型
    排序
    发布更新浏览点赞
    Sakana AI 推出 AB-MCTS:让多个前沿模型协作解决复杂推理问题

    Sakana AI 推出 AB-MCTS:让多个前沿模型协作解决复杂推理问题

    Sakana AI 发布了一项令人瞩目的研究成果:他们开发出一种名为 AB-MCTS(自适应分支蒙特卡洛树搜索) 的新算法。该算法在 ARC-AGI-2 基准测试中表现出色,显著优于单独使用 o4-m...
    大语言模型# AB-MCTS# Sakana AI
    6个月前
    02680
    Kyutai Labs推出新一代流式TTS模型Kyutai TTS:实时语音生成迈入新阶段

    Kyutai Labs推出新一代流式TTS模型Kyutai TTS:实时语音生成迈入新阶段

    近日,Kyutai Labs 正式开源了一款名为 Kyutai TTS 的文本转语音(TTS)模型,参数规模达到16亿,支持实时、流式处理,成为该领域的技术新标杆。这一模型不仅具备出色的语音生成能力...
    语音模型# Kyutai Labs# Kyutai TTS# TTS模型
    6个月前
    02360
    Kurma AI专为水产养殖领域打造的通用语言模型AQUA-7B和AQUA-1B:以生成式 AI 重塑美国水产养殖业

    Kurma AI专为水产养殖领域打造的通用语言模型AQUA-7B和AQUA-1B:以生成式 AI 重塑美国水产养殖业

    美国拥有广阔的海岸线、纯净的水域资源以及领先的技术基础,具备发展高产、可持续水产养殖业的天然优势。然而,这一潜力远未被充分挖掘。 据2021年数据显示,美国人均海产品消费量已达约 20.5磅,其中 8...
    大语言模型# AQUA-1B# AQUA-7B# Kurma AI
    6个月前
    02820
    阿里Ovis团队发布统一多模态模型Ovis-U1:理解、生成与编辑三位一体

    阿里Ovis团队发布统一多模态模型Ovis-U1:理解、生成与编辑三位一体

    近日,阿里巴巴通义实验室Ovis团队正式发布了新一代统一多模态大模型——Ovis-U1。该模型以30亿参数为基础,实现了对多模态任务的全面覆盖,涵盖图像理解、文本到图像生成以及图像编辑三大核心能力。 ...
    图像模型# Ovis-U1# 统一多模态模型
    6个月前
    02240
    德国科技咨询公司TNG发布全新 DeepSeek R1-0528 变体DeepSeek-TNG R1T2 Chimera,速度提升 200%

    德国科技咨询公司TNG发布全新 DeepSeek R1-0528 变体DeepSeek-TNG R1T2 Chimera,速度提升 200%

    距离中国 AI 初创公司 DeepSeek 发布其热门开源模型 DeepSeek-R1-0528 不到两个月,该模型因其低成本训练和高性能推理能力迅速风靡全球 AI 社区。 如今,这款强大模型已被广泛...
    大语言模型# DeepSeek-R1-0528# DeepSeek-TNG R1T2 Chimera# TNG
    6个月前
    02120
    苹果 & 香港研究人员推出 DiffuCoder:首个面向代码生成的扩散大语言模型

    苹果 & 香港研究人员推出 DiffuCoder:首个面向代码生成的扩散大语言模型

    近日,苹果与香港的研究团队联合提出了一种全新的基于扩散机制的大语言模型(Diffusion Large Language Model, dLLM)——DiffuCoder,专为代码生成任务设计。 Gi...
    大语言模型# DiffuCoder# 扩散大语言模型# 苹果
    6个月前
    01860
    阿里通义实验室联合港科大 & 浙大推出 ThinkSound:首个支持视频到音频生成与编辑的统一框架

    阿里通义实验室联合港科大 & 浙大推出 ThinkSound:首个支持视频到音频生成与编辑的统一框架

    阿里巴巴通义实验室联合香港科技大学与浙江大学的研究团队提出了一种全新的多模态视频-音频生成与编辑框架 —— ThinkSound。 项目主页:https://thinksound-project.gi...
    语音模型# ThinkSound# 多模态视频-音频生成
    6个月前
    01860
    智谱AI联合清华推出新一代视觉语言推理模型开源 GLM-4.1V-9B-Thinking

    智谱AI联合清华推出新一代视觉语言推理模型开源 GLM-4.1V-9B-Thinking

    随着智能任务日益复杂,视觉语言大模型(VLM)正从基础的多模态感知迈向更高层次的推理能力提升。为了应对这一趋势,智谱AI 与清华大学联合推出了新一代 VLM 开源模型 —— GLM-4.1V-9B-T...
    多模态模型# GLM-4.1V-9B-Thinking# 智谱AI
    6个月前
    02630
    BRIA AI 推出 Bria 3.2:专为商业设计的下一代文本到图像模型

    BRIA AI 推出 Bria 3.2:专为商业设计的下一代文本到图像模型

    BRIA AI 正式发布其最新文本到图像模型 Bria 3.2。作为一款专为企业和商业应用打造的生成模型,Bria 3.2 凭借仅 40 亿参数 的轻量架构,在美学效果与文本渲染能力方面表现优异,经评...
    图像模型# Bria 3.2# BRIA AI
    6个月前
    01500
    中科大 & 港科大联合推出 LongAnimation :实现长动画自动上色的新框架

    中科大 & 港科大联合推出 LongAnimation :实现长动画自动上色的新框架

    来自中国科学技术大学与香港科技大学的研究团队联合提出了一种名为 LongAnimation 的新型动画着色框架。该框架旨在实现长动画序列的自动化着色,并在整个动画过程中保持长期的颜色一致性。 项目主页...
    视频模型# LongAnimation# 动画自动上色
    6个月前
    01850
    快手 Keye 团队发布 Kwai Keye-VL :专注短视频理解的多模态大模型

    快手 Keye 团队发布 Kwai Keye-VL :专注短视频理解的多模态大模型

    快手 Keye 团队近日推出了一款全新的多模态大型语言模型(MLLM)——Kwai Keye-VL。该模型拥有 80 亿参数,专注于提升对短视频的理解能力,同时保持强大的通用视觉-语言能力。 GitH...
    多模态模型# Kwai Keye-VL# 多模态大模型# 快手
    6个月前
    02050
    百度开源 ERNIE 4.5:覆盖 0.3B 到 424B 参数的大型语言模型系列

    百度开源 ERNIE 4.5:覆盖 0.3B 到 424B 参数的大型语言模型系列

    百度正式开源了其最新的 ERNIE 4.5 系列,这是继 ERNIE 系列之后又一重磅发布的基础语言模型家族。该系列包含 10 款不同规模与架构的模型,从仅 0.3B(十亿)参数的小型密集模型 到高达...
    大语言模型# ERNIE 4.5# 百度
    6个月前
    02350
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    人生 K 线

    人生 K 线

    人生 K 线(Life Destiny K-Line)是一个结合传统八字命理与现代大语言模型(LLM)的轻量级可视化工具。它将一个人从 1 岁到 100 岁的运势走势,以类似股票 K 线图的形式呈现,试图用数据可视化的方式“翻译”命理推演结果。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    PDF Craft

    新PDF Craft

    PDF Craft是一款专注于扫描版书籍 PDF 转换的开源工具。它利用 DeepSeek OCR 模型,在本地完成从图像型 PDF 到结构化电子书(如 Markdown 或 EPUB)的全流程处理,无需联网,不依赖大语言模型(LLM),适合对隐私、精度与效率有要求的用户。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    查看完整榜单