SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    模型

    共 1051 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型
    排序
    发布更新浏览点赞
    腾讯混元项目组联合北京大学提出新框架MixGRPO:用混合微分方程提升图像对齐效率

    腾讯混元项目组联合北京大学提出新框架MixGRPO:用混合微分方程提升图像对齐效率

    在图像生成领域,如何让模型输出更符合人类审美与偏好,已成为对齐研究的核心目标。基于流匹配(Flow Matching)的生成模型近年来展现出强大潜力,而 Group Relative Policy O...
    图像模型# MixGRPO
    6个月前
    02790
    字节跳动 Seed 团队推出Seed Diffusion:打破自回归瓶颈,实现 5.4 倍代码生成加速

    字节跳动 Seed 团队推出Seed Diffusion:打破自回归瓶颈,实现 5.4 倍代码生成加速

    字节跳动 Seed 团队近期发布了一款实验性语言模型——Seed Diffusion 预览版,它采用离散状态扩散机制,专注于代码生成任务,在推理速度上实现了显著突破:最高可达 2,146 token...
    大语言模型# Seed Diffusion# 字节跳动
    6个月前
    01420
    Meta发布新型多语言对比语言-图像预训练(CLIP)模型MetaCLIP 2

    Meta发布新型多语言对比语言-图像预训练(CLIP)模型MetaCLIP 2

    MetaCLIP 2 是一种新型的多语言对比语言-图像预训练(CLIP)模型,旨在从全球范围内的网络数据中学习图像和文本的表示。传统的 CLIP 模型主要基于英语数据进行训练,而 MetaCLIP 2...
    大语言模型# Meta# MetaCLIP 2
    6个月前
    01410
    Cohere 推出 Command A Vision:专为企业打造的高效多模态 AI

    Cohere 推出 Command A Vision:专为企业打造的高效多模态 AI

    今天,AI 不再只是“读文字”的工具。越来越多的企业需要系统能“看懂”图像——从产品手册、工程图纸到财务报表、现场照片。 为此,Cohere 正式发布 Command A Vision —— 一款专为...
    多模态模型# Cohere# Command A Vision
    6个月前
    01170
    阿里推出“会思考”的30B模型Qwen3-30B-A3B-Thinking-2507:复杂任务表现大幅提升

    阿里推出“会思考”的30B模型Qwen3-30B-A3B-Thinking-2507:复杂任务表现大幅提升

    阿里通义千问团队再次升级其 30B 级模型线,正式推出 Qwen3-30B-A3B-Thinking-2507。 这并非一次简单迭代,而是针对复杂推理能力的深度优化版本。过去三个月中,项目组重点提升了...
    大语言模型# Qwen3-30B-A3B-Thinking-2507# 推理模型
    6个月前
    03700
    阿里推出 Qwen3-Coder-30B-A3B-Instruct:轻量级代码大模型,支持 256K 上下文

    阿里推出 Qwen3-Coder-30B-A3B-Instruct:轻量级代码大模型,支持 256K 上下文

    继发布超大规模的 Qwen3-Coder-480B-A35B-Instruct 后,阿里通义千问团队近日推出一款更轻量但性能强劲的新版本: Qwen3-Coder-30B-A3B-Instruct 这...
    大语言模型# Qwen3-Coder-30B-A3B-Instruct# 代码大模型
    6个月前
    07360
    黑森林实验室联合 KREA AI 发布 FLUX.1 Krea [dev]: 实现更真实、更自然的图像生成

    黑森林实验室联合 KREA AI 发布 FLUX.1 Krea [dev]: 实现更真实、更自然的图像生成

    黑森林实验室(Black Forest Labs, BFL)与创意 AI 平台 KREA AI 正式宣布推出 FLUX.1 Krea [dev] —— 一个全新的开源文本到图像生成模型,也是 Krea...
    图像模型# FLUX.1 Krea [dev]# 图像生成# 黑森林实验室
    6个月前
    05310
    腾讯混元提出 X-Omni:用强化学习突破离散自回归图像生成瓶颈

    腾讯混元提出 X-Omni:用强化学习突破离散自回归图像生成瓶颈

    在当前多模态生成模型的发展中,研究者始终在探索一个统一的建模范式:能否用类似语言模型“预测下一个词”的方式,来生成图像?这种被称为“下一令牌预测(next-token prediction)”的自回归...
    图像模型# X-Omni# 腾讯混元
    6个月前
    03430
    阿里Qwen团队推出 Qwen3-30B-A3B-Instruct-2507:更强、更准、更懂你

    阿里Qwen团队推出 Qwen3-30B-A3B-Instruct-2507:更强、更准、更懂你

    阿里Qwen团队发布 Qwen3-30B-A3B-Instruct-2507 ——Qwen3 系列中针对非思考模式优化的新一代指令微调模型。 Qwen Chat:https://chat.qwen.a...
    大语言模型# Qwen3-30B-A3B-Instruct-2507# Qwen团队
    6个月前
    08060
    新加坡政府科技局发布LionGuard 2:专为新加坡语言生态设计的内容审核防护模型

    新加坡政府科技局发布LionGuard 2:专为新加坡语言生态设计的内容审核防护模型

    在多语言交织、语码频繁切换的新加坡数字环境中,一句看似无害的“lah”或“leh”,可能暗藏冒犯;一段夹杂中英马来语的对话,对通用内容审核系统而言却是一道难题。 去年,新加坡政府科技局(GovTech...
    大语言模型# LionGuard 2# 内容审核防护模型
    6个月前
    02460
    腾讯ARC实验室发布 ARC-Hunyuan-Video-7B:专为短视频理解而生的多模态模型

    腾讯ARC实验室发布 ARC-Hunyuan-Video-7B:专为短视频理解而生的多模态模型

    在微信视频号、TikTok 等平台上,每天有数亿条用户生成的短视频被上传。这些视频内容多样、节奏快、信息密度高,往往融合了画面、语音、音效、文字甚至情绪表达。如何让AI真正“理解”这些视频,而不仅仅是...
    多模态模型# ARC-Hunyuan-Video-7B# 多模态模型# 腾讯ARC实验室
    6个月前
    04730
    清华团队提出3D场景生成新框架ScenePainter:解决3D生成中的语义漂移难题

    清华团队提出3D场景生成新框架ScenePainter:解决3D生成中的语义漂移难题

    从一张街景照片出发,AI能否自动“走”过整条街道,生成沿途连续、风格统一的3D视图?这不仅是虚拟现实、自动驾驶仿真的基础需求,也是生成式AI在空间理解上的重要挑战。 然而,当前主流方法在生成长序列3D...
    3D模型# 3D生成# ScenePainter
    6个月前
    02670
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    人生 K 线

    人生 K 线

    人生 K 线(Life Destiny K-Line)是一个结合传统八字命理与现代大语言模型(LLM)的轻量级可视化工具。它将一个人从 1 岁到 100 岁的运势走势,以类似股票 K 线图的形式呈现,试图用数据可视化的方式“翻译”命理推演结果。
    Grok

    Grok

    Grok是一款先进的对话式人工智能。Grok 旨在提供高效、准确且自然的对话交互体验,适用于多种应用场景,包括客户服务、虚拟助手、教育辅导等。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Obsidian-Skills

    Obsidian-Skills

    obsidian-skills是一套专为 Obsidian 用户设计的 Claude Skills 插件,允许 Claude Code 直接在你的本地知识库中创建、读取和修改文件——无需离开 Obsidian 生态,也无需额外转换格式。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    StoryTribe

    StoryTribe

    StoryTribe是一款免费的在线故事板制作工具,无需绘画技能,即可轻松创建插图和故事板。与传统的 AI 图像生成工具不同,StoryTribe 采用“以图制图”的方式,避免了文字到图像转换过程中可能出现的沟通误差。
    查看完整榜单