SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    模型

    共 1188 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型世界模型
    排序
    发布更新浏览点赞
    腾讯开源3D世界生成模型HunyuanWorld 1.0:从文本或图像生成可漫游、可交互的三维世界

    腾讯开源3D世界生成模型HunyuanWorld 1.0:从文本或图像生成可漫游、可交互的三维世界

    如何让一段文字或一张图片,自动生成一个可以自由探索、具备空间一致性且支持后续编辑的三维场景?这是计算机视觉与图形学长期追求的目标。 当前主流方法面临两难: 基于视频或多视角图像生成的方法,虽然能产出视...
    3D模型# 3D世界生成模型# HunyuanWorld 1.0# 腾讯
    8个月前
    01560
    阶跃星辰发布 Step 3:开源最强多模态推理模型,推动“模芯”生态共建

    阶跃星辰发布 Step 3:开源最强多模态推理模型,推动“模芯”生态共建

    在2025世界人工智能大会(WAIC)开幕前夕,中国大模型企业阶跃星辰于今日在上海正式发布其新一代基础大模型——Step 3。该模型定位为“推理时代最适合应用的基座模型”,将于7月31日面向全球开源...
    大语言模型# Step 3# 多模态推理模型# 阶跃星辰
    8个月前
    01450
    阿里Qwen团队发布 Qwen3-235B-A22B-Thinking-2507:深度推理能力再升级

    阿里Qwen团队发布 Qwen3-235B-A22B-Thinking-2507:深度推理能力再升级

    在持续三个月的优化后,阿里Qwen团队正式推出 Qwen3-235B-A22B-Thinking-2507 版本。该模型在逻辑推理、数学、科学、编程及学术任务上的表现显著提升,进一步巩固了其在开源思维...
    大语言模型# Qwen3-235B-A22B-Thinking-2507# 推理模型
    8个月前
    03270
    蚂蚁集团发布Ming-lite-omni v1.5:全模态能力的全面升级

    蚂蚁集团发布Ming-lite-omni v1.5:全模态能力的全面升级

    由 蚂蚁集团旗下的 百灵大模型(Ling)团队研发的全模态大模型 Ming-lite-omni v1.5 正式发布。作为对初代模型的全面升级,v1.5 版本在图像、文本、视频、语音等多种模态的理解与生...
    多模态模型# Ming-lite-omni v1.5# 蚂蚁集团
    8个月前
    03230
    Boson AI 发布 Higgs Audio V2:首个开源的多说话者情感语音生成模型

    Boson AI 发布 Higgs Audio V2:首个开源的多说话者情感语音生成模型

    Boson AI 正式推出 Higgs Audio Generation 版本2(Higgs Audio V2),这是Boson AI在音频生成领域的一次重要突破。该模型具备强大的多说话者对话生成能力...
    语音模型# Boson AI# Higgs Audio V2
    8个月前
    02980
    阿里通义千问推出机器翻译模型Qwen-MT:92种语言互译,打造高效智能翻译新体验

    阿里通义千问推出机器翻译模型Qwen-MT:92种语言互译,打造高效智能翻译新体验

    阿里通义千问团队近日通过Qwen API平台正式发布机器翻译模型Qwen-MT的最新升级版本——qwen-mt-turbo。该模型基于强大的Qwen3架构,结合超大规模多语言翻译数据与强化学习技术,在...
    大语言模型# Qwen-MT# 翻译模型
    8个月前
    05490
    东京大学推出基准测试MangaVQA和多模态漫画理解模型MangaLMM

    东京大学推出基准测试MangaVQA和多模态漫画理解模型MangaLMM

    东京大学的研究人员推出一个名为 MangaVQA 的基准测试和一个名为 MangaLMM 的专门模型,用于多模态漫画理解。漫画(Manga)是一种将图像和文本以复杂方式结合的叙事形式,理解漫画需要同时...
    多模态模型# MangaLMM# MangaVQA# 东京大学
    8个月前
    01590
    Ultra3D:一种高效且高保真的稀疏体素3D生成框架

    Ultra3D:一种高效且高保真的稀疏体素3D生成框架

    在生成式 AI 向三维空间延伸的进程中,高质量、高分辨率的3D内容生成已成为核心挑战。尽管基于稀疏体素的方法在几何细节建模方面表现出色,但其普遍采用的双阶段扩散架构常因注意力机制的二次计算复杂度而面临...
    3D模型# 3D生成框架# Ultra3D
    8个月前
    06380
    交互式世界生成模型 Yume:通过输入图像、文本或视频来创建一个动态、逼真且可交互的世界

    交互式世界生成模型 Yume:通过输入图像、文本或视频来创建一个动态、逼真且可交互的世界

    由上海市人工智能实验室、复旦大学与上海创新研究院联合研发的新型生成模型 Yume 正式亮相。该模型旨在突破传统生成式 AI 的静态局限,构建一个可探索、可控制、高保真且动态演化的虚拟世界。 项目主页...
    视频模型# Yume# 交互式世界生成模型
    8个月前
    02290
    字节跳动发布 Seed LiveInterpret 2.0:首个中英同传延迟与准确率接近人类水平的端到端语音翻译系统

    字节跳动发布 Seed LiveInterpret 2.0:首个中英同传延迟与准确率接近人类水平的端到端语音翻译系统

    在跨语言实时沟通的长期挑战中,机器能否真正替代人类同声传译?字节跳动 Seed 团队给出了迄今为止最接近“是”的答案。 今日,字节跳动正式发布 Seed LiveInterpret 2.0 —— 一款...
    语音模型# Seed LiveInterpret 2.0# 同声传译模型# 字节跳动
    8个月前
    03280
    浙大 × 阿里巴巴推出 OmniAvatar:首个支持音频驱动全身动画的可控虚拟人视频生成模型

    浙大 × 阿里巴巴推出 OmniAvatar:首个支持音频驱动全身动画的可控虚拟人视频生成模型

    在数字人、虚拟主播、AI 视频创作等领域,仅靠语音生成逼真且动作自然的虚拟形象视频,一直是生成式 AI 的关键挑战之一。 现有音频驱动视频生成方法大多聚焦于面部动画,尤其是唇部同步,而对身体动作、姿态...
    视频模型# OmniAvatar# 虚拟人
    8个月前
    02460
    谷歌发布 Gemini 2.5 Flash-Lite 稳定版:更快、更轻、更具成本效益

    谷歌发布 Gemini 2.5 Flash-Lite 稳定版:更快、更轻、更具成本效益

    谷歌宣布,Gemini 2.5 Flash-Lite 正式进入稳定版本并全面开放使用。作为 Gemini 2.5 模型系列中速度最快、成本最低的成员,该模型旨在为大规模生产场景提供高性价比的智能推理能...
    大语言模型# Gemini 2.5 Flash-Lite# 谷歌
    8个月前
    01220
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    OpenMAIC

    OpenMAIC

    OpenMAIC是一个开源的 AI 互动课堂平台,能够将任何主题或文档转化为丰富的互动学习体验。基于多智能体协作引擎,它可以自动生成演示幻灯片、测验、交互式模拟实验和项目制学习活动——由 AI 教师和 AI 同学进行语音讲解、白板绘图,并与你展开实时讨论。内置 OpenClaw 集成,你还可以直接在飞书、Slack、Telegram 等聊天应用中生成课堂。
    悟空

    新悟空

    阿里巴巴发布全球首个企业级AI原生工作平台——“悟空”,让每个团队、每家公司,都能拥有一支24h工作的“龙虾军团”。悟空是一款独立应用,即日起开启邀测,也将直接内置到超2000万企业组织的钉钉之中。
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    Meshy

    Meshy

    Meshy 是一款非常适合初学者和专业用户的 3D 模型生成工具。无论是快速建模、3D 打印还是动画设计,它都能轻松应对。如果你对 3D 模型创建感兴趣,不妨试试 Meshy,让生成式 AI 为你的创意插上翅膀!
    Joker of Academics(小丑学术期刊 )

    Joker of Academics(小丑学术期刊 )

    Joker 🤡 of Academics(小丑学术期刊 ) 是一本完全经过同行评审的开放获取期刊,致力于严肃研究非严肃的学术成果。我们发表敢于风趣的严谨研究、不知何故居然行得通的荒诞主义方法论,以及应用于可能并不需要它的领域的批判理论。
    360 安全龙虾

    360 安全龙虾

    60安全龙虾目前已接入16家国内主流大模型,覆盖文本生成、编程开发、多模态创作等多种能力。同时内置100余个高频技能,可直接用于文档生成、数据分析、PPT制作、会议转写等常见办公场景。
    查看完整榜单