SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    模型

    共 1007 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型
    排序
    发布更新浏览点赞
    线性注意力 + 恒定内存 KV 缓存!SANA-Video:高效生成分钟级高清视频的新一代文生视频模型

    线性注意力 + 恒定内存 KV 缓存!SANA-Video:高效生成分钟级高清视频的新一代文生视频模型

    在文本到视频(T2V)生成领域,高分辨率、长时长与低延迟三者往往难以兼得。现有大模型虽能生成高质量视频,但动辄数千秒的推理时间与高昂的训练成本严重限制了其落地应用。 为此,由英伟达、香港大学、麻省理工...
    视频模型# SANA-Video# 文生视频模型
    3个月前
    05590
    Wan-Alpha:支持透明通道的高质量文生视频模型

    Wan-Alpha:支持透明通道的高质量文生视频模型

    在视频编辑、虚拟合成、游戏特效和社交媒体创作中,带有透明背景(Alpha 通道)的视频素材具有不可替代的价值——它们可以无缝叠加到任意场景中,无需后期抠像或遮罩处理。 然而,当前主流的文生视频(Tex...
    视频模型# Wan-Alpha# 文生视频模型
    3个月前
    01470
    英伟达提出 DC-Gen:用于加速扩散模型的后训练框架,生成速度快 53 倍

    英伟达提出 DC-Gen:用于加速扩散模型的后训练框架,生成速度快 53 倍

    在文生图领域,高分辨率输出(如 4K)正成为标配。然而,随之而来的计算成本和推理延迟问题日益凸显——以当前领先的 FLUX.1-Krea-12B 模型为例,在英伟达H100 GPU 上生成一张 4K ...
    图像模型# DC-Gen# 文生图模型# 英伟达
    3个月前
    01850
    智谱发布 GLM-4.6:200K 上下文、30% 更省,专为编程优化

    智谱发布 GLM-4.6:200K 上下文、30% 更省,专为编程优化

    今日,智谱 AI 正式推出其最新旗舰文本模型 GLM-4.6,作为 GLM 系列的最新迭代版本,该模型在推理、编码与智能体能力上实现全面升级,定位为当前国内最强的代码专用大模型。 项目主页:https...
    大语言模型# GLM-4.6# 智谱
    3个月前
    0710
    腾讯混元推出 混元3D-Part:让3D模型像乐高一样“可拆解”

    腾讯混元推出 混元3D-Part:让3D模型像乐高一样“可拆解”

    在AIGC推动内容创作变革的当下,3D生成正成为下一个关键战场。然而,一个长期被忽视的问题是:大多数AI生成的3D模型都是“一体成型”的黑盒结果——无法拆分、难以编辑、不便生产。 腾讯混元推出 Hun...
    3D模型# Hunyuan3D-Part# 混元3D-Part
    3个月前
    0870
    蚂蚁集团发布全球首个开源万亿参数推理大模型 Ring-1T-preview

    蚂蚁集团发布全球首个开源万亿参数推理大模型 Ring-1T-preview

    在大模型迈向“深度思考”的关键阶段,蚂蚁集团迈出重要一步:其自研的万亿参数自然语言推理大模型 Ring-1T-preview 正式上线 Hugging Face,成为全球首个开源的万亿参数级推理专用大...
    大语言模型# Ring-1T-preview# 推理大模型# 蚂蚁集团
    3个月前
    01130
    Anthropic 发布 Claude Sonnet 4.5:编程能力业界领先,可自主开发生产级应用,定价不变

    Anthropic 发布 Claude Sonnet 4.5:编程能力业界领先,可自主开发生产级应用,定价不变

    周一,Anthropic 正式发布其最新前沿模型 Claude Sonnet 4.5,宣称在编程任务中实现“生产级”输出能力,标志着其在软件工程场景下的可靠性迈上新台阶。 该模型即日起通过 Claud...
    大语言模型# Anthropic# Claude Sonnet 4.5# 编程模型
    3个月前
    0980
    DeepSeek 发布DeepSeek-V3.2-Exp:首次引入细粒度稀疏注意力,API 成本直降 50%+

    DeepSeek 发布DeepSeek-V3.2-Exp:首次引入细粒度稀疏注意力,API 成本直降 50%+

    在国庆节假期前夕,DeepSeek 正式推出 DeepSeek-V3.2-Exp ——一个面向未来架构演进的实验性(Experimental)版本。该模型并非最终发布版,而是通向新一代高效架构的关键中...
    大语言模型# DeepSeek# DeepSeek-V3.2-Exp
    3个月前
    01390
    腾讯混元发布 HunyuanImage-3.0:800亿参数开源原生多模态模型,实现“语义理解-图像生成”的深度融合

    腾讯混元发布 HunyuanImage-3.0:800亿参数开源原生多模态模型,实现“语义理解-图像生成”的深度融合

    腾讯混元项目组正式发布并开源HunyuanImage-3.0——当前开源社区规模最大、性能最强的文生图模型。该模型总参数量突破800亿,推理时每token仅激活130亿参数(兼顾性能与效率),基于原生...
    图像模型# HunyuanImage-3.0# 腾讯混元
    3个月前
    05450
    腾讯混元推出 Hunyuan3D-Omni:统一框架实现多模态可控 3D 生成

    腾讯混元推出 Hunyuan3D-Omni:统一框架实现多模态可控 3D 生成

    腾讯混元项目组近日发布 Hunyuan3D-Omni ——一个面向 3D 资产生成的统一框架,解决传统单图生成 3D 模型时存在的几何失真、姿态不可控等问题。 地址:https://3d.hunyua...
    3D模型# Hunyuan3D-Omni# 腾讯混元
    3个月前
    01310
    Stability AI 推出 SD3.5-Flash:让高质量图像生成在消费级设备上实现秒级输出

    Stability AI 推出 SD3.5-Flash:让高质量图像生成在消费级设备上实现秒级输出

    Stability AI 近日发布 SD3.5-Flash ——一个全新的少步蒸馏(few-step distillation)图像生成模型,解决当前生成式 AI 模型在普通硬件上运行困难的核心痛点...
    图像模型# SD3.5-Flash# Stability AI
    3个月前
    02240
    谷歌发布推出改进的 Gemini 2.5 Flash 和 Flash-Lite 版本:响应更快、成本更低、智能更强

    谷歌发布推出改进的 Gemini 2.5 Flash 和 Flash-Lite 版本:响应更快、成本更低、智能更强

    谷歌今日推出 Gemini 2.5 Flash 和 Gemini 2.5 Flash-Lite 的预览更新版本,已在 Google AI Studio 与 Vertex AI 平台上线。此次升级聚焦于...
    大语言模型# Gemini 2.5 Flash# Gemini 2.5 Flash-Lite# 谷歌
    3个月前
    01310
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Apple Wallpapers

    Apple Wallpapers

    AppleWalls 提供 iPhone、iPad 与 Mac 系统原生高清壁纸下载,收录 iOS 与 macOS 各版本官方壁纸。探索苹果设计美学,体验纯粹的 Apple 风格。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    OiiOii AI

    OiiOii AI

    OiiOii.ai 是一个基于多智能体架构的动画生成平台,其核心目标是将动画制作从线性协作流程,转变为端到端的自动化生成。用户只需上传一张图片或输入一段文字描述,系统即可自动完成剧本生成、分镜设计、角色建模、镜头调度、配乐合成与最终渲染,输出一段完整动画视频。
    Grok

    Grok

    Grok是一款先进的对话式人工智能。Grok 旨在提供高效、准确且自然的对话交互体验,适用于多种应用场景,包括客户服务、虚拟助手、教育辅导等。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    查看完整榜单