SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    模型

    共 995 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    大语言模型多模态模型图像模型语音模型3D模型Flux衍生视频模型
    排序
    发布更新浏览点赞
    线性注意力 + 恒定内存 KV 缓存!SANA-Video:高效生成分钟级高清视频的新一代文生视频模型

    线性注意力 + 恒定内存 KV 缓存!SANA-Video:高效生成分钟级高清视频的新一代文生视频模型

    在文本到视频(T2V)生成领域,高分辨率、长时长与低延迟三者往往难以兼得。现有大模型虽能生成高质量视频,但动辄数千秒的推理时间与高昂的训练成本严重限制了其落地应用。 为此,由英伟达、香港大学、麻省理工...
    视频模型# SANA-Video# 文生视频模型
    2个月前
    05440
    Wan-Alpha:支持透明通道的高质量文生视频模型

    Wan-Alpha:支持透明通道的高质量文生视频模型

    在视频编辑、虚拟合成、游戏特效和社交媒体创作中,带有透明背景(Alpha 通道)的视频素材具有不可替代的价值——它们可以无缝叠加到任意场景中,无需后期抠像或遮罩处理。 然而,当前主流的文生视频(Tex...
    视频模型# Wan-Alpha# 文生视频模型
    2个月前
    01400
    英伟达提出 DC-Gen:用于加速扩散模型的后训练框架,生成速度快 53 倍

    英伟达提出 DC-Gen:用于加速扩散模型的后训练框架,生成速度快 53 倍

    在文生图领域,高分辨率输出(如 4K)正成为标配。然而,随之而来的计算成本和推理延迟问题日益凸显——以当前领先的 FLUX.1-Krea-12B 模型为例,在英伟达H100 GPU 上生成一张 4K ...
    图像模型# DC-Gen# 文生图模型# 英伟达
    2个月前
    01850
    智谱发布 GLM-4.6:200K 上下文、30% 更省,专为编程优化

    智谱发布 GLM-4.6:200K 上下文、30% 更省,专为编程优化

    今日,智谱 AI 正式推出其最新旗舰文本模型 GLM-4.6,作为 GLM 系列的最新迭代版本,该模型在推理、编码与智能体能力上实现全面升级,定位为当前国内最强的代码专用大模型。 项目主页:https...
    大语言模型# GLM-4.6# 智谱
    2个月前
    0710
    腾讯混元推出 混元3D-Part:让3D模型像乐高一样“可拆解”

    腾讯混元推出 混元3D-Part:让3D模型像乐高一样“可拆解”

    在AIGC推动内容创作变革的当下,3D生成正成为下一个关键战场。然而,一个长期被忽视的问题是:大多数AI生成的3D模型都是“一体成型”的黑盒结果——无法拆分、难以编辑、不便生产。 腾讯混元推出 Hun...
    3D模型# Hunyuan3D-Part# 混元3D-Part
    2个月前
    0870
    蚂蚁集团发布全球首个开源万亿参数推理大模型 Ring-1T-preview

    蚂蚁集团发布全球首个开源万亿参数推理大模型 Ring-1T-preview

    在大模型迈向“深度思考”的关键阶段,蚂蚁集团迈出重要一步:其自研的万亿参数自然语言推理大模型 Ring-1T-preview 正式上线 Hugging Face,成为全球首个开源的万亿参数级推理专用大...
    大语言模型# Ring-1T-preview# 推理大模型# 蚂蚁集团
    2个月前
    01130
    Anthropic 发布 Claude Sonnet 4.5:编程能力业界领先,可自主开发生产级应用,定价不变

    Anthropic 发布 Claude Sonnet 4.5:编程能力业界领先,可自主开发生产级应用,定价不变

    周一,Anthropic 正式发布其最新前沿模型 Claude Sonnet 4.5,宣称在编程任务中实现“生产级”输出能力,标志着其在软件工程场景下的可靠性迈上新台阶。 该模型即日起通过 Claud...
    大语言模型# Anthropic# Claude Sonnet 4.5# 编程模型
    2个月前
    0980
    DeepSeek 发布DeepSeek-V3.2-Exp:首次引入细粒度稀疏注意力,API 成本直降 50%+

    DeepSeek 发布DeepSeek-V3.2-Exp:首次引入细粒度稀疏注意力,API 成本直降 50%+

    在国庆节假期前夕,DeepSeek 正式推出 DeepSeek-V3.2-Exp ——一个面向未来架构演进的实验性(Experimental)版本。该模型并非最终发布版,而是通向新一代高效架构的关键中...
    大语言模型# DeepSeek# DeepSeek-V3.2-Exp
    2个月前
    01270
    腾讯混元发布 HunyuanImage-3.0:800亿参数开源原生多模态模型,实现“语义理解-图像生成”的深度融合

    腾讯混元发布 HunyuanImage-3.0:800亿参数开源原生多模态模型,实现“语义理解-图像生成”的深度融合

    腾讯混元项目组正式发布并开源HunyuanImage-3.0——当前开源社区规模最大、性能最强的文生图模型。该模型总参数量突破800亿,推理时每token仅激活130亿参数(兼顾性能与效率),基于原生...
    图像模型# HunyuanImage-3.0# 腾讯混元
    2个月前
    05290
    腾讯混元推出 Hunyuan3D-Omni:统一框架实现多模态可控 3D 生成

    腾讯混元推出 Hunyuan3D-Omni:统一框架实现多模态可控 3D 生成

    腾讯混元项目组近日发布 Hunyuan3D-Omni ——一个面向 3D 资产生成的统一框架,解决传统单图生成 3D 模型时存在的几何失真、姿态不可控等问题。 地址:https://3d.hunyua...
    3D模型# Hunyuan3D-Omni# 腾讯混元
    2个月前
    01150
    Stability AI 推出 SD3.5-Flash:让高质量图像生成在消费级设备上实现秒级输出

    Stability AI 推出 SD3.5-Flash:让高质量图像生成在消费级设备上实现秒级输出

    Stability AI 近日发布 SD3.5-Flash ——一个全新的少步蒸馏(few-step distillation)图像生成模型,解决当前生成式 AI 模型在普通硬件上运行困难的核心痛点...
    图像模型# SD3.5-Flash# Stability AI
    2个月前
    02130
    谷歌发布推出改进的 Gemini 2.5 Flash 和 Flash-Lite 版本:响应更快、成本更低、智能更强

    谷歌发布推出改进的 Gemini 2.5 Flash 和 Flash-Lite 版本:响应更快、成本更低、智能更强

    谷歌今日推出 Gemini 2.5 Flash 和 Gemini 2.5 Flash-Lite 的预览更新版本,已在 Google AI Studio 与 Vertex AI 平台上线。此次升级聚焦于...
    大语言模型# Gemini 2.5 Flash# Gemini 2.5 Flash-Lite# 谷歌
    2个月前
    01310
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    OpenStock

    OpenStock

    OpenStock 是昂贵市场平台的开源替代品。追踪实时价格、设置个性化提醒并探索详细的公司洞察——公开构建,为所有人服务,永久免费。
     Hitem3D 

     Hitem3D 

    Hitem3D由Math Magic开发,是一款基于专有高分辨率AI模型Sparc3D的3D生成工具。只需上传一张参考图像,即可即时生成行业领先品质的工作室级3D资产,极大降低了3D创作的门槛。这一突破性解决方案赋能游戏开发者、设计师和3D艺术家高效释放创意,加速从概念到部署的创作流程。
    Phota Labs

    Phota Labs

    PhotaLabs不是通用世界的幻象制造机,而是专属于你的个人视觉模型。它学习你的真实照片和视频,理解你的外貌、关系、环境与审美,然后以此为基础,帮你重新看见、延伸并重温那些只属于你的时刻。
    Next AI Draw.io

    Next AI Draw.io

    Next AI Draw.io 是一个基于 Next.js 的 Web 应用,将大语言模型(LLM)与 draw.io 的强大图表能力深度集成。用户可通过自然语言指令创建、修改和增强专业图表,无需手动拖拽。
    Figma Make

    Figma Make

    Figma Make是一款类似的AI驱动工具,更侧重于创意构思和原型设计。用户可以通过输入提示词创建Web应用原型。这一原型应用支持协作,用户可以通过提示助手更改或添加特定元素。如果团队中有开发者,他们可以直接修改代码以进行必要的调整。
    查看完整榜单