SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    新技术

    共 939 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    Qwen3 MoE Fused:显著提升 Qwen3 推理速度的融合专家计算方案

    Qwen3 MoE Fused:显著提升 Qwen3 推理速度的融合专家计算方案

    Qwen3 MoE Fused 是一个面向 Qwen3 MoE 模型 的高性能推理优化项目,由开发者 woct0rdho 发起并实现。该项目通过重构 MoE(Mixture of Experts)中专...
    新技术# Qwen3 MoE Fused
    5个月前
    03190
    Dynamics Lab 发布全球首个 AI 原生 UGC 游戏引擎 Mirage

    Dynamics Lab 发布全球首个 AI 原生 UGC 游戏引擎 Mirage

    游戏的未来不再依赖专业设计师逐帧构建,而是由每一位玩家通过想象、生成与体验来共同塑造。 今天,Dynamics Lab 正式推出 Mirage —— 全球首个AI原生、实时生成的用户生成内容(UGC...
    新技术# Dynamics Lab# Mirage
    5个月前
    03570
    字节跳动Pico团队推出新型框架EX-4D:从单目视频生成高质量的极端视角 4D 视频

    字节跳动Pico团队推出新型框架EX-4D:从单目视频生成高质量的极端视角 4D 视频

    字节跳动Pico团队推出新型框架EX-4D,旨在从单目视频生成高质量的极端视角 4D 视频。该框架通过深度防水网格(Depth Watertight Mesh, DW-Mesh)表示法,有效处理边界遮...
    新技术# EX-4D# 字节跳动
    5个月前
    02000
    字节跳动推出 X-UniMotion:首个能精准复刻手部动作的视频生成模型

    字节跳动推出 X-UniMotion:首个能精准复刻手部动作的视频生成模型

    字节跳动研究团队发布了一项令人瞩目的视频生成新成果 —— X-UniMotion。该模型能够基于参考人物和驱动动作视频,实现对全身动作(尤其是复杂手部动作)的高精度复现,几乎看不出瑕疵,尤其在手部细节...
    新技术# X-UniMotion# 字节跳动
    5个月前
    03680
    突破负引导瓶颈:萨里大学提出新型扩散模型控制机制 NAG

    突破负引导瓶颈:萨里大学提出新型扩散模型控制机制 NAG

    萨里大学与 NetMind.AI 的研究人员联合提出了一种名为 Normalized Attention Guidance(NAG) 的新技术,解决扩散模型中“负引导”(negative guidan...
    新技术# NAG
    5个月前
    01710
    英伟达推出视频重光照技术UniRelight:通过对单张图像或视频进行光照条件的修改,实现场景在不同光照下的视觉效果呈现

    英伟达推出视频重光照技术UniRelight:通过对单张图像或视频进行光照条件的修改,实现场景在不同光照下的视觉效果呈现

    英伟达、多伦多大学和Vector 研究所的研究人员发布视频重光照(relighting)技术UniRelight,通过对单张图像或视频进行光照条件的修改,实现场景在不同光照下的视觉效果呈现。 项目主页...
    新技术# UniRelight# 视频重光照技术
    5个月前
    02630
    新型训练自由高分辨率图像生成方法HiWave:利用预训练的扩散模型生成高质量的高分辨率图像

    新型训练自由高分辨率图像生成方法HiWave:利用预训练的扩散模型生成高质量的高分辨率图像

    苏黎世联邦理工学院和迪斯尼研究院的研究人员推出新型训练自由(training-free)高分辨率图像生成方法HiWave,利用预训练的扩散模型生成高质量的高分辨率图像。 论文地址:https://ar...
    新技术# HiWave# 高分辨率
    6个月前
    01720
    用于生成 4D 场景(即包含时间和空间维度的视频)框架4Real-Video-V2 :从文本提示中创建 4D 场景

    用于生成 4D 场景(即包含时间和空间维度的视频)框架4Real-Video-V2 :从文本提示中创建 4D 场景

    Snap和阿卜杜拉国王科技大学的研究人员推出 4Real-Video-V2 框架,用于生成 4D 场景(即包含时间和空间维度的视频)。该框架能够从文本提示中创建 4D 场景,通过结合扩散模型直接生成同...
    新技术# 4Real-Video-V2
    6个月前
    02040
    SimpleGVR:轻量高效视频超分辨率模型,让低清视频也能高清呈现

    SimpleGVR:轻量高效视频超分辨率模型,让低清视频也能高清呈现

    由澳门大学智慧城市物联网国家重点实验室、中国科学院深圳先进技术研究院、清华大学、快手科技和深圳理工大学联合研究团队提出了一种新型视频超分辨率(Video Super-Resolution, VSR)模...
    新技术# SimpleGVR# 视频超分辨率模型
    6个月前
    03590
    DreamActor-H1:字节跳动推出高保真人类-产品演示视频生成框架

    DreamActor-H1:字节跳动推出高保真人类-产品演示视频生成框架

    在电商广告、虚拟试穿、交互式媒体等场景中,如何高效生成高质量的人类-产品演示视频,一直是视觉生成领域的重要挑战。 近日,字节跳动 AI 实验室提出了一种全新的视频生成框架——DreamActor-H1...
    新技术# DreamActor-H1# 字节跳动
    6个月前
    02600
    腾讯混元推出新型框架 Hunyuan-GameCraft:为游戏环境生成高动态、交互式的视频内容

    腾讯混元推出新型框架 Hunyuan-GameCraft:为游戏环境生成高动态、交互式的视频内容

    腾讯混元项目组和华中科技大学的研究人员推出新型框架 Hunyuan-GameCraft,为游戏环境生成高动态、交互式的视频内容。Hunyuan-GameCraft 能够从单张图像和对应的提示出发,生成...
    新技术# Hunyuan-GameCraft# 腾讯混元
    6个月前
    02950
    InterActHuman:港中大 & 字节跳动联合推出多概念人类动画生成框架

    InterActHuman:港中大 & 字节跳动联合推出多概念人类动画生成框架

    来自香港中文大学和字节跳动的研究团队联合提出了一种新型视频生成框架 —— InterActHuman,用于生成包含多人物、人-物交互场景的高质量人类中心视频。 项目主页:https://zhenzhi...
    新技术# InterActHuman# 多概念人类动画生成
    6个月前
    01940
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Grok

    Grok

    Grok是一款先进的对话式人工智能。Grok 旨在提供高效、准确且自然的对话交互体验,适用于多种应用场景,包括客户服务、虚拟助手、教育辅导等。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Next AI Draw.io

    Next AI Draw.io

    Next AI Draw.io 是一个基于 Next.js 的 Web 应用,将大语言模型(LLM)与 draw.io 的强大图表能力深度集成。用户可通过自然语言指令创建、修改和增强专业图表,无需手动拖拽。
    The Ultra-Scale Playbook

    The Ultra-Scale Playbook

    Hugging Face旗下的Nanotron团队近期推出了一本免费、开源的综合性书籍——《Ultrascale-Playbook》。这本书旨在为读者提供关于如何在大规模GPU集群上高效训练大语言模型的全面指导,涵盖了分布式/并行化技术以及低级优化技巧。
    Open ASR 排行榜

    Open ASR 排行榜

    Open ASR 排行榜 对 Hugging Face Hub 上的语音识别模型进行排名和评估。我们报告平均 WER(字错误率)(⬇️ 越低越好)和 RTFx(实时因子)(⬆️ 越高越好),模型根据其平均 WER 从低到高进行排名。
    查看完整榜单