SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    百科

    共 2206 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    去噪方法GeneOH Diffusion:解决手-物体交互(HOI)去噪的问题

    去噪方法GeneOH Diffusion:解决手-物体交互(HOI)去噪的问题

    来自清华大学、上海人工智能实验室、上海启智研究院的研究人员推出GeneOH Diffusion,它旨在解决手-物体交互(HOI)去噪的问题。在手-物体交互中,我们经常需要准确地追踪手部动作,尤其是在游...
    新技术# GeneOH Diffusion
    2年前
    07330
    高质量人类动作视频生成框架MimicMotion:依据任意运动指令生成高质感、任意长度的视频内容

    高质量人类动作视频生成框架MimicMotion:依据任意运动指令生成高质感、任意长度的视频内容

    腾讯和上海交通大学的研究人员推出高质量人类动作视频生成框架MimicMotion,依据任意运动指令生成高质感、任意长度的视频内容。简单来说,MimicMotion是一个可以制作出逼真人类动作视频的智能...
    新技术# MimicMotion# 视频生成
    1年前
    07310
    字节跳动推出新型视频生成技术CamTrol:为现有的视频扩散模型增添摄像机运动操控功能

    字节跳动推出新型视频生成技术CamTrol:为现有的视频扩散模型增添摄像机运动操控功能

    中国科学技术大学和字节跳动的研究人员推出新型视频生成技术CamTrol,这是一种无需训练的、强大的解决方案,可以为现有的视频扩散模型增添摄像机运动操控功能。简单来说,就是可以在不经过额外训练的情况下...
    新技术# CamTrol# 字节跳动# 视频生成
    1年前
    07310
    虚拟服装试穿技术IDM-VTON:根据一个人的图片和一件衣服的图片,生成这个人穿上这件衣服的图像

    虚拟服装试穿技术IDM-VTON:根据一个人的图片和一件衣服的图片,生成这个人穿上这件衣服的图像

    来自韩国科学技术院和OMNIOUS.AI的研究人员推出虚拟服装试穿技术IDM-VTON,该技术能够根据分别描绘人物和服装的图像对,渲染出人物穿着精选服装的视觉效果。虚拟试穿是一种计算机视觉技术,它可以...
    新技术# IDM-VTON# 虚拟服装试穿# 虚拟试穿
    2年前
    07310
    新型实时一步潜在扩散模型SDXS:在图像生成任务中显著提高效率,同时保持图像质量

    新型实时一步潜在扩散模型SDXS:在图像生成任务中显著提高效率,同时保持图像质量

    小米推出新型实时一步潜在扩散模型SDXS,它能够在图像生成任务中显著提高效率,同时保持图像质量。SDXS模型通过模型小型化和减少采样步骤的双重方法,显著降低了模型的延迟,使其能够在低功耗设备上实时生成...
    新技术# SDXS# 一步潜在扩散模型
    11个月前
    07310
    无需训练的概率并行解码算法SJD:用于加速自动回归文本到图像的生成模型

    无需训练的概率并行解码算法SJD:用于加速自动回归文本到图像的生成模型

    香港大学、华为诺亚方舟实验室、香港中文大学、清华大学、上海交通大学和无问芯穹的研究人员推出一种无需训练的概率并行解码算法SJD(猜测性雅可比解码),用于加速自动回归文本到图像的生成模型。自动回归模型在...
    新技术# SJD# 解码算法
    1年前
    07300
    Follow-Your系列新框架Follow-Your-Pose v2:用于于角色图像动画的框架,可以根据一系列的动作信号(比如视频、深度图或姿势序列)生成动画视频

    Follow-Your系列新框架Follow-Your-Pose v2:用于于角色图像动画的框架,可以根据一系列的动作信号(比如视频、深度图或姿势序列)生成动画视频

    来自腾讯混元团队、中山大学、香港科技大学的研究人员推出Follow-Your系列新框架Follow-Your-Pose v2,这是去年发布的Follow-Your-Pose升级版,这是一个用于于角色图...
    新技术# Follow-Your-Pose v2# 动画视频
    2年前
    07300
    全新文生图框架RealCompo:结合SD1.5模型与GLIGEN模型的优势来提高生成图像的质量

    全新文生图框架RealCompo:结合SD1.5模型与GLIGEN模型的优势来提高生成图像的质量

    RealCompo是一个全新的文生图框架,它旨在解决当前文生图模型在处理多对象组合生成时遇到的困难,通过动态平衡真实性和组合性来提高生成图像的质量。 GitHub 论文 RealCompo利用了文本到...
    新技术# GLIGEN模型# RealCompo# 文生图框架
    2年前
    07300
    新型视频生成模型HPDM:通过分层处理和上下文融合技术,生成高分辨率视频

    新型视频生成模型HPDM:通过分层处理和上下文融合技术,生成高分辨率视频

    Snap、阿卜杜拉国王科技大学和特伦托大学的研究人员推出新型视频生成模型Hierarchical Patch Diffusion Models(HPDM,分层补丁扩散模型),这个模型专门设计用于高分辨...
    新技术# HPDM# 分层补丁扩散模型# 视频生成
    1年前
    07290
    CAD-MLLM:实现一个统一的计算机辅助设计(CAD)模型生成系统

    CAD-MLLM:实现一个统一的计算机辅助设计(CAD)模型生成系统

    上海科技大学、忆生科技、深度求索(DeepSeek-AI)和香港大学的研究人员推出一个名为“CAD-MLLM”的系统,它旨在实现一个统一的计算机辅助设计(CAD)模型生成系统。该系统能够根据用户的多种...
    新技术# CAD# CAD-MLLM
    1年前
    07250
    IDEA研究院推出先进开集目标检测模型系列Grounding DINO 1.5:推动开放集对象检测技术的边界

    IDEA研究院推出先进开集目标检测模型系列Grounding DINO 1.5:推动开放集对象检测技术的边界

    IDEA研究院(粤港澳大湾区数字经济研究院)推出先进模型系列Grounding DINO 1.5,旨在推动开放集对象检测技术的边界。开放集对象检测是一种计算机视觉任务,它要求模型能够识别图像中的对象...
    新技术# Grounding DINO 1.5# 开集目标检测模型
    2年前
    07240
    腾讯混元团队推出支持中英双语提示词的文生图模型Hunyuan-DiT:能够根据上下文与用户进行多轮多模态对话,生成并优化图像

    腾讯混元团队推出支持中英双语提示词的文生图模型Hunyuan-DiT:能够根据上下文与用户进行多轮多模态对话,生成并优化图像

    腾讯混元团队推出支持中英双语提示词的文生图模型Hunyuan-DiT,它特别擅长理解中文和英文的文本提示,并据此生成图像,Hunyuan-DiT能够根据上下文与用户进行多轮多模态对话,生成并优化图像...
    新技术# Hunyuan-DiT# 提示词# 文生图模型
    2年前
    07240
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Next AI Draw.io

    Next AI Draw.io

    Next AI Draw.io 是一个基于 Next.js 的 Web 应用,将大语言模型(LLM)与 draw.io 的强大图表能力深度集成。用户可通过自然语言指令创建、修改和增强专业图表,无需手动拖拽。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    DeepAnalyze

    DeepAnalyze

    DeepAnalyze 是首个用于自主数据科学的智能体式 LLM,它能够在无需人工干预的情况下自主完成广泛的数据中心任务。其核心模型 DeepAnalyze-8B 仅用 80 亿参数,就在多项数据科学任务上超越了基于主流闭源大模型构建的预定义工作流智能体,标志着自主数据科学从“可能”走向“可行”。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    查看完整榜单