SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    百科

    共 2206 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    3D服装生成框架DressCode:根据文本指导生成具有缝纫图案和基于物理渲染(PBR)纹理的服装

    3D服装生成框架DressCode:根据文本指导生成具有缝纫图案和基于物理渲染(PBR)纹理的服装

    上海科技大学、宾夕法尼亚大学、影眸科技和赜深科技推出3D服装生成框架DressCode,它能够根据文本指导生成具有缝纫图案和基于物理渲染(PBR)纹理的服装。这项技术对于数字化人类创建、时尚设计、虚拟...
    新技术# 3D服装生成# DressCode
    2年前
    09020
    Controlnet作者新项目IC-Light:根据文本提示或参考背景图重新打光生成符合新背景环境光照的图片

    Controlnet作者新项目IC-Light:根据文本提示或参考背景图重新打光生成符合新背景环境光照的图片

    IC-Light是Controlnet、Fooocus、Stable Diffusion WebUI Forge的开发者lllyasviel推出新开源项目,这是一款控制图像照明效果的模型,简单来说其主...
    新技术# controlnet# IC-Light# 打光
    2年前
    09010
    零样本视频恢复DiffIR2VR-Zero:将低质量的视频转换成高质量的视频

    零样本视频恢复DiffIR2VR-Zero:将低质量的视频转换成高质量的视频

    阳明交通大学、东京大学和联发科的研究人员推出DiffIR2VR-Zero,它能够实现零样本(zero-shot)视频恢复。零样本意味着这种方法不需要针对特定任务进行训练,就能将低质量的视频转换成高质量...
    新技术# DiffIR2VR-Zero# 视频恢复
    1年前
    08950
    基于人类与场景互动数据集Trumans开发的动作生成模型

    基于人类与场景互动数据集Trumans开发的动作生成模型

    来自北京大学人工智能研究院、BIGAI通用人工智能国家重点实验室、北京大学CFCS计算机学院和北京理工大学的研究团队创建一个详细的人类与场景互动数据集trumans,并开发出一种先进的动作生成模型,为...
    新技术# Trumans# 动作生成模型
    2年前
    08950
    新型文本到视频生成框架VideoTetris:专门设计来解决现有方法在处理复杂场景(如多对象或对象数量动态变化的长视频)生成时面临的挑战

    新型文本到视频生成框架VideoTetris:专门设计来解决现有方法在处理复杂场景(如多对象或对象数量动态变化的长视频)生成时面临的挑战

    来自北京大学和快手科技的研究人员推出新型文本到视频生成框架VideoTetris,此框架专门设计来解决现有方法在处理复杂场景(如多对象或对象数量动态变化的长视频)生成时面临的挑战。VideoTetri...
    新技术# VideoTetris# 北京大学# 快手
    2年前
    08930
    MVEdit:用于3D对象合成和编辑的通用3D扩散适配器

    MVEdit:用于3D对象合成和编辑的通用3D扩散适配器

    来自斯坦福大学、加州大学圣地亚哥分校和Apparate Labs的研究人员推出MVEdit,这是一个用于3D对象合成和编辑的通用3D扩散适配器。 项目主页 Demo GitHub MVEdit的核心功...
    新技术# 3D# MVEdit
    2年前
    08930
    新型图像编辑框架Differential Diffusion:精确地控制图像的编辑过程

    新型图像编辑框架Differential Diffusion:精确地控制图像的编辑过程

    来自特拉维夫大学、赖希曼大学的研究人员推出新型图像编辑框架Differential Diffusion,此框架的核心特点是能够让用户对图像的每个像素或区域进行不同程度的编辑,这在以往的图像编辑技术中是...
    新技术# Differential Diffusion# 图像编辑
    2年前
    08900
    大语言模型适配器ELLA:提升了文生图模型处理复杂描述的能力

    大语言模型适配器ELLA:提升了文生图模型处理复杂描述的能力

    腾讯推出大语言模型适配器(LLM Adapter)ELLA,无需 U-Net 或大语言模型训练,就可通过 ELLA ,为文生图模型增强文本对齐,解决大多数模型受限于 CLIP 本身对密集提示词的理解能...
    新技术# DPG-Bench# ELLA# TSC
    2年前
    08870
    ComfyUI-IndexTTS2:轻量IndexTTS-2包装器实现语音克隆 + 情感控制,附安装与节点指南

    ComfyUI-IndexTTS2:轻量IndexTTS-2包装器实现语音克隆 + 情感控制,附安装与节点指南

    在 AI 音频生成领域,高质量的文本转语音(TTS)系统正从“能说”向“会表达”演进。近期,由 B站IndexTeam 推出的 IndexTTS-2 因其出色的语音克隆能力与细粒度情感控制机制受到关注...
    百科# ComfyUI-IndexTTS2# IndexTTS-2
    3个月前
    08840
    视觉语言模型CoLLaVO:提高视觉语言模型在零样本视觉语言任务中的性能

    视觉语言模型CoLLaVO:提高视觉语言模型在零样本视觉语言任务中的性能

    韩国研究人员推出视觉语言模型CoLLaVO(Crayon Large Language and Vision mOdel),此模型旨在通过增强对象级别的图像理解能力,提高视觉语言模型(VLMs)在零样...
    新技术# CoLLaVO# 视觉语言模型
    2年前
    08830
    负面提示词在Stable Diffusion中的作用及书写技巧

    负面提示词在Stable Diffusion中的作用及书写技巧

    在Stable Diffusion中,负面提示(Negative Prompts)作为一种图像生成的引导机制发挥着重要作用。它们使用户能够定义希望从生成的图像中排除的内容,这在避免产生模糊、失真或包含...
    科普# negative prompts# Stable Diffusion# 负面提示
    2年前
    08800
    Genspark 推出 AI Slides功能:AI 自动生成 PPT,彻底颠覆幻灯片创作方式

    Genspark 推出 AI Slides功能:AI 自动生成 PPT,彻底颠覆幻灯片创作方式

    创建富有影响力的幻灯片一直是一项耗时且富有挑战性的任务。Genspark 宣布推出其最新创新功能——AI Slides,旨在彻底改变幻灯片的创作体验。 地址:https://www.genspark...
    早报# AI Slides# Genspark
    8个月前
    08780
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Next AI Draw.io

    Next AI Draw.io

    Next AI Draw.io 是一个基于 Next.js 的 Web 应用,将大语言模型(LLM)与 draw.io 的强大图表能力深度集成。用户可通过自然语言指令创建、修改和增强专业图表,无需手动拖拽。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    查看完整榜单