SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    百科

    共 2255 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    具有光照感知能力的扩散模型Relightful Harmonization

    具有光照感知能力的扩散模型Relightful Harmonization

    来自Adobe和纽约大学的研究人员推出具有光照感知能力的扩散模型Relightful Harmonization,这是一种先进的图像处理方法,专门用于在更换人像照片背景时,保持前景人物与新背景之间的光...
    新技术# Relightful Harmonization# 光影
    2年前
    05520
    新算法ViewFusion:解决在多视角图像生成一致性的问题

    新算法ViewFusion:解决在多视角图像生成一致性的问题

    来自亚马逊、悉尼大学、阿德莱德大学的研究人员推出新算法ViewFusion,它旨在解决在多视角图像合成中保持一致性的挑战。这个算法可以与现有的预训练扩散模型无缝集成,用于生成高质量、多样化的图像。 论...
    新技术# ViewFusion# 图像生成
    2年前
    07110
    韩国团队提出文生图大模型KOALA:可在低端GPU电脑上运行

    韩国团队提出文生图大模型KOALA:可在低端GPU电脑上运行

    韩国研究人员提出了一种高效的潜在扩散模型KOALA,该模型可以用于文本到图像的生成,研究人员构建了T2I模型KOALA-1B和KOALA-700M,减小了模型大小,降低了模型对硬件的需求,提高了模型运...
    新技术# KOALA# 文生图大模型# 韩国
    2年前
    08590
    LayerDiffusion:可生成高质量的透明图像和图层

    LayerDiffusion:可生成高质量的透明图像和图层

    Controlnet、Fooocus、Stable Diffusion WebUI Forge的开发者lllyasviel推出新的项目LayerDiffusion,它允许大规模预训练的潜在扩散模型(如...
    新技术# LayerDiffusion# 图层# 透明图像
    2年前
    06910
    微调模型TCD:提高图像生成的速度和质量

    微调模型TCD:提高图像生成的速度和质量

    来自华南理工、南洋理工、北理工和悉尼大学的研究人员推出TCD(Trajectory Consistency Distillation),这是一种用于加速文生图模型图像生成的微调模型。TCD的目标是提高...
    新技术# TCD# 微调模型
    2年前
    08060
    DistriFusion:加速高分辨率扩散模型的并行推理算法

    DistriFusion:加速高分辨率扩散模型的并行推理算法

    来自麻省理工学院、普林斯顿大学、Lepton AI 和 英伟达的研究人员推出DistriFusion,这是一种用于加速高分辨率扩散模型(diffusion models)的并行推理算法。 项目主页 G...
    新技术# DistriFusion# 高分辨率扩散模型
    2年前
    06120
    基于优化框架的跨模态视频-音频生成方法Seeing and Hearing:能够同时生成视频和音频内容

    基于优化框架的跨模态视频-音频生成方法Seeing and Hearing:能够同时生成视频和音频内容

    香港科技大学和腾讯 PCG ARC 实验室推出基于优化框架的跨模态视频-音频生成方法Seeing and Hearing,它能够同时生成视频和音频内容。方法的主要创新点在于,通过预训练的多模态模型(如...
    新技术# Seeing and Hearing# 优化框架# 跨模态视频-音频生成方法
    2年前
    06520
    基于Kronecker积的新型适应模块DiffuseKronA:保持图像生成质量的同时,显著减少模型的参数数量

    基于Kronecker积的新型适应模块DiffuseKronA:保持图像生成质量的同时,显著减少模型的参数数量

    来自印度信息技术研究所、Hugging Face、阳明交通大学、IBM 研究院的研究人员提出一种用于个性化扩散模型的参数高效微调方法DiffuseKronA,主要功能是在保持图像生成质量的同时,显著减...
    新技术# DiffuseKronA# 扩散模型
    2年前
    06950
    创新框架EMO:只需要提供一张静态照片和一段语音,就能生成口型匹配的视频

    创新框架EMO:只需要提供一张静态照片和一段语音,就能生成口型匹配的视频

    阿里巴巴推出创新框架EMO,它是一个能够根据音频生成表情丰富的肖像视频的系统。想象一下,你只需要提供一张静态的照片和一段语音,EMO就能创造出一个视频,视频中的人物头像会根据语音的内容和情感变化做出相...
    新技术# EMO# 口型匹配
    2年前
    07070
    Multi-LoRA Composition:不经过训练直接融合多个 Lora 不损失效果

    Multi-LoRA Composition:不经过训练直接融合多个 Lora 不损失效果

    来自伊利诺伊大学香槟分校和微软公司的研究人员公开了多LoRA组合来生成图像的项目。简单来说,LoRA是一种可以让文本生成图像模型更准确地呈现特定元素(如独特的字符、风格或服装)的技术。论文探讨了如何更...
    新技术# Lora# Multi-LoRA Composition
    2年前
    08670
    负面提示词在Stable Diffusion中的作用及书写技巧

    负面提示词在Stable Diffusion中的作用及书写技巧

    在Stable Diffusion中,负面提示(Negative Prompts)作为一种图像生成的引导机制发挥着重要作用。它们使用户能够定义希望从生成的图像中排除的内容,这在避免产生模糊、失真或包含...
    科普# negative prompts# Stable Diffusion# 负面提示
    2年前
    08840
    新框架VSP-LLM:通过观察视频中人的嘴型来理解和翻译说话内容

    新框架VSP-LLM:通过观察视频中人的嘴型来理解和翻译说话内容

    这篇论文介绍了一个名为VSP-LLM(Visual Speech Processing incorporated with LLMs)的新框架,它结合了视觉语音处理和大语言模型(LLMs),以提高视觉...
    新技术# VSP-LLM# 大语言模型# 视觉语音翻译
    2年前
    06800
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    通义万象

    通义万象

    通义万象是阿里云旗下的图像及视频生成平台,凭借其强大的多模态生成能力,正在引领生成式 AI 的发展。除了传统的文生图能力,通义万象现已支持文生视频、图生视频等多种功能,并在插画设计、涂鸦作画、局部重绘、短片创作、配乐生成等场景化应用中表现出色。
    秒哒

    秒哒

    百度秒哒,由百度智能云倾力打造的国内首个“对话式”应用开发平台,正式全量上线。作为一款无代码工具,秒哒致力于让每个人都能通过自然语言描述需求,自动生成完整功能代码,轻松实现创意想法。
    查看完整榜单