SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 943 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    分辨率适配器ResAdapte:解决SD模型生成超大图片和非训练分辨率图片时的肢体异常以及画面崩坏问题

    分辨率适配器ResAdapte:解决SD模型生成超大图片和非训练分辨率图片时的肢体异常以及画面崩坏问题

    字节跳动推出ResAdapter,它是一个用于SD模型的分辨率适配器,可以生成任意风格领域的图像,并且能够在不同的分辨率下保持图像的一致性和质量。 项目主页 GitHub 模型地址 简单来说,可以解决...
    新技术# ResAdapte# SD模型
    2年前
    09250
    阿里推出高保真图像到视频生成框架AtomoVideo

    阿里推出高保真图像到视频生成框架AtomoVideo

    阿里旗下阿里妈妈研究人员推出高保真图像到视频生成框架AtomoVideo,它能够将输入的图像转化为高保真的视频。相较于现有的技术,它提供了更出色的运动强度和一致性,而且完美兼容各种个性化文生图模型,无...
    新技术# AI视频# AtomoVideo
    2年前
    07200
    个性化图像生成RealCustom:理解你的描述,并生成符合你要求的个性化图像

    个性化图像生成RealCustom:理解你的描述,并生成符合你要求的个性化图像

    来自中科大、字节跳动的研究人员推出新型文本到图像定制方法RealCustom。这种方法的目标是为给定的主题生成受文本驱动的图像,这在内容创作领域具有革命性的意义。 项目主页 论文地址 想象一下,你想要...
    新技术# RealCustom# 个性化图像生成
    2年前
    05730
    视觉变换器VisionLLaMA:基于LLaMA架构设计,用于处理图像任务

    视觉变换器VisionLLaMA:基于LLaMA架构设计,用于处理图像任务

    来自美团、浙江大学、Moonshot AI的研究人员推出名为VisionLLaMA的新型视觉变换器(Vision Transformer),它是基于LLaMA(Large Language Model...
    新技术# VisionLLaMA# 视觉变换器
    2年前
    06080
    具有光照感知能力的扩散模型Relightful Harmonization

    具有光照感知能力的扩散模型Relightful Harmonization

    来自Adobe和纽约大学的研究人员推出具有光照感知能力的扩散模型Relightful Harmonization,这是一种先进的图像处理方法,专门用于在更换人像照片背景时,保持前景人物与新背景之间的光...
    新技术# Relightful Harmonization# 光影
    2年前
    05590
    新算法ViewFusion:解决在多视角图像生成一致性的问题

    新算法ViewFusion:解决在多视角图像生成一致性的问题

    来自亚马逊、悉尼大学、阿德莱德大学的研究人员推出新算法ViewFusion,它旨在解决在多视角图像合成中保持一致性的挑战。这个算法可以与现有的预训练扩散模型无缝集成,用于生成高质量、多样化的图像。 论...
    新技术# ViewFusion# 图像生成
    2年前
    07130
    韩国团队提出文生图大模型KOALA:可在低端GPU电脑上运行

    韩国团队提出文生图大模型KOALA:可在低端GPU电脑上运行

    韩国研究人员提出了一种高效的潜在扩散模型KOALA,该模型可以用于文本到图像的生成,研究人员构建了T2I模型KOALA-1B和KOALA-700M,减小了模型大小,降低了模型对硬件的需求,提高了模型运...
    新技术# KOALA# 文生图大模型# 韩国
    2年前
    08610
    LayerDiffusion:可生成高质量的透明图像和图层

    LayerDiffusion:可生成高质量的透明图像和图层

    Controlnet、Fooocus、Stable Diffusion WebUI Forge的开发者lllyasviel推出新的项目LayerDiffusion,它允许大规模预训练的潜在扩散模型(如...
    新技术# LayerDiffusion# 图层# 透明图像
    2年前
    06980
    微调模型TCD:提高图像生成的速度和质量

    微调模型TCD:提高图像生成的速度和质量

    来自华南理工、南洋理工、北理工和悉尼大学的研究人员推出TCD(Trajectory Consistency Distillation),这是一种用于加速文生图模型图像生成的微调模型。TCD的目标是提高...
    新技术# TCD# 微调模型
    2年前
    08100
    DistriFusion:加速高分辨率扩散模型的并行推理算法

    DistriFusion:加速高分辨率扩散模型的并行推理算法

    来自麻省理工学院、普林斯顿大学、Lepton AI 和 英伟达的研究人员推出DistriFusion,这是一种用于加速高分辨率扩散模型(diffusion models)的并行推理算法。 项目主页 G...
    新技术# DistriFusion# 高分辨率扩散模型
    2年前
    06120
    基于优化框架的跨模态视频-音频生成方法Seeing and Hearing:能够同时生成视频和音频内容

    基于优化框架的跨模态视频-音频生成方法Seeing and Hearing:能够同时生成视频和音频内容

    香港科技大学和腾讯 PCG ARC 实验室推出基于优化框架的跨模态视频-音频生成方法Seeing and Hearing,它能够同时生成视频和音频内容。方法的主要创新点在于,通过预训练的多模态模型(如...
    新技术# Seeing and Hearing# 优化框架# 跨模态视频-音频生成方法
    2年前
    06530
    基于Kronecker积的新型适应模块DiffuseKronA:保持图像生成质量的同时,显著减少模型的参数数量

    基于Kronecker积的新型适应模块DiffuseKronA:保持图像生成质量的同时,显著减少模型的参数数量

    来自印度信息技术研究所、Hugging Face、阳明交通大学、IBM 研究院的研究人员提出一种用于个性化扩散模型的参数高效微调方法DiffuseKronA,主要功能是在保持图像生成质量的同时,显著减...
    新技术# DiffuseKronA# 扩散模型
    2年前
    07040
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    Higgsfield AI

    Higgsfield AI

    Higgsfield AI平台支持文生图和图生视频,近期对图生视频功能进行了全面升级,专为追求高质量、风格化内容创作并渴望真正电影级操控的创意人士打造——无论是MV导演、商业片制作人、AI创作者,还是社交媒体叙事者。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    互联网大厂模拟器

    互联网大厂模拟器

    《互联网大厂模拟器》或许不会改变现实,但它提供了一个出口:在虚拟世界里,我们可以安全地体验“另一种职场人生”,然后笑着关掉页面,继续面对明天的站会。
    查看完整榜单