SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    百科

    共 2256 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    虚拟服装试穿工具OOTDiffusion:革新你的虚拟试衣体验

    虚拟服装试穿工具OOTDiffusion:革新你的虚拟试衣体验

    OOTDiffusion是一款开源虚拟服装试穿工具,它利用潜在扩散模型(latent diffusion models)的强大能力实现了前所未有的高精度和可控性试穿体验。 GitHub:https...
    新技术# OOTDiffusion# 虚拟服装
    2年前
    07760
    Binary Opacity Grids:从多视角图像重建三角网格,生成高质量的视图合成

    Binary Opacity Grids:从多视角图像重建三角网格,生成高质量的视图合成

    来自的谷歌的研究人员推出名为“Binary Opacity Grids”的新方法,它用于从多视角图像重建三角网格,并能够捕捉到精细的几何细节,如叶子、树枝和草地等。这种方法在保持低计算成本的同时,能够...
    新技术# 3D# Binary Opacity Grids
    2年前
    07180
    新型图像生成模型FiT:基于Transformer架构,可以生成无限制分辨率和长宽比的图像

    新型图像生成模型FiT:基于Transformer架构,可以生成无限制分辨率和长宽比的图像

    FiT(Flexible Vision Transformer)是一款新型图像生成模型,基于Transformer架构,旨在生成具有无限制分辨率和长宽比的图像。 GitHub 论文 模型 传统的图像生...
    新技术# FiT# Transformer# 图像生成模型
    2年前
    08200
    文生图模型GLIGEN:用于将Stable Diffusion模型扩展为可定制模型

    文生图模型GLIGEN:用于将Stable Diffusion模型扩展为可定制模型

    威斯康星大学麦迪逊分校、哥伦比亚大学和微软的研究人员推出的GLIGEN模型,用于将Stable Diffusion模型扩展为可定制的模型。这个模型的核心目标是让计算机能够根据文本描述生成图像,并且能够...
    新技术# GLIGEN# Stable Diffusion# 文生图模型
    2年前
    08690
    AI视频编辑工具LAVE:利用大语言模型(LLMs)来辅助用户进行视频编辑

    AI视频编辑工具LAVE:利用大语言模型(LLMs)来辅助用户进行视频编辑

    来自加州大学圣地亚哥分校和Meta的研究人员推出AI视频编辑工具LAVE(LLM-Powered Agent Assistance and Language Augmentation for Vide...
    新技术# AI视频编辑# LAVE
    2年前
    08800
    视觉-语言适配器PaLM2-VAdapter:将传统的视觉编码器和大语言模型结合起来

    视觉-语言适配器PaLM2-VAdapter:将传统的视觉编码器和大语言模型结合起来

    PaLM2-VAdapter模型的主要目的是更有效地连接视觉编码器和大语言模型,以提高它们之间的协同工作效果。 论文 它能够有效地将传统的视觉编码器(vision encoders)和大语言模型(LL...
    新技术# PaLM2-VAdapter# 大语言模型# 视觉编码器
    2年前
    08830
    GaussianObject框架:仅用四张图片就重建出高质量的3D物体

    GaussianObject框架:仅用四张图片就重建出高质量的3D物体

    来自上海交大、华为、多伦多大学的研究人员推出GaussianObject框架,它能够仅用四张图片就重建出高质量的3D物体。这个框架利用了高斯溅射(Gaussian Splatting)技术,通过在稀疏...
    新技术# GaussianObject# 高斯溅射
    2年前
    01,1200
    自级联扩散模型Self-Cascade:快速适应高分辨率的图像和视频生成

    自级联扩散模型Self-Cascade:快速适应高分辨率的图像和视频生成

    来自南洋理工大学、腾讯AI实验室、香港科技大学和克莱姆森大学的研究人员提出了一种名为自级联扩散模型(Self-Cascade Diffusion Model)的新方法,该方法利用了低分辨率模型的丰富知...
    新技术# Self-Cascade# 自级联扩散模型
    2年前
    09350
    Stable Diffusion WebUI Forge:大幅优化低显存显卡的显存占用和推理速度

    Stable Diffusion WebUI Forge:大幅优化低显存显卡的显存占用和推理速度

    Controlnet与Fooocus的开发者lllyasviel,近期又推出了基于 Stable Diffusion WebUI的Stable Diffusion WebUI Forge,新的 UI ...
    百科# AI绘画# Stable Diffusion WebUI# Stable Diffusion WebUI Forge
    2年前
    01,9060
    一种新颖的模型微调方法DoRA:比LoRA更精细、更全面的微调策略

    一种新颖的模型微调方法DoRA:比LoRA更精细、更全面的微调策略

    DoRA(Weight-Decomposed Low-Rank Adaptation)是一种用于微调(fine-tuning)大型预训练模型的新方法。DoRA的核心思想是将预训练模型的权重分解为两个部...
    新技术# DoRA# Lora# 模型微调
    2年前
    01,2650
    新型文生图模型的微调算法SPIN-Diffusion

    新型文生图模型的微调算法SPIN-Diffusion

    SPIN-Diffusion是一种新型文生图模型的微调算法。这个算法特别适用于那些只有单个图像与文本提示(prompt)相关联的数据集,它通过一种自我博弈(self-play)的机制,让模型不断地与自...
    新技术# SPIN-Diffusion# 文生图模型
    2年前
    08530
    Meta发布世界模型早期版本V-JEPA:无需人工标注或指导,自主学习视频中的视觉信息

    Meta发布世界模型早期版本V-JEPA:无需人工标注或指导,自主学习视频中的视觉信息

    Meta今日推出V-JEPA(Video Joint-Embedding Predictive Architecture)模型,一种通过观看视频来教机器理解和模拟物理世界的方法,以迈向利用对世界的学习...
    新技术# Meta# V-JEPA# 世界模型
    2年前
    07890
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    ITELLOU

    ITELLOU

    ITELLYOU(也称为NEXT, ITELLYOU)是一个专注于提供微软原版软件资源的非官方网站,主要帮助用户获取未经修改的微软产品镜像,如Windows操作系统、Office办公软件和开发工具等。
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    秒哒

    秒哒

    百度秒哒,由百度智能云倾力打造的国内首个“对话式”应用开发平台,正式全量上线。作为一款无代码工具,秒哒致力于让每个人都能通过自然语言描述需求,自动生成完整功能代码,轻松实现创意想法。
    查看完整榜单