SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    百科

    共 2211 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    新型知识蒸馏方法DisBack:加速扩散模型的生成模型的采样速度

    新型知识蒸馏方法DisBack:加速扩散模型的生成模型的采样速度

    浙江大学、北京大学和阿里巴巴的研究人员推出新型知识蒸馏方法DisBack,它用于加速一类称为扩散模型(diffusion models)的生成模型的采样速度。扩散模型是当前非常热门的生成模型,能够生成...
    新技术# DisBack# 蒸馏方法
    1年前
    06180
    新型视觉模型训练方法SynCLR:完全从生成模型中学习,不需要任何真实数据

    新型视觉模型训练方法SynCLR:完全从生成模型中学习,不需要任何真实数据

    来自谷歌和MIT的研究人员提出一种新型视觉模型训练方法SynCLR,它完全从生成模型中学习,而不需要任何真实数据。 GitHub 论文 SynCLR的核心思想是利用大语言模型(LLMs)生成大量的图像...
    新技术# SynCLR# 大模型# 大语言模型
    2年前
    06180
    文本反转Textual Inversion:通过少量的图像和自然语言描述来创建新的“伪词”来指导图像生成

    文本反转Textual Inversion:通过少量的图像和自然语言描述来创建新的“伪词”来指导图像生成

    使用文本到图像生成模型(Text-to-Image Models)来个性化地创造图像,这些模型能够根据自然语言描述生成图像,但通常难以精确地表达特定的独特概念。 项目主页 GitHub 来自特拉维夫大...
    新技术# Textual Inversion# 文本反转# 英伟达
    2年前
    06170
    基于ComfyUI的ComfyGen:用于文本到图像生成的提示自适应工作流

    基于ComfyUI的ComfyGen:用于文本到图像生成的提示自适应工作流

    英伟达和特拉维夫大学的研究人员推出新型文生图系统ComfyGen,此系统能够根据用户提供的文本提示(prompt),自动选择或生成最适合该提示的图像生成工作流。研究团队引入了一个新颖的任务——提示自适...
    新技术# ComfyGen# ComfyUI# 工作流
    1年前
    06160
    新型多模态大语言模型INF-LLaVA:专门设计用于处理高分辨率图像,以提高模型对视觉和语言信息的理解能力

    新型多模态大语言模型INF-LLaVA:专门设计用于处理高分辨率图像,以提高模型对视觉和语言信息的理解能力

    厦门大学的研究人员推出新型多模态大语言模型INF-LLaVA,它专门设计用于处理高分辨率图像,以提高模型对视觉和语言信息的理解能力。在人工智能领域,处理高分辨率图像一直是一个挑战,因为这些图像包含的细...
    新技术# INF-LLaVA# 多模态大语言模型
    1年前
    06160
    谷歌推出贪婪生长方法(Greedy Growing):用来训练大规模、高分辨率的基于像素的图像扩散模型

    谷歌推出贪婪生长方法(Greedy Growing):用来训练大规模、高分辨率的基于像素的图像扩散模型

    谷歌发布论文讨论了一个非常有趣的话题:如何通过一种称为“贪婪生长”(Greedy Growing)的方法来训练大规模、高分辨率的基于像素的图像扩散模型,且无需级联超分辨率组件。简单来说,就是科学家们找...
    新技术# Greedy Growing# 谷歌# 贪婪生长
    2年前
    06160
    字节跳动推出文生图模型SDXL-Lightning:基于SDXL1.0基础模型提炼

    字节跳动推出文生图模型SDXL-Lightning:基于SDXL1.0基础模型提炼

    SDXL-Lightning是由字节跳动发布的一款速度极快的文生图模型,它采用新型扩散模型蒸馏方法,优化扩散模型,能在短时间内高效生成分辨率为1024像素的高品质图像。 模型地址:https://hu...
    新技术# SDXL-Lightning# SDXL1.0# 字节跳动
    2年前
    06150
    SSAM 2增强版SAMURAI:专门设计用于视觉物体跟踪

    SSAM 2增强版SAMURAI:专门设计用于视觉物体跟踪

    Segment Anything Model 2 (SAM 2) 是一个在物体分割任务中表现出色的模型,但在视觉物体跟踪方面仍面临一些挑战。特别是在处理拥挤场景中快速移动或自我遮挡的物体时,SAM 2...
    新技术# SAMURAI# SSAM 2
    1年前
    06140
    运动潜在一致性模型MotionLCM:能够实时控制人体动作的生成

    运动潜在一致性模型MotionLCM:能够实时控制人体动作的生成

    来自清华大学和上海人工智能实验室的研究人员推出运动潜在一致性模型MotionLCM,它能够实时控制人体动作的生成。这个框架通过一种称为“潜在一致性模型”(Motion Latent Consisten...
    新技术# MotionLCM# 运动潜在一致性模型
    2年前
    06120
    图像分割技术OpenTrans:提高开放词汇表分割(OVS)的效率

    图像分割技术OpenTrans:提高开放词汇表分割(OVS)的效率

    来自北京交通大学和西蒙菲莎大学的研究人员推出OpenTrans,它旨在提高开放词汇表分割(Open-Vocabulary Segmentation, OVS)的效率。OVS是一种图像分割技术,能够识别...
    新技术# OpenTrans# 图像分割技术
    2年前
    06120
    动态排版Dynamic Typography:将文字通过动画效果生动呈现的技术

    动态排版Dynamic Typography:将文字通过动画效果生动呈现的技术

    来自香港科技大学和特拉维夫大学的研究人员推出Dynamic Typography(动态排版),它是一种将文字通过动画效果生动呈现的技术。简单来说,就是让文字动起来,通过变形和运动来表达文字的含义,从而...
    新技术# Dynamic Typography# 动态排版
    2年前
    06110
    矩形扩散Rectified Diffusion:提高扩散模型的生成速度

    矩形扩散Rectified Diffusion:提高扩散模型的生成速度

    香港中文大学、北京大学和普林斯顿大学的研究人员推出Rectified Diffusion,它用于加速生成扩散模型(diffusion models),这些模型在视觉生成领域取得了显著的进展,比如生成高...
    百科# Rectified Diffusion# 矩形扩散
    1年前
    06100
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Next AI Draw.io

    Next AI Draw.io

    Next AI Draw.io 是一个基于 Next.js 的 Web 应用,将大语言模型(LLM)与 draw.io 的强大图表能力深度集成。用户可通过自然语言指令创建、修改和增强专业图表,无需手动拖拽。
    秒哒

    秒哒

    百度秒哒,由百度智能云倾力打造的国内首个“对话式”应用开发平台,正式全量上线。作为一款无代码工具,秒哒致力于让每个人都能通过自然语言描述需求,自动生成完整功能代码,轻松实现创意想法。
    OiiOii AI

    OiiOii AI

    OiiOii.ai 是一个基于多智能体架构的动画生成平台,其核心目标是将动画制作从线性协作流程,转变为端到端的自动化生成。用户只需上传一张图片或输入一段文字描述,系统即可自动完成剧本生成、分镜设计、角色建模、镜头调度、配乐合成与最终渲染,输出一段完整动画视频。
    DeepAnalyze

    DeepAnalyze

    DeepAnalyze 是首个用于自主数据科学的智能体式 LLM,它能够在无需人工干预的情况下自主完成广泛的数据中心任务。其核心模型 DeepAnalyze-8B 仅用 80 亿参数,就在多项数据科学任务上超越了基于主流闭源大模型构建的预定义工作流智能体,标志着自主数据科学从“可能”走向“可行”。
    查看完整榜单