SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 知识库
  • 排行榜
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 知识库
    • 排行榜

    百科

    共 2252 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    新型视频超分辨率(VSR)技术EvTexture:通过挖掘事件数据中的高频细节,从而提高视频的分辨率和质量

    新型视频超分辨率(VSR)技术EvTexture:通过挖掘事件数据中的高频细节,从而提高视频的分辨率和质量

    中国科学技术大学和合肥国家科学中心人工智能研究院的研究人员推出新型视频超分辨率(VSR)技术EvTexture,这项技术的核心在于利用事件驱动的信号来增强视频中的纹理细节,从而提高视频的分辨率和质量...
    新技术# EvTexture# VSR# 视频超分辨率
    2年前
    08360
    新型蒸馏技术iCD:提升文本引导的图像编辑任务中的图像生成和编辑能力

    新型蒸馏技术iCD:提升文本引导的图像编辑任务中的图像生成和编辑能力

    俄罗斯Yandex Research和高等经济大学的研究人员推出新型蒸馏技术Invertible Consistency Distillation(iCD),它用于提升文本引导的图像编辑任务中的图像生...
    新技术# iCD# 蒸馏技术
    2年前
    05890
    新型图像编辑工具StyleFeatureEditor:结合了AI的最新进展,使用户能够以前所未有的细节级别和灵活性来编辑图像

    新型图像编辑工具StyleFeatureEditor:结合了AI的最新进展,使用户能够以前所未有的细节级别和灵活性来编辑图像

    俄罗斯高等经济大学、AIRI和德国不来梅建筑大学的研究人员推出新型图像编辑工具StyleFeatureEditor,它是基于一种名为StyleGAN的生成对抗网络(GAN)的。StyleGAN是一种特...
    新技术# StyleFeatureEditor# 图像编辑
    2年前
    05110
    合成语言-视觉数据集StableSemantics:专注于自然图像中的语义表示

    合成语言-视觉数据集StableSemantics:专注于自然图像中的语义表示

    卡内基·梅隆大学的研究人员推出合成语言-视觉数据集StableSemantics,它专注于自然图像中的语义表示。简单来说,这个数据集旨在帮助计算机视觉系统更好地理解图像中的场景和对象的语义含义。它涵盖...
    新技术# StableSemantics# 合成语言-视觉数据集
    2年前
    07550
    视频合成模型后续调优方法ExVideo:提升模型生成视频的长度和质量

    视频合成模型后续调优方法ExVideo:提升模型生成视频的长度和质量

    华东师范大学和阿里巴巴的研究人员推出新型视频合成模型扩展方法ExVideo,这种方法旨在通过参数高效的方式对现有的视频合成模型(Stable Video Diffusion)进行后期调整(post-t...
    新技术# ExVideo# SVD模型
    2年前
    07730
    基于提示、针对文生图模型的新型剪枝方法APTP:减少文生图模型在计算资源受限的环境中部署时的计算负担,同时保持模型性能

    基于提示、针对文生图模型的新型剪枝方法APTP:减少文生图模型在计算资源受限的环境中部署时的计算负担,同时保持模型性能

    马里兰大学和佛罗里达州立大学推出一种针对文生图模型的新型剪枝方法APTP(Adaptive Prompt-Tailored Pruning,自适应提示定制剪枝),这是一种专门为文生图模型设计的、基于提...
    新技术# APTP# 剪枝方法# 文生图模型
    2年前
    06200
    不可混合扩散Immiscible Diffusion:加速扩散模型的训练过程

    不可混合扩散Immiscible Diffusion:加速扩散模型的训练过程

    加州大学伯克利分校和清华大学的研究人员推出新技术“Immiscible Diffusion(不可混合扩散)”,它旨在加速扩散模型的训练过程。扩散模型是一类在图像生成领域取得显著进展的模型,但它们的训练...
    新技术# Immiscible Diffusion# 扩散模型
    2年前
    09170
    图像编辑技术MimicBrush:允许用户指定源图像中需要编辑的区域,并提供一个参考图像,来展示编辑后期望的效果

    图像编辑技术MimicBrush:允许用户指定源图像中需要编辑的区域,并提供一个参考图像,来展示编辑后期望的效果

    香港大学、阿里巴巴集团和蚂蚁集团的研究人员推出图像编辑技术MimicBrush,它通过模仿(imitative editing)的方式,让用户能够更加方便地发挥创造力进行图像编辑。简单来说,Mimic...
    新技术# MimicBrush# 图像编辑
    2年前
    06160
    通用且即插即用的加速方案AsyncDiff:加速SD模型的运行速度

    通用且即插即用的加速方案AsyncDiff:加速SD模型的运行速度

    新加坡国立大学推出通用且即插即用的加速方案AsyncDiff,它能够显著加速扩散模型(diffusion models)的运行速度。扩散模型是一种强大的生成模型,能够创造出各种数据,比如图片和视频,但...
    新技术# AsyncDiff# SD模型
    2年前
    07220
    一维(1D)标记化技术TiTok:用极少的标记(tokens)来表示和生成高分辨率图像

    一维(1D)标记化技术TiTok:用极少的标记(tokens)来表示和生成高分辨率图像

    字节跳动和慕尼黑工业大学的研究人员推出新型图像表示方法TiTok,它通过一种新颖的一维(1D)标记化技术,用极少的标记(tokens)来表示和生成高分辨率图像。这种方法与传统的二维(2D)图像标记化方...
    新技术# TiTok# 一维标记化
    2年前
    08370
    创新系统SEE-2-SOUND:为静态图片或动态视频生成与之匹配的立体声效果,增强观众的沉浸感和体验

    创新系统SEE-2-SOUND:为静态图片或动态视频生成与之匹配的立体声效果,增强观众的沉浸感和体验

    多伦多大学、Temerty 人工智能研究与医学教育中心和Sunnybrook 研究所的研究人员推出创新系统SEE-2-SOUND,它能够将视觉内容(如图片或视频)转换成具有空间感的音频输出。简单来说...
    新技术# SEE-2-SOUND# 立体声
    2年前
    05840
    新型多模态DiT模型AV-DiT:生成既有视觉画面又有声音的高质量视频

    新型多模态DiT模型AV-DiT:生成既有视觉画面又有声音的高质量视频

    来自多伦多大学、德克萨斯大学达拉斯分校和Adobe研究中心的研究人员推出新型多模态扩散变换器AV-DiT(Audio-Visual Diffusion Transformer),它专门设计用于联合生成...
    新技术# AV-DiT# DiT模型
    2年前
    06570
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Google AI Studio

    Google AI Studio

    Google AI Studio 是一个功能齐全的工具,特别适合希望快速构建和试验 AI 应用的开发者。其多模态支持、提示库和与 Gemini API 的无缝集成使其成为生成 AI 开发的有力平台。
    Rocket.new

    Rocket.new

    Rocket是您构建生产就绪应用和网站的 AI 驱动工具,将 Rocket 视为集产品经理与工程师于一身的存在——它能将您的自然语言提示转化为完整的应用和网站,包含后端、集成功能和托管服务。无需编写代码。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    Proxy

    Proxy

    Proxy是一款非常实用的 AI代理工具,虽然它并不完美,但在处理日常琐事方面表现出色。它的核心优势在于简单易用、无需复杂设置,并且能够主动解决问题。对于忙碌的用户来说,Proxy 是一个值得信赖的数字助手,可以显著提高效率。
    Hume AI

    Hume AI

    Hume AI 是一家专注于先进 AI 语音技术的研究实验室和技术公司,使命是确保AI的开发服务于人类目标和情感福祉。通过构建能够以共情方式进行交流并学习如何让人们感到快乐的 AI 模型,Hume 正在重新定义语音交互的未来。
    海螺音乐

    海螺音乐

    海螺音乐不仅是一款强大的音乐生成工具,还提供了丰富的功能和实用的小贴士,帮助用户优化歌词输入、控制歌曲结构并激发创作灵感。
    查看完整榜单