SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 943 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    新型视频超分辨率(VSR)技术EvTexture:通过挖掘事件数据中的高频细节,从而提高视频的分辨率和质量

    新型视频超分辨率(VSR)技术EvTexture:通过挖掘事件数据中的高频细节,从而提高视频的分辨率和质量

    中国科学技术大学和合肥国家科学中心人工智能研究院的研究人员推出新型视频超分辨率(VSR)技术EvTexture,这项技术的核心在于利用事件驱动的信号来增强视频中的纹理细节,从而提高视频的分辨率和质量...
    新技术# EvTexture# VSR# 视频超分辨率
    2年前
    08550
    新型蒸馏技术iCD:提升文本引导的图像编辑任务中的图像生成和编辑能力

    新型蒸馏技术iCD:提升文本引导的图像编辑任务中的图像生成和编辑能力

    俄罗斯Yandex Research和高等经济大学的研究人员推出新型蒸馏技术Invertible Consistency Distillation(iCD),它用于提升文本引导的图像编辑任务中的图像生...
    新技术# iCD# 蒸馏技术
    2年前
    05890
    新型图像编辑工具StyleFeatureEditor:结合了AI的最新进展,使用户能够以前所未有的细节级别和灵活性来编辑图像

    新型图像编辑工具StyleFeatureEditor:结合了AI的最新进展,使用户能够以前所未有的细节级别和灵活性来编辑图像

    俄罗斯高等经济大学、AIRI和德国不来梅建筑大学的研究人员推出新型图像编辑工具StyleFeatureEditor,它是基于一种名为StyleGAN的生成对抗网络(GAN)的。StyleGAN是一种特...
    新技术# StyleFeatureEditor# 图像编辑
    2年前
    05120
    合成语言-视觉数据集StableSemantics:专注于自然图像中的语义表示

    合成语言-视觉数据集StableSemantics:专注于自然图像中的语义表示

    卡内基·梅隆大学的研究人员推出合成语言-视觉数据集StableSemantics,它专注于自然图像中的语义表示。简单来说,这个数据集旨在帮助计算机视觉系统更好地理解图像中的场景和对象的语义含义。它涵盖...
    新技术# StableSemantics# 合成语言-视觉数据集
    2年前
    07600
    视频合成模型后续调优方法ExVideo:提升模型生成视频的长度和质量

    视频合成模型后续调优方法ExVideo:提升模型生成视频的长度和质量

    华东师范大学和阿里巴巴的研究人员推出新型视频合成模型扩展方法ExVideo,这种方法旨在通过参数高效的方式对现有的视频合成模型(Stable Video Diffusion)进行后期调整(post-t...
    新技术# ExVideo# SVD模型
    2年前
    07790
    基于提示、针对文生图模型的新型剪枝方法APTP:减少文生图模型在计算资源受限的环境中部署时的计算负担,同时保持模型性能

    基于提示、针对文生图模型的新型剪枝方法APTP:减少文生图模型在计算资源受限的环境中部署时的计算负担,同时保持模型性能

    马里兰大学和佛罗里达州立大学推出一种针对文生图模型的新型剪枝方法APTP(Adaptive Prompt-Tailored Pruning,自适应提示定制剪枝),这是一种专门为文生图模型设计的、基于提...
    新技术# APTP# 剪枝方法# 文生图模型
    2年前
    06220
    不可混合扩散Immiscible Diffusion:加速扩散模型的训练过程

    不可混合扩散Immiscible Diffusion:加速扩散模型的训练过程

    加州大学伯克利分校和清华大学的研究人员推出新技术“Immiscible Diffusion(不可混合扩散)”,它旨在加速扩散模型的训练过程。扩散模型是一类在图像生成领域取得显著进展的模型,但它们的训练...
    新技术# Immiscible Diffusion# 扩散模型
    2年前
    09190
    图像编辑技术MimicBrush:允许用户指定源图像中需要编辑的区域,并提供一个参考图像,来展示编辑后期望的效果

    图像编辑技术MimicBrush:允许用户指定源图像中需要编辑的区域,并提供一个参考图像,来展示编辑后期望的效果

    香港大学、阿里巴巴集团和蚂蚁集团的研究人员推出图像编辑技术MimicBrush,它通过模仿(imitative editing)的方式,让用户能够更加方便地发挥创造力进行图像编辑。简单来说,Mimic...
    新技术# MimicBrush# 图像编辑
    2年前
    06210
    通用且即插即用的加速方案AsyncDiff:加速SD模型的运行速度

    通用且即插即用的加速方案AsyncDiff:加速SD模型的运行速度

    新加坡国立大学推出通用且即插即用的加速方案AsyncDiff,它能够显著加速扩散模型(diffusion models)的运行速度。扩散模型是一种强大的生成模型,能够创造出各种数据,比如图片和视频,但...
    新技术# AsyncDiff# SD模型
    2年前
    07250
    一维(1D)标记化技术TiTok:用极少的标记(tokens)来表示和生成高分辨率图像

    一维(1D)标记化技术TiTok:用极少的标记(tokens)来表示和生成高分辨率图像

    字节跳动和慕尼黑工业大学的研究人员推出新型图像表示方法TiTok,它通过一种新颖的一维(1D)标记化技术,用极少的标记(tokens)来表示和生成高分辨率图像。这种方法与传统的二维(2D)图像标记化方...
    新技术# TiTok# 一维标记化
    2年前
    08530
    创新系统SEE-2-SOUND:为静态图片或动态视频生成与之匹配的立体声效果,增强观众的沉浸感和体验

    创新系统SEE-2-SOUND:为静态图片或动态视频生成与之匹配的立体声效果,增强观众的沉浸感和体验

    多伦多大学、Temerty 人工智能研究与医学教育中心和Sunnybrook 研究所的研究人员推出创新系统SEE-2-SOUND,它能够将视觉内容(如图片或视频)转换成具有空间感的音频输出。简单来说...
    新技术# SEE-2-SOUND# 立体声
    2年前
    05850
    新型多模态DiT模型AV-DiT:生成既有视觉画面又有声音的高质量视频

    新型多模态DiT模型AV-DiT:生成既有视觉画面又有声音的高质量视频

    来自多伦多大学、德克萨斯大学达拉斯分校和Adobe研究中心的研究人员推出新型多模态扩散变换器AV-DiT(Audio-Visual Diffusion Transformer),它专门设计用于联合生成...
    新技术# AV-DiT# DiT模型
    2年前
    06630
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    人生 K 线

    人生 K 线

    人生 K 线(Life Destiny K-Line)是一个结合传统八字命理与现代大语言模型(LLM)的轻量级可视化工具。它将一个人从 1 岁到 100 岁的运势走势,以类似股票 K 线图的形式呈现,试图用数据可视化的方式“翻译”命理推演结果。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    MiniMax开放平台

    MiniMax开放平台

    MiniMax 是一个多模态 AI 技术的领导者,其强大的计算能力和丰富的功能使其成为企业和开发者的重要工具。无论是文本生成、语音合成还是视频制作,MiniMax 都能提供高质量的解决方案,助力用户实现技术创新和商业价值的最大化。
    Poe API

    Poe API

    Quora 旗下的 AI 聚合平台 Poe 正式推出 开发者 API,允许开发者通过统一接口,调用平台上超过 100 款文本、图像、语音和视频生成模型。
    AI Art Pics

    AI Art Pics

    AI Art Pics 是一个免费、开源、持续更新的 AI 图像提示词灵感库,目前已收录 5000+ 条真实可用的提示词,覆盖 20+ 创意领域,支持 Midjourney、Stable Diffusion、Gemini、ChatGPT 等主流模型。
    Hume AI

    Hume AI

    Hume AI 是一家专注于先进 AI 语音技术的研究实验室和技术公司,使命是确保AI的开发服务于人类目标和情感福祉。通过构建能够以共情方式进行交流并学习如何让人们感到快乐的 AI 模型,Hume 正在重新定义语音交互的未来。
    查看完整榜单