SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 958 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    人类偏好优化技术NCPPO:改善文生图模型,使其生成的图像更加符合人类的偏好

    人类偏好优化技术NCPPO:改善文生图模型,使其生成的图像更加符合人类的偏好

    俄罗斯国家研究型高等经济大学的研究人员推出新方法NCPPO,它用于改善文本到图像的扩散模型(Diffusion Models),使其生成的图像更加符合人类的偏好。扩散模型是一种生成模型,它们通过逐步去...
    新技术# NCPPO# 人类偏好# 文生图模型
    2年前
    05980
    AniClipart:根据文本提示将静态的剪贴画转换成动画

    AniClipart:根据文本提示将静态的剪贴画转换成动画

    香港城市大学和莫纳什大学的研究人员推出AniClipart,它能够根据文本提示将静态的剪贴画(clipart)转换成动画。剪贴画是一种预先制作的图形艺术形式,通常用于快速增强视觉内容。传统的剪贴画动画...
    新技术# AniClipart
    2年前
    05980
    LoRA:为解决大语言模型微调而开发

    LoRA:为解决大语言模型微调而开发

    微软的研究人员于2021年推出LoRA(Low-Rank Adaptation of Large Language Models,大语言模型的低阶适应),这是为解决大语言模型微调而开发的一项技术,用于...
    新技术# Lora# 大语言模型# 微软
    2年前
    05980
    小鹏科技推出通用视频编辑框架AiAS:将任何物体无缝插入到动态视频

    小鹏科技推出通用视频编辑框架AiAS:将任何物体无缝插入到动态视频

    小鹏科技推出通用框架“Anything in Any Scene(AiAS)”,用于创建逼真视频模拟的方法,可以将任何物体无缝插入到现有的动态视频中。这种方法特别强调物理真实性,包括几何真实性、光照真...
    新技术# AiAS# 小鹏科技# 视频编辑
    2年前
    05980
    图像修补任务Reflecting Reality:专门用于创建逼真的镜面反射

    图像修补任务Reflecting Reality:专门用于创建逼真的镜面反射

    印度理工学院班加罗尔分校视觉与人工智能实验室、三星印度研发中心和牛津大学视觉几何组的研究人员推出Reflecting Reality,它专门用于创建逼真的镜面反射。简单来说,可以处理给定的图片,自动在...
    新技术# Reflecting Reality# 镜面反射
    1年前
    05960
    GenXD:能够从任意数量的条件图像生成高质量的3D和4D场景

    GenXD:能够从任意数量的条件图像生成高质量的3D和4D场景

    近年来,2D视觉生成取得了显著成功,但在3D和4D生成方面,由于缺乏大规模数据和有效的模型设计,实际应用仍然具有挑战性。新加坡国立大学和微软的研究人员推出了一个名为GenXD的模型,它能够从任意数量的...
    新技术# 3D# GenXD
    1年前
    05950
    新型蒸馏技术iCD:提升文本引导的图像编辑任务中的图像生成和编辑能力

    新型蒸馏技术iCD:提升文本引导的图像编辑任务中的图像生成和编辑能力

    俄罗斯Yandex Research和高等经济大学的研究人员推出新型蒸馏技术Invertible Consistency Distillation(iCD),它用于提升文本引导的图像编辑任务中的图像生...
    新技术# iCD# 蒸馏技术
    2年前
    05950
    大型重建模型Real3D:利用单视图真实世界图像进行3D重建

    大型重建模型Real3D:利用单视图真实世界图像进行3D重建

    德克萨斯大学奥斯汀分校的研究人员推出Real3D,它是首个能够使用单视图真实世界图像进行训练的大型重建模型(Large Reconstruction Model,简称LRM)。Real3D通过自训练框...
    新技术# 3D模型# Real3D
    2年前
    05950
    高效稀疏注意力机制 SpargeAttn:加速大模型的推理过程,同时不损失模型性能

    高效稀疏注意力机制 SpargeAttn:加速大模型的推理过程,同时不损失模型性能

    清华大学和加州大学伯克利分校的研究人员推出高效稀疏注意力机制 SpargeAttn,旨在加速大模型的推理过程,同时不损失模型性能。注意力机制在现代深度学习模型中扮演着重要角色,但由于其计算复杂度与序列...
    新技术# SpargeAttn# 加州大学伯克利分校# 清华大学
    1年前
    05920
    创新系统SEE-2-SOUND:为静态图片或动态视频生成与之匹配的立体声效果,增强观众的沉浸感和体验

    创新系统SEE-2-SOUND:为静态图片或动态视频生成与之匹配的立体声效果,增强观众的沉浸感和体验

    多伦多大学、Temerty 人工智能研究与医学教育中心和Sunnybrook 研究所的研究人员推出创新系统SEE-2-SOUND,它能够将视觉内容(如图片或视频)转换成具有空间感的音频输出。简单来说...
    新技术# SEE-2-SOUND# 立体声
    2年前
    05900
    DiLightNet:用于文生图模型图像生成过程中对照明效果精细控制

    DiLightNet:用于文生图模型图像生成过程中对照明效果精细控制

    来自浙江大学、微软亚洲研究院、威廉玛丽学院和清华大学的研究人员提出一种新方法DiLightNet,它用于在基于文本提示的扩散模型图像生成过程中实现精细的照明控制。 论文地址 扩散模型是一种能够根据文本...
    新技术# DiLightNet# 照明效果
    2年前
    05900
    个性化图像生成新方法ViPer: 通过个体偏好学习实现生成模型的视觉个性化

    个性化图像生成新方法ViPer: 通过个体偏好学习实现生成模型的视觉个性化

    瑞士联邦理工学院的研究人员推出一种个性化生成模型输出的方法ViPer,它可以让生成模型(比如用来生成图片的AI)根据个人的喜好来定制生成的内容。这是通过一次性捕捉用户的总体偏好,并在无需详细工程化提示...
    新技术# ViPer# 个性化图像生成
    2年前
    05890
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    悟空

    新悟空

    阿里巴巴发布全球首个企业级AI原生工作平台——“悟空”,让每个团队、每家公司,都能拥有一支24h工作的“龙虾军团”。悟空是一款独立应用,即日起开启邀测,也将直接内置到超2000万企业组织的钉钉之中。
    ArkClaw

    ArkClaw

    字节旗下火山引擎正式上线 ArkClaw, 开箱即用的云上 SaaS 版 OpenClaw。无需任何复杂配置,打开网页即可使用 7×24 小时在线的 AI 助手。
    Joker of Academics(小丑学术期刊 )

    Joker of Academics(小丑学术期刊 )

    Joker 🤡 of Academics(小丑学术期刊 ) 是一本完全经过同行评审的开放获取期刊,致力于严肃研究非严肃的学术成果。我们发表敢于风趣的严谨研究、不知何故居然行得通的荒诞主义方法论,以及应用于可能并不需要它的领域的批判理论。
    Loomy

    新Loomy

    科大讯飞正式发布基于AstronClaw打造的桌面AI助理Loomy。Loomy面向本地办公场景,支持文件整理、内容创作、数据分析、网页操作、邮件处理等多步骤任务自动执行。
    QClaw

    QClaw

    腾讯推出QClaw ,这是基于 OpenClaw 进行深度产品化封装的“官方一键安装包”。它的目标非常明确:让强大的 AI Agent 能力,像安装普通软件一样简单,并直接融入中国人的国民级应用——微信和 QQ。
    查看完整榜单