SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 958 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    一种在推理阶段组合定制扩散模型的新方法TweedieMix:用于改进多概念融合在基于扩散的图像和视频生成中的应用

    一种在推理阶段组合定制扩散模型的新方法TweedieMix:用于改进多概念融合在基于扩散的图像和视频生成中的应用

    KRAFTON和韩国科学技术研究院AI研究生院的研究人员推出一种在推理阶段组合定制扩散模型的新方法TweedieMix,它用于改进多概念融合在基于扩散的图像和视频生成中的应用。简单来说,Tweedie...
    新技术# TweedieMix# 扩散模型
    1年前
    04780
    基于文本的编辑框架TurboEdit:能够使用极少的几步就能基于文本指令编辑真实图片

    基于文本的编辑框架TurboEdit:能够使用极少的几步就能基于文本指令编辑真实图片

    特拉维夫大学的研究人员推出一种流行的基于文本的编辑框架TurboEdit,它能够使用极少的几步就能基于文本指令编辑真实图片。这种技术利用了所谓的“扩散模型”(diffusion models),这是一...
    新技术# TurboEdit# 图像编辑# 编辑框架
    2年前
    04780
    自适应投影引导APG:不牺牲图像质量的前提下,使用更高的指导尺度,从而生成更丰富、更真实的图像

    自适应投影引导APG:不牺牲图像质量的前提下,使用更高的指导尺度,从而生成更丰富、更真实的图像

    苏黎世联邦理工学院和迪士尼研究的研究人员推出自适应投影引导(APG),保留了CFG提高质量的优势,同时允许使用更高的引导比例而不产生过饱和。APG易于实现,并且实际上不会给采样过程带来额外的计算开销...
    新技术# APG# 自适应投影引导
    1年前
    04770
    IFAdapter:提升基于文本生成图像的扩散模型在生成多个实例时的精确度和细节控制能力而设计

    IFAdapter:提升基于文本生成图像的扩散模型在生成多个实例时的精确度和细节控制能力而设计

    腾讯PCG和新加坡国立大学的研究人员推出新型方法IFAdapter,它是为了提升基于文本生成图像(Text-to-Image,简称T2I)的扩散模型在生成多个实例时的精确度和细节控制能力而设计的。简单...
    新技术# IFAdapter
    2年前
    04750
    清华大学推出RIFLEx:解决视频扩散模型在生成更长视频时的时空连贯性问题

    清华大学推出RIFLEx:解决视频扩散模型在生成更长视频时的时空连贯性问题

    清华大学的研究人员推出RIFLEx,解决视频扩散模型在生成更长视频时的时空连贯性问题。该方法通过调整位置编码中的内在频率,有效抑制重复内容的生成,同时保持运动一致性,无需额外训练或修改模型。 项目主页...
    新技术# RIFLEx# 清华大学# 视频扩散模型
    12个月前
    04740
    3D生成框架ComboVerse:从单张图片中生成复杂的三维资产

    3D生成框架ComboVerse:从单张图片中生成复杂的三维资产

    来自南洋理工大学、上海人工智能实验室和香港中文大学的研究团队推出3D生成框架ComboVerse,它能够从单张图片中生成复杂的三维资产。 项目主页 首先,从模型和数据两个维度对“多物体差距”进行了深入...
    新技术# 3D# ComboVerse
    2年前
    04740
    可控图像到视频生成框架SG-I2V:用于在图像到视频的生成过程中实现对象和相机运动的控制

    可控图像到视频生成框架SG-I2V:用于在图像到视频的生成过程中实现对象和相机运动的控制

    图像到视频生成技术已经取得了显著的进步,能够生成高度逼真的视频。然而,调整生成视频中的特定元素,如物体运动或相机移动,通常需要繁琐的试错过程,例如使用不同的随机种子重新生成视频。最近的技术通过微调预训...
    新技术# SG-I2V# 视频生成
    1年前
    04730
    文本到纹理方法RoCoTex:用于生成高质量、一致性强的3D模型纹理

    文本到纹理方法RoCoTex:用于生成高质量、一致性强的3D模型纹理

    NCSOFT 图形 AI 实验室、韩国大学计算机科学与工程系和韩国中央大学图像系的研究人员推出一种稳健的文本到纹理方法RoCoTex,它是一种用于生成高质量、一致性强的3D模型纹理的方法。简单来说,R...
    新技术# 3D模型纹理# RoCoTex
    1年前
    04730
    新型视觉基础模型Lotus:使用扩散模型来生成高质量的密集预测结果

    新型视觉基础模型Lotus:使用扩散模型来生成高质量的密集预测结果

    香港科技大学(广州)、阿德莱德大学、诺亚方舟实验室和香港科技大学的研究人员推出新型视觉基础模型Lotus,它使用扩散模型来生成高质量的密集预测结果。简单来说,Lotus就像一个超级聪明的图像处理专家...
    新技术# Lotus# 视觉基础模型
    1年前
    04720
    新型文本到图像生成方法FRAP:基于自适应调整每个词汇的提示权重来改善生成图像与提示之间的一致性和真实性

    新型文本到图像生成方法FRAP:基于自适应调整每个词汇的提示权重来改善生成图像与提示之间的一致性和真实性

    阿尔伯塔大学电子与计算机工程系、华为技术加拿大公司和华为麒麟解决方案的研究人员推出新型文本到图像生成方法FRAP,旨在提高由文本提示生成图像的真实性和忠实度,确保生成的图像与文本描述的内容精确匹配。F...
    新技术# FRAP# 文生图
    2年前
    04720
    数据生成管道Gen4Gen:创建高质量的个性化图像和文本描述

    数据生成管道Gen4Gen:创建高质量的个性化图像和文本描述

    来自加州大学伯克利分校、牛津大学、哈佛大学、卡耐基梅隆大学、香港大学、加州大学戴维斯分校的研究人员推出数据生成管道Gen4Gen,它用于创建一个名为MyCanvas的数据集,旨在提高文本到图像扩散模型...
    新技术# Gen4Gen# 数据生成管道
    2年前
    04720
    3D对象生成和重建流程PartGen:可以从文本、图像或非结构化3D对象开始,生成由多个有意义部分组成的3D对象

    3D对象生成和重建流程PartGen:可以从文本、图像或非结构化3D对象开始,生成由多个有意义部分组成的3D对象

    近年来,文本到3D生成器和3D扫描仪技术取得了显著进展,能够生成高质量的3D资产。然而,这些资产通常由单一的融合表示组成,例如隐式神经场、高斯混合或网格,缺乏任何有用的结构。这种单一表示方式使得资产难...
    新技术# 3D对象# PartGen
    1年前
    04710
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    悟空

    新悟空

    阿里巴巴发布全球首个企业级AI原生工作平台——“悟空”,让每个团队、每家公司,都能拥有一支24h工作的“龙虾军团”。悟空是一款独立应用,即日起开启邀测,也将直接内置到超2000万企业组织的钉钉之中。
    OpenMAIC

    新OpenMAIC

    OpenMAIC是一个开源的 AI 互动课堂平台,能够将任何主题或文档转化为丰富的互动学习体验。基于多智能体协作引擎,它可以自动生成演示幻灯片、测验、交互式模拟实验和项目制学习活动——由 AI 教师和 AI 同学进行语音讲解、白板绘图,并与你展开实时讨论。内置 OpenClaw 集成,你还可以直接在飞书、Slack、Telegram 等聊天应用中生成课堂。
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    Meshy

    Meshy

    Meshy 是一款非常适合初学者和专业用户的 3D 模型生成工具。无论是快速建模、3D 打印还是动画设计,它都能轻松应对。如果你对 3D 模型创建感兴趣,不妨试试 Meshy,让生成式 AI 为你的创意插上翅膀!
    Joker of Academics(小丑学术期刊 )

    Joker of Academics(小丑学术期刊 )

    Joker 🤡 of Academics(小丑学术期刊 ) 是一本完全经过同行评审的开放获取期刊,致力于严肃研究非严肃的学术成果。我们发表敢于风趣的严谨研究、不知何故居然行得通的荒诞主义方法论,以及应用于可能并不需要它的领域的批判理论。
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    查看完整榜单