SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    新技术

    共 962 篇文章
    百科工具模型ComfyUIAI合集web UI提示词
    教程新技术硬件科普早报
    排序
    发布更新浏览点赞
    多模态框架FakeShield:通过多模态大语言模型评估图像的真实性,用于检测AI及PS图片

    多模态框架FakeShield:通过多模态大语言模型评估图像的真实性,用于检测AI及PS图片

    生成式AI的快速发展为内容创作带来了巨大便利,但同时也使得图像篡改变得更加容易且难以检测。当前的图像伪造检测和定位(IFDL)方法虽然通常有效,但仍面临两大挑战: 黑箱性质:检测原理未知,难以理解和解...
    新技术# FakeShield# 多模态框架
    1年前
    06550
    4D 场景纹理化Tex4D:使用视频扩散模型为未纹理化的动画网格序列生成多视图、时间一致的 4D 纹理

    4D 场景纹理化Tex4D:使用视频扩散模型为未纹理化的动画网格序列生成多视图、时间一致的 4D 纹理

    来自香港中文大学(深圳)、NVIDIA 和加州大学默塞德分校的研究人员开发了 Tex4D,这是一种零样本方法,使用视频扩散模型为未纹理化的动画网格序列生成多视图、时间一致的 4D 纹理。简单来说,如果...
    新技术# 4D 场景# 4D 纹理# Tex4D
    1年前
    03790
    FlexGen框架:能够根据单一视角的图像、文本提示或两者的结合来灵活生成可控制且一致的多视图图像

    FlexGen框架:能够根据单一视角的图像、文本提示或两者的结合来灵活生成可控制且一致的多视图图像

    来自香港科技大学(广州)、香港科技大学和趣玩的研究人员开发了一个名为FlexGen的框架,它能够根据单一视角的图像、文本提示或两者的结合来灵活生成可控制且一致的多视图图像。想象一下,你给FlexGen...
    新技术# FlexGen
    1年前
    04610
    结合了大语言模型与文生图模型的新框架SGEdit:用于基于场景图的精确和灵活的图像编辑

    结合了大语言模型与文生图模型的新框架SGEdit:用于基于场景图的精确和灵活的图像编辑

    场景图提供了一种结构化、层次化的图像表示方式,其中节点和边分别代表图像中的对象及其相互关系。这种方式不仅能够帮助用户更直观地理解图像内容,还能作为图像编辑的有效接口,极大提升了编辑工作的准确性和灵活性...
    新技术# SGEdit# 图像编辑# 大语言模型
    1年前
    04670
    GS^3:从多视角点光源输入图像中实时合成高质量的新光照和视图

    GS^3:从多视角点光源输入图像中实时合成高质量的新光照和视图

    浙江大学CAD与CG国家重点实验室推出一种新技术,用于从多视角点光源输入图像中实时合成高质量的新光照和视图。他们的方法称为 GS^3,使用基于空间和角度的高斯表示,并结合三重 splatting 过程...
    新技术# GS^3# 多视角点光源
    1年前
    04030
    新型图像生成技术“集合自回归模型”(SAR):通过改变图像生成的顺序和方式,使得生成图像的速度和灵活性都得到了极大的提升

    新型图像生成技术“集合自回归模型”(SAR):通过改变图像生成的顺序和方式,使得生成图像的速度和灵活性都得到了极大的提升

    香港中文大学MMLab 、上海人工智能实验室和南京大学的研究人员推出一种新的图像生成技术“集合自回归模型”(Set AutoRegressive Modeling,简称SAR)。你可以把它想象成一个超...
    新技术# SAR# 图像生成# 集合自回归模型
    1年前
    04280
    新型条件图像生成模型BiGR:不仅能创作出高质量的图像,还能理解和识别图像中的内容

    新型条件图像生成模型BiGR:不仅能创作出高质量的图像,还能理解和识别图像中的内容

    香港大学、香港科技大学、云天励飞和香港中文大学的研究人员介绍了一种名为BiGR(Binary Generative Representation)的新型条件图像生成模型。BiGR 使用紧凑的二进制潜在...
    新技术# BiGR# 条件图像生成模型
    1年前
    04860
    灵活视觉变换器FiT v2:根据给定的文本描述或已有的图像,生成高质量、高分辨率的新图像

    灵活视觉变换器FiT v2:根据给定的文本描述或已有的图像,生成高质量、高分辨率的新图像

    自然界的图像具有无穷的分辨率,而现有的扩散模型(如扩散变换器)在处理超出其训练领域的图像分辨率时常常面临挑战。为了解决这一限制,研究人员提出了一种新的视角,将图像概念化为具有动态大小的令牌序列,而不是...
    新技术# FiT v2# 灵活视觉变换器
    1年前
    04570
    非自回归扩散框架的动态帧化身DAWN:根据单一的肖像图像和语音音频剪辑生成生动、逼真的头部动画视频

    非自回归扩散框架的动态帧化身DAWN:根据单一的肖像图像和语音音频剪辑生成生动、逼真的头部动画视频

    中国科学技术大学和科大讯飞研究院的研究人员推出新框架DAWN,它能够根据单一的肖像图像和语音音频剪辑生成生动、逼真的头部动画视频。这项技术的核心在于使用非自回归(NAR)扩散模型来一次性生成动态长度的...
    新技术# DAWN# 头部动画
    1年前
    05150
    EvolveDirector 框架:通过使用公开可用的资源来训练一个能够与高级文生图模型相媲美的模型

    EvolveDirector 框架:通过使用公开可用的资源来训练一个能够与高级文生图模型相媲美的模型

    近年来,生成模型在生成高质量图像方面取得了显著进展,但大多数模型依赖于专有的高质量数据集,并且有些模型保留了其参数,只提供可访问的应用程序编程接口(APIs)。这限制了这些模型在下游任务中的应用。为了...
    新技术# EvolveDirector# 文生图模型
    1年前
    04830
    角色图像动画化Animate-X:基于潜在扩散模型(LDM)的通用动画框架,让图像上的角色动起来

    角色图像动画化Animate-X:基于潜在扩散模型(LDM)的通用动画框架,让图像上的角色动起来

    近年来,角色图像动画技术取得了显著进展,即从参考图像和目标姿态序列生成高质量视频。然而,大多数现有方法仅适用于人体,对拟人化角色(如卡通角色、游戏角色等)的泛化效果不佳。这种限制主要归因于对运动的建模...
    新技术# Animate-X# 角色图像动画化
    1年前
    03810
    新型框架Cavia:生成具有相机控制功能的多视角视频

    新型框架Cavia:生成具有相机控制功能的多视角视频

    德克萨斯大学奥斯汀分校、苹果和谷歌的研究人员推出新型框架Cavia,它能够生成具有相机控制功能的多视角视频。简单来说,Cavia可以根据一张图片和一些相机运动的指令,生成一系列从不同角度和时间点观察的...
    新技术# Cavia
    1年前
    04870
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    OpenMAIC

    OpenMAIC

    OpenMAIC是一个开源的 AI 互动课堂平台,能够将任何主题或文档转化为丰富的互动学习体验。基于多智能体协作引擎,它可以自动生成演示幻灯片、测验、交互式模拟实验和项目制学习活动——由 AI 教师和 AI 同学进行语音讲解、白板绘图,并与你展开实时讨论。内置 OpenClaw 集成,你还可以直接在飞书、Slack、Telegram 等聊天应用中生成课堂。
    S.H.I.T

    S.H.I.T

    在主流学术界为顶刊版面、高影响因子和“非升即走”的考核指标疯狂内卷之时,一场名为“学术垃圾”的反叛运动正在角落里悄然兴起。一群“想开了”的硕博研究生和青年学者(青椒),不再试图迎合传统的学术评价体系,而是隆重推出了一系列名字惊世骇俗的“旗舰”期刊——《SHIT》、《Notrue》、《Silence》、《Crazy》。
    悟空

    悟空

    阿里巴巴发布全球首个企业级AI原生工作平台——“悟空”,让每个团队、每家公司,都能拥有一支24h工作的“龙虾军团”。悟空是一款独立应用,即日起开启邀测,也将直接内置到超2000万企业组织的钉钉之中。
    LibTV

    LibTV

    LiblibAI正式推出AI视频创作产品LibTV,这是全球首个同时面向人类创作者与AI Agent(智能体) 的专业视频创作平台。区别于传统AI视频工具的线性时间轴和黑盒生成模式,LibTV搭建了“无限画布+节点工作流”的全新生态,让创作从“碰运气”变成“可控化”,从“单一人机操作”升级为“人机协同创作”。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    WebToApp

    WebToApp

    WebToApp 是一款完全开源的 Android 应用,允许你在手机端零代码完成网站、媒体资源或 HTML 项目到 APK 的转换与构建。无需电脑,无需 Android Studio,几分钟即可生成可安装、可分发的独立应用。
    查看完整榜单