新技术

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

用于保护个人肖像图像免受恶意生成编辑的新技术FaceLock

随着扩散模型的迅速发展，生成图像编辑变得更加普及，这不仅促进了创意表达，也引发了严重的伦理问题。特别是对人类肖像的恶意编辑，如深度伪造（deepfake）技术，威胁到了个人隐私和身份安全。为了应对这一...

新技术 # FaceLock

1年前

02570

图像修复模型ABAIR：在从受到未知退化影响的输入图像中恢复出高质量的图像

在图像处理领域，盲目的全功能图像恢复（Blind All-in-One Image Restoration, BAIR）旨在从未知失真退化的输入中恢复高质量的图像。然而，传统方法在训练阶段需要预先定义...

新技术 # ABAIR模型

1年前

02670

Omegance：用于控制基于扩散模型合成中细节粒度（granularity）的单一参数方法

南洋理工大学额研究人员推出Omegance，它是一种用于控制基于扩散模型合成中细节粒度（granularity）的单一参数方法。Omegance通过在扩散模型的反向去噪步骤中引入一个参数ω（omega...

新技术 # Omegance

1年前

02630

视频引导音效生成模型MultiFoley：根据多种模态的控制信号（包括文本、音频和视频）来生成与视频同步的声音效果

在影视制作、游戏开发和多媒体内容创作中，为视频添加恰当的音效是提升观众体验的重要环节。然而，创造既符合视觉场景又具有艺术感的音效往往需要耗费大量时间和专业技能。为了应对这一挑战，密歇根大学与Adobe...

新技术 # MultiFoley # 视频引导音效生成模型

1年前

02830

统一多模态框架UniPose：用于理解、生成和编辑人体姿态

中国科学院计算技术研究所和中国科学院大学的研究人员推出统一多模态框架UniPose，它用于理解、生成和编辑人体姿态。UniPose利用大语言模型（LLMs）来处理包括图像、文本和3D SMPL姿态在内...

新技术 # UniPose # 人体姿态 # 多模态

1年前

02910

个性化图像生成的高效、轻量级框架DreamCache：在不需要额外微调的情况下，通过特征缓存实现快速的个性化图像生成

在数字内容创作日益丰富的今天，个性化图像生成技术正逐渐成为各行业创新的关键。这项技术依赖于文本到图像的生成模型，它们能够识别并捕捉参考对象的核心特征，从而在各种情境中实现可控的图像生成。然而，现有的方...

新技术 # DreamCache # 个性化图像生成

1年前

02810

CoDe：提高视觉自回归（VAR）模型在图像生成任务中的效率

新加坡国立大学的研究人员推出一个名为“Collaborative Decoding（CoDe）”的新方法，旨在提高视觉自回归（Visual Auto-Regressive，简称VAR）模型在图像生成任...

新技术 # CODE # 视觉自回归模型

1年前

02640

3D高效框架Make-It-Animatable：将任意3D人物模型快速制作成可用于动画的角色

中国科学技术大学和腾讯的研究人员推出高效框架Make-It-Animatable，它用于将任意3D人物模型快速制作成可用于动画的角色。这个框架能够在不到一秒钟的时间内，无论3D模型的形状和姿势如何，都...

新技术 # 3D # Make-It-Animatable

1年前

03140

零样本（Zero-Shot）定制化图像生成新方法Diffusion Self-Distillation

斯坦福大学的研究人员推出Diffusion Self-Distillation，这是一种基于扩散模型的技术，用于零样本（Zero-Shot）定制化图像生成。这种方法可以在不需要额外推理阶段训练的情况下...

新技术 # Diffusion Self-Distillation # DSD

1年前

02620

CAT4D：用于从单目视频创建4D（动态3D）场景

Google DeepMind、哥伦比亚大学和加州大学圣地亚哥分校的研究人员推出创新技术CAT4D，用于从单目视频创建4D（动态3D）场景。CAT4D利用多视图视频扩散模型，结合多种数据集进行训练，以...

新技术 # CAT4D

1年前

02560

Free^2Guide：无梯度框架提升文本到视频（T2V）生成中的文本对齐

扩散模型在文本到图像（T2I）和文本到视频（T2V）合成等生成任务中取得了显著成果。然而，在T2V生成中，实现准确的文本对齐仍然是一个具有挑战性的问题，尤其是在处理帧间复杂的时序依赖性时。现有的基于强...

新技术 # Free^2Guide # 视频生成

1年前

03080

ROICtrl：通过区域实例控制增强扩散模型的多实例生成

自然语言在描述复杂场景时，尤其是在准确地将位置和属性信息与多个实例关联方面，常常遇到困难。这限制了当前基于文本的视觉生成模型，使其只能生成包含少数主导实例的简单组合。为了解决这一限制，新加坡国立大学...

新技术 # ROICtrl

1年前

02820

加载更多