新技术

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

AI视频生成系统Direct-a-Video：像导演拍摄视频一样生成视频

Direct-a-Video是一个AI视频生成系统，该系统允许用户独立地为一个或多个对象和/或相机运动指定运动，就像导演拍摄视频一样。项目主页开发者提出了一种简单而有效的策略，用于分别控制对象运动...

新技术 # AI视频生成 # Direct-a-Video

2年前

06080

个性化图像生成新方法InstantFamily：在零样本的情况下，根据多个身份标识（Multi-ID）生成个性化的图像

韩国SK电信推出个性化图像生成新方法InstantFamily，它能够在零样本（zero-shot）的情况下，根据多个身份标识（Multi-ID）生成个性化的图像。这项技术特别适用于创建包含多个人物的...

新技术 # InstantFamily # 个性化图像生成

2年前

06070

新颖图像和视频处理框架MaGGIe：用于实现人类图像的精确分割，从图像和视频中提取人物前景

来自马里兰大学和Adobe的研究人员推出新的图像和视频处理技术MaGGIe（Masked Guided Gradual Human Instance Matting），它用于实现人类图像的精确分割...

新技术 # MaGGIe # 图像分割 # 抠图

2年前

06070

基于偏好学习的奖励模型VADER：让模型更有效地学习如何生成符合特定要求的视频

卡内基梅隆大学的研究人员推出奖励模型（一种基于偏好学习的方法）VADER，来指导视频生成过程，从而让模型更有效地学习如何生成符合特定要求的视频。例如，你想要生成一段描述“一只穿着红色外套、拿着雪球的浣...

新技术 # VADER # 奖励模型

2年前

06060

开源自回归图像生成模型Open-MAGVIT2

腾讯ARC 实验室、清华大学和南京大学推出开源自回归图像生成模型Open-MAGVIT2 ，它致力于推广自回归视觉生成模型的使用。自回归模型是一种人工智能技术，可以根据一系列给定的数据点预测下一个数据...

新技术 # Open-MAGVIT2

2年前

06040

文生图定制模型Pair Customization：从单一图像对中学习风格差异，并随后将习得的风格应用于生成过程中

来自卡内基梅隆大学和东北大学的研究人员推出新定制方法Pair Customization，该方法从单一图像对中学习风格差异，并随后将习得的风格应用于生成过程中。这是一款使用一对图像（一个原始图像和一个...

新技术 # Pair Customization # 文生图定制模型

2年前

06040

图像编辑新方法DICE：用于改进离散扩散模型在可控编辑任务中的性能

罗格斯大学、麻省理工学院-IBM Watson AI 实验室、谷歌 DeepMind、NEC 美国实验室、纽约大学、沃尔玛全球科技公司、澳大利亚国立大学和麻省理工学院阿灵顿分校的研究人员推出图像编...

新技术 # DICE # 图像编辑

1年前

06030

具有光照感知能力的扩散模型Relightful Harmonization

来自Adobe和纽约大学的研究人员推出具有光照感知能力的扩散模型Relightful Harmonization，这是一种先进的图像处理方法，专门用于在更换人像照片背景时，保持前景人物与新背景之间的光...

新技术 # Relightful Harmonization # 光影

2年前

06030

阿里推出新型视频生成框架I4VGen：无需训练且即插即用的视频扩散推理框架

阿里推出新型视频生成框架I4VGen，这是一个无需训练（training-free）且即插即用（plug-and-play）的视频扩散推理框架，它通过强化图像技术来提升文本到视频（text-to-vi...

新技术 # I4VGen # 视频生成框架

2年前

06020

深度估算模型Depth Anything：让照片自动感知空间距离

来自香港大学、TikTok、浙江实验室、浙江大学的研究人员推出了深度估算模型Depth Anything，它是一个用于单目深度估计（Monocular Depth Estimation, MDE）的实...

新技术 # Depth Anything # 深度估算模型

2年前

06020

FlashFace：允许用户通过提供一张或几张参考面部图像和文本提示来个性化他们的照片

来自香港大学、阿里和蚂蚁的研究团队推出FlashFace，它允许用户通过提供一张或几张参考面部图像和文本提示来个性化他们的照片。项目主页：https://jshilong.github.io/fla...

新技术 # FlashFace # 个性化

2年前

06010

全新LoRA训练方法ADDifT（交替直接差分训练）

背景与动机 LoRA（低秩适应）是一种参数高效的微调技术，广泛用于大语言模型和扩散模型（如Stable Diffusion）的定制化训练。然而，传统LoRA训练方法存在效率低和易学到无关特征（如背景或...

新技术 # ADDifT # Lora # LoRA模型

1年前

05990

加载更多