新技术

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

多内容数据集ImagiNet：为了提高合成图像检测的泛化能力而设计

保加利亚大特尔诺沃自然科学与数学高中、索非亚大学、保加利亚普罗夫迪夫数学高中和斯坦福大学的研究人员推出多内容数据集ImagiNet，它是为了提高合成图像检测的泛化能力而设计的。合成图像是由计算机生成的...

新技术 # ImagiNet # 数据集

2年前

06540

新型AI方法DIVA：使用扩散模型作为 CLIP 视觉辅助

中国科学院自动化研究所、中国科学院大学人工智能学院、北京人工智能研究院和北京交通大学的研究人员推出新型人工智能方法DIVA，它旨在提升一种流行的图像和语言联合预训练模型CLIP的视觉识别能力。CLI...

新技术 # CLIP 视觉辅助 # DIVA

2年前

08120

用于生成长视频的模型FreeLong：在不增加额外训练成本的情况下，让现有的短视频生成模型处理更长的视频内容

悉尼科技大学和浙江大学的研究人员推出一种用于生成长视频的模型FreeLong，它可以在不增加额外训练成本的情况下，让现有的短视频生成模型处理更长的视频内容，同时保持或提升视频的质量。FreeLong是...

新技术 # FreeLong # 视频生成模型

2年前

01,2360

新型图像处理技术Diffree：根据文本提示，在图像中添加新的对象

厦门大学多媒体可信感知与高效计算教育部重点实验室、上海人工智能实验室OpenGVLab和香港大学推出新型图像处理技术Diffree，它能够根据文本提示，在图像中添加新的对象。这项技术就像是给照片“填空...

新技术 # Diffree # 图像处理

2年前

06550

个性化图像生成新方法ViPer: 通过个体偏好学习实现生成模型的视觉个性化

瑞士联邦理工学院的研究人员推出一种个性化生成模型输出的方法ViPer，它可以让生成模型（比如用来生成图片的AI）根据个人的喜好来定制生成的内容。这是通过一次性捕捉用户的总体偏好，并在无需详细工程化提示...

新技术 # ViPer # 个性化图像生成

2年前

05900

专为人体图像动画设计的大规模高质量数据集HumanVid：结合了精心挑选的真实世界数据和合成数据

香港中文大学和上海人工智能实验室的研究人员推出HumanVid，它旨在揭开用于生成逼真人物视频动画的训练数据的神秘面纱。HumanVid是首个为人物图像动画量身定制的大规模、高质量的数据集，它结合了精...

新技术 # HumanVid

2年前

09340

文生图风格化工具Artist：无需训练即可实现美学控制的文本驱动风格化

香港理工大学的研究人员推出一种无需训练即可实现美学控制的文本驱动风格化方法Artist。简而言之，Artist能够根据文本描述，将一张静态图片转换成具有特定艺术风格的图像，同时保持图片内容的完整性和细...

新技术 # Artist # 风格化

2年前

08350

视觉布局CGB-DM：基于Transformer的扩散模型的内容与图形平衡布局生成方法

清华大学的研究人员推出基于Transformer的扩散模型的内容与图形平衡布局生成方法CGB-DM，简单来说，CGB-DM是一个智能设计系统，它可以根据文本描述生成既美观又和谐的视觉布局。这就像是给一...

新技术 # CGB-DM # 视觉布局

2年前

08850

高度一致且可控制运动的图像动画生成方法Cinemo：将一张静态图片转换成一段视频，并且在转换过程中保持图片原有的细节信息

莫纳什大学、上海人工智能实验室和南京邮电大学的研究人员推出Cinemo，它是一种用于图像动画化（也称为图像到视频生成，I2V）的新型方法。简单来说，Cinemo能够将一张静态图片转换成一段视频，并且在...

新技术 # Cinemo # 图像动画

2年前

06240

新型多模态大语言模型INF-LLaVA：专门设计用于处理高分辨率图像，以提高模型对视觉和语言信息的理解能力

厦门大学的研究人员推出新型多模态大语言模型INF-LLaVA，它专门设计用于处理高分辨率图像，以提高模型对视觉和语言信息的理解能力。在人工智能领域，处理高分辨率图像一直是一个挑战，因为这些图像包含的细...

新技术 # INF-LLaVA # 多模态大语言模型

2年前

06370

基于扩散模型的2D虚拟试穿框架OutfitAnyone：通过上传自己的照片和想要试穿的衣服图片，就能在线看到衣服穿在自己身上的样子

阿里巴巴和中国科学技术大学的研究人员推出新的虚拟试穿技术OutfitAnyone，它是一个基于扩散模型的2D虚拟试穿框架。Outfit Anyone 通过利用双流条件扩散模型解决了这些局限性，使其能够...

新技术 # OutfitAnyone # 虚拟试穿

2年前

05120

新型视频生成框架MovieDreamer：专门用于制作长篇视频内容，比如电影

浙江大学和阿里巴巴的研究人员推出新型视频生成框架MovieDreamer，专门用于制作长篇视频内容，比如电影。与传统的短时视频生成技术不同，MovieDreamer能够处理复杂的叙事结构和情节发展，同...

新技术 # MovieDreamer # 视频生成框架

2年前

09620

加载更多