diffusion-e2e-ft:通过微调图像条件扩散模型来简化和提高单目深度估计的效率亚琛工业大学和埃因霍温理工大学的研究人员推出diffusion-e2e-ft,通过微调图像条件扩散模型来简化和提高单目深度估计的效率。单目深度估计是指仅使用一张图片来预测场景中每个像素的深度信息。这项...新技术# diffusion-e2e-ft# 单目深度估计1年前06080
北京人工智能研究院推出新型图像生成模型OmniGen北京人工智能研究院推出新型图像生成模型OmniGen,与流行的扩散模型(例如,Stable Diffusion)不同,OmniGen不再需要额外的模块,如ControlNet或IP-Adapter来处...新技术# OmniGen# 图像生成模型1年前04500
Jina AI推出新型文本嵌入模型 jina-embeddings-v3:专为多语言数据和长文本检索任务优化Jina AI推出文本嵌入模型 jina-embeddings-v3,这是一个具有 5.7 亿参数的新型文本嵌入模型,它在多语言数据和长上下文检索任务上实现了最先进的性能,支持的最大上下文长度达到 8...新技术# jina-embeddings-v3# 文本嵌入模型1年前04440
音乐生成系统Seed-Music:能够创作出高质量的音乐,并且可以根据用户的细致要求来调整音乐的风格和内容字节跳动旗下豆包团队推出音乐生成系统Seed-Music,能够创作出高质量的音乐,并且可以根据用户的细致要求来调整音乐的风格和内容。Seed-Music结合了自回归语言建模和扩散方法,支持两种关键的音...新技术# Seed-Music# 音乐生成1年前04630
图像编辑方法Click2Mask:通过简单的点击来实现对图片的局部编辑,而不需要复杂的遮罩或详细的描述耶路撒冷希伯来大学的研究人员推出图像编辑方法Click2Mask,它能够让用户通过简单的点击来实现对图片的局部编辑,而不需要复杂的遮罩或详细的描述。总的来说,Click2Mask提供了一种直观且高效的...新技术# Click2Mask# 图像编辑1年前04560
DrawingSpinUp:将单一的平面角色绘画转换成三维动画,同时保留了原始艺术作品的风格和特征香港城市大学的研究人员推出创新系统DrawingSpinUp,它能够将单一的平面角色绘画转换成三维动画,同时保留了原始艺术作品的风格和特征。这就像是给一张静态的画注入生命,让它动起来,比如让一个纸上的...新技术# DrawingSpinUp1年前04380
图像编辑框架InstantDrag:通过简单的拖拽操作来编辑图片,就像在手机上操作APP一样直观和快速首尔国立大学和浦项科技大学的研究人员推出图像编辑框架InstantDrag,它能够让用户通过简单的拖拽操作来编辑图片,就像在手机上操作APP一样直观和快速。例如,你有一张图片,你想要移动图片中的某个部...新技术# InstantDrag# 图像编辑1年前04550
针对文生图模型的一次性个性化定制技术TextBoost:使用单个参考图像,通过微调文本编码器,来生成与文本提示相匹配的定制化图像韩国科学技术院推出一种针对文本到图像模型的一次性个性化定制技术TextBoost,这种方法使用单个参考图像,通过微调文本编码器,来生成与文本提示相匹配的定制化图像。例如,你想要通过一段描述来生成一张图...新技术# TextBoost# 个性化定制# 文生图模型1年前05460
IFAdapter:提升基于文本生成图像的扩散模型在生成多个实例时的精确度和细节控制能力而设计腾讯PCG和新加坡国立大学的研究人员推出新型方法IFAdapter,它是为了提升基于文本生成图像(Text-to-Image,简称T2I)的扩散模型在生成多个实例时的精确度和细节控制能力而设计的。简单...新技术# IFAdapter1年前04720
新型高分辨率图像到3D生成框架Hi3D:将单张2D图片转换成具有高分辨率纹理细节的3D模型复旦大学计算机学院、新加坡管理大学和智象未来的研究人员推出新型高分辨率图像到3D生成框架Hi3D,Hi3D 的目标是将单张2D图片转换成具有高分辨率纹理细节的3D模型。这就像给一个平面的照片施魔法,让...新技术# 3D# 3D模型# Hi3D1年前05090
新型高效微调方法SaRA:用于提升预训练扩散模型(SD 1.5、SD 2.0和SD 3.0)在新任务上的表现上海交通大学和腾讯优图实验室的研究人员推出新型高效微调方法SaRA,用于提升预训练扩散模型在新任务上的表现。扩散模型是一种强大的生成模型,能够生成图像、视频和3D模型等。但这些模型通常需要大量的参数...新技术# SaRA# 微调模型1年前05690
开源自回归图像生成模型Open-MAGVIT2 腾讯ARC 实验室、清华大学和南京大学推出开源自回归图像生成模型Open-MAGVIT2 ,它致力于推广自回归视觉生成模型的使用。自回归模型是一种人工智能技术,可以根据一系列给定的数据点预测下一个数据...新技术# Open-MAGVIT21年前06000