针对图生图模型的machine unlearning(机器遗忘)框架来自美国德克萨斯大学奥斯汀分校和摩根大通全球技术应用研究中心的研究人员推出了一种针对图生图模型的machine unlearning(机器遗忘)框架,能够在不损害模型性能的前提下,有效地从模型中移除特...新技术# Machine Unlearning# 机器遗忘2年前05590
3D网格模型生成框架AToM来自Snap、沙特阿卜杜拉国王科技大学、多伦多大学的研究人员推出一款3D模型生成框架AToM(Amortized Text-to-Mesh),AToM的核心特点是能够同时优化多个文本提示(prompt...新技术# 3D网格模型# AToM2年前04880
北大团队推出多模态混合专家模型MoE-LLaVA来自北大的研究人员推出多模态的混合专家模型MoE-LLaVA,旨在通过一种新颖的训练策略,有效地提高模型在处理视觉和语言任务时的性能,同时保持计算成本的稳定。 GitHub Demo 论文 此模型只有...新技术# MoE-LLaVA# 北大# 多模态混合专家模型2年前05570
开源图像标注模型JoyTag:没有任何过滤和审查JoyTag是一个机器学习研究者推出的开源图像标注模型,该模型是在Danbooru 2021 + 手动标记的图像数据集上训练的,对训练的内容和标签没有任何过滤和审查,适用于从手绘到摄影的各种图像,在处...新技术# JoyTag# 图像标注模型# 开源2年前06430
图像超分辨率技术SeeSR:保持生成的高分辨率图像的语义准确性来自香港理工大学、OPPO、字节跳动的研究人员推出图像超分辨率技术SeeSR,它利用语义提示来增强预训练的文本到图像(T2I)扩散模型在处理现实世界图像超分辨率问题时的性能。这种方法特别关注于在图像质...新技术# SeeSR# 图像超分辨率2年前07090
图像修复模型InstructIR:按照人类指令进行高质量图像修复来自维尔茨堡大学计算机视觉实验室、索尼PlayStation旗下FTG团队的研究人员推出一款图像修复模型InstructIR,它能够根据人类编写的指令来修复和增强图像。简单来说,一张因为雨滴而模糊的招...新技术# InstructIR# 图像修复模型2年前05190
图像超分辨率技术StableSR:将低分辨率的图像转换为高分辨率的图像StableSR是来自南洋理工大学S实验室的研究人员开发的图像超分辨率技术,它可以将低分辨率的图像转换为高分辨率的图像。简单来说,这项技术可以让你看到的图片变得更加清晰和详细。 我们可以用一个生活中的...新技术# StableSR# 超分辨率2年前07540
小鹏科技推出通用视频编辑框架AiAS:将任何物体无缝插入到动态视频小鹏科技推出通用框架“Anything in Any Scene(AiAS)”,用于创建逼真视频模拟的方法,可以将任何物体无缝插入到现有的动态视频中。这种方法特别强调物理真实性,包括几何真实性、光照真...新技术# AiAS# 小鹏科技# 视频编辑2年前05900
3D场景编辑方法ReplaceAnything3D(RAM3D):通过文本提示在3D场景中替换特定的物体来自Meta、伦敦大学的研究人员推出一种基于文本引导的3D场景编辑方法ReplaceAnything3D(RAM3D),它允许用户通过文本提示在3D场景中替换特定的物体。这种方法结合了预训练的文本引导...新技术# 3D场景编辑# RAM3D# ReplaceAnything3D2年前05950
谷歌研究团队推出专为移动设备打造的文生图模型MobileDiffusion谷歌的研究团队推出了新的文生图模型MobileDiffusion,它能够在手机上几乎瞬间(亚秒级)生成高质量的图片。该模型在架构和采样技术方面进行广泛优化,在iPhone 15 Pro上,Mobile...新技术# MobileDiffusion# 安卓# 扩散模型2年前07580
全新生成模型StableIdentity:只需一张人脸照片,快速生成不同风格的人物照片、视频来自大连理工大学、ZMO AI的研究人员提出了一种全新的图像、视频和3D定制生成模型StableIdentity,它能够将任何人的面部特征稳定地融入到各种不同的场景中。这项技术的核心在于,它能够通过一...新技术# StableIdentity# 生成模型2年前07830
高效灵活的对象检测工具YOLO-World来自腾讯AI实验室、华中科技大学EIC学院的研究人员推出高效实时开放词汇对象检测框架YOLO-World,旨在通过视觉语言模型和大规模数据集的预训练,增强YOLO(You Only Look Once...新技术# YOLO-World# 对象检测工具# 腾讯AI实验室2年前09680