谷歌推出新型图像编辑工具Magic Insert:将一张图片中的主题(比如一个人或者一个物体)拖拽到另一张风格完全不同的图片上,并且让这个主题在新图片中看起来非常自然谷歌推出新型图像编辑工具Magic Insert,可以让我们像变魔术一样,将一张图片中的主题(比如一个人或者一个物体)拖拽到另一张风格完全不同的图片上,并且让这个主题在新图片中看起来非常自然,就像它本...新技术# Magic Insert# 图像编辑# 谷歌2年前07170
DreamReward:通过人类偏好反馈来提升从文本到3D内容生成的质量生数科技发布创新框架DreamReward,它专注于通过人类偏好反馈来提升从文本到3D内容生成(text-to-3D generation)的质量。它通过结合人类反馈和先进的机器学习技术,极大地提高了...新技术# 3D模型# DreamReward2年前07160
专门解读胸部X光片的图像模型CheXagent:帮助医生提高临床决策的效率和质量来自斯坦福大学和Stability AI的研究人员推出了一个专门解读胸部X光片的图像模型CheXagent,这个模型的目的是帮助医生更准确地分析和理解X光片,从而提高临床决策的效率和质量。 项目主页 ...新技术# CheXagent# Stability AI# X光片2年前07160
新的4位量化方法SVDQuant:通过量化权重和激活值为4位来加速模型的推理过程,同时保持图像质量扩散模型因其在生成高保真图像方面的卓越能力而备受关注。然而,这些模型在内存和计算方面的要求非常高,这限制了它们在消费级设备和需要低延迟的应用中的部署。为了解决这些问题,研究人员提出了多种技术,包括后训...新技术# SVDQuant# 量化方法11个月前07140
新算法ViewFusion:解决在多视角图像生成一致性的问题来自亚马逊、悉尼大学、阿德莱德大学的研究人员推出新算法ViewFusion,它旨在解决在多视角图像合成中保持一致性的挑战。这个算法可以与现有的预训练扩散模型无缝集成,用于生成高质量、多样化的图像。 论...新技术# ViewFusion# 图像生成2年前07130
创新框架EMO:只需要提供一张静态照片和一段语音,就能生成口型匹配的视频阿里巴巴推出创新框架EMO,它是一个能够根据音频生成表情丰富的肖像视频的系统。想象一下,你只需要提供一张静态的照片和一段语音,EMO就能创造出一个视频,视频中的人物头像会根据语音的内容和情感变化做出相...新技术# EMO# 口型匹配2年前07120
图像超分辨率技术SeeSR:保持生成的高分辨率图像的语义准确性来自香港理工大学、OPPO、字节跳动的研究人员推出图像超分辨率技术SeeSR,它利用语义提示来增强预训练的文本到图像(T2I)扩散模型在处理现实世界图像超分辨率问题时的性能。这种方法特别关注于在图像质...新技术# SeeSR# 图像超分辨率2年前07100
针对姿势引导的人像图像动画技术TCAN:让图片中的人物根据某个动作序列(比如一个视频)来做出相应的动作韩国科学技术院和Naver的研究人员推出一种针对姿势引导的人像图像动画技术TCAN,该技术能有效抵抗姿态估计错误,并在时间维度上保持连贯。这是一个关于如何让静态图片中的人体动作起来的研究,具体来说,就...新技术# TCAN# 人像图像动画2年前07090
单样本文生图模型的微调方法:解决泛化性和真实性问题来自腾讯的研究人员提出了一种面向对象的单样本文生图模型的微调方法Object-Driven One-Shot Fine-tuning of Text-to-Image Diffusion with P...新技术# Lora# 微调# 文生图2年前07070
新型图像编辑方法Guide-and-Rescale:能够在不破坏原始图像的基础上,对真实的照片进行各种编辑俄罗斯高等经济大学、斯科尔科沃科学技术研究所 和新南威尔士大学悉尼分校的研究人员推出新的图像编辑方法Guide-and-Rescale,此方法的核心是能够在不破坏原始图像的基础上,对真实的照片进行各种...新技术# Guide-and-Rescale# 图像编辑1年前07060
阿里推出新型大型多模态模型ConvLLaVA:专门设计用于处理高分辨率的视觉数据清华大学和阿里巴巴的研究人员推出新型大型多模态模型ConvLLaVA,它专门设计用于处理高分辨率的视觉数据。多模态模型能够理解和处理多种类型的数据,比如文本、图像和视频,这使得它们在各种应用场景中都非...新技术# ConvLLaVA# 多模态模型# 阿里巴巴2年前07060
基于Kronecker积的新型适应模块DiffuseKronA:保持图像生成质量的同时,显著减少模型的参数数量来自印度信息技术研究所、Hugging Face、阳明交通大学、IBM 研究院的研究人员提出一种用于个性化扩散模型的参数高效微调方法DiffuseKronA,主要功能是在保持图像生成质量的同时,显著减...新技术# DiffuseKronA# 扩散模型2年前07050