图像分割技术OpenTrans:提高开放词汇表分割(OVS)的效率来自北京交通大学和西蒙菲莎大学的研究人员推出OpenTrans,它旨在提高开放词汇表分割(Open-Vocabulary Segmentation, OVS)的效率。OVS是一种图像分割技术,能够识别...新技术# OpenTrans# 图像分割技术2年前06760
ControlNet++:通过显式优化生成图像与条件控制之间的像素级循环一致性,来改进可控生成过程中佛罗里达大学计算机视觉研究中心和字节跳动的研究人员推出ControlNet++,这是一种新方法,通过显式优化生成图像与条件控制之间的像素级循环一致性,来改进可控生成过程。具体来说,对于给定的条件控制...新技术# controlnet# 可控性# 文生图模型2年前09070
新型框架PhysAvatar:将物理模拟和逆向渲染技术相结合,创建逼真的3D虚拟人物来自斯坦福大学、卡内基梅隆大学、谷歌和慕尼黑工业大学的研究人员推出新型框架PhysAvatar,它将物理模拟和逆向渲染技术相结合,能够自动从多视角视频数据中估计人体的形状和外观,以及衣物面料的物理参数...新技术# 3D虚拟人物# PhysAvatar2年前07530
SpaTracker:通过在三维空间中跟踪像素点,能够在各种复杂场景中实现精确的运动估计来自浙江大学、加州大学伯克利分校和蚂蚁集团的研究人员推出SpatialTracker,这是一种能够在三维空间中跟踪任意二维像素点的方法。它使用单目深度估计器将2D像素提升到3D,使用三平面表示法有效表...新技术# SpaTracker# 三维空间2年前06690
一致性模型的强化学习RLCM:提升图像生成的速度和质量来自康奈尔大学的研究团队推出RLCM(Reinforcement Learning for Consistency Models, 一致性模型的强化学习),RLCM提供了一种有效的方法来提升图像生成的...新技术# RLCM# 一致性模型2年前07410
attribute-control:对文生图模型生成的图像中的特定属性进行精细控制来自慕尼黑工业大学的研究人员推出attribute-control,它能够对文本到图像(T2I)模型生成的图像中的特定属性进行精细控制。 项目主页 GitHub Demo 开发团队发现,在常用的基于t...新技术# attribute-control# 文生图模型# 精细控制2年前01,0920
新型图像编辑框架DesignEdit:实现精确的空间感知图像编辑微软亚洲研究院和北京大学的研究人员推出新型图像编辑框架DesignEdit,它能够实现精确的空间感知图像编辑。开发团队借鉴了设计领域的图层概念,通过灵活应用多种操作来操控图像中的对象。我们的核心思想是...新技术# DesignEdit# 图像编辑2年前06240
新型文本到图像生成框架InstantStyle:在生成图像时保持一致的风格InstantX团队推出新型文本到图像生成框架InstantStyle,它专注于在生成图像时保持一致的风格。它通过简化风格迁移的过程,使得普通用户和专业人士都能够轻松地创造具有一致风格的图像。 项目主...新技术# InstantStyle# 风格2年前06540
新型图像生成模型VAR:基于Transformer的自回归模型来自北京大学和字节跳动的研究人员推出新型图像生成模型VAR(Visual Autoregressive Modeling,“视觉自回归建模”),VAR模型是一种基于Transformer的自回归(au...新技术# VAR模型2年前06190
TGATE:减少不必要的计算来提高效率,同时保持生成图像的质量来自阿卜杜拉国王科技大学、新加坡国立大学和瑞士人工智能实验室的研究人员推出一种简单且无需训练的方法TGATE,通过减少不必要的计算来提高效率,同时保持生成图像的质量,这对于各种需要快速高质量图像生成的...新技术# TGATE2年前05620
新型框架CSD:理解和从图像中提取风格描述符,可以实现对图像风格的检索、归因和匹配来自纽约大学、埃利斯研究所、马里兰大学帕克分校的研究人员推出新型框架CSD,旨在理解和从图像中提取风格描述符,可以实现对图像风格的检索、归因和匹配,特别适用于Stable Diffusion模型。 G...新技术# CSD# 图像风格2年前06490
CameraCtrl:为文生视频模型提供精确的摄像机控制能力来自香港中文大学、上海人工智能实验室和斯坦福大学的研究人员推出CameraCtrl,它能够为文本到视频(Text-to-Video, T2V)生成模型提供精确的摄像机控制能力。在视频创作中,摄像机的移...新技术# CameraCtrl# 文生视频模型2年前05780