新技术

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

图像分割技术OpenTrans：提高开放词汇表分割（OVS）的效率

来自北京交通大学和西蒙菲莎大学的研究人员推出OpenTrans，它旨在提高开放词汇表分割（Open-Vocabulary Segmentation, OVS）的效率。OVS是一种图像分割技术，能够识别...

新技术 # OpenTrans # 图像分割技术

2年前

06760

ControlNet++：通过显式优化生成图像与条件控制之间的像素级循环一致性，来改进可控生成过程

中佛罗里达大学计算机视觉研究中心和字节跳动的研究人员推出ControlNet++，这是一种新方法，通过显式优化生成图像与条件控制之间的像素级循环一致性，来改进可控生成过程。具体来说，对于给定的条件控制...

新技术 # controlnet # 可控性 # 文生图模型

2年前

09070

新型框架PhysAvatar：将物理模拟和逆向渲染技术相结合，创建逼真的3D虚拟人物

来自斯坦福大学、卡内基梅隆大学、谷歌和慕尼黑工业大学的研究人员推出新型框架PhysAvatar，它将物理模拟和逆向渲染技术相结合，能够自动从多视角视频数据中估计人体的形状和外观，以及衣物面料的物理参数...

新技术 # 3D虚拟人物 # PhysAvatar

2年前

07530

SpaTracker：通过在三维空间中跟踪像素点，能够在各种复杂场景中实现精确的运动估计

来自浙江大学、加州大学伯克利分校和蚂蚁集团的研究人员推出SpatialTracker，这是一种能够在三维空间中跟踪任意二维像素点的方法。它使用单目深度估计器将2D像素提升到3D，使用三平面表示法有效表...

新技术 # SpaTracker # 三维空间

2年前

06690

一致性模型的强化学习RLCM：提升图像生成的速度和质量

来自康奈尔大学的研究团队推出RLCM（Reinforcement Learning for Consistency Models, 一致性模型的强化学习），RLCM提供了一种有效的方法来提升图像生成的...

新技术 # RLCM # 一致性模型

2年前

07410

attribute-control：对文生图模型生成的图像中的特定属性进行精细控制

来自慕尼黑工业大学的研究人员推出attribute-control，它能够对文本到图像（T2I）模型生成的图像中的特定属性进行精细控制。项目主页 GitHub Demo 开发团队发现，在常用的基于t...

新技术 # attribute-control # 文生图模型 # 精细控制

2年前

01,0920

新型图像编辑框架DesignEdit：实现精确的空间感知图像编辑

微软亚洲研究院和北京大学的研究人员推出新型图像编辑框架DesignEdit，它能够实现精确的空间感知图像编辑。开发团队借鉴了设计领域的图层概念，通过灵活应用多种操作来操控图像中的对象。我们的核心思想是...

新技术 # DesignEdit # 图像编辑

2年前

06240

新型文本到图像生成框架InstantStyle：在生成图像时保持一致的风格

InstantX团队推出新型文本到图像生成框架InstantStyle，它专注于在生成图像时保持一致的风格。它通过简化风格迁移的过程，使得普通用户和专业人士都能够轻松地创造具有一致风格的图像。项目主...

新技术 # InstantStyle # 风格

2年前

06540

新型图像生成模型VAR：基于Transformer的自回归模型

来自北京大学和字节跳动的研究人员推出新型图像生成模型VAR（Visual Autoregressive Modeling，“视觉自回归建模”），VAR模型是一种基于Transformer的自回归（au...

新技术 # VAR模型

2年前

06190

TGATE：减少不必要的计算来提高效率，同时保持生成图像的质量

来自阿卜杜拉国王科技大学、新加坡国立大学和瑞士人工智能实验室的研究人员推出一种简单且无需训练的方法TGATE，通过减少不必要的计算来提高效率，同时保持生成图像的质量，这对于各种需要快速高质量图像生成的...

新技术 # TGATE

2年前

05620

新型框架CSD：理解和从图像中提取风格描述符，可以实现对图像风格的检索、归因和匹配

来自纽约大学、埃利斯研究所、马里兰大学帕克分校的研究人员推出新型框架CSD，旨在理解和从图像中提取风格描述符，可以实现对图像风格的检索、归因和匹配，特别适用于Stable Diffusion模型。 G...

新技术 # CSD # 图像风格

2年前

06490

CameraCtrl：为文生视频模型提供精确的摄像机控制能力

来自香港中文大学、上海人工智能实验室和斯坦福大学的研究人员推出CameraCtrl，它能够为文本到视频（Text-to-Video, T2V）生成模型提供精确的摄像机控制能力。在视频创作中，摄像机的移...

新技术 # CameraCtrl # 文生视频模型

2年前

05780

加载更多