Controlnet作者新项目IC-Light:根据文本提示或参考背景图重新打光生成符合新背景环境光照的图片IC-Light是Controlnet、Fooocus、Stable Diffusion WebUI Forge的开发者lllyasviel推出新开源项目,这是一款控制图像照明效果的模型,简单来说其主...新技术# controlnet# IC-Light# 打光2年前09150
新型图像上采样模型Inf-DiT:高效地对任何分辨率的图像进行上采样,即提高图像的分辨率而不失细节清华大学与智谱AI的研究人员推出新型图像上采样模型Inf-DiT,它能够高效地对任何分辨率的图像进行上采样,即提高图像的分辨率而不失细节。在图像处理领域,上采样是一个重要的技术,它可以用于放大图像而不...新技术# Inf-DiT# 图像上采样模型2年前01,2240
谷歌推出新框架ImageInWords(IIW):创建准确且细节丰富的图像描述,以提高视觉-语言模型的训练效果Google Research、Google DeepMind和华盛顿大学的研究团队推出新框架ImageInWords(IIW),此框架旨在创建准确且细节丰富的图像描述,以提高视觉-语言模型(VLMs...新技术# IIW# ImageInWords# 数据集2年前06960
新型视觉模型EfficientViT:专门用于高分辨率的密集预测任务来自MIT、浙江大学、清华大学、MIT-IBM Watson AI实验室的研究人员推出新型视觉模型EfficientViT,它专门用于高分辨率的密集预测任务。这类任务在计算机视觉领域非常重要,应用范围...新技术# EfficientViT# 视觉模型2年前06480
图像和视频生成框架StoryDiffusion:能够生成一系列内容一致的图像和视频来自南开大学和字节跳动的研究人员推出一种新的图像和视频生成框架StoryDiffusion,这项技术的核心在于它能够生成一系列内容一致的图像和视频,这对于讲述一个故事或者展示一个连贯的场景来说非常重要...新技术# StoryDiffusion# 图像生成# 视频生成2年前07970
文生图定制模型Pair Customization:从单一图像对中学习风格差异,并随后将习得的风格应用于生成过程中来自卡内基梅隆大学和东北大学的研究人员推出新定制方法Pair Customization,该方法从单一图像对中学习风格差异,并随后将习得的风格应用于生成过程中。这是一款使用一对图像(一个原始图像和一个...新技术# Pair Customization# 文生图定制模型2年前05850
3D服装生成框架DressCode:根据文本指导生成具有缝纫图案和基于物理渲染(PBR)纹理的服装上海科技大学、宾夕法尼亚大学、影眸科技和赜深科技推出3D服装生成框架DressCode,它能够根据文本指导生成具有缝纫图案和基于物理渲染(PBR)纹理的服装。这项技术对于数字化人类创建、时尚设计、虚拟...新技术# 3D服装生成# DressCode2年前09160
个性化图像生成新方法InstantFamily:在零样本的情况下,根据多个身份标识(Multi-ID)生成个性化的图像韩国SK电信推出个性化图像生成新方法InstantFamily,它能够在零样本(zero-shot)的情况下,根据多个身份标识(Multi-ID)生成个性化的图像。这项技术特别适用于创建包含多个人物的...新技术# InstantFamily# 个性化图像生成2年前06010
图像编辑技术Paint by Inpaint:根据文本指令在图像中添加对象,而无需用户提供输入遮罩来自魏茨曼科学研究所和以色列理工学院的研究人员推出一种新颖的图像编辑技术Paint by Inpaint,它能够根据文本指令在图像中添加对象,而无需用户提供输入遮罩(mask)。这项技术的核心在于利用...新技术# Paint by Inpaint# 图像编辑2年前07530
新型3D重建模型GS-LRM:能够从少数几张2D图像中快速预测出高质量的3D高斯原始体Adobe和康奈尔大学的研究人员推出新型3D重建模型GS-LRM(Gaussian Splatting Large Reconstruction Model),这个模型能够从少数几张2D图像中快速...新技术# 3D重建模型# GS-LRM2年前06050
3D图像渲染技术SAGS:改进现有的3D图像渲染方法,以实现更高质量的图像渲染,同时减少所需的计算资源和存储空间来自伦敦帝国理工学院和华为诺亚方舟实验室的研究人员推出新的3D图像渲染技术SAGS(Structure-Aware 3D Gaussian Splatting),这项技术旨在改进现有的3D图像渲染方法...新技术# 3D图像渲染# SAGS2年前09160
英伟达推出VFC:用于生成高保真、详细图像和3D对象标题的强大工具英伟达推出VFC(Visual Fact Checker),它是一个用于生成高保真、详细图像和3D对象标题的强大工具。简单来说,VFC就像一个能够精确描述图片内容的智能助手,无论是2D的平面图像还是3...新技术# VFC2年前05620