百科 | 第151页 | SD百科导航

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

DrawingSpinUp：将单一的平面角色绘画转换成三维动画，同时保留了原始艺术作品的风格和特征

香港城市大学的研究人员推出创新系统DrawingSpinUp，它能够将单一的平面角色绘画转换成三维动画，同时保留了原始艺术作品的风格和特征。这就像是给一张静态的画注入生命，让它动起来，比如让一个纸上的...

新技术 # DrawingSpinUp

1年前

04250

图像编辑框架InstantDrag：通过简单的拖拽操作来编辑图片，就像在手机上操作APP一样直观和快速

首尔国立大学和浦项科技大学的研究人员推出图像编辑框架InstantDrag，它能够让用户通过简单的拖拽操作来编辑图片，就像在手机上操作APP一样直观和快速。例如，你有一张图片，你想要移动图片中的某个部...

新技术 # InstantDrag # 图像编辑

1年前

04450

针对文生图模型的一次性个性化定制技术TextBoost：使用单个参考图像，通过微调文本编码器，来生成与文本提示相匹配的定制化图像

韩国科学技术院推出一种针对文本到图像模型的一次性个性化定制技术TextBoost，这种方法使用单个参考图像，通过微调文本编码器，来生成与文本提示相匹配的定制化图像。例如，你想要通过一段描述来生成一张图...

新技术 # TextBoost # 个性化定制 # 文生图模型

1年前

05240

IFAdapter：提升基于文本生成图像的扩散模型在生成多个实例时的精确度和细节控制能力而设计

腾讯PCG和新加坡国立大学的研究人员推出新型方法IFAdapter，它是为了提升基于文本生成图像（Text-to-Image，简称T2I）的扩散模型在生成多个实例时的精确度和细节控制能力而设计的。简单...

新技术 # IFAdapter

1年前

04640

新型高分辨率图像到3D生成框架Hi3D：将单张2D图片转换成具有高分辨率纹理细节的3D模型

复旦大学计算机学院、新加坡管理大学和智象未来的研究人员推出新型高分辨率图像到3D生成框架Hi3D，Hi3D 的目标是将单张2D图片转换成具有高分辨率纹理细节的3D模型。这就像给一个平面的照片施魔法，让...

新技术 # 3D # 3D模型 # Hi3D

1年前

05020

新型高效微调方法SaRA：用于提升预训练扩散模型（SD 1.5、SD 2.0和SD 3.0）在新任务上的表现

上海交通大学和腾讯优图实验室的研究人员推出新型高效微调方法SaRA，用于提升预训练扩散模型在新任务上的表现。扩散模型是一种强大的生成模型，能够生成图像、视频和3D模型等。但这些模型通常需要大量的参数...

新技术 # SaRA # 微调模型

1年前

05670

开源自回归图像生成模型Open-MAGVIT2

腾讯ARC 实验室、清华大学和南京大学推出开源自回归图像生成模型Open-MAGVIT2 ，它致力于推广自回归视觉生成模型的使用。自回归模型是一种人工智能技术，可以根据一系列给定的数据点预测下一个数据...

新技术 # Open-MAGVIT2

1年前

05950

新型AI模型PT-DiT：针对文本到任意任务（如文本到图像、文本到视频等）的高效能扩散变换器

中山大学 & 360人工智能研究院的研究人员推出一种新的人工智能模型PT-DiT，它是一种针对文本到任意任务（如文本到图像、文本到视频等）的高效能扩散变换器。这个模型特别关注于提高计算效率，减...

新技术 # PT-DiT # Qihoo-T2X

1年前

06070

新型图像编辑方法Guide-and-Rescale：能够在不破坏原始图像的基础上，对真实的照片进行各种编辑

俄罗斯高等经济大学、斯科尔科沃科学技术研究所和新南威尔士大学悉尼分校的研究人员推出新的图像编辑方法Guide-and-Rescale，此方法的核心是能够在不破坏原始图像的基础上，对真实的照片进行各种...

新技术 # Guide-and-Rescale # 图像编辑

1年前

07050

基于大语言模型的框架GenAgent：用于自动生成复杂的工作流程，以构建协作式人工智能系统

上海人工智能实验室推出一个基于大语言模型的框架GenAgent，用于自动生成复杂的工作流程，以构建协作式人工智能（AI）系统，相比单一的大型模型，GenAgent提供了更大的灵活性和可扩展性。这种系统...

新技术 # GenAgent

1年前

09700

字节跳动推出基于音频驱动人物肖像新框架Loopy：专门用于生成与音频同步的逼真人像视频

字节跳动和浙江大学的研究人员推出新型人工智能模型Loopy，它专门用于生成与音频同步的逼真人像视频。Loopy的核心特点是完全基于音频信号来驱动人像动作，而不需要额外的空间信号来辅助控制动作，这使得生...

新技术 # Loopy # 人物 # 字节跳动

1年前

06340

无需训练的图像编辑技术DiffUHaul：专门用于在图像中无缝移动物体

英伟达研究中心、耶路撒冷希伯来大学、特拉维夫大学和赖希曼大学的研究人员推出一种无需训练的图像编辑技术DiffUHaul，专门用于在图像中无缝移动物体。例如，你有一张图片，里面有一只猫和一块岩石，你想要...

新技术 # DiffUHaul # 图像编辑

1年前

06410

加载更多

百科