新技术

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

一种在推理阶段组合定制扩散模型的新方法TweedieMix：用于改进多概念融合在基于扩散的图像和视频生成中的应用

KRAFTON和韩国科学技术研究院AI研究生院的研究人员推出一种在推理阶段组合定制扩散模型的新方法TweedieMix，它用于改进多概念融合在基于扩散的图像和视频生成中的应用。简单来说，Tweedie...

新技术 # TweedieMix # 扩散模型

1年前

04780

基于文本的编辑框架TurboEdit：能够使用极少的几步就能基于文本指令编辑真实图片

特拉维夫大学的研究人员推出一种流行的基于文本的编辑框架TurboEdit，它能够使用极少的几步就能基于文本指令编辑真实图片。这种技术利用了所谓的“扩散模型”（diffusion models），这是一...

新技术 # TurboEdit # 图像编辑 # 编辑框架

2年前

04780

自适应投影引导APG：不牺牲图像质量的前提下，使用更高的指导尺度，从而生成更丰富、更真实的图像

苏黎世联邦理工学院和迪士尼研究的研究人员推出自适应投影引导（APG），保留了CFG提高质量的优势，同时允许使用更高的引导比例而不产生过饱和。APG易于实现，并且实际上不会给采样过程带来额外的计算开销...

新技术 # APG # 自适应投影引导

1年前

04770

IFAdapter：提升基于文本生成图像的扩散模型在生成多个实例时的精确度和细节控制能力而设计

腾讯PCG和新加坡国立大学的研究人员推出新型方法IFAdapter，它是为了提升基于文本生成图像（Text-to-Image，简称T2I）的扩散模型在生成多个实例时的精确度和细节控制能力而设计的。简单...

新技术 # IFAdapter

2年前

04750

清华大学推出RIFLEx：解决视频扩散模型在生成更长视频时的时空连贯性问题

清华大学的研究人员推出RIFLEx，解决视频扩散模型在生成更长视频时的时空连贯性问题。该方法通过调整位置编码中的内在频率，有效抑制重复内容的生成，同时保持运动一致性，无需额外训练或修改模型。项目主页...

新技术 # RIFLEx # 清华大学 # 视频扩散模型

12个月前

04740

3D生成框架ComboVerse：从单张图片中生成复杂的三维资产

来自南洋理工大学、上海人工智能实验室和香港中文大学的研究团队推出3D生成框架ComboVerse，它能够从单张图片中生成复杂的三维资产。项目主页首先，从模型和数据两个维度对“多物体差距”进行了深入...

新技术 # 3D # ComboVerse

2年前

04740

可控图像到视频生成框架SG-I2V：用于在图像到视频的生成过程中实现对象和相机运动的控制

图像到视频生成技术已经取得了显著的进步，能够生成高度逼真的视频。然而，调整生成视频中的特定元素，如物体运动或相机移动，通常需要繁琐的试错过程，例如使用不同的随机种子重新生成视频。最近的技术通过微调预训...

新技术 # SG-I2V # 视频生成

1年前

04730

文本到纹理方法RoCoTex：用于生成高质量、一致性强的3D模型纹理

NCSOFT 图形 AI 实验室、韩国大学计算机科学与工程系和韩国中央大学图像系的研究人员推出一种稳健的文本到纹理方法RoCoTex，它是一种用于生成高质量、一致性强的3D模型纹理的方法。简单来说，R...

新技术 # 3D模型纹理 # RoCoTex

1年前

04730

新型视觉基础模型Lotus：使用扩散模型来生成高质量的密集预测结果

香港科技大学（广州）、阿德莱德大学、诺亚方舟实验室和香港科技大学的研究人员推出新型视觉基础模型Lotus，它使用扩散模型来生成高质量的密集预测结果。简单来说，Lotus就像一个超级聪明的图像处理专家...

新技术 # Lotus # 视觉基础模型

1年前

04720

新型文本到图像生成方法FRAP：基于自适应调整每个词汇的提示权重来改善生成图像与提示之间的一致性和真实性

阿尔伯塔大学电子与计算机工程系、华为技术加拿大公司和华为麒麟解决方案的研究人员推出新型文本到图像生成方法FRAP，旨在提高由文本提示生成图像的真实性和忠实度，确保生成的图像与文本描述的内容精确匹配。F...

新技术 # FRAP # 文生图

2年前

04720

数据生成管道Gen4Gen：创建高质量的个性化图像和文本描述

来自加州大学伯克利分校、牛津大学、哈佛大学、卡耐基梅隆大学、香港大学、加州大学戴维斯分校的研究人员推出数据生成管道Gen4Gen，它用于创建一个名为MyCanvas的数据集，旨在提高文本到图像扩散模型...

新技术 # Gen4Gen # 数据生成管道

2年前

04720

3D对象生成和重建流程PartGen：可以从文本、图像或非结构化3D对象开始，生成由多个有意义部分组成的3D对象

近年来，文本到3D生成器和3D扫描仪技术取得了显著进展，能够生成高质量的3D资产。然而，这些资产通常由单一的融合表示组成，例如隐式神经场、高斯混合或网格，缺乏任何有用的结构。这种单一表示方式使得资产难...

新技术 # 3D对象 # PartGen

1年前

04710

加载更多

一种在推理阶段组合定制扩散模型的新方法TweedieMix：用于改进多概念融合在基于扩散的图像和视频生成中的应用

基于文本的编辑框架TurboEdit：能够使用极少的几步就能基于文本指令编辑真实图片

自适应投影引导APG：不牺牲图像质量的前提下，使用更高的指导尺度，从而生成更丰富、更真实的图像

IFAdapter：提升基于文本生成图像的扩散模型在生成多个实例时的精确度和细节控制能力而设计

清华大学推出RIFLEx：解决视频扩散模型在生成更长视频时的时空连贯性问题

3D生成框架ComboVerse：从单张图片中生成复杂的三维资产

可控图像到视频生成框架SG-I2V：用于在图像到视频的生成过程中实现对象和相机运动的控制

文本到纹理方法RoCoTex：用于生成高质量、一致性强的3D模型纹理

新型视觉基础模型Lotus：使用扩散模型来生成高质量的密集预测结果

新型文本到图像生成方法FRAP：基于自适应调整每个词汇的提示权重来改善生成图像与提示之间的一致性和真实性

数据生成管道Gen4Gen：创建高质量的个性化图像和文本描述

3D对象生成和重建流程PartGen：可以从文本、图像或非结构化3D对象开始，生成由多个有意义部分组成的3D对象

新悟空

新OpenMAIC

S.H.I.T

Meshy

Joker of Academics（小丑学术期刊）

CutCut

新技术

网址

新悟空

新OpenMAIC

S.H.I.T

Meshy

Joker of Academics（小丑学术期刊 ）

CutCut

Joker of Academics（小丑学术期刊）