新技术

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

图像生成评估基准DREAMBENCH++：与人类偏好对齐的自动化评估系统，专门用于个性化图像生成

清华大学、西安交通大学、伊利诺伊大学香槟分校、中国科学院大学和旷视科技的研究人员推出图像生成评估基准DREAMBENCH++，它是一个与人类偏好对齐的自动化评估系统，专门用于个性化图像生成。简单来说...

新技术 # DREAMBENCH++# 图像生成评估基准

2年前

05230

3D场景生成技术Invisible Stitch：生成平滑且连贯的3D场景，通过深度修复来改善场景的几何一致性

牛津大学的研究人员推出一种新的3D场景生成技术Invisible Stitch，这项技术的目标是生成平滑且连贯的3D场景，特别是通过深度修复（depth inpainting）来改善场景的几何一致性...

新技术 # 3D场景生成 # Invisible Stitch

2年前

05230

新型文生图模型CountGen：根据文本提示准确地生成指定数量的对象

巴伊兰大学、英伟达和特拉维夫大学的研究人员推出新型文生图模型CountGen，它能够根据文本提示准确地生成指定数量的对象。在以往的技术中，尽管文本到图像的扩散模型取得了巨大成功，但它们在控制生成图像中...

新技术 # CountGen # 文生图模型

2年前

05220

一种无需额外训练和条件约束的新方法SEG：利用了自我注意力机制的能量视角来改进图像生成

高丽大学的研究人员推出一种无需额外训练和条件约束的新方法SEG（Smoothed Energy Guidance，平滑能量指导），它利用了自我注意力机制的能量视角来改进图像生成。例如，你有一个魔法画笔...

新技术 # SEG # 平滑能量指导

2年前

05210

苹果推出新预训练方法CLOC：提升图像和文本表示的预训练效果，特别是在局部区域的语义理解方面

苹果推出新预训练方法CLOC（对比定位语言-图像预训练），旨在提升图像和文本表示的预训练效果，特别是在局部区域的语义理解方面。CLOC模型可以生成高分辨率、细节丰富的深度图，这些深度图不仅包含整体图像...

新技术 # CLOC # 对比定位语言-图像预训练 # 苹果

1年前

05190

新型图像编辑工具StyleFeatureEditor：结合了AI的最新进展，使用户能够以前所未有的细节级别和灵活性来编辑图像

俄罗斯高等经济大学、AIRI和德国不来梅建筑大学的研究人员推出新型图像编辑工具StyleFeatureEditor，它是基于一种名为StyleGAN的生成对抗网络（GAN）的。StyleGAN是一种特...

新技术 # StyleFeatureEditor # 图像编辑

2年前

05190

controllable text-to-3D generation：根据文本提示和条件图像生成高质量、可控制的3D模型

来自浙江大学、西湖大学和同济大学的研究团队推出controllable text-to-3D generation，它能够根据文本提示和条件图像生成高质量、可控制的3D模型。这种方法的核心在于使用一种...

新技术 # 3D模型 # controllable text-to-3D generation

2年前

05180

RankDPO：提高模型在遵循文本提示和视觉质量方面的表现

直接偏好优化（DPO）已成为一种强大的方法，用于将文本到图像（T2I）模型与人类反馈对齐。然而，成功应用DPO需要大量的资源来收集和标注大规模数据集，例如数百万张生成的人类偏好注释的配对图像。此外，随...

新技术 # RankDPO

1年前

05170

FSC-CLIP：提升预训练视觉和语言模型（VLMs）在理解图像和文字组合任务上的能力，同时保持在多模态任务上的性能

韩国科学技术院、世宗大学和汉阳大学的研究人员推出FSC-CLIP，提升预训练视觉和语言模型（VLMs）在理解图像和文字组合任务上的能力，同时保持在多模态任务上的性能。简单来说，就是让计算机能够更好地理...

新技术 # FSC-CLIP # 多模态

1年前

05170

新型视频扩展方法Follow-Your-Canvas：能够将现有视频的内容扩展到更高的分辨率，并在扩展区域生成丰富的新内容

腾讯混元、香港科技大学、中国科学技术大学和清华大学的研究人员推出新型视频扩展方法Follow-Your-Canvas，它能够将现有视频的内容扩展到更高的分辨率，并在扩展区域生成丰富的新内容。这种方法特...

新技术 # Follow-Your-Canvas # 视频扩展

2年前

05170

Dynamics Lab 发布全球首个 AI 原生 UGC 游戏引擎 Mirage

游戏的未来不再依赖专业设计师逐帧构建，而是由每一位玩家通过想象、生成与体验来共同塑造。今天，Dynamics Lab 正式推出 Mirage —— 全球首个AI原生、实时生成的用户生成内容（UGC...

新技术 # Dynamics Lab # Mirage

9个月前

05140

3D立体视频生成新方法SVG：利用现成的单目视频生成模型来创造出令人印象深刻的3D立体视频

谷歌和香港大学的研究人员推出3D立体视频生成新方法SVG，它能够利用现成的单目视频生成模型来创造出令人印象深刻的3D立体视频。这项技术对于虚拟现实（VR）和增强现实（AR）领域尤为重要，因为它可以提供...

新技术 # 3D立体视频 # SVG

2年前

05130

加载更多

图像生成评估基准DREAMBENCH++：与人类偏好对齐的自动化评估系统，专门用于个性化图像生成

3D场景生成技术Invisible Stitch：生成平滑且连贯的3D场景，通过深度修复来改善场景的几何一致性

新型文生图模型CountGen：根据文本提示准确地生成指定数量的对象

一种无需额外训练和条件约束的新方法SEG：利用了自我注意力机制的能量视角来改进图像生成

苹果推出新预训练方法CLOC：提升图像和文本表示的预训练效果，特别是在局部区域的语义理解方面

新型图像编辑工具StyleFeatureEditor：结合了AI的最新进展，使用户能够以前所未有的细节级别和灵活性来编辑图像

controllable text-to-3D generation：根据文本提示和条件图像生成高质量、可控制的3D模型

RankDPO：提高模型在遵循文本提示和视觉质量方面的表现

FSC-CLIP：提升预训练视觉和语言模型（VLMs）在理解图像和文字组合任务上的能力，同时保持在多模态任务上的性能

新型视频扩展方法Follow-Your-Canvas：能够将现有视频的内容扩展到更高的分辨率，并在扩展区域生成丰富的新内容

Dynamics Lab 发布全球首个 AI 原生 UGC 游戏引擎 Mirage

3D立体视频生成新方法SVG：利用现成的单目视频生成模型来创造出令人印象深刻的3D立体视频

S.H.I.T

新悟空

Meshy

新OpenMAIC

CutCut

Yihen-Drama

新技术

网址

S.H.I.T

新悟空

Meshy

新OpenMAIC

CutCut

Yihen-Drama