新技术

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

去噪方法GeneOH Diffusion：解决手-物体交互（HOI）去噪的问题

来自清华大学、上海人工智能实验室、上海启智研究院的研究人员推出GeneOH Diffusion，它旨在解决手-物体交互（HOI）去噪的问题。在手-物体交互中，我们经常需要准确地追踪手部动作，尤其是在游...

新技术 # GeneOH Diffusion

2年前

07390

全新文生图框架RealCompo：结合SD1.5模型与GLIGEN模型的优势来提高生成图像的质量

RealCompo是一个全新的文生图框架，它旨在解决当前文生图模型在处理多对象组合生成时遇到的困难，通过动态平衡真实性和组合性来提高生成图像的质量。 GitHub 论文 RealCompo利用了文本到...

新技术 # GLIGEN模型 # RealCompo # 文生图框架

2年前

07390

谷歌推出CamViG：控制视频生成过程中的相机视角，从而生成具有精确相机运动的视频

Google Research推出CamViG（Camera Aware Image-to-Video Generation），它能够根据单一图像和三维相机运动信号生成视频。这项技术的核心在于，它能够...

新技术 # CamViG # 相机运动 # 谷歌

2年前

07380

基于图像条件的扩散模型Semantica：根据给定的条件图像（即输入图像）的语义信息生成新的图像

Google Deepmind推出新型图像生成模型Semantica，Semantica的核心特点是它能够在不需要对特定数据集进行微调（finetuning）的情况下，适应不同的图像数据集。这是通过一...

新技术 # Google DeepMind # Semantica

2年前

07370

Garment3DGen：根据真实世界的图像或通过文本描述生成的图像来创建3D服装模型

Meta推出Garment3DGen，它是一种自动化的方法，能够将基础的服装网格模型转换成可以直接用于模拟的资产，无论是通过图像还是文本提示。这个方法使得快速生成资产变得简单快捷，大大降低了原本需要专...

新技术 # 3D服装模型 # Garment3DGen

2年前

07370

谷歌推出新型图像编辑工具Magic Insert：将一张图片中的主题（比如一个人或者一个物体）拖拽到另一张风格完全不同的图片上，并且让这个主题在新图片中看起来非常自然

谷歌推出新型图像编辑工具Magic Insert，可以让我们像变魔术一样，将一张图片中的主题（比如一个人或者一个物体）拖拽到另一张风格完全不同的图片上，并且让这个主题在新图片中看起来非常自然，就像它本...

新技术 # Magic Insert # 图像编辑 # 谷歌

2年前

07340

DreamReward：通过人类偏好反馈来提升从文本到3D内容生成的质量

生数科技发布创新框架DreamReward，它专注于通过人类偏好反馈来提升从文本到3D内容生成（text-to-3D generation）的质量。它通过结合人类反馈和先进的机器学习技术，极大地提高了...

新技术 # 3D模型 # DreamReward

2年前

07340

新型4D内容生成管道4Diffusion：创造全新的视角和动态场景，而不仅仅是对现有视频进行剪辑和调整

北京航空航天大学、上海人工智能实验室和香港大学的研究人员推出新型4D内容生成管道4Diffusion，它能够从单目视频生成具有空间-时间一致性的四维内容。简单来说，4Diffusion就像一个高级的视...

新技术 # 4Diffusion # 4D模型

2年前

07330

MegaFusion：将现有的扩散模型扩展到更高分辨率的图像生成，而无需额外的调整或适应

上海交通大学、上海人工智能实验室和大连理工大学的研究人员推出MegaFusion，它能够将现有的扩散模型（diffusion models）扩展到更高分辨率的图像生成，而无需额外的调整或适应。具体而言...

新技术 # MegaFusion

2年前

07290

文生视频新技术T2V-Turbo：快速生成高质量的视频，并且能够根据文本描述来创建视频内容

来自加州大学圣巴巴拉分校、谷歌和滑铁卢大学的研究人员推出文生视频新技术T2V-Turbo，它可以快速生成高质量的视频，并且能够根据文本描述来创建视频内容。它将来自混合的不同可微奖励模型的反馈整合到预训...

新技术 # T2V-Turbo # 文生视频

2年前

07280

基于Kronecker积的新型适应模块DiffuseKronA：保持图像生成质量的同时，显著减少模型的参数数量

来自印度信息技术研究所、Hugging Face、阳明交通大学、IBM 研究院的研究人员提出一种用于个性化扩散模型的参数高效微调方法DiffuseKronA，主要功能是在保持图像生成质量的同时，显著减...

新技术 # DiffuseKronA # 扩散模型

2年前

07280

阿里推出高保真图像到视频生成框架AtomoVideo

阿里旗下阿里妈妈研究人员推出高保真图像到视频生成框架AtomoVideo，它能够将输入的图像转化为高保真的视频。相较于现有的技术，它提供了更出色的运动强度和一致性，而且完美兼容各种个性化文生图模型，无...

新技术 # AI视频 # AtomoVideo

2年前

07270

加载更多