新技术

百科工具模型 ComfyUI AI合集 web UI 提示词

教程新技术硬件科普早报

排序

发布更新浏览点赞

新型生成模型DisCo-Diff：用于增强连续扩散模型的性能

英伟达和麻省理工学院的研究人员推出新型生成模型DisCo-Diff，它用于增强连续扩散模型（Diffusion Models, DMs）的性能。扩散模型是一种强大的数据生成方法，但它们通常需要将复杂的...

新技术 # DisCo-Diff # 生成模型

2年前

06780

独立条件引导（ICG）和时间步引导（TSG）：在不牺牲这两种特性的情况下，改善生成模型的表现

苏黎世联邦理工学院和迪士尼搜索的研究人员提出了两种新的图像生成模型引导方法——独立条件引导（ICG）和时间步引导（TSG），它们可以在不牺牲这两种特性的情况下，改善生成模型的表现。这些方法可以提高生成...

新技术 # ICG # TSG # 时间步引导

2年前

09910

3D立体视频生成新方法SVG：利用现成的单目视频生成模型来创造出令人印象深刻的3D立体视频

谷歌和香港大学的研究人员推出3D立体视频生成新方法SVG，它能够利用现成的单目视频生成模型来创造出令人印象深刻的3D立体视频。这项技术对于虚拟现实（VR）和增强现实（AR）领域尤为重要，因为它可以提供...

新技术 # 3D立体视频 # SVG

2年前

05170

腾讯优图推出RealTalk：用于生成逼真、实时的音频驱动人脸视频的框架

腾讯优图实验室和南京大学的研究人员推出新技术RealTalk，它是一个用于生成逼真、实时的音频驱动人脸视频的框架。简单来说，RealTalk可以根据一个人的语音生成一个看起来非常真实的3D人脸动画，而...

新技术 # RealTalk # 南京大学 # 腾讯优图

2年前

06970

新型文生图风格迁移技术InstantStyle-Plus：在生成图像的同时保留原始图像的内容和风格

InstantX团队推出新型文生图风格迁移技术InstantStyle-Plus，在生成图像的同时保留原始图像的内容和风格。这项技术特别适用于需要将一种图像的风格应用到另一种图像上，但又希望保留原始图...

新技术 # InstantStyle-Plus # 风格迁移

2年前

09610

谷歌推出新型图像编辑工具Magic Insert：将一张图片中的主题（比如一个人或者一个物体）拖拽到另一张风格完全不同的图片上，并且让这个主题在新图片中看起来非常自然

谷歌推出新型图像编辑工具Magic Insert，可以让我们像变魔术一样，将一张图片中的主题（比如一个人或者一个物体）拖拽到另一张风格完全不同的图片上，并且让这个主题在新图片中看起来非常自然，就像它本...

新技术 # Magic Insert # 图像编辑 # 谷歌

2年前

07360

FoleyCrafter：用于将无声视频通过自动生成高质量、与视频同步的声音效果，从而带来沉浸式的视听体验

上海人工智能实验室he 香港中文大学（深圳）的研究人员推出FoleyCrafter系统，它专门用于将无声视频通过自动生成高质量、与视频同步的声音效果，从而带来沉浸式的视听体验。这项技术在电影、电视和游...

新技术 # FoleyCrafter

2年前

06730

高质量人类动作视频生成框架MimicMotion：依据任意运动指令生成高质感、任意长度的视频内容

腾讯和上海交通大学的研究人员推出高质量人类动作视频生成框架MimicMotion，依据任意运动指令生成高质感、任意长度的视频内容。简单来说，MimicMotion是一个可以制作出逼真人类动作视频的智能...

新技术 # MimicMotion # 视频生成

2年前

08420

零样本视频恢复DiffIR2VR-Zero：将低质量的视频转换成高质量的视频

阳明交通大学、东京大学和联发科的研究人员推出DiffIR2VR-Zero，它能够实现零样本（zero-shot）视频恢复。零样本意味着这种方法不需要针对特定任务进行训练，就能将低质量的视频转换成高质量...

新技术 # DiffIR2VR-Zero # 视频恢复

2年前

01,0520

新型图像分割模型EVF-SAM：利用多模态提示（即图像和文本），结合视觉-语言模型来生成指代提示，并借助SAM模型完成分割任务

华中科技大学和vivo AI 实验室的研究人员推出新型图像分割模型EVF-SAM，EVF-SAM的核心特点是它能够理解文本提示，并根据这些提示对图像中的对象进行精确分割。这项技术对于那些需要根据用户描...

新技术 # EVF-SAM # 图像分割模型

2年前

01,1840

用于视频合成的交互式工具Image Conductor：让用户对视频内容中的相机运动和对象移动进行精细且准确的控制

北京大学、腾讯PCG ARC实验室、南洋理工大学、清华大学、澳门大学和深圳先进技术研究院的研究人员推出Image Conductor，它是一种用于视频合成的交互式工具，能够让用户对视频内容中的相机运...

新技术 # Image Conductor # 视频合成

2年前

08070

新型框架FreeTraj：在视频扩散模型中实现无需调整参数的轨迹控制

南洋理工大学、香港科技大学和腾讯人工智能实验室的研究人员推出新型框架FreeTraj，它用于在视频扩散模型中实现无需调整参数的轨迹控制。简而言之，FreeTraj允许用户在生成视频时精确控制视频中对...

新技术 # FreeTraj # 轨迹控制

2年前

04900

加载更多