针对姿势引导的人像图像动画技术TCAN:让图片中的人物根据某个动作序列(比如一个视频)来做出相应的动作韩国科学技术院和Naver的研究人员推出一种针对姿势引导的人像图像动画技术TCAN,该技术能有效抵抗姿态估计错误,并在时间维度上保持连贯。这是一个关于如何让静态图片中的人体动作起来的研究,具体来说,就...新技术# TCAN# 人像图像动画2年前07930
视频增强技术Noise Calibration(噪声校准):使用预训练的视频扩散模型来改善视频质量,同时确保原始视频的内容保持不变大连理工大学和腾讯AI实验室的研究人员推出视频增强技术“Noise Calibration(噪声校准)”,它使用预训练的视频扩散模型来改善视频质量,同时确保原始视频的内容保持不变。该技术通过少量迭代步...新技术# Noise Calibration# 噪声校准# 视频增强技术2年前07930
E2GAN:用于图像到图像翻译的高效训练和推理的生成对抗网络(GAN)模型Snap和东北大学的研究人员推出E2GAN,这是一种用于图像到图像翻译的高效训练和推理的生成对抗网络(GAN)模型。简单来说,E2GAN的目标是让计算机能够通过学习大量图像数据,快速生成或编辑出符合特...新技术# E2GAN# 生成对抗网络(GAN)模型2年前04950
视频流翻译方法Live2Diff:专为直播视频转换设计的时间单向注意力视频扩散模型上海人工智能实验室、马克斯普朗克信息研究所和南洋理工大学的研究人员推出视频流翻译方法Live2Diff(LIVE2DIFF),它利用了单向注意力机制在视频扩散模型中,专门为直播视频流设计。这种方法的核...新技术# Live2Diff# 直播2年前08720
基于 SEED-X 的新型多模态大语言模型SEED-Story:根据用户提供的文本和图片生成长篇的图文故事香港科技大学(广州)、腾讯、香港中文大学和香港科技大学的研究人员推出新型多模态大语言模型SEED-Story,它能够根据用户提供的文本和图片生成长篇的多模态故事。这些故事不仅包含丰富的叙事文本,还包括...新技术# SEED-Story# 图文故事# 多模态大语言模型2年前01,1490
基于偏好学习的奖励模型VADER:让模型更有效地学习如何生成符合特定要求的视频卡内基梅隆大学的研究人员推出奖励模型(一种基于偏好学习的方法)VADER,来指导视频生成过程,从而让模型更有效地学习如何生成符合特定要求的视频。例如,你想要生成一段描述“一只穿着红色外套、拿着雪球的浣...新技术# VADER# 奖励模型2年前06060
肖像动画新技术EchoMimic:将静态的肖像照片转化为逼真的动态视频蚂蚁集团支付宝终端技术部推出肖像动画新技术EchoMimic,它可以将静态的肖像照片转化为逼真的动态视频。EchoMimic创新性地结合音频与面部标志点进行联合训练,并通过一项新颖的训练策略,使其不仅...新技术# EchoMimic# 肖像动画2年前05530
视频驱动人脸识别动画系统LivePortrait:将静态的肖像照片生动地动画化,同时保持高效和精确的控制能力快手科技、中国科学技术大学和复旦大学的研究人员推出视频驱动人脸识别动画系统LivePortrait,它能够将静态的肖像照片生动地动画化,同时保持高效和精确的控制能力。例如,你有一张其他人物照片,Liv...新技术# LivePortrait2年前07880
新型生成模型DisCo-Diff:用于增强连续扩散模型的性能英伟达和麻省理工学院的研究人员推出新型生成模型DisCo-Diff,它用于增强连续扩散模型(Diffusion Models, DMs)的性能。扩散模型是一种强大的数据生成方法,但它们通常需要将复杂的...新技术# DisCo-Diff# 生成模型2年前06760
独立条件引导(ICG)和时间步引导(TSG):在不牺牲这两种特性的情况下,改善生成模型的表现苏黎世联邦理工学院和迪士尼搜索的研究人员提出了两种新的图像生成模型引导方法——独立条件引导(ICG)和时间步引导(TSG),它们可以在不牺牲这两种特性的情况下,改善生成模型的表现。这些方法可以提高生成...新技术# ICG# TSG# 时间步引导2年前09900
3D立体视频生成新方法SVG:利用现成的单目视频生成模型来创造出令人印象深刻的3D立体视频谷歌和香港大学的研究人员推出3D立体视频生成新方法SVG,它能够利用现成的单目视频生成模型来创造出令人印象深刻的3D立体视频。这项技术对于虚拟现实(VR)和增强现实(AR)领域尤为重要,因为它可以提供...新技术# 3D立体视频# SVG2年前05130
腾讯优图推出RealTalk:用于生成逼真、实时的音频驱动人脸视频的框架腾讯优图实验室和南京大学的研究人员推出新技术RealTalk,它是一个用于生成逼真、实时的音频驱动人脸视频的框架。简单来说,RealTalk可以根据一个人的语音生成一个看起来非常真实的3D人脸动画,而...新技术# RealTalk# 南京大学# 腾讯优图2年前06970