基于 SEED-X 的新型多模态大语言模型SEED-Story:根据用户提供的文本和图片生成长篇的图文故事香港科技大学(广州)、腾讯、香港中文大学和香港科技大学的研究人员推出新型多模态大语言模型SEED-Story,它能够根据用户提供的文本和图片生成长篇的多模态故事。这些故事不仅包含丰富的叙事文本,还包括...新技术# SEED-Story# 图文故事# 多模态大语言模型1年前01,0560
基于偏好学习的奖励模型VADER:让模型更有效地学习如何生成符合特定要求的视频卡内基梅隆大学的研究人员推出奖励模型(一种基于偏好学习的方法)VADER,来指导视频生成过程,从而让模型更有效地学习如何生成符合特定要求的视频。例如,你想要生成一段描述“一只穿着红色外套、拿着雪球的浣...新技术# VADER# 奖励模型1年前06000
肖像动画新技术EchoMimic:将静态的肖像照片转化为逼真的动态视频蚂蚁集团支付宝终端技术部推出肖像动画新技术EchoMimic,它可以将静态的肖像照片转化为逼真的动态视频。EchoMimic创新性地结合音频与面部标志点进行联合训练,并通过一项新颖的训练策略,使其不仅...新技术# EchoMimic# 肖像动画1年前05490
视频驱动人脸识别动画系统LivePortrait:将静态的肖像照片生动地动画化,同时保持高效和精确的控制能力快手科技、中国科学技术大学和复旦大学的研究人员推出视频驱动人脸识别动画系统LivePortrait,它能够将静态的肖像照片生动地动画化,同时保持高效和精确的控制能力。例如,你有一张其他人物照片,Liv...新技术# LivePortrait2年前07350
新型生成模型DisCo-Diff:用于增强连续扩散模型的性能英伟达和麻省理工学院的研究人员推出新型生成模型DisCo-Diff,它用于增强连续扩散模型(Diffusion Models, DMs)的性能。扩散模型是一种强大的数据生成方法,但它们通常需要将复杂的...新技术# DisCo-Diff# 生成模型2年前06660
独立条件引导(ICG)和时间步引导(TSG):在不牺牲这两种特性的情况下,改善生成模型的表现苏黎世联邦理工学院和迪士尼搜索的研究人员提出了两种新的图像生成模型引导方法——独立条件引导(ICG)和时间步引导(TSG),它们可以在不牺牲这两种特性的情况下,改善生成模型的表现。这些方法可以提高生成...新技术# ICG# TSG# 时间步引导2年前08970
3D立体视频生成新方法SVG:利用现成的单目视频生成模型来创造出令人印象深刻的3D立体视频谷歌和香港大学的研究人员推出3D立体视频生成新方法SVG,它能够利用现成的单目视频生成模型来创造出令人印象深刻的3D立体视频。这项技术对于虚拟现实(VR)和增强现实(AR)领域尤为重要,因为它可以提供...新技术# 3D立体视频# SVG2年前05020
腾讯优图推出RealTalk:用于生成逼真、实时的音频驱动人脸视频的框架腾讯优图实验室和南京大学的研究人员推出新技术RealTalk,它是一个用于生成逼真、实时的音频驱动人脸视频的框架。简单来说,RealTalk可以根据一个人的语音生成一个看起来非常真实的3D人脸动画,而...新技术# RealTalk# 南京大学# 腾讯优图2年前06850
新型文生图风格迁移技术InstantStyle-Plus:在生成图像的同时保留原始图像的内容和风格InstantX团队推出新型文生图风格迁移技术InstantStyle-Plus,在生成图像的同时保留原始图像的内容和风格。这项技术特别适用于需要将一种图像的风格应用到另一种图像上,但又希望保留原始图...新技术# InstantStyle-Plus# 风格迁移2年前08950
谷歌推出新型图像编辑工具Magic Insert:将一张图片中的主题(比如一个人或者一个物体)拖拽到另一张风格完全不同的图片上,并且让这个主题在新图片中看起来非常自然谷歌推出新型图像编辑工具Magic Insert,可以让我们像变魔术一样,将一张图片中的主题(比如一个人或者一个物体)拖拽到另一张风格完全不同的图片上,并且让这个主题在新图片中看起来非常自然,就像它本...新技术# Magic Insert# 图像编辑# 谷歌2年前07110
FoleyCrafter:用于将无声视频通过自动生成高质量、与视频同步的声音效果,从而带来沉浸式的视听体验上海人工智能实验室he 香港中文大学(深圳)的研究人员推出FoleyCrafter系统,它专门用于将无声视频通过自动生成高质量、与视频同步的声音效果,从而带来沉浸式的视听体验。这项技术在电影、电视和游...新技术# FoleyCrafter2年前06610
高质量人类动作视频生成框架MimicMotion:依据任意运动指令生成高质感、任意长度的视频内容腾讯和上海交通大学的研究人员推出高质量人类动作视频生成框架MimicMotion,依据任意运动指令生成高质感、任意长度的视频内容。简单来说,MimicMotion是一个可以制作出逼真人类动作视频的智能...新技术# MimicMotion# 视频生成2年前07530