字节跳动推出基于音频驱动人物肖像新框架Loopy:专门用于生成与音频同步的逼真人像视频 字节跳动和浙江大学的研究人员推出新型人工智能模型Loopy,它专门用于生成与音频同步的逼真人像视频。Loopy的核心特点是完全基于音频信号来驱动人像动作,而不需要额外的空间信号来辅助控制动作,这使得生... 新技术# Loopy# 人物# 字节跳动 6个月前03970
字节跳动推出AI音乐生成产品-海绵音乐 对于AI音乐,前面已经给大家介绍了Suno和Udio,字节跳动也在这一赛道发力,在昨天推出了AI音乐生成产品-海绵音乐,从目前生成效果来看,虽然还不如Suno和Udio,但对于中文歌曲生成效果还不错,... 工具# AI音乐# 字节跳动# 海绵音乐 7个月前04900
字节跳动推出新型视频生成技术CamTrol:为现有的视频扩散模型增添摄像机运动操控功能 中国科学技术大学和字节跳动的研究人员推出新型视频生成技术CamTrol,这是一种无需训练的、强大的解决方案,可以为现有的视频扩散模型增添摄像机运动操控功能。简单来说,就是可以在不经过额外训练的情况下,... 新技术# CamTrol# 字节跳动# 视频生成 8个月前04530
字节跳动推出PuLID:用于个性化文本到图像的生成 字节跳动推出PuLID,它用于个性化文本到图像(Text-to-Image,简称T2I)的生成。PuLID的全称是“Pure and Lightning ID customization”,即纯粹和闪... 新技术# PuLID# 个性化图像生成# 字节跳动 10个月前08710
字节跳动推出文生图模型SDXL-Lightning:基于SDXL1.0基础模型提炼 SDXL-Lightning是由字节跳动发布的一款速度极快的文生图模型,它采用新型扩散模型蒸馏方法,优化扩散模型,能在短时间内高效生成分辨率为1024像素的高品质图像。 模型地址:https://hu... 新技术# SDXL-Lightning# SDXL1.0# 字节跳动 10个月前03940
字节跳动推出数据集COCONut,专门针对图像分割任务 字节跳动推出数据集COCONut,它是对现有的COCO数据集的现代化升级,专门针对图像分割任务。图像分割是计算机视觉中的一个核心问题,它的目标是将图像中的每个像素正确地分类到不同的实例或类别中,此数据... 新技术# COCONut# 图像分割# 字节跳动 10个月前04820
字节跳动推出新颖视频合成方法Boximator:可控制画面范围及运动方向 字节跳动发布了一种新颖视频合成方法Boximator,主要用于生成具有丰富和精细运动控制的高质量视频。Boximator引入了两种约束类型:硬边框(hard box)和软边框(soft box),允许... 新技术# Boximator# 字节跳动# 视频合成 1年前04340