字节跳动推出统一的视频生成框架Phantom :通过跨模态对齐实现主体一致性的视频生成 字节跳动的研究人员推出一个统一的视频生成框架Phantom ,通过跨模态对齐实现主体一致性的视频生成(Subject-to-Video, S2V),用于单主体和多主体参考,构建在现有的文本到视频和图像... 新技术# Phantom# 字节跳动# 视频生成 2天前090