端到端的训练框架Mimir:通过大语言模型增强文本到视频生成 蚂蚁集团和清华大学的研究人员提出了Mimir,这是一个端到端的训练框架,旨在解决当前视频扩散模型在文本理解方面的不足,并充分利用大语言模型(LLMs)的强大文本处理能力。Mimir通过引入精心设计的标... 新技术# Mimir# 大语言模型 3个月前01120