新ComfyUI-AudioX:港科大开源新框架,视频一键生成同步音效与背景音乐在视频创作中,寻找或制作与画面完美同步的音效和背景音乐往往是最耗时的环节之一。现在,ComfyUI-AudioX 自定义节点的到来,让这一过程在本地即可高效完成。 GitHub:https://git...插件# AudioX# ComfyUI-AudioX9小时前060
新型多模态音频生成框架AudioX:通过统一的模型架构实现从各种输入模态(如文本、视频、图像、音频等)生成高质量的音频和音乐香港科技大学的研究人员推出新型多模态音频生成框架“AudioX”,通过统一的模型架构实现从各种输入模态(如文本、视频、图像、音频等)生成高质量的音频和音乐。该框架通过创新的多模态掩码训练策略,强制模型...语音模型# AudioX# 多模态音频生成10个月前01820
香港科技大学推出统一DiT架构模型AudioX:通过多模态输入(如文本、视频、图像、音乐和音频)生成高质量的音频和音乐香港科技大学的研究人员推出统一DiT架构模型AudioX,通过多模态输入(如文本、视频、图像、音乐和音频)生成高质量的音频和音乐。AudioX通过创新的多模态掩码训练策略,强制模型从掩码输入中学习,从...语音模型# AI音乐# AudioX# DiT模型12个月前04830