音频语言模型(ALMs)在各种应用中发挥着关键作用,包括实时转录、翻译、语音控制...
19小时前 10

之前介绍过的《Lightricks推出开源视频生成模型LTX Video》,今天LTX-Video迎来了...
1天前 16

北京邮电大学、中国科学院计算技术研究所、大连理工大学和北京智源研究院的研究人...
2天前 24

加州大学圣地亚哥分校 Hao AI 实验室推出的一个开源技术栈FastVideo ,旨在显著加...
3天前 71

阿里巴巴旗下通义实验室语音团队在之前提出的 CosyVoice 基础上,推出了全新的 Cos...
4天前 28

ColorFlow 是由清华大学和腾讯ARC实验室提出的一个创新性三阶段扩散模型框架,专门...
4天前 28

图森未来今日正式发布了其首款“图生视频”大模型——Ruyi,目前Ruyi-Mini-7B版本已经...
4天前 40

12月16日,无问芯穹宣布正式开源其“端模型+端软件+端IP”端上智能一体化解决方案中...
5天前 28

尽管视频感知能力已经迅速集成到大型多模态模型(LMMs)中,但其驱动视频理解的基...
5天前 30

UltraReal Fine-Tune 是基于 FLUX.1-dev 模型的一个微调版本,旨在通过训练者自己...
5天前 30

Dramatic Portrait是一个用于人物肖像增强的Flux Lora,生成的人物更加真实,没有F...
5天前 30
没有账号?注册  忘记密码?