来自香港大学和字节跳动的研究人员推出多模态大语言模型Groma,它具备精细化和定位...
2024-04-22 432

微软亚洲研究院推出新框架VASA-1,它可以根据单张静态图像和语音音频片段,生成具...
2024-04-22 294

Stability AI在经历了人员变动后,其最新基于MMDiT架构的Stable Diffusion 3是否开...
2024-04-22 1.29k

香港城市大学和莫纳什大学的研究人员推出AniClipart,它能够根据文本提示将静态的...
2024-04-21 364

Snap推出新架构注意力混合(Mixture-of-Attention,简称MoA),即在个性化图像生成...
2024-04-21 662

来自香港科技大学和特拉维夫大学的研究人员推出Dynamic Typography(动态排版),...
2024-04-20 412

来自韩国Nota AI和三星电子的研究人员推出EdgeFusion,它能够在资源受限的移动设备...
2024-04-20 320

来自加州大学圣地亚哥分校和Adob​​e的研究人员推出大型3D重建模型MeshLRM,这是一...
2024-04-20 360

Stability AI宣布Stable Diffusion 3及其增强版Stable Diffusion 3 Turbo API已经...
2024-04-18 438

小i研究院发布了OOTDiffusion的分支版本Magic Clothing,它能够根据特定的服装和文...
2024-04-18 662

新加坡科技设计大学和密歇根大学的研究人员推出新型文本到音频生成模型Tango 2,它...
2024-04-17 368

北卡罗来纳大学教堂山分校的研究人员推出高效且多功能的框架CTRL-Adapter,它能够...
2024-04-17 594
没有账号?注册  忘记密码?