阿里在去年2月推出新型音频驱动的虚拟角色视频生成方法EMO,近期又发布了 EMO2,它...
1周前 60

香港大学和快手科技的研究人员推出GameFactory框架,旨在通过生成式交互视频来创建...
1周前 58

哈尔滨工业大学(深圳)和清华大学的研究人员推出多智能体协作框架 FILMAGENT,旨...
1周前 60

阿里巴巴达摩院的研究人员推出新型多模态基础模型VideoLLaMA 3,旨在提升图像和视...
1周前 54

字节跳动推出新型身份保持视频生成方法EchoVideo ,旨在通过多模态特征融合解决传...
1周前 50

南开大学、巴塞罗那自治大学计算机视觉中心、穆罕默德·本·扎耶德人工智能大学,林...
1周前 50

阿里巴巴通义实验室的研究人员推出一种基于扩散模型的视频修复方法DiffuEraser,能...
1周前 38

香港中文大学、北京大学和上海人工智能实验室的研究人员探索思维链(Chain-of-Thou...
1周前 42

文本转语音(TTS)技术正成为人机交互领域的重要工具。随着娱乐、无障碍服务、客户...
2周前 52

Hugging Face团队最近发布了两款名为SmolVLM-256M和SmolVLM-500M的新模型,它们被...
2周前 52

字节跳动与清华大学的研究人员推出新型自动化 GUI(图形用户界面)交互模型 UI-TAR...
2周前 64
没有账号?注册  忘记密码?