用于生成同步语音体态手势视频的框架 TANGO:把新的语音和已有的视频动作结合起来,生成高保真的、与语音同步的身体手势视频
东京大学和CyberAgent 人工智能实验室的研究人员推出了一个用于生成同步语音体态...
Ollama 与Hugging Face合作!Ollama可以使用 Hugging Face上所有GGUF格式模型了
Ollama 是一个基于 llama.cpp 的应用,可以直接在本地运行开源的大语言模型,之前...
Adobe MAX大会亮点!Adobe旗下多个应用发布新功能,视频生成功能已上线Adobe Premiere Pro和Adobe Firefly
今天,在美国迈阿密海滩举行的Adobe MAX大会上,Adobe发布了最新版本的Adobe Creat...
FSC-CLIP:提升预训练视觉和语言模型(VLMs)在理解图像和文字组合任务上的能力,同时保持在多模态任务上的性能
韩国科学技术院、世宗大学和汉阳大学的研究人员推出FSC-CLIP,提升预训练视觉和语...