首页
ComfyUI
web UI
知识库
工具
模型
百科
教程
新技术
早报
硬件
科普
公告
导航
关于
登录
注册
搜索
多模态
新技术
FSC-CLIP:提升预训练视觉和语言模型(VLMs)在理解图像和文字组合任务上的能力,同时保持在多模态任务上的性能
韩国科学技术院、世宗大学和汉阳大学的研究人员推出FSC-CLIP,提升预训练视觉和语...
2024-10-12
182
新技术
基于多模态token的新型基础模型MIO:能够以端到端、自回归的方式理解和生成语音、文本、图像和视频
北京航空航天大学、01.AI、香港理工大学、AIWaves、阿尔伯塔大学、滑铁卢大学、曼...
2024-10-05
202
升级VIP
全屏浏览
夜间模式
返回顶部
没有账号?
注册
忘记密码?
显示验证码
已有账号?
登录