首页
ComfyUI
web UI
知识库
工具
模型
百科
教程
新技术
早报
硬件
科普
快讯
导航
关于
登录
注册
搜索
多模态大语言模型
新技术
多模态大语言模型Oryx:专门设计用于理解和处理视觉数据,如图像、视频和3D场景
清华大学、腾讯和南洋理工大学 S-Lab的研究人员推出多模态大语言模型Oryx,它专门...
2024-09-20
334
新技术
新型多模态大语言模型INF-LLaVA:专门设计用于处理高分辨率图像,以提高模型对视觉和语言信息的理解能力
厦门大学的研究人员推出新型多模态大语言模型INF-LLaVA,它专门设计用于处理高分辨...
2024-07-24
358
新技术
基于 SEED-X 的新型多模态大语言模型SEED-Story:根据用户提供的文本和图片生成长篇的图文故事
香港科技大学(广州)、腾讯、香港中文大学和香港科技大学的研究人员推出新型多模...
2024-07-14
684
新技术
多模态大语言模型Groma:具备精细化和定位化的视觉感知能力
来自香港大学和字节跳动的研究人员推出多模态大语言模型Groma,它具备精细化和定位...
2024-04-22
458
新技术
多模态大语言模型LITA:专门设计来处理视频中的时间定位问题
英伟达推出多模态大语言模型LITA(Language Instructed Temporal-Localization As...
2024-03-29
476
新技术
多模态问答系统Lumos:结合场景文本识别和多模态大语言模型
来自Meta Reality Labs的研究人员推出了多模态问答系统Lumos,这是一个结合了场景...
2024-02-15
374
上一页
1
2
升级VIP
全屏浏览
夜间模式
返回顶部
没有账号?
注册
忘记密码?
显示验证码
已有账号?
登录