首页
ComfyUI
web UI
知识库
工具
百科
教程
新技术
早报
模型
硬件
科普
导航
关于
登录
注册
搜索
多模态大语言模型
新技术
新型多模态大语言模型INF-LLaVA:专门设计用于处理高分辨率图像,以提高模型对视觉和语言信息的理解能力
厦门大学的研究人员推出新型多模态大语言模型INF-LLaVA,它专门设计用于处理高分辨...
2024-07-24
154
新技术
基于 SEED-X 的新型多模态大语言模型SEED-Story:根据用户提供的文本和图片生成长篇的图文故事
香港科技大学(广州)、腾讯、香港中文大学和香港科技大学的研究人员推出新型多模...
2024-07-14
294
新技术
多模态大语言模型Groma:具备精细化和定位化的视觉感知能力
来自香港大学和字节跳动的研究人员推出多模态大语言模型Groma,它具备精细化和定位...
2024-04-22
246
新技术
多模态大语言模型LITA:专门设计来处理视频中的时间定位问题
英伟达推出多模态大语言模型LITA(Language Instructed Temporal-Localization As...
2024-03-29
242
新技术
多模态问答系统Lumos:结合场景文本识别和多模态大语言模型
来自Meta Reality Labs的研究人员推出了多模态问答系统Lumos,这是一个结合了场景...
2024-02-15
180
升级VIP
全屏浏览
夜间模式
返回顶部
没有账号?
注册
忘记密码?
显示验证码
已有账号?
登录