首页
ComfyUI
web UI
知识库
工具
模型
百科
教程
新技术
早报
硬件
科普
快讯
导航
关于
登录
注册
搜索
PLLaVA
新技术
视觉模型PLLaVA:能够理解视频中的内容,包括动作、场景、人物穿着等,并能够生成详细描述这些内容的字幕
来自新加坡国立大学、纽约大学和字节跳动的研究人员推出用于视频密集字幕生成的先...
2024-04-29
268
升级VIP
全屏浏览
夜间模式
返回顶部
没有账号?
注册
忘记密码?
显示验证码
已有账号?
登录