多模态大模型

排序

发布更新浏览点赞

阿里国际发布 Ovis2.6-30B-A3B：MoE 架构多模态大模型，低成本实现高性能视觉理解

阿里国际正式推出 Ovis2.6-30B-A3B 多模态大语言模型，作为 Ovis 系列的最新迭代版本，它在 Ovis2.5 基础上全面升级主干架构与多模态能力，以更低推理成本实现更强的长上下文、高分...

多模态模型 # Ovis2.6-30B-A3B # 多模态大模型

2个月前

0200

ComfyUI-QwenVL：在 ComfyUI 中无缝集成多模态大模型Qwen-VL

ComfyUI-QwenVL 是一款专为 ComfyUI 设计的自定义节点，核心优势在于深度集成了阿里巴巴云 Qwen 团队开发的 Qwen-VL 系列视觉 - 语言模型（LVLMs），涵盖最新的 Q...

插件 # ComfyUI-QwenVL # Qwen-VL # 多模态大模型

5个月前

06270

Qianfan-VL：百度推出的多模态大模型系列，面向企业级视觉语言任务

由百度 AI 云团队研发，Qianfan-VL 是一系列参数规模从 3B 到 70B 的多模态大语言模型（MLLM），专注于提升企业在文档理解、OCR识别和数学推理等高频场景下的自动化能力。项目主页...

多模态模型 # Qianfan-VL # 多模态大模型 # 百度

6个月前

01670

蚂蚁集团发布 M2-Reasoning-7B：通用与空间推理能力领先的多模态大模型

蚂蚁集团 inclusionAI 项目组正式发布 M2-Reasoning-7B，一个在通用推理与空间推理领域表现卓越的多模态大语言模型（MLLM）。该模型基于 70 亿参数架构，通过创新的数据生成...

多模态模型 # M2-Reasoning-7B # 多模态大模型 # 蚂蚁集团

9个月前

02040

快手 Keye 团队发布 Kwai Keye-VL ：专注短视频理解的多模态大模型

快手 Keye 团队近日推出了一款全新的多模态大型语言模型（MLLM）——Kwai Keye-VL。该模型拥有 80 亿参数，专注于提升对短视频的理解能力，同时保持强大的通用视觉-语言能力。 GitH...

多模态模型 # Kwai Keye-VL # 多模态大模型 # 快手

9个月前

03100

蚂蚁集团开源全新统一多模态大模型 Ming-Lite-Omni：支持图像、文本、音频、视频

近日，蚂蚁集团旗下的百灵大模型（Ling）团队正式宣布开源其最新推出的统一多模态大模型 —— Ming-Lite-Omni。这是一款基于 Ling 系列轻量模型构建的 MoE 架构全模态 AI 模...

多模态模型 # Ming-Lite-Omni # 多模态大模型 # 蚂蚁集团

10个月前

03500

没有了

阿里国际发布 Ovis2.6-30B-A3B：MoE 架构多模态大模型，低成本实现高性能视觉理解

ComfyUI-QwenVL：在 ComfyUI 中无缝集成多模态大模型Qwen-VL

Qianfan-VL：百度推出的多模态大模型系列，面向企业级视觉语言任务

蚂蚁集团发布 M2-Reasoning-7B：通用与空间推理能力领先的多模态大模型

快手 Keye 团队发布 Kwai Keye-VL ：专注短视频理解的多模态大模型

蚂蚁集团开源全新统一多模态大模型 Ming-Lite-Omni：支持图像、文本、音频、视频

S.H.I.T

Alaya Code

OpenMAIC

抓虾吧

ITELLOU

Jellyfish AI短剧工厂

多模态大模型

阿里国际发布 Ovis2.6-30B-A3B：MoE 架构多模态大模型，低成本实现高性能视觉理解

ComfyUI-QwenVL：在 ComfyUI 中无缝集成多模态大模型Qwen-VL

Qianfan-VL：百度推出的多模态大模型系列，面向企业级视觉语言任务

蚂蚁集团发布 M2-Reasoning-7B：通用与空间推理能力领先的多模态大模型

快手 Keye 团队发布 Kwai Keye-VL ：专注短视频理解的多模态大模型

蚂蚁集团开源全新统一多模态大模型 Ming-Lite-Omni：支持图像、文本、音频、视频

网址

S.H.I.T

Alaya Code

OpenMAIC

抓虾吧

ITELLOU

Jellyfish AI短剧工厂