阿里巴巴

排序

发布更新浏览点赞

通义千问视觉理解模型 Qwen-VL升级版：Qwen-VL-Plus、Qwen-VL-Max

阿里云宣布通义千问视觉理解模型 Qwen-VL 再次升级，继 Plus 版本之后推出 Max 版本，升级版模型拥有更强的视觉推理能力和中文理解能力，能够根据图片识人、答题、创作、写代码，并在多个权威测...

2年前

09440

ComfyUI-Copilot：阿里开发的ComfyUI智能助手，让 ComfyUI 更强大！

ComfyUI-Copilot 是阿里巴巴国际数字商业集团推出的一款基于 ComfyUI 框架构建的智能助手。它通过自然语言交互的方式，极大地简化了 AI 算法的调试和部署过程，无论是生成文本、图像还...

插件 # ComfyUI # ComfyUI-Copilot # 智能助手

10个月前

09320

阿里推出新型大型多模态模型ConvLLaVA：专门设计用于处理高分辨率的视觉数据

清华大学和阿里巴巴的研究人员推出新型大型多模态模型ConvLLaVA，它专门设计用于处理高分辨率的视觉数据。多模态模型能够理解和处理多种类型的数据，比如文本、图像和视频，这使得它们在各种应用场景中都非...

新技术 # ConvLLaVA # 多模态模型 # 阿里巴巴

2年前

07210

阿里巴巴Wanx 团队推出新型多模态生成模型ACE：可以根据文本指令来执行复杂的图像编辑和生成任务

阿里巴巴Wanx 团队推出新型多模态生成模型ACE，这个模型的核心功能是处理和生成图像，但它与传统的图像处理工具不同，因为它可以根据文本指令来执行复杂的图像编辑和生成任务。例如，你是一名摄影师，你拍摄...

新技术 # ACE # 阿里巴巴

1年前

06700

阿里Qwen Chat上线Web Dev功能，用一句话生成完整网页

Qwen官网新增Web Dev功能，让网页开发变得前所未有的简单。类似于Claude的Artifacts和Gemini的Canvas，Qwen Web Dev可以直接渲染网页，并结合Qwen 3强大...

早报 # Qwen Chat # Web Dev # 阿里巴巴

11个月前

06010

阿里推出 Qwen3 系列大模型：开源 8 款模型，性能飞跃，多语言支持，推理能力显著提升

阿里 QWEN 团队在今天推出 Qwen3，这是 Qwen 系列大言模型的最新力作。Qwen3 以其卓越的性能和广泛的应用潜力，正在成为开源AI领域的新焦点。性能突破：超越行业标杆 Qwen3 的旗...

大语言模型 # QWEN 团队 # 阿里巴巴

11个月前

05830

阿里Qwen团队发布端到端多模态模型Qwen2.5-Omni-3B

阿里Qwen团队在发布Qwen3系列模型后，又推出Qwen2.5-Omni系列的一个新模型Qwen2.5-Omni-3B，这是一个端到端多模态模型，能够无缝处理文本、图像、音频和视频等多种输入形式，并...

多模态模型 # Qwen # Qwen2.5-Omni-3B # 阿里巴巴

11个月前

04710

阿里推出角色视频合成框架MIMO：允许用户对视频中的人物进行替换

阿里巴巴智能计算研究院推出MIMO，它能够根据用户提供的简单输入，合成具有可控属性（如角色、动作和场景）的逼真角色视频。简单来说，这项技术能够让用户通过提供一些基本的指令或样本，来创造出一段新的视频...

新技术 # MIMO # 角色视频合成 # 阿里巴巴

2年前

04580

阿里发布 Qwen3-4B 双模型：小参数，大能力，原生支持 256K 上下文

在大模型“军备竞赛”愈演愈烈的今天，阿里巴巴通义实验室反其道而行之，推出两款 40 亿参数级别的小型语言模型： Qwen3-4B-Instruct-2507：面向多语言、高响应速度的通用指令模型 Q...

大语言模型 # Qwen3-4B-Instruct-2507 # Qwen3-4B-Thinking-2507 # 通义实验室

8个月前

04280

阿里巴巴通义实验室推出Wan2.1-FLF2V-14B：140亿参数的首尾帧到视频生成大模型

阿里巴巴通义实验室近日开源了Wan2.1系列的首款大模型——Wan2.1-FLF2V-14B。这是一款专为首尾帧到视频生成设计的140亿参数大模型，旨在为数字艺术家提供前所未有的效率和创作灵活性。模...

视频模型 # Wan2.1-FLF2V-14B # 视频生成大模型 # 阿里巴巴

12个月前

04050

通义实验室推出基于指令的图像生成和编辑框架ACE++：基于FLUX.1-dev模型，实现多种图像生成和编辑任务

阿里巴巴通义实验室推出基于指令的图像生成和编辑框架ACE++，这是之前介绍过的新型多模态生成模型ACE升级版，ACE++ 通过改进的长上下文条件单元（LCU++）和两阶段训练方案，能够高效地利用预训练...

图像模型 # ACE # FLUX.1-dev # 图像生成

1年前

03520

阿里旗下PAI项目组开源了视频生成模型Wan 2.1 的控制模型Wan2.1-Fun系列，支持Canny、Depth、Pose、MLSD等多种模式

阿里旗下PAI项目组开源了视频生成模型Wan 2.1 的控制模型，支持不同的控制条件，如Canny、Depth、Pose、MLSD等，同时支持使用轨迹控制。模型地址：https://huggingf...

视频模型 # Wan 2.1 # Wan2.1-Fun-1.3B-Control # Wan2.1-Fun-1.3B-InP

1年前

03300

加载更多

通义千问视觉理解模型 Qwen-VL升级版：Qwen-VL-Plus、Qwen-VL-Max

ComfyUI-Copilot：阿里开发的ComfyUI智能助手，让 ComfyUI 更强大！

阿里推出新型大型多模态模型ConvLLaVA：专门设计用于处理高分辨率的视觉数据

阿里巴巴Wanx 团队推出新型多模态生成模型ACE：可以根据文本指令来执行复杂的图像编辑和生成任务

阿里Qwen Chat上线Web Dev功能，用一句话生成完整网页

阿里推出 Qwen3 系列大模型：开源 8 款模型，性能飞跃，多语言支持，推理能力显著提升

阿里Qwen团队发布端到端多模态模型Qwen2.5-Omni-3B

阿里推出角色视频合成框架MIMO：允许用户对视频中的人物进行替换

阿里发布 Qwen3-4B 双模型：小参数，大能力，原生支持 256K 上下文

阿里巴巴通义实验室推出Wan2.1-FLF2V-14B：140亿参数的首尾帧到视频生成大模型

通义实验室推出基于指令的图像生成和编辑框架ACE++：基于FLUX.1-dev模型，实现多种图像生成和编辑任务

阿里旗下PAI项目组开源了视频生成模型Wan 2.1 的控制模型Wan2.1-Fun系列，支持Canny、Depth、Pose、MLSD等多种模式

S.H.I.T

OpenMAIC

Alaya Code

ITELLOU

抓虾吧

Jellyfish AI短剧工厂

阿里巴巴

网址

S.H.I.T

OpenMAIC

Alaya Code

ITELLOU

抓虾吧

Jellyfish AI短剧工厂