阿里巴巴

排序

发布更新浏览点赞

ComfyUI-Copilot：阿里开发的ComfyUI智能助手，让 ComfyUI 更强大！

ComfyUI-Copilot 是阿里巴巴国际数字商业集团推出的一款基于 ComfyUI 框架构建的智能助手。它通过自然语言交互的方式，极大地简化了 AI 算法的调试和部署过程，无论是生成文本、图像还...

插件 # ComfyUI # ComfyUI-Copilot # 智能助手

10个月前

09340

阿里巴巴发布 QVQ-Max：能看、能理解、能思考的视觉推理模型

阿里巴巴推出一款名为 QVQ-Max 的全新视觉推理模型，这是其 Qwen模型系列中的最新成员。QVQ-Max 的独特之处在于它能够理解照片和视频的内容，并对这些信息进行分析和推理，从而提供解决方案...

多模态模型 # QVQ-Max # 视觉推理模型 # 阿里巴巴

1年前

02840

阿里巴巴推出全身虚拟形象解决方案TaoAvatar：在AR设备上实时运行一个会说话的全身虚拟人

阿里巴巴的研究人员推出一种名为 TaoAvatar 的技术，用于创建逼真的、全身的、会说话的虚拟形象（avatar），并能够在增强现实（AR）设备上实时运行。TaoAvatar 基于 3D 高斯点绘制...

3D模型 # TaoAvatar # 虚拟形象 # 阿里巴巴

1年前

02620

阿里巴巴宣布夸克升级：打造无边界的“AI超级框”

阿里巴巴今日宣布，夸克正式升级为无边界的“AI超级框”，基于阿里通义领先的推理及多模态大模型，为用户提供一站式、全能化的AI服务。从对话式AI到“AI超级框” 与传统的对话式AI不同，夸克此次升级将...

早报 # AI超级框 # 夸克 # 阿里巴巴

1年前

03250

阿里巴巴提出START：显著提升大语言模型推理能力的创新工具

在大语言模型的发展中，尽管在理解和生成类人文本方面取得了显著进展，但在处理复杂推理任务时，尤其是需要多步计算或逻辑分析的任务，这些模型往往表现不佳。传统的思维链（Chain of Thought, C...

新技术 # START # 大语言模型 # 推理

1年前

02330

Qwen Chat 推出全新推理功能“Thinking (QwQ)” ，加速 AI 普及化

阿里 Qwen 团队宣布在 Qwen Chat 中推出全新功能“Thinking (QwQ)”，该功能由 QwQ-Max-Preview 推理模型提供支持，现已可通过 Qwen 官方网站访问。 Qw...

早报 # Qwen # Qwen Chat # QwQ-Max-Preview

1年前

03290

阿里巴巴通义实验室开源视频生成模型 Wan2.1

在AI技术的浪潮中，视频生成技术正逐渐成为新的热点。阿里巴巴集团通义实验室紧跟技术前沿，于2月21日宣布开源其先进的视频生成模型——WanX 2.1。然而，在发布过程中出现了一个小插曲，模型名称由Wa...

视频模型 # AI视频 # Wan2.1 # WanX 2.1

1年前

02530

通义灵码全新升级：支持 DeepSeek-V3 和 DeepSeek-R1 满血版模型

阿里巴巴旗下的“通义灵码”今日宣布推出全新的模型选择功能，支持基于百炼的 DeepSeek-V3 和 DeepSeek-R1 满血版 671B 模型。这一更新不仅增强了通义灵码的能力，还为开发者提供了...

早报 # AI编程 # 通义灵码 # 阿里巴巴

1年前

02410

通义实验室推出基于指令的图像生成和编辑框架ACE++：基于FLUX.1-dev模型，实现多种图像生成和编辑任务

阿里巴巴通义实验室推出基于指令的图像生成和编辑框架ACE++，这是之前介绍过的新型多模态生成模型ACE升级版，ACE++ 通过改进的长上下文条件单元（LCU++）和两阶段训练方案，能够高效地利用预训练...

图像模型 # ACE # FLUX.1-dev # 图像生成

1年前

03520

阿里巴巴语音实验室发布开源语音处理框架 ClearerVoice-Studio：支持语音增强、分离和目标说话人提取

在当今的音频环境中，清晰沟通面临诸多挑战。背景噪音、重叠对话以及音频和视频信号的混合等因素常常破坏了沟通的清晰度和理解力。这些问题不仅影响个人通话，还波及专业会议和内容制作等场景。尽管音频技术有所进步...

语音模型 # ClearerVoice-Studio # 阿里巴巴

1年前

03270

阿里巴巴Wanx 团队推出新型多模态生成模型ACE：可以根据文本指令来执行复杂的图像编辑和生成任务

阿里巴巴Wanx 团队推出新型多模态生成模型ACE，这个模型的核心功能是处理和生成图像，但它与传统的图像处理工具不同，因为它可以根据文本指令来执行复杂的图像编辑和生成任务。例如，你是一名摄影师，你拍摄...

新技术 # ACE # 阿里巴巴

1年前

06700

阿里推出角色视频合成框架MIMO：允许用户对视频中的人物进行替换

阿里巴巴智能计算研究院推出MIMO，它能够根据用户提供的简单输入，合成具有可控属性（如角色、动作和场景）的逼真角色视频。简单来说，这项技术能够让用户通过提供一些基本的指令或样本，来创造出一段新的视频...

新技术 # MIMO # 角色视频合成 # 阿里巴巴

2年前

04580

加载更多