阿里巴巴语音实验室发布开源语音处理框架 ClearerVoice-Studio:支持语音增强、分离和目标说话人提取在当今的音频环境中,清晰沟通面临诸多挑战。背景噪音、重叠对话以及音频和视频信号的混合等因素常常破坏了沟通的清晰度和理解力。这些问题不仅影响个人通话,还波及专业会议和内容制作等场景。尽管音频技术有所进步...语音模型# ClearerVoice-Studio# 阿里巴巴10个月前03160
阿里巴巴宣布夸克升级:打造无边界的“AI超级框”阿里巴巴今日宣布,夸克正式升级为无边界的“AI超级框”,基于阿里通义领先的推理及多模态大模型,为用户提供一站式、全能化的AI服务。 从对话式AI到“AI超级框” 与传统的对话式AI不同,夸克此次升级将...早报# AI超级框# 夸克# 阿里巴巴9个月前03140
阿里旗下PAI项目组开源了视频生成模型Wan 2.1 的控制模型Wan2.1-Fun系列,支持Canny、Depth、Pose、MLSD等多种模式阿里旗下PAI项目组开源了视频生成模型Wan 2.1 的控制模型,支持不同的控制条件,如Canny、Depth、Pose、MLSD等,同时支持使用轨迹控制。 模型地址:https://huggingf...视频模型# Wan 2.1# Wan2.1-Fun-1.3B-Control# Wan2.1-Fun-1.3B-InP8个月前03090
阿里巴巴发布 QVQ-Max:能看、能理解、能思考的视觉推理模型阿里巴巴推出一款名为 QVQ-Max 的全新视觉推理模型,这是其 Qwen模型系列中的最新成员。QVQ-Max 的独特之处在于它能够理解照片和视频的内容,并对这些信息进行分析和推理,从而提供解决方案...多模态模型# QVQ-Max# 视觉推理模型# 阿里巴巴8个月前02760
阿里巴巴通义实验室开源视频生成模型 Wan2.1在AI技术的浪潮中,视频生成技术正逐渐成为新的热点。阿里巴巴集团通义实验室紧跟技术前沿,于2月21日宣布开源其先进的视频生成模型——WanX 2.1。然而,在发布过程中出现了一个小插曲,模型名称由Wa...视频模型# AI视频# Wan2.1# WanX 2.19个月前02410
阿里巴巴推出全身虚拟形象解决方案TaoAvatar:在AR设备上实时运行一个会说话的全身虚拟人阿里巴巴的研究人员推出一种名为 TaoAvatar 的技术,用于创建逼真的、全身的、会说话的虚拟形象(avatar),并能够在增强现实(AR)设备上实时运行。TaoAvatar 基于 3D 高斯点绘制...3D模型# TaoAvatar# 虚拟形象# 阿里巴巴9个月前02330
通义灵码全新升级:支持 DeepSeek-V3 和 DeepSeek-R1 满血版模型阿里巴巴旗下的“通义灵码”今日宣布推出全新的模型选择功能,支持基于百炼的 DeepSeek-V3 和 DeepSeek-R1 满血版 671B 模型。这一更新不仅增强了通义灵码的能力,还为开发者提供了...早报# AI编程# 通义灵码# 阿里巴巴10个月前02300
阿里巴巴提出START:显著提升大语言模型推理能力的创新工具在大语言模型的发展中,尽管在理解和生成类人文本方面取得了显著进展,但在处理复杂推理任务时,尤其是需要多步计算或逻辑分析的任务,这些模型往往表现不佳。传统的思维链(Chain of Thought, C...新技术# START# 大语言模型# 推理9个月前02170
阿里 Qwen 项目组正式推出全新多模态模型Qwen VLo随着多模态大模型的不断发展,我们对技术边界的认知也在持续被刷新。从最初的 QwenVL 到如今的 Qwen2.5 VL,我们在提升模型图像理解能力方面不断取得进步。 项目主页:https://qwen...多模态模型# Qwen VLo# Qwen 项目组# 阿里巴巴5个月前01970
阿里发布 AgentScope 1.0:面向生产级智能体的开源开发框架阿里巴巴近日正式推出 AgentScope 1.0 —— 一个以开发者为核心的开源智能体(Agent)开发框架,致力于解决当前智能体应用在可控性、可维护性和落地部署方面的关键挑战。 不同于仅聚焦于单点...大语言模型# AgentScope 1.0# 智能体开发框架# 阿里巴巴3个月前01580
阿里巴巴推出 SmartResume:一个能“读懂”复杂简历版式的智能解析系统在企业招聘中,自动化处理海量简历是刚需,但简历格式千奇百怪——多栏排版、图文混排、表格嵌套,传统文本提取工具常会打乱语义顺序,导致关键信息错位。 针对这一难题,阿里巴巴企业智能团队发布了 SmartR...多模态模型# SmartResume# 智能简历解析# 阿里巴巴4周前0900
阿里重磅官宣:千问 App 全平台公测,Qwen 最强模型打造“会办事”的AI生活入口今日,阿里巴巴正式宣布 千问 App 全平台公测上线——这款基于全球第一开源模型通义千问 Qwen 打造的个人 AI 助手,不仅延续了强大的对话能力,更以“会聊天、能办事”为核心定位,剑指未来 AI ...早报# Qwen# 千问 App# 阿里巴巴3周前0190