SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    阿里巴巴

    共 25 篇文章
    排序
    发布更新浏览点赞
    阿里巴巴语音实验室发布开源语音处理框架 ClearerVoice-Studio:支持语音增强、分离和目标说话人提取

    阿里巴巴语音实验室发布开源语音处理框架 ClearerVoice-Studio:支持语音增强、分离和目标说话人提取

    在当今的音频环境中,清晰沟通面临诸多挑战。背景噪音、重叠对话以及音频和视频信号的混合等因素常常破坏了沟通的清晰度和理解力。这些问题不仅影响个人通话,还波及专业会议和内容制作等场景。尽管音频技术有所进步...
    语音模型# ClearerVoice-Studio# 阿里巴巴
    10个月前
    03160
    阿里巴巴宣布夸克升级:打造无边界的“AI超级框”

    阿里巴巴宣布夸克升级:打造无边界的“AI超级框”

    阿里巴巴今日宣布,夸克正式升级为无边界的“AI超级框”,基于阿里通义领先的推理及多模态大模型,为用户提供一站式、全能化的AI服务。 从对话式AI到“AI超级框” 与传统的对话式AI不同,夸克此次升级将...
    早报# AI超级框# 夸克# 阿里巴巴
    9个月前
    03140
    阿里旗下PAI项目组开源了视频生成模型Wan 2.1 的控制模型Wan2.1-Fun系列,支持Canny、Depth、Pose、MLSD等多种模式

    阿里旗下PAI项目组开源了视频生成模型Wan 2.1 的控制模型Wan2.1-Fun系列,支持Canny、Depth、Pose、MLSD等多种模式

    阿里旗下PAI项目组开源了视频生成模型Wan 2.1 的控制模型,支持不同的控制条件,如Canny、Depth、Pose、MLSD等,同时支持使用轨迹控制。 模型地址:https://huggingf...
    视频模型# Wan 2.1# Wan2.1-Fun-1.3B-Control# Wan2.1-Fun-1.3B-InP
    8个月前
    03090
    阿里巴巴发布 QVQ-Max:能看、能理解、能思考的视觉推理模型

    阿里巴巴发布 QVQ-Max:能看、能理解、能思考的视觉推理模型

    阿里巴巴推出一款名为 QVQ-Max 的全新视觉推理模型,这是其 Qwen模型系列中的最新成员。QVQ-Max 的独特之处在于它能够理解照片和视频的内容,并对这些信息进行分析和推理,从而提供解决方案...
    多模态模型# QVQ-Max# 视觉推理模型# 阿里巴巴
    8个月前
    02760
    阿里巴巴通义实验室开源视频生成模型 Wan2.1

    阿里巴巴通义实验室开源视频生成模型 Wan2.1

    在AI技术的浪潮中,视频生成技术正逐渐成为新的热点。阿里巴巴集团通义实验室紧跟技术前沿,于2月21日宣布开源其先进的视频生成模型——WanX 2.1。然而,在发布过程中出现了一个小插曲,模型名称由Wa...
    视频模型# AI视频# Wan2.1# WanX 2.1
    9个月前
    02410
    阿里巴巴推出全身虚拟形象解决方案TaoAvatar:在AR设备上实时运行一个会说话的全身虚拟人

    阿里巴巴推出全身虚拟形象解决方案TaoAvatar:在AR设备上实时运行一个会说话的全身虚拟人

    阿里巴巴的研究人员推出一种名为 TaoAvatar 的技术,用于创建逼真的、全身的、会说话的虚拟形象(avatar),并能够在增强现实(AR)设备上实时运行。TaoAvatar 基于 3D 高斯点绘制...
    3D模型# TaoAvatar# 虚拟形象# 阿里巴巴
    9个月前
    02330
    通义灵码全新升级:支持 DeepSeek-V3 和 DeepSeek-R1 满血版模型

    通义灵码全新升级:支持 DeepSeek-V3 和 DeepSeek-R1 满血版模型

    阿里巴巴旗下的“通义灵码”今日宣布推出全新的模型选择功能,支持基于百炼的 DeepSeek-V3 和 DeepSeek-R1 满血版 671B 模型。这一更新不仅增强了通义灵码的能力,还为开发者提供了...
    早报# AI编程# 通义灵码# 阿里巴巴
    10个月前
    02300
    阿里巴巴提出START:显著提升大语言模型推理能力的创新工具

    阿里巴巴提出START:显著提升大语言模型推理能力的创新工具

    在大语言模型的发展中,尽管在理解和生成类人文本方面取得了显著进展,但在处理复杂推理任务时,尤其是需要多步计算或逻辑分析的任务,这些模型往往表现不佳。传统的思维链(Chain of Thought, C...
    新技术# START# 大语言模型# 推理
    9个月前
    02170
    阿里 Qwen 项目组正式推出全新多模态模型Qwen VLo

    阿里 Qwen 项目组正式推出全新多模态模型Qwen VLo

    随着多模态大模型的不断发展,我们对技术边界的认知也在持续被刷新。从最初的 QwenVL 到如今的 Qwen2.5 VL,我们在提升模型图像理解能力方面不断取得进步。 项目主页:https://qwen...
    多模态模型# Qwen VLo# Qwen 项目组# 阿里巴巴
    5个月前
    01970
    阿里发布 AgentScope 1.0:面向生产级智能体的开源开发框架

    阿里发布 AgentScope 1.0:面向生产级智能体的开源开发框架

    阿里巴巴近日正式推出 AgentScope 1.0 —— 一个以开发者为核心的开源智能体(Agent)开发框架,致力于解决当前智能体应用在可控性、可维护性和落地部署方面的关键挑战。 不同于仅聚焦于单点...
    大语言模型# AgentScope 1.0# 智能体开发框架# 阿里巴巴
    3个月前
    01580
    阿里巴巴推出 SmartResume:一个能“读懂”复杂简历版式的智能解析系统

    阿里巴巴推出 SmartResume:一个能“读懂”复杂简历版式的智能解析系统

    在企业招聘中,自动化处理海量简历是刚需,但简历格式千奇百怪——多栏排版、图文混排、表格嵌套,传统文本提取工具常会打乱语义顺序,导致关键信息错位。 针对这一难题,阿里巴巴企业智能团队发布了 SmartR...
    多模态模型# SmartResume# 智能简历解析# 阿里巴巴
    4周前
    0900
    阿里重磅官宣:千问 App 全平台公测,Qwen 最强模型打造“会办事”的AI生活入口

    阿里重磅官宣:千问 App 全平台公测,Qwen 最强模型打造“会办事”的AI生活入口

    今日,阿里巴巴正式宣布 千问 App 全平台公测上线——这款基于全球第一开源模型通义千问 Qwen 打造的个人 AI 助手,不仅延续了强大的对话能力,更以“会聊天、能办事”为核心定位,剑指未来 AI ...
    早报# Qwen# 千问 App# 阿里巴巴
    3周前
    0190
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Next AI Draw.io

    Next AI Draw.io

    Next AI Draw.io 是一个基于 Next.js 的 Web 应用,将大语言模型(LLM)与 draw.io 的强大图表能力深度集成。用户可通过自然语言指令创建、修改和增强专业图表,无需手动拖拽。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    OiiOii AI

    OiiOii AI

    OiiOii.ai 是一个基于多智能体架构的动画生成平台,其核心目标是将动画制作从线性协作流程,转变为端到端的自动化生成。用户只需上传一张图片或输入一段文字描述,系统即可自动完成剧本生成、分镜设计、角色建模、镜头调度、配乐合成与最终渲染,输出一段完整动画视频。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    MuMuAINovel

    MuMuAINovel

    MuMuAINovel 是一款开源的 AI 小说创作辅助工具,专为写作者设计。它不替代你的创意,而是帮你把想法快速转化为结构完整、设定一致、可扩展的长篇故事。
    查看完整榜单