SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
  • 百科工具
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航
    • 百科工具

    阿里巴巴

    共 25 篇文章
    排序
    发布更新浏览点赞
    阿里巴巴发布 QVQ-Max:能看、能理解、能思考的视觉推理模型

    阿里巴巴发布 QVQ-Max:能看、能理解、能思考的视觉推理模型

    阿里巴巴推出一款名为 QVQ-Max 的全新视觉推理模型,这是其 Qwen模型系列中的最新成员。QVQ-Max 的独特之处在于它能够理解照片和视频的内容,并对这些信息进行分析和推理,从而提供解决方案...
    多模态模型# QVQ-Max# 视觉推理模型# 阿里巴巴
    8个月前
    02760
    阿里巴巴推出全身虚拟形象解决方案TaoAvatar:在AR设备上实时运行一个会说话的全身虚拟人

    阿里巴巴推出全身虚拟形象解决方案TaoAvatar:在AR设备上实时运行一个会说话的全身虚拟人

    阿里巴巴的研究人员推出一种名为 TaoAvatar 的技术,用于创建逼真的、全身的、会说话的虚拟形象(avatar),并能够在增强现实(AR)设备上实时运行。TaoAvatar 基于 3D 高斯点绘制...
    3D模型# TaoAvatar# 虚拟形象# 阿里巴巴
    9个月前
    02330
    阿里巴巴宣布夸克升级:打造无边界的“AI超级框”

    阿里巴巴宣布夸克升级:打造无边界的“AI超级框”

    阿里巴巴今日宣布,夸克正式升级为无边界的“AI超级框”,基于阿里通义领先的推理及多模态大模型,为用户提供一站式、全能化的AI服务。 从对话式AI到“AI超级框” 与传统的对话式AI不同,夸克此次升级将...
    早报# AI超级框# 夸克# 阿里巴巴
    9个月前
    03140
    阿里巴巴提出START:显著提升大语言模型推理能力的创新工具

    阿里巴巴提出START:显著提升大语言模型推理能力的创新工具

    在大语言模型的发展中,尽管在理解和生成类人文本方面取得了显著进展,但在处理复杂推理任务时,尤其是需要多步计算或逻辑分析的任务,这些模型往往表现不佳。传统的思维链(Chain of Thought, C...
    新技术# START# 大语言模型# 推理
    9个月前
    02170
    Qwen Chat 推出全新推理功能“Thinking (QwQ)” ,加速 AI 普及化

    Qwen Chat 推出全新推理功能“Thinking (QwQ)” ,加速 AI 普及化

    阿里 Qwen 团队宣布在 Qwen Chat 中推出全新功能“Thinking (QwQ)”,该功能由 QwQ-Max-Preview 推理模型提供支持,现已可通过 Qwen 官方网站 访问。 Qw...
    早报# Qwen# Qwen Chat# QwQ-Max-Preview
    9个月前
    03190
    阿里巴巴通义实验室开源视频生成模型 Wan2.1

    阿里巴巴通义实验室开源视频生成模型 Wan2.1

    在AI技术的浪潮中,视频生成技术正逐渐成为新的热点。阿里巴巴集团通义实验室紧跟技术前沿,于2月21日宣布开源其先进的视频生成模型——WanX 2.1。然而,在发布过程中出现了一个小插曲,模型名称由Wa...
    视频模型# AI视频# Wan2.1# WanX 2.1
    9个月前
    02410
    通义灵码全新升级:支持 DeepSeek-V3 和 DeepSeek-R1 满血版模型

    通义灵码全新升级:支持 DeepSeek-V3 和 DeepSeek-R1 满血版模型

    阿里巴巴旗下的“通义灵码”今日宣布推出全新的模型选择功能,支持基于百炼的 DeepSeek-V3 和 DeepSeek-R1 满血版 671B 模型。这一更新不仅增强了通义灵码的能力,还为开发者提供了...
    早报# AI编程# 通义灵码# 阿里巴巴
    10个月前
    02300
    通义实验室推出基于指令的图像生成和编辑框架ACE++:基于FLUX.1-dev模型,实现多种图像生成和编辑任务

    通义实验室推出基于指令的图像生成和编辑框架ACE++:基于FLUX.1-dev模型,实现多种图像生成和编辑任务

    阿里巴巴通义实验室推出基于指令的图像生成和编辑框架ACE++,这是之前介绍过的新型多模态生成模型ACE升级版,ACE++ 通过改进的长上下文条件单元(LCU++)和两阶段训练方案,能够高效地利用预训练...
    图像模型# ACE# FLUX.1-dev# 图像生成
    10个月前
    03440
    阿里巴巴语音实验室发布开源语音处理框架 ClearerVoice-Studio:支持语音增强、分离和目标说话人提取

    阿里巴巴语音实验室发布开源语音处理框架 ClearerVoice-Studio:支持语音增强、分离和目标说话人提取

    在当今的音频环境中,清晰沟通面临诸多挑战。背景噪音、重叠对话以及音频和视频信号的混合等因素常常破坏了沟通的清晰度和理解力。这些问题不仅影响个人通话,还波及专业会议和内容制作等场景。尽管音频技术有所进步...
    语音模型# ClearerVoice-Studio# 阿里巴巴
    10个月前
    03160
    阿里巴巴Wanx 团队推出新型多模态生成模型ACE:可以根据文本指令来执行复杂的图像编辑和生成任务

    阿里巴巴Wanx 团队推出新型多模态生成模型ACE:可以根据文本指令来执行复杂的图像编辑和生成任务

    阿里巴巴Wanx 团队推出新型多模态生成模型ACE,这个模型的核心功能是处理和生成图像,但它与传统的图像处理工具不同,因为它可以根据文本指令来执行复杂的图像编辑和生成任务。例如,你是一名摄影师,你拍摄...
    新技术# ACE# 阿里巴巴
    12个月前
    06540
    阿里推出角色视频合成框架MIMO:允许用户对视频中的人物进行替换

    阿里推出角色视频合成框架MIMO:允许用户对视频中的人物进行替换

    阿里巴巴智能计算研究院推出MIMO,它能够根据用户提供的简单输入,合成具有可控属性(如角色、动作和场景)的逼真角色视频。简单来说,这项技术能够让用户通过提供一些基本的指令或样本,来创造出一段新的视频...
    新技术# MIMO# 角色视频合成# 阿里巴巴
    1年前
    04510
    阿里推出新型大型多模态模型ConvLLaVA:专门设计用于处理高分辨率的视觉数据

    阿里推出新型大型多模态模型ConvLLaVA:专门设计用于处理高分辨率的视觉数据

    清华大学和阿里巴巴的研究人员推出新型大型多模态模型ConvLLaVA,它专门设计用于处理高分辨率的视觉数据。多模态模型能够理解和处理多种类型的数据,比如文本、图像和视频,这使得它们在各种应用场景中都非...
    新技术# ConvLLaVA# 多模态模型# 阿里巴巴
    2年前
    06960
    加载更多
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Next AI Draw.io

    Next AI Draw.io

    Next AI Draw.io 是一个基于 Next.js 的 Web 应用,将大语言模型(LLM)与 draw.io 的强大图表能力深度集成。用户可通过自然语言指令创建、修改和增强专业图表,无需手动拖拽。
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    MuMuAINovel

    MuMuAINovel

    MuMuAINovel 是一款开源的 AI 小说创作辅助工具,专为写作者设计。它不替代你的创意,而是帮你把想法快速转化为结构完整、设定一致、可扩展的长篇故事。
    OiiOii AI

    OiiOii AI

    OiiOii.ai 是一个基于多智能体架构的动画生成平台,其核心目标是将动画制作从线性协作流程,转变为端到端的自动化生成。用户只需上传一张图片或输入一段文字描述,系统即可自动完成剧本生成、分镜设计、角色建模、镜头调度、配乐合成与最终渲染,输出一段完整动画视频。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    查看完整榜单