SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航

    通义千问

    共 4 篇文章
    排序
    发布更新浏览点赞
    阿里通义千问系列再添新成员,Qwen3 模型即将发布

    阿里通义千问系列再添新成员,Qwen3 模型即将发布

    阿里云通义千问开源负责人林俊旸在社交平台 X 上发文暗示,备受期待的Qwen3 系列模型有望于今日正式发布。尽管具体发布时间尚未完全确认,但种种迹象表明,这一全新系列模型将在本周内与公众见面。 值得一...
    早报# Qwen3# 通义千问
    3个月前
    01090
    Manus 与阿里通义千问达成战略合作,在国产模型和算力平台上实现 Manus 全部功能

    Manus 与阿里通义千问达成战略合作,在国产模型和算力平台上实现 Manus 全部功能

    Manus在其官方微博宣布,已与阿里通义千问团队达成了一项战略合作。此次合作将基于通义千问系列的开源模型,在国内的模型和算力平台上实现Manus的所有功能。目前,两家公司的技术团队已经开始紧密合作,目...
    早报# Manus# 通义千问
    4个月前
    01400
    阿里EMO 模型上线通义千问APP,用照片 + 音频生成唱歌视频

    阿里EMO 模型上线通义千问APP,用照片 + 音频生成唱歌视频

    阿里巴巴在今年2月份就公开了创新框架EMO,它是一个能够根据音频生成表情丰富的肖像视频的系统。你只需要提供一张静态的照片和一段语音,EMO就能创造出一个视频,视频中的人物头像会根据语音的内容和情感变化...
    工具# EMO 模型# 通义千问
    1年前
    01,2460
    通义千问视觉理解模型 Qwen-VL升级版:Qwen-VL-Plus、Qwen-VL-Max

    通义千问视觉理解模型 Qwen-VL升级版:Qwen-VL-Plus、Qwen-VL-Max

    阿里云宣布通义千问视觉理解模型 Qwen-VL 再次升级,继 Plus 版本之后推出 Max 版本,升级版模型拥有更强的视觉推理能力和中文理解能力,能够根据图片识人、答题、创作、写代码,并在多个权威测...
    新技术# Qwen-VL-Max# Qwen-VL-Plus# 视觉理解模型
    1年前
    06060
    没有了
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Open ASR 排行榜

    Open ASR 排行榜

    Open ASR 排行榜 对 Hugging Face Hub 上的语音识别模型进行排名和评估。我们报告平均 WER(字错误率)(⬇️ 越低越好)和 RTFx(实时因子)(⬆️ 越高越好),模型根据其平均 WER 从低到高进行排名。
    Qwen Chat

    Qwen Chat

    Qwen Chat是阿里通义团队在海外市场推出了一款全新的AI助手,可以看作是通义千问的海外版,这款助手基于开源的Open WebUI框架开发而成。
    VideoTutor

    VideoTutor

    VideoTutor 是一款 AI 驱动的教育工具,专注于生成学习视频,它提供定制的 AI 解释视频和 24/7 AI 教师支持,覆盖数学、科学和语言等主题。它适合 K-12 学生自主学习,但具体效果可能因用户而异。
    TTSMaker

    TTSMaker

    TTSMaker是一款在线文本转语音工具,也称为AI语音生成器,它可以将文本转换为音频,并且可以播放或下载音频文件。
    BabelDOC

    BabelDOC

    BabelDOC 是新一代智能 PDF 翻译工具,采用先进的排版保持技术,为您提供专业级的双语对照翻译体验。无论是前沿学术论文,还是商业分析报告,BabelDOC 都能帮您轻松跨越语言藩篱,同时完美呈现原文档的精致排版。
    Whisk

    Whisk

    Whisk 是谷歌最新的 Google Labs 实验,允许用户通过输入或创建传达主题、场景和风格的图像,轻松组合并重新混合这些元素,生成独一无二的作品。Whisk 结合了 Imagen 3 的图像生成能力和 Gemini 的视觉理解和描述能力,使用户能够以有趣的新方式探索创意。
    查看完整榜单