SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    阿里

    共 10 篇文章
    排序
    发布更新浏览点赞
    Qwen3-TTS 全家桶开源:支持音色克隆、创造与多语言拟人语音

    Qwen3-TTS 全家桶开源:支持音色克隆、创造与多语言拟人语音

    在语音生成技术快速迭代的当下,开发者与用户对高保真、可定制、低延迟的语音合成方案需求日益迫切。阿里Qwen项目组推出的 Qwen3-TTS 开源全家桶,凭借音色克隆、音色创造、拟人化语音生成与自然语言...
    语音模型# Qwen3-TTS# 阿里
    1周前
    0710
    阿里 Qoder 推出限时5折优惠,支持支付宝付款,助力开发者体验高效 AI 编程

    阿里 Qoder 推出限时5折优惠,支持支付宝付款,助力开发者体验高效 AI 编程

    阿里巴巴新一代 Agentic 编程平台 Qoder 正式启动全球限时五折优惠活动,并新增 支付宝支付 支持,进一步降低使用门槛,让更多开发者便捷体验 AI 驱动的编程效率革新。 什么是 Qoder...
    早报# Qoder# 阿里
    4个月前
    02260
    阿里通义千问上线 Qwen-3-Max-Preview:当前系列最强语言模型

    阿里通义千问上线 Qwen-3-Max-Preview:当前系列最强语言模型

    阿里Qwen项目组近日在官网及 OpenRouter 平台正式推出 Qwen-3-Max-Preview,并将其定义为通义千问系列中当前最强大的语言模型。 该模型基于 Qwen3 架构进一步优化,在推...
    大语言模型# Qwen-3-Max-Preview# 阿里
    5个月前
    0780
    阿里开源 Wan2.2-S2V-14B:输入一张图 + 一段音频,生成电影级数字人视频

    阿里开源 Wan2.2-S2V-14B:输入一张图 + 一段音频,生成电影级数字人视频

    阿里Wan团队正式开源音频驱动视频生成模型Wan2.2-S2V-14B。这款模型打破了传统视频生成对复杂输入的依赖——用户仅需提供一张静态图像与一条音频,即可生成面部表情自然、口型精准同步、肢体动作流...
    视频模型# Wan2.2-S2V-14B# 数字人# 阿里
    5个月前
    04910
    阿里达摩院开源 Rynn 系列:从协议到模型,打通具身智能“最后一公里”

    阿里达摩院开源 Rynn 系列:从协议到模型,打通具身智能“最后一公里”

    在上周开幕的 2025 世界机器人大会上,阿里达摩院宣布开源一套完整的具身智能技术体系,包括: 视觉-语言-动作模型 RynnVLA-001-7B 世界理解模型 RynnEC 机器人上下文协议 Ryn...
    多模态模型# RynnEC# RynnRCP# RynnVLA-001-7B
    6个月前
    03310
    香港大学联合阿里团队推出 LayerFlow:重新定义视频生成逻辑

    香港大学联合阿里团队推出 LayerFlow:重新定义视频生成逻辑

    香港大学、阿里达摩院与湖畔实验室的研究团队近日发布LayerFlow——一款专为层感知视频生成设计的统一框架。不同于传统视频生成方案,LayerFlow通过分层提示机制,可同步生成透明前景、纯净背景及...
    新技术# LayerFlow# 阿里# 香港大学
    8个月前
    01890
    阿里正式发布 Qwen3 Embedding和Reranker 系列模型:专为文本表征与检索排序设计

    阿里正式发布 Qwen3 Embedding和Reranker 系列模型:专为文本表征与检索排序设计

    今天凌晨,阿里巴巴正式开源 Qwen3 Embedding 系列模型,作为 Qwen 模型家族的最新成员,该系列专注于文本语义表征、信息检索与排序任务,在多语言理解、跨语言检索和代码相关性建模等方面展...
    大语言模型# Qwen3 Embedding# Qwen3 Reranker# 阿里
    8个月前
    01460
    卷麻了!阿里在除夕夜推出超大规模的 MoE 模型 Qwen2.5-Max

    卷麻了!阿里在除夕夜推出超大规模的 MoE 模型 Qwen2.5-Max

    过去,有一种观点认为,持续增加数据规模和模型参数可能是通向人工通用智能(AGI)的一条可行路径。然而,无论是对于稠密模型还是MoE(Mixture of Experts)模型而言,整个大模型社区在训练...
    大语言模型# MoE# Qwen2.5-Max# 阿里
    12个月前
    03020
    IC-LoRA模型及工作流:虚拟试衣、电影分镜、产品设计等

    IC-LoRA模型及工作流:虚拟试衣、电影分镜、产品设计等

    阿里通义团队推出的新型图像生成框架In-Context LoRA(IC-LoRA),利用Flux模型的上下文生成能力,来简化和提高图像生成任务的质量和效率。它可以通过提示词基于 Flux 生成主题连贯...
    工作流# IC-LoRA# 电影分镜# 虚拟试衣
    1年前
    06210
    阿里推出AI视频生成模型I2VGen-XL

    阿里推出AI视频生成模型I2VGen-XL

    阿里旗下达摩院推出AI视频生成模型I2VGen-XL,可以根据用户输入的静态图像和文本生成目标接近、语义相同的视频,生成的视频具高清 (1280 * 720)、宽屏 (16:9)、时序连贯、质感好等特...
    新技术# AI视频# I2VGen-XL# 阿里
    2年前
    06750
    没有了
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Skills.sh

    Skills.sh

    Vercel 近日上线了一个名为 skills.sh 的新站点,专门用于发现、浏览和安装 AI 智能体的“技能”(Skills)。
    Clawdbot/Moltbot

    Clawdbot/Moltbot

    Clawdbot 是一款可在您自己的设备上运行的个人 AI 助手。它在您已使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及扩展渠道(如 BlueBubbles、Matrix、Zalo 和 Zalo Personal)上为您提供应答。它可以在 macOS/iOS/Android 上进行语音交谈,并能渲染一个您可控制的实时画布。网关仅是控制平面——核心产品是助手本身。
    Situation Monitor

    Situation Monitor

    Situation Monitor 是由开发者 Reggie James 创建的一个免费、开源的全球风险监测平台。它通过一张交互式地图,实时整合并可视化全球范围内的关键地缘政治与安全信息,帮助用户快速掌握潜在冲突热点和战略动态。
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    Fogsight (雾象)

    Fogsight (雾象)

    雾象是一款由大语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。
    Awesome Clawdbot(Moltbot) Skills

    新Awesome Clawdbot(Moltbot) Skills

    社区维护了一份名为 Awesome Clawdbot (Moltbot) Skills 的精选技能集合。该列表收录了 565 项以上 来自 ClawdHub(Moltbot 官方公共技能注册表)的技能,并按功能类别组织,便于浏览与安装。
    查看完整榜单