SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 百科工具
    • 工具
  • 排行榜
  • 网址提交
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 百科工具
      • 工具
    • 排行榜
    • 网址提交

    AI语音

    共 39 篇网址
    AI绘画AI视频AI音乐AI助手AI语音AI编程3DAI工具基准测试AI搜索模型API实用工具AI数字人服务托管AI硬件影音视频文件共享无版权资源浏览器操作系统图形图像爱学习信息查询下载服务学习办公AI辅助趣味应用世界模型
    排序
    发布更新浏览点赞
    Speechify

    Speechify

    Speechify 早已以高质量文本转语音(TTS)闻名,帮助用户“听”文章、PDF 和网页。如今,它正从语音输出工具转型为以语音为第一交互方式的 AI 生产力平台。
    0570
    AI语音# Speechify# TTS
    Supertonic

    Supertonic

    Supertonic 是一款闪电般快速的设备端文本转语音系统,专为极致性能和最小计算开销而设计。基于 ONNX Runtime 驱动,完全在您的设备上运行——无需云端支持、无需 API 调用、无需担心隐私问题。
    0410
    AI语音# Supertonic# TTS
    Audio.Z.AI

    Audio.Z.AI

    Audio.Z.AI 是体验 GLM-TTS 能力的最简单入口。虽然功能尚处早期,但其免费、高音质、支持克隆的特点,已足够满足轻量级语音合成需求。
    0390
    AI语音# Audio.Z.AI# GLM-TTS# 智谱 AI
    Subtle Computing

    Subtle Computing

    总部位于加州的初创公司 Subtle Computing 正在尝试从根本上解决这个问题:他们不训练更大的语言模型,而是确保输入语音本身足够“干净”。通过一种轻量级的端到端语音隔离模型,他们的技术能在本地设备上实时分离用户语音与环境噪音,显著提升后续语音识别的准确性。
    0380
    AI语音# Subtle Computing# 语音隔离模型
    NovaSR

    NovaSR

    NovaSR 是一个仅 50KB 的音频上采样模型,能够将模糊的 16kHz 音频升级为清晰明快的 48kHz 音频,处理速度超过实时速度的 3500 倍。
    0370
    AI语音# NovaSR# 音频超分辨率模型
    Cartesia

    Cartesia

    Cartesia 不仅带来了 SSM 架构驱动的低延迟 TTS、真实场景优化的 STT 模型,更通过 Line 平台解决了语音代理开发的“最后一公里”问题。其核心价值在于:让“实时、自然、可靠”的语音交互不再是技术难题,让开发者无需关注底层模型与基础设施,专注于业务逻辑与用户体验。
    0290
    AI语音# AI 语音# Cartesia# STT 模型
    Ai好记

    Ai好记

    Ai好记是为知识管理设计的多模态知识管理工具。它可以将全网音视频内容统一解析,生成结构化笔记、思维导图和 AI 总结,让碎片化的学习资料像Windows系统中的文件一样,有序可查、逻辑清晰、易于调用。
    0220
    AI语音# Ai好记# 知识管理
    LinaCodec

    LinaCodec

    Linacodec是一款极低比特率(171 bps)的音频分词器,仅用 12.5 个 token/秒 即可完整表示语音信号,并支持 48kHz 高清音频重建。
    0200
    AI语音# Linacodec# 音频分词器
    Voice Clone Studio

    Voice Clone Studio

    Voice Clone Studio是一个基于 Gradio 的语音克隆与语音设计 Web 界面,由 Qwen3-TTS 和 VibeVoice 驱动。支持使用 Whisper 或 VibeVoice-asr 进行自动转录。
    020
    AI语音# Qwen3-TTS# VibeVoice# Voice Clone Studio
    没有了
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    关于我们网址提交友链申请广告合作

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2026 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    Skills.sh

    Skills.sh

    Vercel 近日上线了一个名为 skills.sh 的新站点,专门用于发现、浏览和安装 AI 智能体的“技能”(Skills)。
    Situation Monitor

    Situation Monitor

    Situation Monitor 是由开发者 Reggie James 创建的一个免费、开源的全球风险监测平台。它通过一张交互式地图,实时整合并可视化全球范围内的关键地缘政治与安全信息,帮助用户快速掌握潜在冲突热点和战略动态。
     CutCut

     CutCut

    CutCut是一个视频下载与剪辑工具,支持从 YouTube、Bilibili 等主流平台直接按章节或自定义时间范围下载片段,无需先下完整视频再剪辑。
    Clawdbot/Moltbot

    Clawdbot/Moltbot

    Clawdbot 是一款可在您自己的设备上运行的个人 AI 助手。它在您已使用的渠道(WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage、Microsoft Teams、WebChat)以及扩展渠道(如 BlueBubbles、Matrix、Zalo 和 Zalo Personal)上为您提供应答。它可以在 macOS/iOS/Android 上进行语音交谈,并能渲染一个您可控制的实时画布。网关仅是控制平面——核心产品是助手本身。
    TapNow

    TapNow

    TapNow是一个面向创作者的专业级 AI 视觉内容平台,支持从脚本撰写、分镜头设计到高保真成片输出的完整流程,单人即可在 1–3 天内完成传统需 4–6 周的影视级项目。
    Awesome Clawdbot(Moltbot) Skills

    新Awesome Clawdbot(Moltbot) Skills

    社区维护了一份名为 Awesome Clawdbot (Moltbot) Skills 的精选技能集合。该列表收录了 565 项以上 来自 ClawdHub(Moltbot 官方公共技能注册表)的技能,并按功能类别组织,便于浏览与安装。
    查看完整榜单