Loading...
SD百科导航
  • 首页
  • 快讯
  • 早报
  • 模型
  • ComfyUI
  • 工具
  • 新技术
  • 百科
    • 教程
    • 硬件
    • 科普
  • 知识库
  • 导航
    • 首页
    • 快讯
    • 早报
    • 模型
    • ComfyUI
    • 工具
    • 新技术
    • 百科
      • 教程
      • 硬件
      • 科普
    • 知识库
    • 导航

    AI语音

    共 17 篇网址
    AI绘画AI视频AI音乐AI助手AI语音AI编程3DAI工具基准测试AI搜索模型API实用工具AI数字人模型托管
    排序
    发布更新浏览点赞
    NaturalReader

    NaturalReader

    NaturalReader 是一款功能强大、易于使用的文本转语音工具,适合各种场景下的阅读需求。无论您是希望节省时间的学生、需要无障碍支持的读者,还是寻求高质量语音内容的创作者,NaturalReader 都能为您提供卓越的体验。
    06140
    AI语音# NaturalReader# TTS# 文本转语音
    录咖

    录咖

    录咖以其强大的 AI 技术和丰富的功能,为音视频创作和处理带来了前所未有的便捷体验。无论你是创作者、教育工作者还是普通用户,录咖都能成为你得力的助手。
    03140
    AI语音# AI音频处理# 录咖
    TTSMaker

    TTSMaker

    TTSMaker是一款在线文本转语音工具,也称为AI语音生成器,它可以将文本转换为音频,并且可以播放或下载音频文件。
    03060
    AI语音# AI配音# TTSMaker# 文本转语音
    AI Speaker

    AI Speaker

    AI Speaker 是一款基于微软 TTS 服务的在线文字转语音(TTS)工具,能够将文字即时转换为自然流畅的 语音,支持100多种语言和600多种AI语音。
    02841
    AI语音# AI Speaker# TTS# 微软
    ElevenLabs

    ElevenLabs

    ElevenLabs 成立于 2022 年,总部位于英国和波兰,致力于利用 AI 技术生成自然、富有表现力的语音。它的平台支持从文本到语音的转换、语音克隆和多语言配音,服务于各种需求。
    02430
    AI语音# AI语音# ElevenLabs# 语音克隆
    海螺语音

    海螺语音

    MiniMax旗下的海螺AI上线了基于T2A-01系列语音模型的“海螺语音”。这一更新为用户带来了更加自然、流畅的超拟人人声体验。
    02210
    AI语音# MiniMax# TTS# 海螺AI
    Zonos

    Zonos

    Zonos模型基于约 20 万小时的语音数据进行训练,涵盖中性和富有表现力的语音模式。虽然主要数据集为英语内容,但也包含大量中文、日语、法语、西班牙语和德语的语音数据,从而支持多语言合成。
    02170
    AI语音# Zonos# Zyphra# 开源TTS模型
    ElevenReader

    ElevenReader

    AI 语音初创公司 ElevenLabs 旗下的文本转语音(TTS)应用 ElevenReader是一款强大的移动文本转语音应用程序,旨在帮助用户随时随地聆听任何文本内容。
    02030
    AI语音# ElevenLabs# ElevenReader# GenFM
    Podcastle

    Podcastle

    播客录制和编辑平台 Podcastle 正式发布了其名为 Asyncflow v1.0 的 AI 模型,正式加入 AI 驱动的文本转语音(TTS)领域。该平台不仅为用户提供了超过 450 个 AI 声音,还计划推出面向开发者的 API,允许开发者将文本转语音模型直接集成到他们的应用程序中。
    01920
    AI语音# Asyncflow# Podcastle# TTS
    Krisp

    Krisp

    Krisp的AI口音转换功能为跨语言沟通提供了一种新的解决方案。通过实时将说话者的口音转换为美国英语,该工具能够有效减少沟通障碍,提高沟通效率。尽管目前该技术主要针对印度英语口音,但其未来扩展计划显示了其巨大的应用潜力。
    01910
    AI语音# Krisp# 印度口音# 口音转换
    OpenAI音频模型

    OpenAI音频模型

    OpenAI正式推出了全新的音频模型,涵盖了文本转语音(Text-to-Speech, TTS)和语音转文本(Speech-to-Text, STT)两大核心功能,为语音交互领域带来了重大突破。
    01890
    AI语音# gpt-4o-mini-transcribe# gpt-4o-mini-tts# gpt-4o-transcribe
    SubEasy

    SubEasy

    SubEasy 是视频创作者的得力助手,它通过强大的字幕生成、翻译和优化功能,帮助创作者节省时间,提升效率,从而更专注于内容创作本身。无论是精准的字幕生成、智能的润色与重排,还是多语言翻译和自定义设计,SubEasy 都为创作者提供了全方位的支持。
    01810
    AI语音# AI字幕转录# SubEasy# 字幕翻译
    Hedra

    Hedra

    Hedra 是一个人工智能创作实验室,通过尖端的视频模型,赋能人类讲故事的能力。只需几秒钟,即可将您的角色变成富有表现力的说话者、歌手和说唱歌手。
    01680
    AI语音# Hedra# 对口型# 数字人
    Gladia

    Gladia

    法国AI公司Gladia发布语音转文字模型Solaria,Solaria都能提供无可比拟的多语言支持基础,且质量与速度毫不妥协。凭借英语等常见语言94%的词准确率(WAR)行业标杆、独家支持的100+种语言(其中42种为Gladia独有)、以及270毫秒超低延迟,Solaria正在为AI语音交互树立全新标准。
    01670
    AI语音# Gladia# Solaria# 语音识别模型
    Hume AI

    Hume AI

    Hume AI 是一家专注于先进 AI 语音技术的研究实验室和技术公司,使命是确保AI的开发服务于人类目标和情感福祉。通过构建能够以共情方式进行交流并学习如何让人们感到快乐的 AI 模型,Hume 正在重新定义语音交互的未来。
    01570
    AI语音# AI语音# EVI2# Hume AI
    ListenHub

    ListenHub

    ListenHub 是一款轻量级、支持中文和英语的 NotebookLM 替代工具,基于前沿AI技术,快速生成你感兴趣的专属播客。无论你想听什么,ListenHub 都能用超真实AI人声为你呈现自然对话。相比 NotebookLM,ListenHub 生成内容更加快速,且支持移动端的流畅体验,让你随时随地探索热门话题、同步收藏、轻松制作和收听播客。
    01210
    AI语音# ListenHub# NotebookLM# 播客
    Fish Audio

    Fish Audio

    Fish Audio是一款生成式AI文本转语音和语音克隆平台,允许用户上传15秒语音片段进行克隆,支持多种场景如故事讲述、广告和有声书。它与AWS、Google Cloud和Nvidia合作,确保技术兼容性。
    0600
    AI语音# Fish Audio# OpenAudio S1# TTS
    没有了
    SD百科导航
    SD百科导航是专注于AI创作领域的专业导航网站。我们全面涵盖Stable Diffusion、Flux、AI绘画、AI视频、AI音乐以及大语言模型等前沿内容。

    友链申请免责声明广告合作关于我们

    扫码关注微信公众号SD百科导航
    扫码关注微信公众号
    Copyright © 2025 SD百科导航 皖ICP备18025588号-5  皖公网安备34040002000401 
    反馈
    让我们一起共建文明社区!您的反馈至关重要!
    网址
    网址文章软件模型

    网址

    日榜周榜月榜
    朱雀大模型检测

    朱雀大模型检测

    腾讯朱雀 AI 检测是于 2025 年 1 月 17 日推出的一款 AI 生成内容检测工具,主要用于帮助用户识别 AI 生成的文本和图像内容。每位用户每天最多可检测20次文本和20次图片。
    扣子空间

    扣子空间

    扣子空间(Coze Space)是一个通用型 AI Agent 平台,允许用户用自然语言描述任务,比如生成一份研究报告或一个 PPT。平台会自动分析需求,调用合适的工具和插件来完成任务,输出如网页、文档或表格等内容。它特别适合没有编程经验的用户,通过可视化界面快速搭建 AI 应用。
    RunningHub

    RunningHub

    RunningHub 是一个云平台,让用户轻松开发和分享 AI 应用。它特别适合那些希望通过浏览器直接操作的创作者,无需复杂的本地设置。平台基于 ComfyUI 工作流,提供强大的 GPU 云计算支持,确保高效任务执行。
    Tripo

    Tripo

    Tripo AI 是一家领先的 AI 驱动 3D 建模解决方案提供商,允许用户使用文本、单张图像、多张图像、涂鸦或视频等输入,快速创建高质量的 3D 模型和环境。
    AI Speaker

    AI Speaker

    AI Speaker 是一款基于微软 TTS 服务的在线文字转语音(TTS)工具,能够将文字即时转换为自然流畅的 语音,支持100多种语言和600多种AI语音。
    星野APP

    星野APP

    星野APP是一款由MiniMax开发的AI伴侣应用,专为中国用户设计,旨在提供个性化的虚拟交互体验。用户可以通过星野APP创建自己的AI角色,定制其外貌、声音、性格和技能。
    查看完整榜单