NaturalReaderNaturalReader 是一款功能强大、易于使用的文本转语音工具,适合各种场景下的阅读需求。无论您是希望节省时间的学生、需要无障碍支持的读者,还是寻求高质量语音内容的创作者,NaturalReader 都能为您提供卓越的体验。06140AI语音# NaturalReader# TTS# 文本转语音
AI SpeakerAI Speaker 是一款基于微软 TTS 服务的在线文字转语音(TTS)工具,能够将文字即时转换为自然流畅的 语音,支持100多种语言和600多种AI语音。02841AI语音# AI Speaker# TTS# 微软
ElevenLabsElevenLabs 成立于 2022 年,总部位于英国和波兰,致力于利用 AI 技术生成自然、富有表现力的语音。它的平台支持从文本到语音的转换、语音克隆和多语言配音,服务于各种需求。02430AI语音# AI语音# ElevenLabs# 语音克隆
ZonosZonos模型基于约 20 万小时的语音数据进行训练,涵盖中性和富有表现力的语音模式。虽然主要数据集为英语内容,但也包含大量中文、日语、法语、西班牙语和德语的语音数据,从而支持多语言合成。02170AI语音# Zonos# Zyphra# 开源TTS模型
ElevenReaderAI 语音初创公司 ElevenLabs 旗下的文本转语音(TTS)应用 ElevenReader是一款强大的移动文本转语音应用程序,旨在帮助用户随时随地聆听任何文本内容。02030AI语音# ElevenLabs# ElevenReader# GenFM
Podcastle播客录制和编辑平台 Podcastle 正式发布了其名为 Asyncflow v1.0 的 AI 模型,正式加入 AI 驱动的文本转语音(TTS)领域。该平台不仅为用户提供了超过 450 个 AI 声音,还计划推出面向开发者的 API,允许开发者将文本转语音模型直接集成到他们的应用程序中。01920AI语音# Asyncflow# Podcastle# TTS
KrispKrisp的AI口音转换功能为跨语言沟通提供了一种新的解决方案。通过实时将说话者的口音转换为美国英语,该工具能够有效减少沟通障碍,提高沟通效率。尽管目前该技术主要针对印度英语口音,但其未来扩展计划显示了其巨大的应用潜力。01910AI语音# Krisp# 印度口音# 口音转换
OpenAI音频模型OpenAI正式推出了全新的音频模型,涵盖了文本转语音(Text-to-Speech, TTS)和语音转文本(Speech-to-Text, STT)两大核心功能,为语音交互领域带来了重大突破。01890AI语音# gpt-4o-mini-transcribe# gpt-4o-mini-tts# gpt-4o-transcribe
SubEasySubEasy 是视频创作者的得力助手,它通过强大的字幕生成、翻译和优化功能,帮助创作者节省时间,提升效率,从而更专注于内容创作本身。无论是精准的字幕生成、智能的润色与重排,还是多语言翻译和自定义设计,SubEasy 都为创作者提供了全方位的支持。01810AI语音# AI字幕转录# SubEasy# 字幕翻译
HedraHedra 是一个人工智能创作实验室,通过尖端的视频模型,赋能人类讲故事的能力。只需几秒钟,即可将您的角色变成富有表现力的说话者、歌手和说唱歌手。01680AI语音# Hedra# 对口型# 数字人
Gladia法国AI公司Gladia发布语音转文字模型Solaria,Solaria都能提供无可比拟的多语言支持基础,且质量与速度毫不妥协。凭借英语等常见语言94%的词准确率(WAR)行业标杆、独家支持的100+种语言(其中42种为Gladia独有)、以及270毫秒超低延迟,Solaria正在为AI语音交互树立全新标准。01670AI语音# Gladia# Solaria# 语音识别模型
Hume AIHume AI 是一家专注于先进 AI 语音技术的研究实验室和技术公司,使命是确保AI的开发服务于人类目标和情感福祉。通过构建能够以共情方式进行交流并学习如何让人们感到快乐的 AI 模型,Hume 正在重新定义语音交互的未来。01570AI语音# AI语音# EVI2# Hume AI
ListenHubListenHub 是一款轻量级、支持中文和英语的 NotebookLM 替代工具,基于前沿AI技术,快速生成你感兴趣的专属播客。无论你想听什么,ListenHub 都能用超真实AI人声为你呈现自然对话。相比 NotebookLM,ListenHub 生成内容更加快速,且支持移动端的流畅体验,让你随时随地探索热门话题、同步收藏、轻松制作和收听播客。01210AI语音# ListenHub# NotebookLM# 播客
Fish AudioFish Audio是一款生成式AI文本转语音和语音克隆平台,允许用户上传15秒语音片段进行克隆,支持多种场景如故事讲述、广告和有声书。它与AWS、Google Cloud和Nvidia合作,确保技术兼容性。0600AI语音# Fish Audio# OpenAudio S1# TTS