
OpenAI音频模型
OpenAI正式推出了全新的音频模型,涵盖了文本转语音(Text-to-Speech, TTS)和语音转文本(Speech-to-Text, STT)两大核心功能,为语音交互领域带来了重大突破。
你有没有过这样的经历:对着手机语音输入一大段想法,结果满屏都是“那个……”、“呃……”、“我是说……”,最后还得花大量时间手动删除这些废话?
现在,谷歌悄悄给出了解决方案。
一款名为 Google AI Edge Eloquent 的新应用近日在 iOS App Store 上线(Android 版本也在路上)。它不是普通的语音转文字工具,而是一个能听懂你“言外之意”的 AI 秘书。

传统的语音输入法是“录音机”,你说什么它记什么,包括所有的结巴、重复和口头禅。
Eloquent 则不同,它由谷歌轻量级的 Gemma 开源模型驱动。它的核心能力不是“听写”,而是“理解”。
在 AI 时代,隐私是最大的顾虑。Eloquent 的一大卖点就是**“离线优先”**。
最令人惊喜的是,Eloquent 目前完全免费,没有使用次数限制,也没有订阅陷阱。谷歌将其定位为一款实验性产品,旨在探索边缘 AI(Edge AI)的可能性。







