谷歌将高清语音模型Chirp 3引入Vertex AI平台,并计划从下周开始正式推出

早报2周前发布 小马良
35 0

在生成式AI领域,文本和图像生成一直是关注焦点。然而,随着技术的快速发展,语音AI正迅速崛起,成为下一波浪潮。谷歌在这一领域的最新进展是将高清语音模型Chirp 3集成到其Vertex AI开发平台中,并计划从下周开始正式推出。

谷歌Chirp 3:语音AI的新突破

上周,谷歌宣布Chirp 3将支持31种语言,并推出8种新的语音选项。这一模型的使用场景广泛,包括构建语音助手、创建有声读物、开发客户支持代理以及为视频配音。这一消息是在谷歌DeepMind伦敦办公室的一次活动中公布的,标志着谷歌在语音AI领域的重大进展。

谷歌将高清语音模型Chirp 3引入Vertex AI平台,并计划从下周开始正式推出

竞争与限制

与此同时,其他公司也在语音AI领域迅速发展。例如,Sesame——一家因推出逼真的“Maya”和“Miles”AI语音应用而闻名的初创公司——上周宣布开放其模型,供开发者构建定制应用和服务。

值得注意的是,谷歌对Chirp 3的使用设定了限制,以防止滥用。谷歌云首席执行官托马斯·库里安(Thomas Kurian)在新闻发布会上表示:“我们正在与安全团队合作,确保这些问题得到妥善处理。”

市场格局与未来展望

谷歌的Chirp 3将与谷歌旗舰LLM(大型语言模型)Gemini的较新版本、图像生成模型Imagen以及昂贵的Veo 2视频生成工具一同部署在Vertex AI平台上。尽管Chirp 3是否能像Sesame那样创造出高度“逼真”的“人类”声音仍有待观察,但正如DeepMind首席执行官德米斯·哈萨比斯(Demis Hassabis)所强调的,这是一场马拉松,而非短跑。

哈萨比斯指出:“短期内,认为AI将在未来几年内解决一切问题的想法还为时尚早。我们距离实现AGI(通用人工智能)还有数年时间。AI将在未来十年内改变世界,但这属于中期到长期的范畴。”

Vertex AI:谷歌的AI开发平台

谷歌早在2021年就推出了Vertex AI,作为开发者在云端构建机器学习服务的平台。这一平台的推出早于OpenAI的GPT服务引发的生成式AI热潮。此后,谷歌通过Vertex AI追赶微软和亚马逊等竞争对手,为开发者提供生成式AI工具。除了在Gemini之上构建生成式AI外,开发者还可以使用Vertex AI对数据进行分类、训练模型,并为生产环境设置训练模型。

历史与展望

多年来,谷歌一直在开发“Chirp”语音服务,其最初是为了与亚马逊的Alexa服务竞争而启动的项目。如今,随着Chirp 3的推出,谷歌在语音AI领域迈出了重要一步。未来,谷歌是否会将其封闭生态系统扩展到谷歌以外的模型,将是值得关注的方向。

© 版权声明

相关文章

暂无评论

none
暂无评论...