Deepgram即将推出一款名为Aura的新型文本转语音(TTS)API,专为实时语音AI代理设计。这款API的特点是提供接近人类的高质量对话,速度和效率优于目前市面上所有的语音AI解决方案。Aura的开发依托Deepgram多年在语音识别和语言理解领域的经验,旨在解决速度、成本、可靠性和对话质量方面的难题。目前,Deepgram已开放Aura的等待名单,供用户注册体验。
视频
这一年来,大型语言模型(LLMs)迅速普及,人们对其潜力表现出浓厚兴趣。声音界面将成为主要的LLMs访问方式。以下是一些支持这一观点的最新动态:
传统语音笔记正受到青睐;调查显示,多数人仍偏好电话解决客户服务问题;配备持续监听和语音AI技术的可穿戴设备日益流行;OpenAI最近使ChatGPT支持语音交互;对以声音为主的体验和工具的兴趣激增。ChatGPT和LLM时代的到来,使得对话AI技术栈得以发展,支持与人自然交互的语音驱动AI助手和代理。客户对目前语音AI供应商表示不满,主要是因为速度、成本、可靠性和对话质量问题。因此,推出了TTS API——Deepgram Aura,专为实时、对话式语音AI代理打造。
Deepgram将很快为开发者提供完整的语音AI平台,结合其业界领先的Nova-2语音转文字API和即将推出的Aura文本转语音API,为他们构建高吞吐量、实时AI代理提供必要的构建块。Deepgram对初期开发者组使用Aura取得的进展感到兴奋,并向少数合作伙伴提供了有限访问权限,以便他们立即开始与Aura集成。Deepgram将根据他们的反馈,继续完善语音套件和API功能,并确保其生产级应用的顺利推出。
点击文章最后的链接,立即加入等待名单,成为首批尝试Aura的人!
客户的需求在于高质量生产和高吞吐量两个领域。高质量生产着重于打造完美的声音,适用于视频游戏或有声书等场景。高吞吐量处理大量快速、一次性的实时对话,如快餐订餐或预约服务。Aura的目标是制作能反映自然人类对话的文本转语音技术,包括及时响应、语气词的使用、以及根据对话情境调整语调和情绪。初步测试表明,Aura在自然度上超过了其他主要选项,甚至在某些情况下超过了人类发言者。
Deepgram
下一篇: 最后一页
tortoise-tts学习资料汇总 - 高质量多声音TTS系统
2024-12-31
PaddleSpeech入门学习资料汇总 - 开源语音AI工具包
2025-01-02
pot-desktop使用指南 - 跨平台划词翻译和OCR软件
2025-01-02
understand-prompt学习资料汇总 - AI助手的探索与应用
2025-01-02
GPT4All学习资源汇总 - 在本地设备上运行大型语言模型
2025-01-02
2025-01-02
wechat-bot入门指南 - 基于ChatGPT的微信聊天机器人
2025-01-02
Cheetah - AI助手学习资料汇总 - Mac应用助力远程技术面试
2025-01-02
AI代码翻译器学习资料汇总 - 使用AI将代码从一种语言翻译成另一种语言
2025-01-02