全部产品

从这里开始

更新时间:2020-10-30 11:51:02

欢迎开启智能语音交互之旅!

阿里云智能语音交互将为您提供如下服务:

  • 实时语音识别服务:对长时间的语音数据流进行识别,适用于会议演讲、视频直播等长时间不间断识别的场景。

  • 一句话识别服务对一分钟内的短语音进行识别,适用于对话聊天,控制口令等较短的语音识别场景。

  • 录音文件识别服务:对上传的音频文件进行识别,适用于非实时识别场景。

  • 语音合成服务:将文本转化为接近真人的语音服务,包含男女童音、多语言/方言。适用于智能客服、电话外呼等虚拟对话场景。

  • 长文本语音合成服务:将超长文本(十万字)合成为接近真人的语音服务,包含男女童音、多语言/方言(且拥有音频重复使用权)。适用于文学伴读、新闻阅读等场景。

  • 自学习服务:使用自学习服务提供的训练热词和定制语言模型功能,提升识别效果。

  • 个性化人声定制服务:设备获取用户录制的少量语音,系统逐条检测录音质量后上传音频,自动化训练个性化人声模型。

  • 设备端语音交互NUI SDK:为您提供在智能音箱、语音IoT家电等需要远近场语音交互的智能硬件设备端的语音解决方案。

快速入门系列文档,介绍使用智能语音服务需要的步骤,帮助您快速开通服务、创建测试项目和调用语音识别服务。建议按顺序阅读:

  1. 开通服务

  2. 创建项目

  3. 运行SDK