全部产品
云市场
云游戏

从这里开始

更新时间:2020-08-20 15:46:06

欢迎开启智能语音交互之旅!

阿里云智能语音交互将为您提供如下服务:

  • 实时语音识别服务:对长时间的语音数据流进行识别,适用于会议演讲、视频直播等长时间不间断识别的场景。

  • 一句话识别服务:对一分钟内的短语音进行识别,适用于对话聊天,控制口令等较短的语音识别场景。

  • 录音文件识别服务:对上传的音频文件进行识别,适用于非实时识别场景。

  • 语音合成服务:将文本转化为接近真人的语音服务,包含男女童音、多语言/方言。适用于智能客服、电话外呼等虚拟对话场景。

  • 长文本语音合成服务:将超长文本(十万字)合成为接近真人的语音服务,包含男女童音、多语言/方言(且拥有音频重复使用权)。适用于文学伴读、新闻阅读等场景。

  • 自学习服务:为了提升识别效果,您还可以使用自学习服务。为您提供训练热词和定制语言模型功能,帮助提升上述识别服务的识别效果。

快速入门系列文档,介绍使用智能语音服务需要的步骤,帮助您快速开通服务、创建测试项目和调用语音识别服务。建议按顺序阅读:

  1. 开通服务

  2. 创建项目

  3. 运行SDK