全部产品
云市场
云游戏

使用前须知

更新时间:2020-08-20 16:16:07

初次使用智能语音服务,请先阅读快速开始系列文档,快速体验使用过程,而后按顺序阅读如下文档,以便更好地使用智能语音交互服务。

文档资源

描述

基本概念

介绍与智能语音交互服务相关基本概念。

管理项目

在管理控制台上创建项目、配置参数等。

获取Token

获取访问令牌后再调用智能语音交互服务。

调用语音交互服务

语音识别自学习工具

优化语音识别效果。

各服务对比

服务

时效性

功能

适用场景

支持的语音格式

支持调用方式

免费调用量

购买

一句话识别

实时识别

识别一分钟内的短语音

APP语音搜索、语音电话客服、对话聊天、控制口令等场景

PCM(无压缩的PCM或WAV文件)、OPUS

Java/C++/Android/iOS

最大2个并发

可单独购买

实时语音识别

实时识别

识别长时间的语音数据流

会议演讲、视频直播等长时间不间断语音场景

PCM(无压缩的PCM或WAV文件)

Java/C++/Android/iOS

最大2个并发

可单独购买

语音合成

实时合成

合成长度不超过300个字符(UTF-8编码)的文本内容

需要人工合成音的场景

PCM、WAV、MP3

Java/C++/Android/iOS

最大2个并发

可单独购买

录音文件识别

非实时识别。录音文件上传后,免费用户可在24小时内完成识别并返回识别文本;付费用户可在6小时内完成识别并返回识别文本。

说明

一次性上传大规模数据(半小时内上传超过500小时时长的录音)的除外,如果您有大规模数据转写需求,可与售前专家联系。

免费用户识别文件大小不超过512MB

非实时识别场景

支持单轨/双轨的WAV、MP3

Java/C++/GO/.NET/Node.js/PHP/Python

每个自然日最多识别2小时时长的录音文件

可单独购买

长文本语音合成

非实时合成

将超长文本(千字或万字)合成为语音二进制数据

阅读小说、文章等场景

PCM、WAV、MP3

JAVA/C++/RESTful API

暂不支持免费试用

可单独购买

注意

  • 除录音文件识别以外的其他识别服务只支持单声道(mono)语音数据。

  • 识别服务只支持8000Hz/16000Hz采样率、16bit采样位数的音频。