语音合成为您提供将输入文本合成为语音二进制数据的功能。
功能介绍
如需使用Android/iOS SDK,请参见移动端接口说明。
支持输出PCM、WAV和MP3编码格式数据。
支持设置语速、语调和音量。
支持设置不同类型的声音。
说明字级别音素边界接口:语音合成服务在输出音频的同时,可输出每个汉字/英文单词在音频中的时间位置,即时间戳。该时间信息可用于驱动虚拟人口型、做视频配音字幕等。详情请参见语音合成时间戳功能介绍。
文学场景相关发音人信息,请参见接口说明。
名称
voice参数值
类型
适用场景
支持语言
支持采样率(Hz)
支持字级别音素边界接口
小云
Xiaoyun
标准女声
通用场景
中文及中英文混合场景
8K/16K
否
小刚
Xiaogang
标准男声
通用场景
中文及中英文混合场景
8K/16K
否
若兮
Ruoxi
温柔女声
通用场景
中文及中英文混合场景
8K/16K/24K
否
思琪
Siqi
温柔女声
通用场景
中文及中英文混合场景
8K/16K/24K
是
思佳
Sijia
标准女声
通用场景
中文及中英文混合场景
8K/16K/24K
否
思诚
Sicheng
标准男声
通用场景
中文及中英文混合场景
8K/16K/24K
是
艾琪
Aiqi
温柔女声
通用场景
中文及中英文混合场景
8K/16K
是
艾佳
Aijia
标准女声
通用场景
中文及中英文混合场景
8K/16K
是
艾诚
Aicheng
标准男声
通用场景
中文及中英文混合场景
8K/16K
是
艾达
Aida
标准男声
通用场景
中文及中英文混合场景
8K/16K
是
宁儿
Ninger
标准女声
通用场景
纯中文场景
8K/16K/24K
否
瑞琳
Ruilin
标准女声
通用场景
纯中文场景
8K/16K/24K
否
思悦
Siyue
温柔女声
客服场景
中文及中英文混合场景
8K/16K/24K
否
艾雅
Aiya
严厉女声
客服场景
中文及中英文混合场景
8K/16K
是
艾夏
Aixia
亲和女声
客服场景
中文及中英文混合场景
8K/16K
是
艾美
Aimei
甜美女声
客服场景
中文及中英文混合场景
8K/16K
是
艾雨
Aiyu
自然女声
客服场景
中文及中英文混合场景
8K/16K
是
艾悦
Aiyue
温柔女声
客服场景
中文及中英文混合场景
8K/16K
是
艾婧
Aijing
严厉女声
客服场景
中文及中英文混合场景
8K/16K
是
小美
Xiaomei
甜美女声
客服场景
中文及中英文混合场景
8K/16K/24K
否
艾娜
Aina
浙普女声
客服场景
纯中文场景
8K/16K
是
伊娜
Yina
浙普女声
客服场景
纯中文场景
8K/16K/24K
否
思婧
Sijing
严厉女声
客服场景
纯中文场景
8K/16K/24K
是
思彤
Sitong
儿童音
童声场景
纯中文场景
8K/16K/24K
否
小北
Xiaobei
萝莉女声
童声场景
纯中文场景
8K/16K/24K
是
艾彤
Aitong
儿童音
童声场景
纯中文场景
8K/16K
是
艾薇
Aiwei
萝莉女声
童声场景
纯中文场景
8K/16K
是
艾宝
Aibao
萝莉女声
童声场景
纯中文场景
8K/16K
是
Harry
Harry
英音男声
英文场景
英文场景
8K/16K
否
Abby
Abby
美音女声
英文场景
英文场景
8K/16K
是
Andy
Andy
美音男声
英文场景
英文场景
8K/16K
否
Eric
Eric
英音男声
英文场景
英文场景
8K/16K
否
Emily
Emily
英音女声
英文场景
英文场景
8K/16K
否
Luna
Luna
英音女声
英文场景
英文场景
8K/16K
是
Luca
Luca
英音男声
英文场景
英文场景
8K/16K
否
Wendy
Wendy
英音女声
英文场景
英文场景
8K/16K/24K
否
William
William
英音男声
英文场景
英文场景
8K/16K/24K
否
Olivia
Olivia
英音女声
英文场景
英文场景
8K/16K/24K
否
姗姗
Shanshan
粤语女声
方言场景
标准粤文(简体)及粤英文混合场景
8K/16K/24K
否
小玥
chuangirl
四川话女声
方言场景
中文及中英文混合场景
8K/16K
否
Lydia
Lydia
英中双语女声
英文场景
英文及英中文混合场景
8K/16K
是
艾硕
Aishuo
自然男声
客服场景
中文及中英文混合场景
8K/16K
是
青青
Qingqing
台湾话女声
方言场景
中文场景
8K/16K
否
翠姐
Cuijie
东北话女声
方言场景
中文场景
8K/16K
否
小泽
Xiaoze
湖南重口音男声
方言场景
中文场景
8K/16K
否
智香
Tomoka
日语女声
文学场景
日文场景
8K/16K
是
智也
Tomoya
日语男声
文学场景
日文场景
8K/16K
是
Annie
Annie
美语女声
文学场景
英文场景
8K/16K
是
调用限制
输入文本必须采用
UTF-8
编码。输入文本不能超过300个字符,超过300字符的内容会被截断。
服务地址
访问类型 | 说明 | URL |
---|---|---|
外网访问 | 所有服务器均可使用外网访问URL(SDK中默认设置了外网访问URL)。 | wss://nls-gateway.cn-shanghai.aliyuncs.com/ws/v1 |
上海ECS内网访问 | 使用阿里云上海ECS(ECS地域为华东2(上海)),可使用内网访问URL。 ECS的经典网络不能访问AnyTunnel,即不能在内网访问语音服务;如果希望使用AnyTunnel,需要创建专有网络在其内部访问。 说明
| ws://nls-gateway.cn-shanghai-internal.aliyuncs.com:80/ws/v1 |
交互流程

上图不包含RESTful API的交互流程,关于RESTful API的交互流程图请参见RESTful API。
服务端的响应除了音频流之外,都会在返回信息的header包含本次识别任务的task_id参数,请记录该值。如果出现错误,请将task_id和错误信息提交到工单。
鉴权
客户端在与服务端建立WebSocket连接时,使用Token进行鉴权。关于Token获取请参见获取Token。
开始合成
客户端发起语音合成请求,在请求消息中进行参数设置,各参数通过SDK中SpeechSynthesizer对象的set方法设置,含义如下。
参数
类型
是否必需
说明
appkey
String
是
管控台创建的项目appkey。
text
String
是
待合成文本,文本内容必须采用
UTF-8
编码,长度不超过300个字符(英文字母之间需要添加空格)。voice
String
否
发音人,默认是
xiaoyun
。format
String
否
音频编码格式,默认值:PCM。支持PCM/WAV/MP3格式。
sample_rate
Integer
否
音频采样率,默认值:16000。
volume
Integer
否
音量,取值范围:0~100。默认值:50。
speech_rate
Integer
否
语速,取值范围:-500~500,默认值:0。
pitch_rate
Integer
否
语调,取值范围:-500~500,默认值:0。
接收合成数据
服务端返回合成的语音二进制数据,SDK接收并处理二进制数据。
结束合成
语音合成完毕,服务端发送合成完毕事件通知,举例如下。
{ "header": { "message_id": "05450bf69c53413f8d88aed1ee60****", "task_id": "640bc797bb684bd6960185651307****", "namespace": "SpeechSynthesizer", "name": "SynthesisCompleted", "status": 20000000, "status_message": "GATEWAY|SUCCESS|Success." } }
说明文档示例将合成的音频保存在文件中,如果您需要播放音频且对实时性要求较高,建议使用流式播放,即边接收语音数据边播放,减少延时。
服务状态码
服务的每一次响应都包含status字段,即服务状态码,各状态码含义如下。
通用错误:
错误码 | 原因 | 解决办法 |
---|---|---|
40000001 | 身份认证失败 | 检查使用的令牌是否正确,是否过期。 |
40000002 | 无效的消息 | 检查发送的消息是否符合要求。 |
40000010 | 免费试用已到期 | 请前往控制台开通商用服务。 |
403 | 令牌过期或无效的参数 | 首先检查使用的令牌是否过期,然后检查参数值设置是否合理。 |
40000004 | 空闲超时 | 确认是否长时间(10秒)没有发送数据到服务端。 |
40000005 | 请求数量过多 | 检查是否超过了并发连接数或者每秒钟请求数。如果超过并发数,建议从免费版升级到商用版,或者商用版扩容并发资源。 |
40000000 | 默认的客户端错误码 | 查看错误消息或提交工单。 |
50000000 | 默认的服务端错误 | 如果偶现可以忽略,重复出现请提交工单。 |
50000001 | 内部调用错误 | 如果偶现可以忽略,重复出现请提交工单。 |
网关错误:
错误码 | 原因 | 解决办法 |
---|---|---|
40010001 | 不支持的接口 | 使用了不支持的接口,如果使用SDK请提交工单。 |
40010002 | 不支持的指令 | 使用了不支持的指令,如果使用SDK请提交工单。 |
40010003 | 无效的指令 | 指令格式错误,如果使用SDK请提交工单。 |
40010004 | 客户端提前断开连接 | 检查是否在请求正常完成之前关闭了连接。 |
40010005 | 任务状态错误 | 发送了当前任务状态不能处理的指令。 |
配置错误:
错误码 | 原因 | 解决办法 |
---|---|---|
40020105 | 应用不存在 | 检查应用appkey是否正确,是否与令牌归属同一个账号。 |
TTS(Text to Speech)错误:
错误码 | 原因 | 解决办法 |
---|---|---|
41020001 | 参数错误 | 检查是否传递了正确的参数。 |
51020001 | TTS服务端错误 | 如果偶现可以忽略,重复出现请提交工单。 |
在文档使用中是否遇到以下问题
更多建议
匿名提交