本文为您解答SDK及接口调用相关问题。
为什么语音识别准确率很低,有时只识别出几个字?
请检查音频数据的采样率与管控台应用的模型是否一致,以及音频是否是单通道录音。
说明
只有录音文件识别支持双通道的录音。
确认调用方式和采样率都没问题,识别还是不准确怎么办?
您可以通过如下两种方式提高识别准确率:
使用自定义热词功能,快速、实时提高准确率,详情请参见热词概述。
开通自学习模型训练,通过模型定制的方式提高大量文本的识别率,详情请参见语言模型定制概述。
音频数据必须连续发送吗?
音频数据必须连续发送。
服务端在超过一定时间未接到语音数据(10秒)会超时断开连接,返回40000004错误信息。如果需要再次发送数据,客户端需要重新发起请求。
音频数据发送中断后,为什么还会收到服务器发回的数据?
音频数据未连续发送超时中断后,服务器上如果还有之前未处理完的数据,就会继续返回这些数据的识别结果,但是整个句子的识别已经是错误的了。
语音识别的返回结果JSON中endtime =-1是什么意思?
表示当前句子未结束。当语音识别模式为“流式”时,才会存在中间结果。
C++ SDK语音合成时传入的文本没有采用UTF-8编码会有什么错误信息?
如果传入的文本没有采用UTF-8编码,在文本中含有中文字符时,语音合成SDK调用start函数会失败,返回错误信息:Socket recv failed, errorCode: 0
。错误码为0表示服务端已经关闭了连接,此时应检查传入的文本是否采用UTF-8编码。
服务端返回的状态码都有哪些?
HTTP状态
200
表示请求成功。HTTP状态
4XX
表示客户端错误。HTTP状态
5XX
表示服务端错误。
具体状态码,请参见各服务中的说明。
录音文件识别存在一次请求返回两次相同的结果?
如果是如下情况属正常现象:您提交的语音文件是双声道,且两个声道语音内容一样。
在文档使用中是否遇到以下问题
更多建议
匿名提交