本文介绍如何使用阿里云智能语音服务提供的旧版Android SDK,包括SDK的安装方法及SDK代码示例。请注意,新用户请关注新版Android SDK。
建议您使用新版本Android SDK,本版本后续将不再更新。详情请参见Android SDK。
前提条件
SDK关键接口
NlsClient:语音处理客户端,利用该客户端可以进行一句话识别、实时语音识别和语音合成的语音处理任务。该客户端为线程安全,建议全局仅创建一个实例。
SpeechRecognizer:代表一次语音识别请求。需要将录制的音频或从文件读取的音频数据,发送给SDK。
SpeechRecognizerWithRecorder:代表一次语音识别请求。在SpeechRecognizer的基础上内置录音功能,调用简便,推荐使用。
SpeechRecognizerCallback:语音识别回调接口。在获得识别结果、发生错误等事件发生时会触发回调。您可参照示例调用此接口,在回调方法中加入自己的处理逻辑。
SpeechRecognizerWithRecorderCallback:语音识别回调接口。在SpeechRecognizerCallback基础上增加了录制的语音数据和音频音量的回调方法。
调用步骤
下面以SpeechRecognizer为例,为您介绍一句话识别请求的调用步骤:
创建NlsClient实例。
定义SpeechRecognizerCallback实现类,按您自己的业务需要处理识别结果或错误情况。
调用NlsClient.createRecognizerRequest()方法得到SpeechRecognizer实例。
设置SpeechRecognizer参数,主要是accessToken和appkey。
调用SpeechRecognizer.start()方法开始与云端服务连接。
采集语音并调用SpeechRecognizer.sendAudio()方法发送给云端服务。
在回调中处理识别结果或错误。
调用SpeechRecognizer.stop()方法结束识别。
如果需要发起新的请求,请重复3~8步。
注意SpeechRecognizer不可重复使用,必须新建实例。
调用NlsClient.release()方法释放客户端实例。
Proguard配置
如果代码使用了混淆,请在proguard-rules.pro中配置:
-keep class com.alibaba.idst.util.*{*;}
代码示例
创建识别请求
// 新建识别回调类 SpeechRecognizerCallback callback = new MyCallback(); // 创建识别request speechRecognizer = client.createRecognizerRequest(callback); // 填写Token speechRecognizer.setToken(""); // 填写appkey speechRecognizer.setAppkey(""); // 设置返回中间结果 speechRecognizer.enableIntermediateResult(true); // 启动语音识别 int code = speechRecognizer.start();
采集音频并发送给识别服务。
此处音频数据也可以从文件或其他来源获取。如果使用SpeechRecognizerWithRecorder则SDK内部会处理录音并发送数据,此时可以省略该步骤。
ByteBuffer buf = ByteBuffer.allocateDirect(SAMPLES_PER_FRAME); while(sending){ buf.clear(); // 采集语音 int readBytes = mAudioRecorder.read(buf, SAMPLES_PER_FRAME); byte[] bytes = new byte[SAMPLES_PER_FRAME]; buf.get(bytes, 0, SAMPLES_PER_FRAME); if (readBytes>0 && sending){ // 发送语音数据到识别服务 int code = recognizer.sendAudio(bytes, bytes.length); if (code < 0) { Toast.makeText(SpeechRecognizerActivity.this, "发送语音失败!", Toast.LENGTH_LONG).show(); break; } } buf.position(readBytes); buf.flip(); }
处理回调结果。
// 识别结束,得到最终完整结果。 @Override public void onRecognizedCompleted(final String msg, int code) { Log.d(TAG,"OnRecognizedCompleted " + msg + ": " + String.valueOf(code)); } // 识别返回中间结果,只有开启相关选项时才会回调。 @Override public void onRecognizedResultChanged(final String msg, int code) { Log.d(TAG,"OnRecognizedResultChanged " + msg + ": " + String.valueOf(code)); }
在文档使用中是否遇到以下问题
更多建议
匿名提交