全部产品

接口说明

更新时间:2021-04-21 10:53:30

录音文件识别极速版支持使用者通过HTTP POST方式上传一段短音频并在极短时间内(一般来说,30分钟的音频可以在10秒内完成识别)同步获取识别结果,满足音视频字幕、准实时质检等场景下对语音文件识别时效性要求。

功能介绍

  • 音频格式:支持AAC/MP3/OPUS/WAV格式编码的音频。

  • 使用限制:支持100 MB以内音频文件的识别。

  • 模型类型:8000(电话)/16000(非电话)。

    说明

    服务端自动根据请求参数中的采样率对不符合要求的音频进行采样率调整。

  • 支持设置返回结果:支持设置是否将中文数字转为阿拉伯数字输出,支持对多声道音频只处理首个声道。

  • 支持控制台配置项目热词、定制语言模型。

  • 目前支持中文电话通用、中文非电话通用和英文非电话通用三种场景,后续持续增加新模型支持,可在控制台编辑项目进行模型配置。更多信息,请参见管理项目

前提条件

  • 已获取项目appkey,更多信息,请参见创建项目

  • 已获取Access Token,更多信息,请参见获取Token

交互流程

客户端向服务端发送带有音频数据的HTTP POST请求,服务端返回带有识别结果的HTTP响应。

交互流程图
说明

服务端的错误响应会在返回信息中包含表示本次合成任务的task_id参数,请记录该值,如果出现错误,请将task_id和错误信息提交到工单。

服务地址

访问类型

说明