本文介绍动作行为识别RecognizeAction的语法及示例。

功能描述

RecognizeAction可以识别视频和图像中的人体动作行为,并返回识别后的行为类别。当前可以识别的行为类别包括:举手、吃喝、吸烟、打电话、玩手机、趴桌睡觉、跌倒。您可以根据系统提供的动作置信度判断阈值,对识别的动作进行判断。

前提条件

请确保您已开通人脸人体服务,详情请参见服务开通

输入限制

  • 视频要求:时长大于2秒;支持一些常见的视频格式,例如MPEG、AVI、MOV、MP4。
    说明 建议为居家摄像头或近距离监控场景。即摄像头固定不动,拍摄距离为2~10米之间。
  • 图像要求:为2秒视频均匀采样的4张图像。支持的格式为JPEG、PNG、BMP、JPG。
  • 分辨率:图像和视频的分辨率都要求为大于256×256,小于5000×5000。
  • URL地址中不能包含中文字符。

调试

您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。

请求参数

名称 类型 是否必选 示例值 描述
Action String RecognizeAction

要执行的操作。取值:RecognizeAction。

Type Integer 0

输入内容类型,包括视频和图像两种类型。

  • 0:表示输入视频。
  • 1:表示输入图像。
URLList.N.URL String https://viapi-test.oss-cn-shanghai.aliyuncs.com/test-team/tiankong/00001.jpg,https://viapi-test.oss-cn-shanghai.aliyuncs.com/test-team/tiankong/00003.jpg,https://viapi-test.oss-cn-shanghai.aliyuncs.com/test-team/tiankong/00004.jpg,https://viapi-test.oss-cn-shanghai.aliyuncs.com/test-team/tiankong/00002.jpg

Type为1时需要输入的图像URL地址,必须输入4张图像,且4张图像必须为两秒钟视频均匀采样的图像。当前仅支持上海地域的OSS链接,如何生成URL请参见生成URL

VideoUrl String http://zhongbao-app.oss-cn-shanghai.aliyuncs.com/20201797/151872261_1584522154910.mp4

Type为0时需要输入的视频URL地址。当前仅支持上海地域的OSS链接,如何生成URL请参见生成URL

返回数据

名称 类型 示例值 描述
Data Struct

返回的结果数据内容。

Elements Array

返回的结果元素列表。

Boxes Array

具体动作的坐标框列表。

Box List [1119,576,1373,970]

具体动作的坐标框信息。

Labels List 跌倒

识别到的行为类别。

Scores List 0.702967643737793

行为类别的置信度。取值范围0~1,值越大,识别到的动作越准确。系统根据算法,为不同的动作给出判断的阈值标准,您也可以根据自己的实际情况,对判断的阈值标准进行调整。

  • 举手:0.41(低于0.41则认为不是举手行为,否则认为是举手行为。)
  • 吃喝:0.55(低于0.55则认为不是吃喝行为,否则认为是吃喝行为。)
  • 吸烟:0.53(低于0.53则认为不是吸烟行为,否则认为是吸烟行为。)
  • 打电话:0.48(低于0.48则认为不是打电话行为,否则认为是打电话行为。)
  • 玩手机:0.58(低于0.58则认为不是玩手机行为,否则认为是玩手机行为。)
  • 趴桌睡觉:0.55(低于0.55则认为不是趴桌睡觉行为,否则认为是趴桌睡觉行为。)
  • 跌倒:0.46(低于0.46则认为不是跌倒行为,否则认为是跌倒行为。)
Timestamp Integer 3

当前行为在视频或者图像中发生的时间戳信息。

RequestId String E9C40AF5-A7F8-49D5-8A0C-B21F15A07F17

请求ID。

示例

请求示例

http(s)://[Endpoint]/?Action=RecognizeAction
&Type=0
&<公共请求参数>

正常返回示例

XML 格式

<RequestId>E9C40AF5-A7F8-49D5-8A0C-B21F15A07F17</RequestId>
<Data>
    <Elements>
        <Timestamp>1</Timestamp>
    </Elements>
    <Elements>
        <Scores>0.702967643737793</Scores>
        <Labels>跌倒</Labels>
        <Timestamp>3</Timestamp>
        <Boxes>
            <Box>1119</Box>
            <Box>576</Box>
            <Box>1373</Box>
            <Box>970</Box>
        </Boxes>
    </Elements>
    <Elements>
        <Scores>0.7334273457527161</Scores>
        <Labels>跌倒</Labels>
        <Timestamp>5</Timestamp>
        <Boxes>
            <Box>1128</Box>
            <Box>613</Box>
            <Box>1363</Box>
            <Box>991</Box>
        </Boxes>
    </Elements>
</Data>

JSON 格式

{
	"RequestId": "E9C40AF5-A7F8-49D5-8A0C-B21F15A07F17",
	"Data": {
		"Elements": [
			{
				"Scores": [],
				"Labels": [],
				"Timestamp": 1,
				"Boxes": []
			},
			{
				"Scores": [
					"0.702967643737793"
				],
				"Labels": [
					"跌倒"
				],
				"Timestamp": 3,
				"Boxes": [
					{
						"Box": [
							1119,
							576,
							1373,
							970
						]
					}
				]
			},
			{
				"Scores": [
					"0.7334273457527161"
				],
				"Labels": [
					"跌倒"
				],
				"Timestamp": 5,
				"Boxes": [
					{
						"Box": [
							1128,
							613,
							1363,
							991
						]
					}
				]
			}
		]
	}
}

错误码

关于动作行为识别的错误码,详情请参见常见错误码

SDK参考

单击SDK简介查看SDK信息。