阿里云视觉智能开放平台提供通用文字识别、证件识别、图片分割等离线SDK,可通过无网络环境下离线使用,不同能力支持Android、iOS、Windows和macOS不同的适用终端。本文为您介绍阿里云视觉智能开放平台当前支持的离线SDK能力。

能力介绍

能力名称 支持终端 描述
实时视频分割 实时视频分割SDK (Android) 基于深度学习框架,结合检测识别技术,实现高精视觉分割能力,可实现实时全自动主体、场景像素级识别,对高度镂空主体、复杂背景等场景都有较好的效果。
实时视频分割SDK (iOS)
实时视频分割SDK (Windows)
实时视频分割SDK (macOS)
离线图片分割 离线图片分割SDK(Android) 通过检测识别技术,对用户拍照或上传的图片进行精细化、无瑕疵的抠像处理,实现高精视觉分割能力,支持复杂图片背景的分割和替换。
离线图片分割SDK(iOS)
实时无损分割 实时无损分割SDK(Windows) 通过颜色过滤和深度学习的融合技术,对直播中的视频进行实时分割,同时对边缘瑕疵进行边缘平滑和去杂色处理,实现影视级无瑕疵的实时视频分割效果。
实时无损分割SDK(macOS)
文字离线识别 证件识别SDK(Andorid) 支持身份证、驾驶证、行驶证正反面离线识别,可识别常用多个关键字段内容,识别精准度超过95%。
证件识别SDK(iOS)
车辆类识别SDK(Andorid) 支持扫描识别中国大陆所有单行车牌及VIN码的识别,支持以视频流形式的识别。
车辆类识别SDK(iOS)
通用文字识别SDK(Andorid) 在离线环境下,支持在Andorid或iOS设备端实现通用文字、身份卡证、驾驶卡证和车牌的离线识别,同时包体很小,可达到秒级识别速度。
通用文字识别SDK(iOS)
健身动作计数 健身动作计数SDK(Andorid) 通过摄像头拍摄人像动作视频,实时识别出人体关键点,并根据动作自动计数。已支持的健身动作有14种(跳绳、深蹲、开合跳、仰卧起坐、俯卧撑、平板支撑、臀桥等),还可支持定制健身动作。
健身动作计数SDK(iOS)
健身动作计数SDK(Windows)
健身动作计数SDK(macOS)