功能概述

分析型数据库PostgreSQL版的向量分析旨在帮助您实现非结构化数据的近似检索和分析,其实现原理是通过AI算法提取非结构化数据的特征,然后利用特征向量唯一标识非结构化数据,向量间的距离用于衡量非结构化数据之间的相似度。分析型数据库PostgreSQL版向量检索分析基于MPP查询架构构建,帮助用户实现基于SQL接口进行非结构化数据检索,并支持同结构化数据的关联分析。

典型应用场景

通过分析型数据库PostgreSQL版向量分析,您可以非常容易地搭建各种智能化应用,例如以下几种应用。

  • 以图搜图,即通过图片检索图片。
  • 声纹匹配,通过音频检索音频。
  • 基于语义的文本检索和推荐,通过文本检索近似文本。
  • 文件去重,通过文件指纹去除重复文件。
  • 商品图片分析,在大量图片中分析哪些图片包含了同一个商品。

向量分析作为分析型数据库PostgreSQL版向量分析的高级特性目前已经服务阿里内外部多项业务,包括阿里巴巴数据中台,阿里电商新零售业务,阿里云城市大脑。

典型架构

图 1. 基于AnalyticDB for PG实现非结构化数据向量分析示例


  • Web App把文本,图片或者视频等非结构化数据(后续简称非结构化数据)通过特征提取服务提取特征向量,然后再把特征向量写入分析型数据库PostgreSQL版向量分析的向量表。
  • Web App检索的时候首先把非结构化数据通过特征提取服务接口提取出向量,然后调用分析型数据库PostgreSQL版向量分析的查询分析接口做查询。