表格存储是阿里云自研的NoSQL多模型数据库,提供海量结构化数据存储以及快速的查询和分析服务。表格存储的分布式存储和强大的索引引擎能够提供PB级存储、千万TPS以及毫秒级延迟的服务能力。本手册主要为您介绍表格存储的基础概念、模型以及功能。

基础概念

使用表格存储前,请先了解以下基础概念:

基础概念 描述
实例 实例是您使用和管理表格存储服务的实体,每个实例相当于一个数据库。表格存储对应用程序的访问控制和资源计量都在实例级别完成。
读写吞吐量 读/写吞吐量的单位为读服务能力单元和写服务能力单元,简称CU,是数据读写操作的最小计费单位。
地域 地域是指阿里云物理数据中心所在的位置。
服务地址 每个表格存储实例对应一个服务地址,应用程序在进行表和数据操作时需要指定服务地址。

模型

表格存储提供多种模型,您可以针对业务需求选择相应的模型进行应用。表格存储提供以下几种模型:

模型 描述
Wide column模型 Wide column模型可应用在元数据、大数据等多种场景。 支持多种功能,包括数据版本、生命周期、主键列自增、条件更新、局部事务、原子计数器、过滤器等功能。
Timeline模型 Timeline模型是针对消息数据场景所设计的数据模型,它能满足消息数据场景对消息保序、海量消息存储、实时同步的特殊需求,同时支持全文检索与多维度组合查询。可以同时应用在IM、Feed流等消息场景的实现上。
Timestream模型 Timestream模型是针对时序场景设计的模型。
Grid模型 Grid模型(网格模型)是表格存储针对多维网格数据设计的模型,可以帮助您方便地实现多维网格数据的存储、查询和管理。

功能

表格存储提供以下功能:

功能 描述
主键列自增 若设置一列主键为自增列,在写入一行数据时,这一列主键无需填值,表格存储会自动生成这一主键列的值。该值在分区键上保证唯一,且严格递增。
使用条件更新 条件更新功能只有在满足条件时才对表中的数据进行更改,当不满足条件时更新失败。
局部事务 使用局部事务,您可以创建一个范围不超过一个分区键值的事务,并在该事务内进行读写操作。
原子计数器 原子计数器是将列当成一个原子计数器来使用,便于为某些在线应用提供实时统计功能,例如统计帖子的PV(实时浏览量)等。
使用过滤器 过滤器可以在服务端对读取的结果再进行一次过滤,根据过滤器中的条件决定返回哪些行。由于只返回了符合条件的数据行,所以在大部分场景下,可以有效降低网络传输的数据量,减少响应时间。
多元索引 多元索引基于倒排索引和列式存储,解决大数据的复杂查询难题。
全局二级索引 全局二级索引支持在属性列创建索引。
通道服务 通道服务提供了增量、全量、增量加全量三种类型的分布式数据实时消费通道。通道服务可以简单地实现对表中历史存量和新增数据的消费处理。
HBase支持 开源HBase API的Java应用可以通过Tablestore HBase Client来直接访问表格存储服务。