在数据表上创建一个多元索引后,通过多元索引只能查询到包括在多元索引中的字段。一张数据表可以创建多个多元索引。

背景

请根据实际查询需求确定在一张数据表中创建多元索引的个数。

例如有一张数据表有5个字段,分别为id、name、age、city、sex,需要按照name、age或city查询数据时,有两种创建多元索引的方式。

  • 方法一:一个字段建立一个多元索引
    按照name、age或city字段分别创建多元索引,名称分别为name_index、age_index、city_index。
    • 如果按照城市查询学生,则查询city_index,如果按照年龄查询学生,则查询age_index。
    • 如果查询年龄小于12岁且城市是成都的学生,此种方式就无法查询。

    此方式的实现类似于全局二级索引,使用此方式创建多元索引会带来更高的费用,因此不建议使用此方式创建多元索引。

  • 方法二:多个字段创建在一个多元索引中
    将name、age和city字段创建在一个多元索引中,名称为student_index。
    • 如果按照城市查询学生,则查询student_index中city字段;如果按照年龄查询学生,则查询student_index中age字段。
    • 如果查询年龄小于12岁且城市是成都的学生,则查询student_index中age和city字段。

    此方式才能发挥多元索引最大优势,不仅功能更丰富,而且价格会更低。极力推荐使用此方式创建多元索引。

限制

  • 创建索引的时效性

    创建多元索引后,需要等几秒钟才能使用,但是此过程中不影响数据写入,只影响索引元信息的查询和索引查询。

  • 数量限制

    详情请参见多元索引限制

接口

创建多元索引的接口为CreateSearchIndex。

使用

参数

创建多元索引时,需要指定数据表名称(TableName)、多元索引名称(IndexName)和索引的结构信息(IndexSchema),其中IndexSchema包含FieldSchemas(Index的所有字段的设置)、IndexSetting(索引设置)和IndexSort(索引预排序)。详细参数说明请参见下表。
参数 说明
TableName 多元索引所属的数据表名称。
IndexName 多元索引名称。
FieldSchemas FieldSchema的列表,每个FieldSchema包含如下内容:
  • FieldName(必选):创建多元索引的字段名,即列名,类型为String。

    多元索引中的字段可以是主键列或者属性列。

  • FieldType(必选):字段类型,类型为FieldType.XXX,详情请参见字段
  • Array(可选):是否为数组,类型为bool值。

    如果设置为true,则表示该列是一个数组,在写入时,必须按照JSON数组格式写入,例如["a","b","c"]。

    Nested类型本身是一个数组,所以无须设置Array。

  • Index(可选):是否开启索引,类型为bool值,默认为true。
  • IndexOptions(可选):索引的配置选项,表示是否存储position、offset等term信息到倒排链中,一般使用默认值。
  • Analyzer(可选):分词器类型,目前支持多种分词类型,详情请参见分词
  • EnableSortAndAgg(可选):是否开启排序与统计聚合功能,类型为bool值。

    在查询时,只有EnableSortAndAgg设置为true的字段才能进行排序,排序的详情请参见排序

  • Store(可选):是否在多元索引中附加存储该字段的值,类型为bool值。

    开启后,可以直接从多元索引中读取该字段的值,而不必反查数据表,可用于查询性能优化。

IndexSetting 索引设置,包含RoutingFields设置。

RoutingFields(可选):自定义路由字段。可以选择部分主键列作为路由字段,在进行索引数据写入时,会根据路由字段的值计算索引数据的分布位置,路由字段的值相同的记录会被索引到相同的数据分区中。

IndexSort 索引的预排序方式,可以指定主键排序或者列排序。如果不设置,默认按照主键进行预排序。

示例

创建多元索引的示例代码如下:

  • 示例1
    创建一个多元索引,包含Col_Keyword和Col_Long两列,类型分别设置为字符串(String)和整型(Long)。
    
    private static void createSearchIndex(SyncClient client) {
        CreateSearchIndexRequest request = new CreateSearchIndexRequest();
        request.setTableName(TABLE_NAME); //设置数据表名称。
        request.setIndexName(INDEX_NAME); //设置多元索引名称。
        IndexSchema indexSchema = new IndexSchema();
        indexSchema.setFieldSchemas(Arrays.asList(
                new FieldSchema("Col_Keyword", FieldType.KEYWORD) //设置字段名称和类型。
                        .setIndex(true) //设置开启索引。
                        .setEnableSortAndAgg(true), //设置开启排序和统计聚合功能。
                new FieldSchema("Col_Long", FieldType.LONG)
                        .setIndex(true)
                        .setEnableSortAndAgg(true)));
        request.setIndexSchema(indexSchema);
        client.createSearchIndex(request); //调用client创建多元索引。
    }
  • 示例2
    创建多元索引时指定IndexSort。
    private static void createSearchIndexWithIndexSort(SyncClient client) {
        CreateSearchIndexRequest request = new CreateSearchIndexRequest();
        request.setTableName(TABLE_NAME);
        request.setIndexName(INDEX_NAME);
        IndexSchema indexSchema = new IndexSchema();
        indexSchema.setFieldSchemas(Arrays.asList(
                new FieldSchema("Col_Keyword", FieldType.KEYWORD).setIndex(true).setEnableSortAndAgg(true),
                new FieldSchema("Col_Long", FieldType.LONG).setIndex(true).setEnableSortAndAgg(true),
                new FieldSchema("Col_Text", FieldType.TEXT).setIndex(true),
                new FieldSchema("Timestamp", FieldType.LONG).setIndex(true).setEnableSortAndAgg(true)));
        //设置按照Timestamp列进行预排序,Timestamp列必须建立Index并开启EnableSortAndAgg。
        indexSchema.setIndexSort(new Sort(
                Arrays.<Sort.Sorter>asList(new FieldSort("Timestamp", SortOrder.ASC))));
        request.setIndexSchema(indexSchema);
        client.createSearchIndex(request);
    }