全部产品
云市场

如何配置Schema

更新时间:2020-04-08 15:38:48

Solr 客户端工具包准备

首先需要下载客户端并解压,下载地址

  1. tar zxvf alisolr-7.3.8-bin.tar.gz

修改 alisolr-7.3.8-bin/bin/solr.in.sh 文件,去掉 SOLR_ZK_HOST 前面的注释 #,并修改如下:

  1. SOLR_ZK_HOST="ld-xxxx-proxy-zk.hbaseue.9b78df04-b.rds.aliyuncs.com:2181/solr"

此地址见solr开通页面的客户端访问地址,如下:solr_zk_address

注:上述配置流程中的 ZK 地址是内网地址,如果是想通过公网访问,请填写 ${公网 ZK 地址}/solr 即可。公网 ZK 地址获取,请参考公网访问

下载默认的配置集模板

进入命令行,下载提供的默认配置集_indexer_default,在此基础上进行编辑,添加业务自定义的配置。

  1. cd alisolr-7.3.8-bin/bin
  2. ./solr zk ls /configs // 查询当前的配置集列表
  3. ./solr zk downconfig -d . -n _indexer_default // 下载配置集_indexer_default到当前目录

执行上述命令成功后,将会在当前目录下看到一个conf的目录。在其中有两个重要的文件:managed-schemasolrconfig.xml,索引列相关的配置都在managed-schema中,详细的配置说明可参考社区文档

创建新的配置集

下面给出一个简单的示例:

  • 打开managed-schema文件
  • 增加两个新的索引列定义
    1. <field name="name" type="string" indexed="true" stored="true" required="false" multiValued="false" />
    2. <field name="age" type="pint" indexed="true" stored="true" docValues="true" multiValued="false" />
    name是string类型,age是基本int类型(pint代表的就是int,plong代表的就是long),两个列都需要建立索引,并且需要存储。add_schema

上面每个列都需要自己定义,当列非常多时,定义起来会比较复杂,此时,可以使用Solr提供的动态列能力,可以参考managed-schema中的dynamicField定义,有了它之后,不需要额外定义每个列,只需要在写入数据时指定的名称后缀与定义保持一致即可,例如:name_s可以自动匹配*_sage_i可以自动匹配*_idynamic_schema

  • 上传配置集

修改完后,可以创建一个属于自己的配置集(建议每个collection对应一个配置集),命令如下:

  1. ./solr zk upconfig -d conf/ -n myconf
  • 在Solr WEB界面查看配置是否上传成功query_schema

建议

  1. 建议使用dynamicField功能,不单独定义每个索引列,避免频繁修改managed-schema文件
  2. 每个Collection有自己的配置集,不建议多个Collection共享配置集
  3. 如果需要自己定义配置,请下载_indexer_default 配置集后在此基础上修改,_indexer_default 配置集中有HBase同步Solr的几个关键配置,如solrconfig.xml中的DocBasedVersionConstraintsProcessorFactory UpdateProcessor配置和managed_schema中的uniquekey配置。