数据关联(JOIN)用来连接不同的数据表。在数据分析时,当需要分析的数据存储在不同的表,您可以通过数据关联,把多个表连接起来,形成模型进行数据分析。
前提条件
您已创建数据集,请参见创建并管理数据集。
背景信息
Quick BI支持左外连接(LEFT JOIN)、内连接(INNER JOIN)、全连接(FULL JOIN),下面以学生表和课程的成绩表为例介绍构建模型的三种连接方式。
上图仅为原理示意,实际关联后会保留关联表的原始列。
使用限制
非同源数据表关联仅适用于专业版。
跨源关联数据表需开启quick引擎抽取加速,适用于MySQL、SQL Server、AnalyticDB for MySQL 3.0、Oracle、MaxCompute、PostgreSQL、Hologres、Hive、AnalyticDB for PostgreSQL、PolarDB for MySQL、PolarDB for PostgreSQL、Presto、达梦、Impala、ClickHouse和StarRocks数据源。
MySQL数据源暂不支持全关联。
关联表最多支持设置5层。
操作步骤
选择数据源
选择或创建关联的表。
您可以选择数据表关联数据表、数据表关联SQL代码创建表、SQL代码创建表关联数据表和SQL代码创建表关联SQL代码创建表。
说明SQL代码的编辑操作请参见自定义SQL。
数据表关联数据表
在数据集编辑页面,按照下图步骤,拖拽数据表至画布中。
数据表关联SQL代码创建表
双击或拖拽数据表至画布中。
双击或拖拽SQL代码创建表至画布中。
在SQL代码编辑页,输入SQL,点击运行并确认编辑后完成表的创建。
SQL代码创建表关联数据表
点击使用SQL代码创建数据集,输入SQL,单击运行并确认编辑后完成表的创建。
双击或拖拽数据表至画布中。
SQL代码创建表关联SQL代码创建表
点击使用SQL代码创建数据集,输入SQL,单击运行并确认编辑后完成表的创建。
双击或拖拽SQL代码创建表至画布中。
在SQL代码编辑页,输入SQL,单击运行并确认编辑后完成表的创建。
在新增关联关系面板中,按照下图步骤配置数据关联。
说明关联关系支持配置为左外关联()、内连接()、全连接()。
MySQL不支持全连接()。
配置完成后,您可以单击画布中的关联图标(例如)查看关联关系。
如果某个节点不需要,可鼠标悬浮在表上,单击删除图标()。
删除节点仅支持删除模型的最末节点。
自定义关联条件
配置关联条件时,支持创建自定义计算作为关联字段。
关联字段选择时,在下拉框里选择创建自定义计算。
输入字段表达式,单击确定。
单击确定,您可以在关联字段里看到新建的字段表达式。
您也可以编辑自定义计算。
关联前过滤
关联时支持分别对两张表创建过滤条件,过滤操作将在关联前执行。
单击关联字段对应表右边的图标。
设置过滤条件。
单击确定即可完成关联前过滤条件的设置。
- 本页导读 (0)