E-MapReduce的JOIN和传统批处理JOIN的语义一致,都用于将两张表关联起来。
语法
tableReference [, tableReference ]* | tableexpression
[ joinType ] JOIN tableexpression [ joinCondition ];
参数描述如下:
- tableReference:表名称。
- tableexpression:表达式。
- joinCondition:JOIN条件。
约束
当执行流数据的JOIN操作时,部分JOIN类型是不支持的,具体请参见Spark官方文档说明。
左表 | 右表 | JOIN类型 | 是否支持 |
---|---|---|---|
流式表 | 静态表 | 内连接 | 支持 |
左连接 | 支持 | ||
右连接 | 不支持 | ||
全连接 | 不支持 | ||
静态表 | 流式表 | 内连接 | 支持 |
左连接 | 不支持 | ||
右连接 | 支持 | ||
全连接 | 不支持 | ||
流式表 | 流式表 | 内连接 | 支持 |
左连接 | 支持 | ||
右连接 | 支持 | ||
全连接 | 不支持 |