Zeppelin的Hive解释器是使用JDBC连接HiveServer2。本文为您介绍如何在Zeppelin中使用Hive。

背景信息

EMR数据开发的Zeppelin在以下两方面做了增强:
  • 在多个EMR集群中动态切换。
  • 您无需配置,所有配置都是自动完成。
Zeppelin的Hive解释器提供以下主要功能:
  • 支持任何Hive SQL语句(包括DDL和DML等)。

    Hive解释器与Beeline支持的语言及功能一样。

  • 支持一个段落编写多条SQL语句,每条SQL语句以分号(;)结尾,按照从上到下的顺序执行。
  • 支持注释功能。
  • 支持并发执行多个段落。
  • 支持参数功能。
  • 支持图表展示SQL结果。

示例

  • 多行SQL
    如下图所示,在一个段落里执行2句SQL语句(以分号间隔),第一句切换执行引擎,第二句运行Select语句。hive_sql
  • 注释
    --开头的均为SQL注释。注释
  • 参数功能

    Zeppelin支持${var=value} 形式的差数。var是变量名,value是默认值。

    例如,通常不使用变量时的查询SQL语句如下:
    select count(1) from orders where o_totalprice < 10000;
    在Zeppelin中使用${var=value} 形式的参数查询语句时,设置变量名为price,默认值是10000,此时页面上会显示一个文本框,您可以在文本框里填写任意值,按回车键,即使用文本框里的值替换变量price并运行SQL语句。例如,填写的值为50000,运行的SQL语句如下图所示:var-value
  • 图表展示SQL结果
    Zeppelin内置了很多图表,您可以通过图表方式展示SQL结果。如下图所示,通过柱状图展示一个GROUP BY语句的结果。SQL

内置教程

EMR数据开发集群自带了很多开发教程,详细信息请在如下图页面查看。Hive