• 沒有找到結果。

5.25 Spark

5.25.2 Spark HA 方案介绍

Spark 多主实例 HA 原理与实现方案

基于社区已有的JDBCServer基础上,采用多主实例模式实现了其高可用性方案。集群 中支持同时共存多个JDBCServer服务,通过客户端可以随机连接其中的任意一个服务 进行业务操作。即使集群中一个或多个JDBCServer服务停止工作,也不影响用户通过 同一个客户端接口连接其他正常的JDBCServer服务。

多主实例模式相比主备模式的HA方案,优势主要体现在对以下两种场景的改进。

● 主备模式下,当发生主备切换时,会存在一段时间内服务不可用,该时间 JDBCServer无法控制,取决于Yarn服务的资源情况。

● Spark中通过类似于HiveServer2的Thrift JDBC提供服务,用户通过Beeline以及 JDBC接口访问。因此JDBCServer集群的处理能力取决于主Server的单点能力,可 扩展性不够。

采用多主实例模式的HA方案,不仅可以规避主备切换服务中断的问题,实现服务不中 断或少中断,还可以通过横向扩展集群来提高并发能力。

● 实现方案

多主实例模式的HA方案原理如下图所示。

5-95 Spark JDBCServer HA

1. JDBCServer在启动时,向ZooKeeper注册自身消息,在指定目录中写入节点,节 点包含了该实例对应的IP,端口,版本号和序列号等信息。

2. 客户端连接JDBCServer时,需要指定Namespace,即访问ZooKeeper哪个目录下 的JDBCServer实例。在连接的时候,会从Namespace下随机选择一个实例连接。

3. 客户端成功连接JDBCServer服务后,向JDBCServer服务发送SQL语句。

4. JDBCServer服务执行客户端发送的SQL语句后,将结果返回给客户端。

在HA方案中,每个JDBCServer实例都是独立且等同的,当其中一个实例在升级或者业 务中断时,其他的实例也能接受客户端的连接请求。

多主实例方案遵循以下规则:

● 当一个实例异常退出时,其他实例不会接管此实例上的会话,也不会接管此实例 上运行的业务。

● 当JDBCServer进程停止时,删除在ZooKeeper上的相应节点。

● 由于客户端选择服务端的策略是随机的,可能会出现会话随机分配不均匀的情 况,进而可能引起实例间的负载不均衡。

● 实例进入维护模式(即进入此模式后不再接受新的客户端连接)后,当达到退服 超时时间,仍在此实例上运行的业务有可能会发生失败。

URL连接介绍 – 多主实例模式

多主实例模式的客户端读取ZooKeeper节点中的内容,连接对应的 JDBCServer服务。连接字符串为:

安全模式下:

Kinit认证方式下的JDBCURL如下所示:

jdbc:hive2://

<zkNode1_IP>:<zkNode1_Port>,<zkNode2_IP>:<zkNode2_Port>,<zkNode3_IP>:<zkNode3_P ort>/;serviceDiscoveryMode=zooKeeper;zooKeeperNamespace=sparkthriftserver2x;saslQo p=auth-conf;auth=KERBEROS;principal=spark/hadoop.<系统域名>@<系统域名>;

说明

● 其中“<zkNode_IP>:<zkNode_Port>”是ZooKeeper的URL,多个URL以逗 号隔开。

例如:“192.168.81.37:2181,192.168.195.232:2181,192.168.169.84:2181”。

● 其中“sparkthriftserver2x”是ZooKeeper上的目录,表示客户端从该目录 下随机选择JDBCServer实例进行连接。

示例:安全模式下通过Beeline客户端连接时执行以下命令:

sh CLIENT_HOME/spark/bin/beeline -u "jdbc:hive2://

<zkNode1_IP>:<zkNode1_Port>,<zkNode2_IP>:<zkNode2_Port>,<zkN ode3_IP>:<zkNode3_Port>/;serviceDiscoveryMode=zooKeeper;zooK

eeperNamespace=sparkthriftserver2x;saslQop=auth-conf;auth=KERBEROS;principal=spark/hadoop.<系统域名>@<系统 域名>;"

Keytab认证方式下的JDBCURL如下所示:

jdbc:hive2://

<zkNode1_IP>:<zkNode1_Port>,<zkNode2_IP>:<zkNode2_Port>,<zkNode3_IP>:<zkNode3_P ort>/;serviceDiscoveryMode=zooKeeper;zooKeeperNamespace=sparkthriftserver2x;saslQop

=auth-conf;auth=KERBEROS;principal=spark/hadoop.<系统域名>@<系统域名

>;user.principal=<principal_name>;user.keytab=<path_to_keytab>

其中<principal_name>表示用户使用的Kerberos用户的principal,如

“test@<系统域名>”。<path_to_keytab>表示<principal_name>对应 的keytab文件路径,如“/opt/auth/test/user.keytab”。

普通模式下:

jdbc:hive2://

<zkNode1_IP>:<zkNode1_Port>,<zkNode2_IP>:<zkNode2_Port>,<zkNode3_IP>:<zkNode3_P ort>/;serviceDiscoveryMode=zooKeeper;zooKeeperNamespace=sparkthriftserver2x;

示例:普通模式下通过Beeline客户端连接时执行以下命令:

sh CLIENT_HOME/spark/bin/beeline -u "jdbc:hive2://

<zkNode1_IP>:<zkNode1_Port>,<zkNode2_IP>:<zkNode2_Port>,<zkN ode3_IP>:<zkNode3_Port>/;serviceDiscoveryMode=zooKeeper;zooK eeperNamespace=sparkthriftserver2x;"

– 非多主实例模式

非多主实例模式的客户端连接的是某个指定JDBCServer节点。该模式的连接 字符串相比多主实例模式的去掉关于Zookeeper的参数项

“serviceDiscoveryMode”和“zooKeeperNamespace”。

示例:安全模式下通过Beeline客户端连接非多主实例模式时执行以下命令:

sh CLIENT_HOME/spark/bin/beeline -u "jdbc:hive2://

<server_IP>:<server_Port>/;user.principal=spark/hadoop.<系统域名>@<

系统域名>;saslQop=auth-conf;auth=KERBEROS;principal=spark/

hadoop.<系统域名>@<系统域名>;"

说明

● 其中“<server_IP>:<server_Port>”是指定JDBCServer节点的URL。

● “CLIENT_HOME”是指客户端路径。

多主实例模式与非多主实例模式两种模式的JDBCServer接口相比,除连接方 式不同外其他使用方法相同。由于Spark JDBCServer是Hive中的HiveServer2 的另外一个实现,其使用方法,请参见https://cwiki.apache.org/

confluence/display/Hive/HiveServer2+Clients。

Spark 多租户 HA 方案实现

JDBCServer多主实例方案中,JDBCServer实现使用YARN-Client模式,但YARN资源队 列只有一个,为了解决这种资源局限的问题,引入了多租户模式。

多租户模式是将JDBCServer和租户绑定,每一个租户对应一个或多个JDBCServer,而 一个JDBCServer只给一个租户提供服务。不同的租户可以配置不同的YARN队列,从而 达到资源隔离,且JDBCServer根据需求动态启动,可避免浪费资源。

● 实现方案

多租户模式的HA方案原理如图5-96所示。

5-96 Spark JDBCServer 多租户

a. ProxyServer在启动时,向ZooKeeper注册自身消息,在指定目录中写入节点 信息,节点信息包含了该实例对应的IP,端口,版本号和序列号等信息。

说明

多租户模式下,JDBCServer实例是指ProxyServer(JDBCServer代理)。

b. 客户端连接ProxyServer时,需要指定Namespace,即访问ZooKeeper哪个目 录下的ProxyServer实例。在连接的时候,会从Namespace下随机选择一个实 例连接,详细URL参见URL连接介绍。

c. 客户端成功连接ProxyServer服务,ProxyServer服务首先确认是否有该租户的 JDBCServer存在,如果有,直接将Beeline连上真正的JDBCServer;如果没 有,则以YARN-Cluster模式启动一个新的JDBCServer。JDBCServer启动成功 后,ProxyServer会获取JDBCServer的地址,并将Beeline连上JDBCServer。

d. 客户端发送SQL语句给ProxyServer,ProxyServer将语句转交给真正连上的 JDBCServer处理。最后JDBCServer服务将结果返回给ProxyServer,

ProxyServer再将结果返回给客户端。

在HA方案中,每个ProxyServer服务(即实例)都是独立且等同的,当其中一个实 例在升级或者业务中断时,其他的实例也能接受客户端的连接请求。

URL连接介绍 – 多租户模式

多租户模式的客户端读取ZooKeeper节点中的内容,连接对应的ProxyServer 服务。连接字符串为:

安全模式下:

Kinit认证方式下的客户端URL如下所示:

jdbc:hive2://

<zkNode1_IP>:<zkNode1_Port>,<zkNode2_IP>:<zkNode2_Port>,<zkNode3_IP>:<zkNode3_P ort>/;serviceDiscoveryMode=zooKeeper;zooKeeperNamespace=sparkthriftserver2x;saslQo p=auth-conf;auth=KERBEROS;principal=spark/hadoop.<系统域名>@<系统域名>;

说明

● 其中“<zkNode_IP>:<zkNode_Port>”是ZooKeeper的URL,多个URL以逗 号隔开。

例如:“192.168.81.37:2181,192.168.195.232:2181,192.168.169.84:2181”。

● 其中sparkthriftserver2x是ZooKeeper上的目录,表示客户端从该目录下随 机选择JDBCServer实例进行连接。

示例:安全模式下通过Beeline客户端连接时执行以下命令:

sh CLIENT_HOME/spark/bin/beeline -u "jdbc:hive2://

<zkNode1_IP>:<zkNode1_Port>,<zkNode2_IP>:<zkNode2_Port>,<zkN ode3_IP>:<zkNode3_Port>/;serviceDiscoveryMode=zooKeeper;zooK

eeperNamespace=sparkthriftserver2x;saslQop=auth-conf;auth=KERBEROS;principal=spark/hadoop.<系统域名>@<系统 域名>;"

Keytab认证方式下的URL如下所示:

jdbc:hive2://

<zkNode1_IP>:<zkNode1_Port>,<zkNode2_IP>:<zkNode2_Port>,<zkNode3_IP>:<zkNode3_P ort>/;serviceDiscoveryMode=zooKeeper;zooKeeperNamespace=sparkthriftserver2x;saslQop

=auth-conf;auth=KERBEROS;principal=spark/hadoop.<系统域名>@<系统域名

>;user.principal=<principal_name>;user.keytab=<path_to_keytab>

其中<principal_name>表示用户使用的Kerberos用户的principal,如

“test@<系统域名>”。<path_to_keytab>表示<principal_name>对应 的keytab文件路径,如“/opt/auth/test/user.keytab”。

普通模式下:

jdbc:hive2://

<zkNode1_IP>:<zkNode1_Port>,<zkNode2_IP>:<zkNode2_Port>,<zkNode3_IP>:<zkNode3_P ort>/;serviceDiscoveryMode=zooKeeper;zooKeeperNamespace=sparkthriftserver2x;

示例:普通模式下通过Beeline客户端连接时执行以下命令:

sh CLIENT_HOME/spark/bin/beeline -u "jdbc:hive2://

<zkNode1_IP>:<zkNode1_Port>,<zkNode2_IP>:<zkNode2_Port>,<zkN

ode3_IP>:<zkNode3_Port>/;serviceDiscoveryMode=zooKeeper;zooK eeperNamespace=sparkthriftserver2x;"

– 非多租户模式

非多租户模式的客户端连接的是某个指定JDBCServer节点。该模式的连接字 符串相比多主实例模式的去掉关于ZooKeeper的参数项

“serviceDiscoveryMode”和“zooKeeperNamespace”。

示例:安全模式下通过Beeline客户端连接非多租户模式时执行以下命令:

sh CLIENT_HOME/spark/bin/beeline -u "jdbc:hive2://

<server_IP>:<server_Port>/;user.principal=spark/hadoop.<系统域名>@<

系统域名>;saslQop=auth-conf;auth=KERBEROS;principal=spark/

hadoop.<系统域名>@<系统域名>;"

说明

● 其中“<server_IP>:<server_Port>”是指定JDBCServer节点的URL。

● “CLIENT_HOME”是指客户端路径。

多租户模式与非多租户模式两种模式的JDBCServer接口相比,除连接方式不 同外其他使用方法相同。由于Spark JDBCServer是Hive中的HiveServer2的另 外一个实现,其使用方法,请参见Hive官网:https://cwiki.apache.org/

confluence/display/Hive/HiveServer2+Clients。

指定租户

一般情况下,某用户提交的客户端会连接到该用户默认所属租户的

JDBCServer上,若需要连接客户端到指定租户的JDBCServer上,可以通过添 加--hiveconf mapreduce.job.queuename进行指定。

通过Beeline连接的命令示例如下(aaa为租户名称):

beeline --hiveconf mapreduce.job.queuename=aaa -u

'jdbc:hive2://192.168.39.30:2181,192.168.40.210:2181,192.168.215.97:2 181;serviceDiscoveryMode=zooKeeper;zooKeeperNamespace=sparkthr iftserver2x;saslQop=auth-conf;auth=KERBEROS;principal=spark/

hadoop.<系统域名>@<系统域名>;'