16.2 对接大数据平台
16.2.3 Cloudera CDH 对接 OBS
部署视图
安装版本
硬件:1Master+3Core(配置:8U32G,操作系统:CentOS 7.5)
软件:CDH 6.0.1 部署视图
更新 OBSA-HDFS 工具
步骤1 下载与hadoop版本配套的OBSA-HDFS工具:下载地址。
并将OBSA-HDFS工具jar包(如hadoop-huaweicloud-3.1.1-hw-40.jar)上传到CDH各 节点/opt/obsa-hdfs目录中。
说明
● hadoop-huaweicloud-x.x.x-hw-y.jar包含义:前三位x.x.x为配套hadoop版本号;最后一位y 为OBSA版本号,y值最大为最新版本。如:hadoop-huaweicloud-3.1.1-hw-40.jar,3.1.1是 配套hadoop版本号,40是OBSA的版本号。
● 如hadoop版本为3.1.x,则选择hadoop-huaweicloud-3.1.1-hw-40.jar。
步骤2 增加hadoop-huaweicloud的jar包。
在CDH集群各节点执行以下命令,命令请根据hadoop-huaweicloud的jar包名字及实 际CDH版本进行适配使用。
1. 执行如下命令,将OBSA-HDFS工具的jar包放到/opt/cloudera/parcels/
CDH-6.0.1-1.cdh6.0.1.p0.590678/jars/目录中。
cp /opt/obsa-hdfs/hadoop-huaweicloud-2.8.3.33.jar /opt/cloudera/
parcels/CDH-6.0.1-1.cdh6.0.1.p0.590678/jars/
2. 执行如下命令,建立各目录的软连接,将hadoop-huaweicloud的jar包放入如下 目录。
ln -s /opt/cloudera/parcels/CDH-6.0.1-1.cdh6.0.1.p0.590678/jars/hadoop-huaweicloud-2.8.3.33.jar /opt/cloudera/parcels/
CDH-6.0.1-1.cdh6.0.1.p0.590678/jars/hadoop-huaweicloud.jar
ln -s /opt/cloudera/parcels/CDH-6.0.1-1.cdh6.0.1.p0.590678/jars/hadoop-huaweicloud.jar /opt/cloudera/cm/cloudera-navigator-server/libs/cdh6/
hadoop-huaweicloud.jar
ln -s /opt/cloudera/parcels/CDH-6.0.1-1.cdh6.0.1.p0.590678/jars/hadoop-huaweicloud.jar /opt/cloudera/cm/common_jars/hadoop-/opt/cloudera/parcels/CDH-6.0.1-1.cdh6.0.1.p0.590678/jars/hadoop-huaweicloud.jar ln -s /opt/cloudera/parcels/CDH-6.0.1-1.cdh6.0.1.p0.590678/jars/hadoop-huaweicloud.jar /opt/cloudera/cm/lib/cdh6/hadoop-/opt/cloudera/parcels/CDH-6.0.1-1.cdh6.0.1.p0.590678/jars/hadoop-huaweicloud.jar ln -s /opt/cloudera/parcels/CDH-6.0.1-1.cdh6.0.1.p0.590678/jars/hadoop-huaweicloud.jar /opt/cloudera/cm/cloudera-scm-telepub/libs/cdh6/
hadoop-huaweicloud.jar
ln -s /opt/cloudera/parcels/CDH-6.0.1-1.cdh6.0.1.p0.590678/jars/hadoop-huaweicloud.jar /opt/cloudera/parcels/
CDH-6.0.1-1.cdh6.0.1.p0.590678/lib/hadoop/hadoop-huaweicloud.jar ln -s /opt/cloudera/parcels/CDH-6.0.1-1.cdh6.0.1.p0.590678/jars/hadoop-huaweicloud.jar /opt/cloudera/parcels/
CDH-6.0.1-1.cdh6.0.1.p0.590678/lib/hadoop/client/hadoop-huaweicloud.jar
ln -s /opt/cloudera/parcels/CDH-6.0.1-1.cdh6.0.1.p0.590678/jars/hadoop-huaweicloud.jar /opt/cloudera/parcels/
CDH-6.0.1-1.cdh6.0.1.p0.590678/lib/spark/jars/hadoop-huaweicloud.jar ln -s /opt/cloudera/parcels/CDH-6.0.1-1.cdh6.0.1.p0.590678/jars/hadoop-huaweicloud.jar /opt/cloudera/parcels/
CDH-6.0.1-1.cdh6.0.1.p0.590678/lib/impala/lib/hadoop-huaweicloud.jar ln -s /opt/cloudera/parcels/CDH-6.0.1-1.cdh6.0.1.p0.590678/jars/hadoop-huaweicloud.jar /opt/cloudera/parcels/
CDH-6.0.1-1.cdh6.0.1.p0.590678/lib/hadoop-mapreduce/hadoop-huaweicloud.jar
ln -s /opt/cloudera/parcels/CDH-6.0.1-1.cdh6.0.1.p0.590678/jars/hadoop-huaweicloud.jar /opt/cloudera/cm/lib/cdh5/hadoop-/opt/cloudera/parcels/CDH-6.0.1-1.cdh6.0.1.p0.590678/jars/hadoop-huaweicloud.jar
最佳实践 16 大数据场景下使用 OBS 实现存算分离
ln -s /opt/cloudera/parcels/CDH-6.0.1-1.cdh6.0.1.p0.590678/jars/hadoop-huaweicloud.jar /opt/cloudera/cm/cloudera-scm-telepub/libs/cdh5/
hadoop-huaweicloud.jarln -s /opt/cloudera/parcels/
CDH-6.0.1-1.cdh6.0.1.p0.590678/jars/hadoop-huaweicloud.jar /opt/
cloudera/cm/cloudera-navigator-server/libs/cdh5/hadoop-huaweicloud.jar ----结束
HDFS 和 Yarn 集群对接 OBS 配置项
步骤1 在HDFS集群配置中选择“高级”,在core-site.xml的群集范围高级配置代码段(安全 阀)增加OBS的ak、sk、endpoint和impl配置,对应名称为fs.obs.access.key、
fs.obs.secret.key、fs.obs.endpoint、fs.obs.impl。
说明
1. 访问密钥AK/SK和终端节点Endpoint请根据实际填写,AK/SK获取方式请参见访问密钥
(AK/SK),Endpoint获取方式请参见终端节点(Endpoint)和访问域名。
2. fs.obs.impl配置为org.apache.hadoop.fs.obs.OBSFileSystem。
步骤2 修改后“重启”或“滚动重启”HDFS集群,再重启“部署客户端配置”。
步骤3 进入YARN集群,重启“部署客户端配置”。
步骤4 查看节点中/etc/hadoop/conf/core-site.xml中是否已增加OBS的ak、sk、endpoint和 impl配置。
<value>{Target Endpoint}</value>
</property>
<property>
<name>fs.obs.impl</name>
<value>org.apache.hadoop.fs.obs.OBSFileSystem</value>
</property>
步骤5 在YARN集群中搜索mapreduce.application.classpath配置,添加/opt/cloudera/
parcels/CDH-6.0.1-1.cdh6.0.1.p0.590678/jars/*配置项后,“重启”或“滚动重 启”YARN集群,再重启“部署客户端配置”。
----结束
Spark 集群对接 OBS 配置项
步骤1 Spark应用对接OBS,需要在YARN集群中进行core-site.xml配置,包括:ak、sk、
endpoint、impl等。
步骤2 core-site.xml配置完成后“重启”YARN集群,再重启Spark集群的“部署客户端配 置”。
----结束
Hive 集群对接 OBS 配置项
步骤1 Hive应用对接OBS,需要在Hive集群中进行core-site.xml配置,包括:ak、sk、
endpoint、impl等。
步骤2 core-site.xml配置完成后“重启”Hive集群,再重启Hive集群的“部署客户端配 置”。
----结束