• 沒有找到結果。

源数据Schema,即用户的JSON或CSV数据样例,用于描述JSON或CSV数据格式。DIS 可以根据此JSON或CSV数据样例生成Avro schema, 将通道内上传的JSON或CSV数据转 换为Parquet或CarbonData格式。

创建源数据Schema有如下三个入口:

● 创建通道同时开启“Schema开关”,创建源数据Schema,参见图4-3。

● 创建通道时,关闭“Schema开关”。待通道创建成功后,选择“通道管理”页 签,单击已创建的通道名称,进入所选通道的管理页面。选择“源数据类型”后 的“创建源数据Schema”进行创建,参见图4-4。

● 创建通道时,关闭“Schema开关”。待通道创建成功后,选择“通道管理”页 签,单击已创建的通道名称,进入所选通道的管理页面。选择“转储任务”页 签,单击“添加转储任务”按钮,在弹出的“添加转储任务”页面进行创建,参 见图4-5。

4-3 创建 Schema1

4-4 创建 Schema2

4-5 创建 Schema3

创建源数据 Schema(导入文件方式)

找到创建源数据Schema入口后,按照如下方法创建源数据Schema:

步骤1 单击“源数据Schema”后的“导入文件”。

步骤2 在左侧文本框中输入JSON或者CSV格式的源数据样例,也可单击

导入源数据样例。例如:

说明

导入源数据样例时,仅支持导入“.txt”,“.json”,“.csv”和“.java”的文件格式。

步骤3 左侧文本框中单击 ,可在右侧文本框中根据源数据样例生成Avro schema。例如:

步骤4 右侧文本框中单击 ,可修改已生成的Avro schema。例如:

步骤5 文本框中单击“格式化”和“去格式化”,可格式化解析数据。例如:

步骤6 文本框中单击 ,可删除源数据样例。

----结束

创建源数据 Schema(直接创建方式)

找到创建源数据Schema入口后,按照如下方法创建源数据Schema:

步骤1 单击“源数据Schema”后的“直接创建”。

步骤2 配置“属性名”和“数据类型”后,单击“添加”,如图4-6所示,添加根节点。

4-6 直接创建源数据 Schema-1

步骤3 根节点添加完成后,选中已创建的根节点,按照同样的方法,配置“属性名”和“数 据类型”,添加子节点。

4-7 直接创建源数据 Schema-2

说明

● 选中根节点或者子节点前的复选框,单击“删除” ,可将节点删除。

● 选中根节点或者子节点前的复选框,单击“编辑”,可对已创建的节点属性进行编辑。

● 单击“重置”,可删除所有节点。

步骤4 单击“提交”,源数据Schema创建成功。

----结束

修改源数据 Schema

说明

已创建了源数据Schema的通道,若该通道下存在转储任务,则不允许修改已有的源数据 Schema。

步骤1 使用注册帐户登录DIS控制台。

步骤2 单击管理控制台左上角的 ,选择区域。

步骤3 在左侧列表栏中选择通道管理。

1. 单击通道名称。进入所选通道的管理页面。

2. 单击“源数据类型”后的“查看已有源数据Schema”。

3. 弹出源数据Schema文本框,单击 ,修改源数据Schema。

4-8 修改源数据 Schema

说明

当通道中存在转储任务,修改源数据Schema可能导致通道内未转储完成的数据无法被成功 转储。

4. 修改完成后,单击“提交”,保存修改结果。单击“放弃”,不对源数据Schema 进行修改。

----结束

相關文件