格式化编辑指通过编辑json格式代码,完成知识映射配置。
前提条件
● 已创建图谱并选择图谱规格,请参见购买知识图谱。
● 已创建并选择本体,详情请参见配置图谱本体。
● 已完成数据源配置,详情请参见配置数据源。
● 已完成信息抽取配置,详情请参见配置信息抽取。
操作步骤
1. 在普通配置构建图谱页面,单击“知识映射”,页面下方弹出“知识映射”对话 框,单击右侧 按钮可以放大对话框。
图11-5 知识映射
2. “编辑方式”选择“代码配置模式”。
3. 在“代码配置模式”页签的编辑框中,输入json格式代码,以映射关系如图11-6 为例,代码示例如下所示:
图11-6 实体人物的映射关系
{ "label_map_configs": { "Film": "电影", "Person": "人物"
}, "property_map_configs": [ {
"label": "电影", "source_keys": [ "票房"
],
"target_key": "票房"
},
{
], "relation_map_configs": [ {
后续操作
配置知识映射后,进入下一步操作,配置知识融合,具体操作步骤请见配置知识融 合。
12 配置知识融合
在创建知识图谱时,您需要配置知识融合,设置知识融合判断属性及相似度函数参 数,对来自不同数据源的知识在统一规范下进行异构数据整合、消歧,完成新知识图 谱的创建。
知识融合
知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不 同数据源的知识在统一规范下进行异构数据整合、消歧。
如图12-1所示的两条数据,这两条数据中的“元鲜”实际上是同一个人,因此需要对 这两条数据进行融合。
图12-1 知识融合示例
知识融合过程请见图12-2,融合过程说明请见表12-1。
图12-2 知识融合
图12-3 知识融合 体属性。如图12-1所示,可以选择融合标识 符为“name”,即初步筛选出属性
“name”相同的数据,也可选择融合标识符 为“职业”,即筛选出属性“职业”相同的数 两个实体的属性“name”和“职业”的相似 度均满足预置,就可判断这两个实体实际上指 代的是一个实体。
每组可添加多个判断融合的属性,最多添加9 个。
配置参数 配置参数说明
“相似度函数” 判断属性相似度需要选择相似度函数,当前支 持两种相似度函数,一种是“EditSim”(编 辑距离),一种是“JaccardSim”(Jaccard 距离)。
说明“EditSim”(编辑距离)仅适用于“String”类型 的实体属性,“JaccardSim”(Jaccard距离)仅适 用于“Set<String>”类型的实体属性。
“相似度阈值” 选择相似度阈值,知识融合时,当数据的每组
以创建一个有关于电影的知识图谱为例,如果对人物的属性“name”相似的数据进行 知识融合判断,当属性“name”的相似度大于1.00,且属性“职业”的相似度大于 1.00时,数据进行融合。对电影的属性“name”相似的数据进行知识融合判断,当属 性“name”的相似度大于1.00,且属性“上映时间”的相似度大于1.00时,数据进行 融合。相似度函数均为编辑距离函数“EditSim”。
1. 按配置数据源为待创建的图谱配置数据源。
可添加多组属性配置项,每组属性配置项可添加多个判断融合的属性配置。至少 存在一组属性配置项,组内所有判断融合的属性相似度均大于相似度阈值时,即 可融合这两条数据。
本样例只需添加一个属性配置分组,一组里填写两个属性配置项信息,如图12-4 所示。
单击“添加分组”,即可添加一组新的属性配置项。
单击“增加属性配置项”,即可在组内添加新的属性配置项。
实体配置完成后,单击“保存”。
图12-4 知识融合
8. 在左侧区域,单击“人物”实体名称。在右侧实体“人物”对应的“融合标识 符”栏单击 ,选择标识知识融合的本体属性“name”。
9. 填写实体“人物”的属性配置项信息。
本样例只需添加一个属性配置分组,一组里填写两个属性配置项信息,如图12-5 所示。
单击“添加分组”,即可添加一组新的属性配置项。
单击“增加属性配置项”,即可在组内添加新的属性配置项。
实体配置完成后,单击“保存”。
图12-5 知识融合
10. 在页面右下角单击“保存”,回到图谱流水线页面。
11. 在图谱流水线页面,单击“生成图谱”,完成图谱的创建。
13 融合验证
若在创建图谱时配置了知识融合,存在被融合的实体,就需要进行融合验证,即验证 当前知识融合的配置产生的结果是否符合预期。
背景介绍
知识融合是指融合来自多个数据来源的关于同一个实体或概念的描述信息,对来自不 同数据源的知识在统一规范下进行异构数据整合、消歧。
如图13-1所示的两条数据,这两条数据中的“元鲜”实际上是同一个人,因此需要对 这两条数据进行融合。
图13-1 知识融合示例
配置知识融合后,知识图谱服务会对数据按配置规则进行知识融合。但是融合结果不 一定完全正确,需要经过融合验证,判断融合的数据是否描述的是同一个实体或概 念。
前提条件
已创建完知识图谱,即完成图谱创建,并在配置知识融合步骤2打开知识融合开关配置 知识融合的信息。
操作步骤
1. 登录KG服务管理控制台,默认进入“我的图谱”页面,在“我的图谱”页面单击 图谱卡片,进入图谱详情页。
2. 默认进入“在线版本图谱”页签,等待图谱运行完成,单击“操作”列的“验 证”,进入“随机验证”页面。
仅创建图谱版本时,进行知识融合的图谱版本可进行验证操作。
说明
配置知识融合后,如果存在被融合的实体,“版本验证”页面有随机采样的部分融合样 例。如果不存在被融合的实体,“版本验证”页面就没有融合样例。
图13-2 版本验证
3. 在“随机验证”页面,针对随机采样的部分融合样例,您若认可融合的结果,单 击 ,若不认可,单击 。
右侧可查看融合验证的结果,包含“准确率”、“准确数”、“不准确数”、
“不确定数”。
图13-3 融合验证