评估模型 - 通用文本分类工作流 - 可训练技能模板介绍_企业级AI应用开发专业套件 ModelArts Pro_用户指南_HiLens套件_HiLens安全帽检测技能

3.3 通用文本分类工作流

训练得到模型之后，整个开发过程还不算结束，需要对模型进行评估和考察。往往不能一次性获得一个满意的模型，需要反复的调整算法参数、数据，不断评估训练生成的模型。

一些常用的指标，如精准率、召回率、F1值等，能帮助您有效的评估，最终获得一个满意的模型。

已在自然语言处理套件控制台选择“通用文本分类工作流”新建应用，并训练模型，

详情请见训练模型。

在“模型评估”页面，您可以针对当前版本的模型进行整体评估。

“整体评估”左侧显示当前模型的版本、标签数量、验证集数量。

“整体评估”右侧显示当前模型的评估参数值，包括“精准率”、“召回率”、“F1 值”。您可以在上方单击选择“评估范围”，单击 “添加对比版本”。

图3-19 整体评估

在“模型评估”页面，您可以搜索查看测试集中数据模型预测结果。

“详细评估”左侧在搜索框中搜索标签，右侧显示正确标签所对应样本的正确标签和预测标签，您可以对比正确标签和预测标签，判断当前模型对该样本的预测是否正确。

例如搜索框内输入标签“1”，下方会显示正确标签为“1”的样本中，预测正确的样本数在验证集中的占比。右侧显示正确标签为“1”的样本信息，包括样本的正确标签和预测标签。

图3-20 详细评估

针对当前版本的模型，经过“整体评估”和“详细评估”后，如果根据业务需求，模型还需继续优化，请单击“上一步”，回到“模型训练”步骤，详细操作指导请见训练模型。

如果模型已达到业务需求，请单击“发布部署”，进入“服务部署”步骤，详情请见部署服务。

模型准备完成后，您可以部署服务，开发属于自己的文本分类应用，此应用用于分类自己所上传的文字内容，也可直接调用对应的API。

● 已在自然语言处理套件控制台选择“通用文本分类工作流”新建应用，并评估模型，详情请见评估模型。

● 由于部署服务涉及ModelArts功能，需消耗资源，要确保账户未欠费。

● 如果部署服务使用专属资源池，需要在ModelArts创建专属资源池，详情请见资源池。

在“服务部署”页面，按表3-4填写服务的相关参数，然后单击右下角的“部署”。

图3-21 服务部署

表3-4 服务部署参数说明

参数说明

服务名称待部署的服务名称，首次部署服务请单击可修改默认服务名称。

如果在不同版本非首次部署服务，服务名称不支持修改。

描述待部署服务的简要说明。

资源池用于部署服务的资源池和资源类型。资源池可选“公共资源池”

和“专属资源池”。

● “公共资源池”：提供公共的大规模计算集群，资源按作业隔离。您可以按需选择不同的资源类型。

● “专属资源池”：提供独享的计算资源，不与其他用户共享，更加高效。使用专属资源池需要在ModelArts创建专属资源池，详情请见资源池。

计算节点规格支持选择如下计算规格：

● “CPU：2 核 8 GiB”：适合纯CPU类型的负载运行的模型。

● “CPU+GPU：2 核 8 GiB + P4”：适合CPU+GPU类型模型的运行，带有1个Nvidia P4卡。

服务自动停止设置服务自动停止的时间，在线服务运行状态在所选的时间点后自动停止，同时在线服务也停止计费。

计算节点个数设置当前版本模型的实例个数。如果节点个数设置为1，表示后台的计算模式是单机模式；如果节点个数设置大于1，表示后台的计算模式为分布式的。请根据实际编码情况选择计算模式。

部署成功后，页面显示“服务部署成功”。您可以单击“查看应用监控”，进入应用监控页面查看监控信息，详情请见监控应用。