• 沒有找到結果。

AI加速型云服务器(AI Accelerated Cloud Server, AIACS)是专门为AI业务提供加速服 务的云服务器。搭载昇腾系列芯片及软件栈。

AI推理加速型系列:搭载昇腾310芯片,为AI推理业务加速。

AI 加速实例总览

AI推理加速型:

AI推理加速增强I型Ai1s

AI推理加速I型Ai1 说明

Ai1s为Ai1的增强机型,机型规格和Ai1完全一致,区别仅在于Ai1s支持最新的腾软件栈 CANN,建议首选Ai1s。

适用于 AI 加速型实例的镜像列表

6-99 适用于 AI 加速型实例的镜像列表

类别 实例 支持镜像

AI推理加速

增强I型 Ai1s Ubuntu Server 18.04 64bit CentOS 7.6 64bit

AI推理加速I 型

Ai1 Ubuntu Server 16.04 64bit CentOS 7.4 64bit

AI 推理加速增强 I 型 Ai1s

概述

AI推理加速增强I型实例Ai1s是以昇腾310(Ascend 310)芯片为加速核心的AI加速型 弹性云服务器。基于Ascend 310芯片低功耗、高算力特性,实现了能效比的大幅提 升,助力AI推理业务的快速普及。通过AI推理加速型实例Ai1s将Ascend 310芯片的计 算加速能力在公有云上开放出来,方便用户快速简捷地使用Ascend 310芯片强大的处 理能力。

AI推理加速型实例Ai1s基于Altas300加速卡设计,更多详细信息请参考昇腾开发者社 区。

AI加速型云服务器可用于机器视觉,安防监控,智慧园区,智慧城市,智慧交通,智 慧零售,互联网音视频,视频编解码等业务场景。

规格

6-100 Ai1s 型弹性云服务器的规格 规格名称 vCPU 内存

(GiB

最大带宽/

基准带宽 最大收 发包能力(万/

PPS)

Ascend

310 Ascend RAM(GiB)

虚拟化 类型

ai1s.larg

e.4 2 8 4/1.3 20 1 8 KVM

规格名称 vCPU 内存

(GiB

最大带宽/

基准带宽

最大收 发包能力(万/

PPS)

Ascend

310 Ascend RAM(GiB)

虚拟化 类型

ai1s.xlar

ge.4 4 16 6/2 35 2 16 KVM

ai1s.

2xlarge.

4

8 32 10/4 50 4 32 KVM

ai1s.

4xlarge.

4

16 64 15/8 100 8 64 KVM

ai1s.

8xlarge.

4

32 128 25/15 200 16 128 KVM

功能

Ai1s加速型弹性云服务器功能如下:

● 处理器与内存配比为1:4。

● 处理器:第二代英特尔® 至强® 可扩展处理器 6278,主频2.6GHz,睿频3.5GHz,

或英特尔® 至强® 可扩展处理器 6151, 主频3.0GHz,睿频3.4GHz。

● 支持Ascend 310芯片,每张Atlas300加速卡包含4个Ascend 310芯片

● 单芯片整数精度(INT8)16TeraOPS

● 单芯片提供8GiB显存,内存带宽50GiB/s

● 内置硬件视频编解码引擎,支持5路全高清视频解码器(H.264/265)

使用须知

1. Ai1s实例支持如下版本的操作系统:

– Ubuntu Server 18.04 64bit – CentOS 7.6 64bit

2. Ai1s型弹性云服务器不支持规格变更。

3. Ai1s型云服务器所在物理机发生故障时,云服务器支持自动恢复。

如何使用Ai1s加速型云服务器

使用Ai1s加速型云服务器的流程如下:

步骤1 创建Ai1s加速型云服务器。

使用公共镜像创建的Ai1s加速云服务器默认已安装驱动、固件和开发套件,并配置环 境变量,验证可用性请参考步骤3。

步骤2 远程登录Ai1s加速云服务器。

对于Linux操作系统的Ai1加速云服务器,登录时请以SSH密码方式登录。具体操作,请 参见密码方式登录Linux弹性云服务器(SSH方式)。

步骤3 Ai1s使用样例。

该样例主要是基于Caffe ResNet-50网络(单输入、单batch)实现图片分类的功能。

将Caffe ResNet-50网络的模型文件转换为适配昇腾AI处理器的离线模型(*.om文 件),在样例中,加载该om文件,对2张*.jpg图片进行解码、缩放、推理,分别得到 推理结果后,再对推理结果进行处理,输出最大置信度的类别标识。

转换模型时,需配置色域转换参数,用于将YUV420SP格式的图片转换为RGB格式的图 片,才能符合模型的输入要求。

1. 模型转换

a. 以root用户登录Ai1s云服务器。

b. 设置环境变量(公共镜像中已设置环境变量,如果是私有镜像创建请自行设 置)。

环境变量示例如下,请用实际安装路径替换driver_home和 install_path。

export driver_home=/usr/local/Ascend

export install_path=${driver_home}/ascend-toolkit/latest/x86_64-linux_gcc7.3.0 export DDK_PATH=${install_path}

export PATH=/usr/local/python3.7.5/bin:${install_path}/atc/ccec_compiler/bin:${install_path}/atc/

bin:${install_path}/fwkacllib/ccec_compiler/bin:$PATH

export PYTHONPATH=${install_path}/atc/python/site-packages/te:${install_path}/atc/python/

site-packages/topi:${install_path}/atc/python/site-packages/auto_tune.egg/auto_tune/:$

{install_path}/atc/python/site-packages/schedule_search.egg:${install_path}/opp/op_impl/built-in/ai_core/tbe/:${install_path}/fwkacllib/python/site-packages/topi:${install_path}/fwkacllib/

python/site-packages/hccl:${install_path}/fwkacllib/python/site-packages/auto_tune.egg:$

{install_path}/fwkacllib/python/site-packages/schedule_search.egg:${install_path}/fwkacllib/

python/site-packages/te:${install_path}/tfplugin/python/site-packages/npu_bridge:

$PYTHONPATH

export LD_LIBRARY_PATH=/usr/local/lib/:/usr/lib/:${install_path}/acllib/lib64:${install_path}/atc/

lib64:${install_path}/fwkacllib/lib64:${driver_home}/driver/lib64:${driver_home}/add-ons:$

{install_path}/toolkit/lib64:$LD_LIBRARY_PATH export ASCEND_OPP_PATH=${install_path}/opp export NPU_HOST_LIB=${install_path}/acllib/lib64/stub export SOC_VERSION=Ascend310

c. 准备数据

示例:请将以下示例中“/usr/local/Ascend/ascend-toolkit/latest/arm64-linux_gcc7.3.0”替换成acllib实际路径。

获取ResNet-50网络的权重文件(*.caffemodel),并将获取的文件上传至

云服务器的“/usr/local/Ascend/ascend-toolkit/latest/x86_64-linux_gcc7.3.0/acllib/sample/acl_execute_model/acl_dvpp_resnet50/

caffe_model”目录下。

d. 将ResNet-50网络转换为适配昇腾AI处理器的离线模型(*.om文件),转换模 型时,需配置色域转换参数,用于将YUV420SP格式的图片转换为RGB格式的 图片。

切换到“acl_dvpp_resnet50”目录,执行如下命令:

atc --model=caffe_model/resnet50.prototxt --weight=caffe_model/

resnet50.caffemodel framework=0 output=model/resnet50_aipp --soc_version=Ascend310 --insert_op_conf=caffe_model/aipp.cfg

6-1 转换模型

--output参数:生成的resnet50_aipp.om文件存放在“acl_dvpp_resnet50/

model”目录下。

关于各参数的详细解释,请参见《ATC工具使用指导》中的“约束及参数说 明”。

e. 将Cast和ArgMaxD两个算子的算子描述信息(*.json文件)编译成适配昇腾AI 处理器的离线模型(*.om文件),用于运行算子时使用。

切换到acl_dvpp_resnet50目录,执行如下命令:

atc singleop=out/op_models/op_list.json soc_version=Ascend310 --output=out/op_models

6-2 编译模型

--output参数:生成的om文件必须放在“out/op_models”目录下。

关于各参数的详细解释,请参见《ATC工具使用指导》中的“约束及参数说 明”。

2. 编译代码

a. 设置环境变量,编译脚本src/CMakeLists.txt通过环境变量所设置的头文件、

库文件的路径来编译代码。

如下为设置环境变量的示例,请将/usr/local/Ascend/ascend-toolkit/latest/

x86_64-linux_gcc7.3.0替换为ACLlib的实际安装路径。

执行以下命令导入环境变量(公共镜像中已设置环境变量,如果是私有镜像 创建请自行设置)

export DDK_PATH=/usr/local/Ascend/ascend-toolkit/latest/x86_64-linux_gcc7.3.0

export NPU_HOST_LIB=/usr/local/Ascend/ascend-toolkit/latest/

x86_64-linux_gcc7.3.0/acllib/lib64/stub

b. 切换到acl_dvpp_resnet50目录,创建目录用于存放编译文件。

本例中,创建的目录为“build/intermediates/host”。

mkdir -p build/intermediates/host

c. 切换到“build/intermediates/host”目录,执行cmake生成编译文件。

以下示例中“../../../src”表示CMakeLists.txt文件所在的目录,请根据实际目 录层级修改。

cd build/intermediates/host

cmake ../../../src DCMAKE_CXX_COMPILER=g++ -DCMAKE_SKIP_RPATH=TRUE

6-3 执行 cmake 生成编译文件

d. 执行make命令,生成的可执行文件main在“acl_dvpp_resnet50/out”目录 下。

make

6-4 生成可执行文件 main

3. 运行应用

a. 设置环境变量

如下为设置环境变量的示例,请根据实际安装情况替换路径。(公共镜像中 已设置环境变量,如果是私有镜像创建请自行设置)

export LD_LIBRARY_PATH=/usr/local/Ascend/ascend-toolkit/latest/

x86_64-linux_gcc7.3.0/acllib/lib64:/usr/local/Ascend/add-ons

b. 切换到可执行文件main所在的目录”acl_dvpp_resnet50/out”,给该目录下 的main文件加执行权限。

chmod +x main

c. 切换到可执行文件main所在的目录,例如“/home/HwHiAiUser/

acl_dvpp_resnet50/out”,运行可执行文件。

./main

d. 执行成功后,在屏幕上显示最大置信度的类别标识。

6-5 显示类别标识

----结束

AI 推理加速 I 型 Ai1

概述

AI推理加速型实例Ai1是以昇腾310(Ascend 310)芯片为加速核心的AI加速型弹性云 服务器。基于Ascend 310芯片低功耗、高算力特性,实现了能效比的大幅提升,助力 AI推理业务的快速普及。通过AI推理加速型实例Ai1将Ascend 310芯片的计算加速能力 在公有云上开放出来,方便用户快速简捷地使用Ascend 310芯片强大的处理能力。

AI推理加速型实例Ai1基于Altas300加速卡设计,更多详细信息请参考昇腾开发者社区 AI加速型云服务器可用于机器视觉、语音识别、自然语言处理通用技术,支撑智能零 售、智能园区、机器人云大脑、平安城市等场景。

规格

6-101 Ai1 型弹性云服务器的规格

d 310 Ascen d RAM

● 支持Ascend 310芯片,每张Hi1910加速卡包含4个Ascend 310芯片

● 单芯片半精度(FP16)8TeraFLOPS

● 单芯片整数精度(INT8)16TeraOPS

● 单芯片提供8GiB显存,内存带宽50GiB/s

● 内置硬件视频编解码引擎,支持16路全高清视频解码器(H.264/265)

使用须知

1. Ai1实例支持如下版本的操作系统:

– Ubuntu Server 16.04 64bit – CentOS 7.4 64bit

2. Ai1型弹性云服务器不支持规格变更。

3. Ai1型云服务器所在物理机发生故障时,云服务器支持自动恢复。

如何使用Ai加速型云服务器

使用Ai1加速型云服务器的流程如下:

1. 创建Ai1加速型云服务器。

使用公共镜像创建的Ai1加速云服务器默认已包含Mind Studio工具安装包、DDK 安装包、自动化安装脚本。但需用户手动安装Mind Studio和DDK。具体操作请参 考3。

2. 远程登录Ai1加速云服务器。

对于Linux操作系统的Ai1加速云服务器,登录时请以SSH密码方式登录。具体操 作,请参见密码方式登录Linux弹性云服务器(SSH方式)。

3. Ai1的开发环境准备与安装。

Ai加速云服务器内提供Mind Studio编排开发平台,可以自定义编排人工智能应用 业务流。统一管理推理业务应用模型、数据集,提供日志分析、性能分析、黑匣 子等附加功能。您可以通过Mind Studio编排开发平台,适配Ascend芯片进行人工 智能项目开发与管理,以及对其它框架训练模型进行转换。

DDK安装包为用户提供基于NPU的数字开发者套件。DDK可以用于构建相关工程 的编译环境。不同的发布包里集成了不同NPU形态的DDK,当前版本的DDK集成 了TE、DVPP、流程编排等组件的依赖库和头文件,用户可以通过makefile编译相 应的工程文件。

a. 开发环境准备

Ai1实例目前支持Ubuntu 16.04 64bit和CentOS 64bit两种操作系统,使用公 共镜像创建的Ai1实例默认已包含Mind Studio工具安装包、DDK安装包、自 动化安装脚本。

Ubuntu 16.04 64bit操作系统请参考表6-102。

CentOS 64bit操作系统请参考表6-103。

云服务器创建完成后,请先执行ll或ls命令,确认root目录下是否已包含安装 包和脚本文件。

以CentOS 64bit操作系统为例回显信息如图6-6所示,代表已包含安装包和脚 本文件。

6-6 查询安装包和脚本文件

6-102 Ubuntu 16.04 64bit 系统包含的文件列表

文件 文件名称

Mind Studio工具安装包 mini_mind_studio_Ubuntu.rar DDK安装包

MSpore_DDK-{VERSION}- x86_64.ubuntu16.04-x86_64.ubuntu16.04-aarch64.miniOS.tar.gz

{VERSION}为DDK版本号,DDK版本与 Mind Studio工具安装包版本必须保持一

{VERSION}为DDK版本号,DDK版本与 Mind Studio工具安装包版本必须保持一