Steins;Lab

某团的自留研究所

Intel Movidius Neural Compute Stick - 英特尔Movidius神经计算棒上手体验

新拿到了一块Intel Movidius Neural Compute Stick,是Intel Movidius推出的一款针对神经网络边缘计算加速的usb设备。今天我们来把它和同样低成本的单板计算机树莓派 Raspberry Pi 配合使用,看看综合效能如何。

 

1 初见

包装颜色整体和本体都为英特尔特有蓝色。看起来就像一个大号U盘。纯金属机身,看来是被动散热。

这块硬件的全称是Intel Movidius Neural Compute Stick,由因特尔的Movidius推出(2016年9月英特尔宣布将收购计算机视觉创业公司Movidius)。在设备中,核心是一块英特尔®Movidius™Myriad™2视觉处理单元(VPU)。

这块设备是一块USB设备,旨在通过与主机(HOST)连接,将边缘计算中,深度学习图像的推理计算卸载到专用的计算棒中,来实现一个严苛功率限制下的高速深度学习推理计算。

不可免俗地,来看一下参数规格:

  • 处理器:英特尔®Movidius™Myriad™2视觉处理单元(VPU)
  • 支持的框架:TensorFlow *,Caffe *
  • 连接性:USB 3.0 Type-A
  • USB记忆棒尺寸:2.85英寸x 1.06英寸x 0.55英寸(72.5毫米x 27毫米x 14毫米)
  • 工作温度:0°C至40°C
  • 最低系统要求:
    • 运行Ubuntu * 16.04的x86_64计算机或运行Stretch桌面或Ubuntu 16.04虚拟机实例的Raspberry Pi * 3 Model B.
    • USB 2.0 Type-A端口(建议使用USB 3.0)
    • 1 GB RAM
    • 4 GB存储空间

根据官方描述,是支持树莓派的Raspbian的。今天我们的实验也在该平台上进行。毕竟,面向低成本嵌入式边缘计算的设备,插在性能强劲的x86_64设备上,门不当户不对。

不过需要指出的是,该设备的USB规格是3.0的。Raspberry Pi 3b+仍然是USB2.0接口。可以选择性能更加强劲、接口速度更高的单板计算机以提升效果。

 

2 SDK安装

以下是可能需要的链接:

本文成文时间2018年10月初,相比该设备发售时间并不算早。

目前SDK github官方项目显示因开源许可证“Back Soon”。但仍然可以查看文档和获取SDK。SDK分为v1和v2,v2不向后兼容。

注意在官方提供的APPzoo中,master分支默认是SDKv1的示例;要获取SDKv2的示例,请切到SDKv2的tag分支

本文中使用SDK版本为v2,使用的硬件平台为Raspberry Pi 3B+。作为上手体验,我们先进行轻度体验。

2.1 安装SDK

我们首先使用一个干净的Raspbian系统。我用的18年6月的最新版。具体树莓派镜像部署在此不表。首先将软件包升级至最新。然后获取SDK。

make install将自动安装除了opencv外的所有SDK组件。注意,树莓派根据ncsdk.cfg文件没有指定多线程,自动使用-j4参数可能导致资源不足编译失败。建议设置为-j2或-j3。

该过程可能耗时1个小时左右。

安装完毕后可以运行make opencv安装opencv3.3。安装opencv的过程会更慢,可能使用数个小时。

 

2.2 ncappzoo

接下来,https://github.com/movidius/ncappzoo 是官方提供的应用实例库。包含一些caffe和TensorFlow模型,和使用它们的具体案例。README.md里已经有非常详细的说明,包括目标识别、目标检测和分数应用等。

图:ncappzoo 目标检测应用一角

 

3 Tiny YOLO v2实战

本节主要来看树莓派运行Tiny YOLO(v2)目标检测,看看实际成绩如何。

使用的项目为https://github.com/duangenquan/YoloV2NCS

我使用的是960*540的示例视频,置信度阈值0.3。

受限于USB2.0性能,离线视频平均为1帧。

 

4 评价

根据我们一般理解,深度学习边缘计算发展路线为GPU->FPGA->ASIC。Intel的神经计算棒则直接给我们以最终形态呈现出来。配合Arm v7l架构的HOST,考虑到自身成本(约650元)和HOST成本(约200元),作为视觉方案的快速原型搭建,是可以接受的。其与Caffe和TensorFlow的模型友好是非常大的亮点。

本次上手体验主要体验了该硬件给我们带来除GPU的解决方案性能表现。接下来的文章我们将对其进行深度探究,包括SDK使用、模型转换和运行原理等。: )

11
说点什么

avatar
6 Comment threads
5 Thread replies
7 Followers
 
Most reacted comment
Hottest comment thread
7 Comment authors
fandy平凡之路初夏阳光SPtuanfandy Recent comment authors
  Subscribe  
最新 最旧 得票最多
提醒
fandy
游客

催更,而且你已经不是大学生了,改改简介吧

平凡之路
游客

看不懂!啊

初夏阳光
游客

wow! 好高级的样子,才开始准备学单片机的鶸鷄涩涩发抖…

(话说这是什么评论系统吗?还是自己写的css啊,好漂亮。

fandy
游客
fandy

持续更新好评(我这都好久没登自己的网站了2333)

博客大全
游客

学以致用

Alchemy
游客

利用AI做个女朋友吧