logo
视觉计算推动者 010-86460505 / 400-012-9522

成功案例 > 正文

NVIDIA® DGX-1™ 助力监控视频智能分析平台

案例简介

•  本案例中,北京大学某实验室利用NVIDIA DGX-1深度学习超级计算机,加速深度学习系统模型训练的效率,尤其在行人检测,夸摄像头行人再识别等核心智能化分析技术方面提升明显。

•  本案例主要应用到NVIDIA DGX-1深度学习超级计算机。

Case Introduction

 In this case, a Laboratory of Peking University accelerated the deep learning model training with NVIDIA DGX-1 supercomputer, especially for the core technology of pedestrian detection and person re-identification from nonoverlapping cameras  for the intelligent analysis of surveillance video.

•  The major product utilized in the case is NVIDIA DGX-1 deep learning supercomputer.

背景

在教育部领导下,实验室依托北京大学建设,通过组织领导视频编解码国家标准制定,积极参与相关国际标准制定,建立完善的视频编码与系统技术标准体系;针对标准需要的关键技术,开展视频编码的核心算法研究,成为本领域核心专利的重要产出中心;推进视频编解码专利池的建立,吸收、集成本领域国内、国际先进专利技术,实现标准制定和专利许可的联合创新和良性互动;建立数字视频研究开发的开放平台,支持国内企业和科研机构开展研究开发工作,配合标准的出台与实施,研制编解码核心软件、芯片IP核和原型产品,引导和推动国内产业界的规模化投入;搭建试验、测试、验证和示范平台,成为视频行业的实验开发和测试验证公共支撑服务中心和专业人才的培育中心。

实验室主要面向图像视频处理与编码,人工智能与媒体计算,计算机视觉等相关领域,发展新的视频编码标准,针对数字视频编码与系统技术,建立研究开发和试验平台,开展视频编码算法、编解码系统、新媒体应用。针对重点行业应用和产业发展需要,建立高性能编码器与核心产品开发平台、数字视频处理与测试评估平台、重大应用示范与系统集成平台、多媒体通信技术试验验证平台等支撑平台,并以支撑平台为基础加强与支持单位以及优势单位和地区开展合作研究,通过AVS工作组的集成创新机制建立完善的、自主知识产权的信源编码技术标准体系,实现技术辐射,为我国数字电视、多媒体通信、消费电子、宽带网络等产业发展提供基础支撑。

未来,实验室还将基于NVIDIA DGX-1提供的卓越性能,加快建设大规模监控视频中人、车、 物的智能化分析和检索平台,全面提升监控视频中内容的智能化分析效率和速度。

挑战

随着人们对于公共安全的日益关注,以及在智慧城市、平安城市的发展潮流下,全球越来越多的地方普及监控设施。拒不完全统计,2012年全球有分析价值的数据中有一半是监控视频数据,这个比例在2015年上升到65%,速度是每两年翻一番。在国内,我们大约有3000万台监控摄像机,每月将生成60EB的视频数据,中国已经成为世界最主要的视频监控市场。

然而,面对如此海量的数据,仅仅靠人工分析,效率极低,而且最终能发现的有效信息也许仅仅是大数据的冰山一角。比如2012年在南京发生的“1·6”抢劫案和“8.10重庆枪击抢劫案”(周克华案),警方都动用了上千的公安干警进行原始的视频数据人眼搜索,严重影响公安部门破案的进度和效率。因此,我们急需一种智能化自动化分析手段,来对监控视频进行有效分析和挖掘。

随着近几年以深度学习算法为基础的计算机视觉技术的进步,为视频大数据分析提供了强大的计算和分析工具。反过来,巨量的视频数据也为机器训练提供了丰富的素材。

基于深度学习的视频智能化分析技术,比如,行人检测,车辆检测,跨摄像头行人追踪等等,在模型训练过程中,以及模型的快速的迭代更新都需要深度学习和高性能的计算能力的支持。

在模型训练完成之后,我们希望通过智能化分析技术,对百路甚至上千路监控视频进行实时的分析,这同样需要强大的计算平台来支撑。

方案

NVIDIA DGX-1发布,作为全球NVIDIA AI Lab中的一员,北京大学实验室成为最早接触到该产品的单位。DGX-1极大的提高了实验室科研的效率。DGX-1部署简单,在NVIDIA的支持下,DGX-1半天内就在实验室得到成功部署,与常规其他服务器部署一般需要数天安装和调试相比,效率提升十分明显。随着最新一代GPU的发布,实验室又以最快速度预定了一台配备最新TESLA V100 GPU的DGX-1。在2018年4月交付时,也是仅仅用了几个小时就部署成功并开始模型训练,真正做到了开箱即用。

DGX-1超级计算机突出的性能优势,包括其使用的最新Pascal架构的Tesla V100加速器,性能高达 960 FP16 TFLOPS,相当1400台服务器,对训练速度的提升不言而喻。同时,搭配V100的DGX-1,包含5120个Tensor Core,这极大的加速了深度学习中占比最大的卷积运算,使得整体训练速度有了质的飞跃。对于多GPU并行支持,通过NVIDIA NVLink连接,实现高速大带宽直连通讯的快速互联机制。此外,通过IB网络,还能够进一步提升节点之间的通信速度。DGX-1所提供的具有行业针对性的软件、库和其他工具,都简化了编程和应用的难度,综合保障和提升了深度学习训练的速度。

以行人跨摄像头检索为例,DGX-1极大的提高了算法的运行效率。行人作为监控视频中最重要的元素之一,目前主要包含行人检测,行人检索以及细粒度行人属性分析。整个过程如下图所示:



首先,对于输入的视频流,需要使用行人检测算法将每一帧图像中的行人检测出来。对行人进行特征提取并将特征入库以备后续的检索。同时,对行人进行更细粒度的属性分析,比如穿衣风格、外貌特征等等。所以,图中包含行人检测,特征提取,属性识别三个任务。假设以一个园区为单位,每项任务大约需要承担40路视频的分析。得益于DGX-1中V100 GPU强大且稳定的计算能力,单个GPU就能够实时处理一项任务。同时,NVIDIA NVLink提供了GPU之间的高速互连,为多GPU并行提供了强有力的支持。所以,我们将这三个任务分别部署到三个GPU上,采用NVLink进行数据传输,使得这三项任务可以并行流水化处理。这个对于CPU来说非常难以实现。

对于模型的训练过程,需要不断调整参数,训练不同的模型,然后再互相对比,挑选出最优的模型。在采用DGX-1之前,如果不用集群进行训练,单节点在一万个样本的数据集上训练一次模型需要4天的时间,但是采用DGX-1,训练时间可以大幅缩减到4个小时。这极大的提高了研发效率。不论是对于后续的科研还是产品的迭代,无疑提供了强大的计算能力的支撑,节省大量的实验时间,让我们有更多的精力放在算法的研究上面。

后续,我们将基于现有的系统,加入更多智能化分析技术,比如车辆检测,车辆分析检索,物体检索等等,以DGX-1为计算平台,构建高效的监控视频智能化分析平台。

影响

对基于深度学习的计算机视觉技术的研究,受益于DGX-1的计算能力,采用多GPU并行计算,对视频智能化分析技术,比如行人检测,行人分析与检索,车辆检测,车辆分析与检索等模型的训练与部署进行加速,为实时多路视频分析带来了更大可能。同时,结合实验室在视频编解码领域的优势,对于构建集拥有自主知识产权的AVS2视频编码传输与存储,及基于深度学习的智能分析于一体的智能监控平台,有重大的意义。

智能监控平台的出现,将对视频大数据的高效分析与挖掘,对智慧城市、平安城市的建设起到重大推动作。