优选文档综述:深度神经网络模型压缩和加速方法一、研究背景在神经网络方面,早在上个世纪末,YannLeCun等人已经使用神经网络成功识别了邮件上的手写
至于深度学习的概念是由GeoffreyHinton等人第—次提出,而在2022年,Krizhevsky等人采纳深度学习算法,以超过第二名以传统人工设计特征方法X率10%的庞大领先取得了ImageNet图像分类比赛冠军
此后的计算机视觉比赛已经被各种深度学习模型所承包
这些模型依赖于具有数百甚至数十亿参数的深度网络,传统CPU对如此庞大的网络一筹莫展,只有具有高计算能力的GPU才能让网络得以相对快速训练
如上文中比赛用模型使用了1个包含5个卷积层和3个完全连接层的6000万参数的网络
通常情况下,即使使用当时性能X的GPUNVIDIAK40来训练整个模型仍需要花费两到三天时间
对于使用全连接的大规模网络,其参数规模甚至可以到达数十亿量级
当然,为了解决全连接层参数规模的问题,人们转而考虑增加卷积层,使全连接参数降低
随之带来的负面影响便是大大增长了计算时间与能耗
对于具有更多层和节点的更大的神经网络,减少其存储和计算本钱变得至关重要,特别是对于一些实时应用,如在线学习、增量学习以及自动驾驶
在深度学习的另一端,即更贴近人们生活的移动端,如何让深度模型在移动设备上运行,也是模型压缩加速的一大重要目标
Krizhevsky在2022年的文章中,提出了两点观察结论:卷积层占据了大约90-95%的计算时间和参数规模,有较大的值;全连接层占据了大约5-10%的计算时间,95%的参数规模,并且值较小
这为后来的研究深度模型
优选文档的压缩与加速提供了统计依据
一个典型的例子是具有50个卷积层的ResNet-50需要超过95MB的存储器以及38亿次浮点运算
在丢弃了一些冗余的权重后,网络仍照常工作,但节约了超过75%的参数和50%的计算时间