052改进(改进YOLO系列 | CVPR2023最新Backbone | FasterNet 远超 ShuffleNet、MobileNet、MobileViT 等模型 | 包含 v5/v7 yaml 文件)
论文地址:https://export.arxiv.org/pdf/2303.03667v1.pdf
为了设计快速神经网络 ,许多工作都集中在减少浮点运算(FLOPs)的数量上 。然而 ,作者观察到FLOPs的这种减少不一定会带来延迟的类似程度的减少 。这主要源于每秒低浮点运算(FLOPS)效率低下 。并且 ,如此低的FLOPS主要是由于运算符的频繁内存访问 ,尤其是深度卷积 。因此 ,本文提出了一种新的partial convolution(PConv) ,通过同时减少冗余计算和内存访问可以更有效地提取空间特征 。基于PConv进一步提出FasterNet ,在广泛的设备上实现了比其他网络高得多的运行速度 ,而不影响各种视觉任务的准确性 。同时 ,实现了令人印象深刻的83.5%的TOP-1精度 ,与Swin-B不相上下 ,同时GPU上的推理吞吐量提高了49% ,CPU上的计算时间也节省了42% 。
简介
神经网络在图像分类 、检测和分割等各种计算机视觉任务中经历了快速发展 。尽管其令人印象深刻的性能为许多应用程序提供了动力,但一个巨大的趋势是追求具有低延迟和高吞吐量的快速神经网络 ,以获得良好的用户体验 、即时响应和安全原因等 。
如何快速?研究人员和从业者不需要更昂贵的计算设备 ,而是倾向于设计具有成本效益的快速神经网络,降低计算复杂度
创心域SEO版权声明:以上内容作者已申请原创保护,未经允许不得转载,侵权必究!授权事宜、对本内容有异议或投诉,敬请联系网站管理员,我们将尽快回复您,谢谢合作!