第一次作业

对人工智能技术的认识

当前课程过半,大家对机器学习、模式识别等人工智能领域有了一定的认识,现布置一篇博客作业:

  • 检索一些文献或者网页资讯,记录机器学习等人工智能领域的前沿技术介绍、展望、应用,了解我们国家的先进或不足,存在的卡脖子技术等(选取一种技术方向即可)
    平时有关注机器之心公众号,对行业的现状略有了解
    先进:
  • 人脸识别,应用在各行各业,比如安防监控、金融领域。因为政策的支持,我国人脸识别行业蓬勃发展。我有所了解的是face++,在国产安卓机中普遍使用的解决方案,仅依靠摄像头,解锁速度快错误率低,体验很好。相比其他厂商的方案,在周围黑暗噪点多的环境下表现优异。同时旷视也为支付宝提供线下人脸支付机器、线上刷脸。同时face++现已成长为世界最大的人脸识别技术平台。
  • 旷视的MegEngine框架,在旷视内部一直使用的框架,国产深度学习框架中优秀代表,基于c++开发,从对比数据来看训练速度优于Pytorch和TF,同时具备一些Pytorch和TF不具备的特性。

不足:

  • 最不足的我认为是硬件。现在主流的框架依赖的硬件CUDA一家独大,国内阿里、依图也在开发硬件,但都是ASIC,自家用。距离建立起生态还有很长的路要走。

补充:

最近一周,YOLO V4热度较高,尝试去了解了下YOLO V4 :

在相关论文中,研究者对比了 YOLOv4 和当前最优目标检测器,发现 YOLOv4 在取得与 EfficientDet 同等性能的情况下,速度是 EfficientDet 的二倍。此外,与 YOLOv3 相比,新版本的 AP 和 FPS 分别提高了 10% 和 12%。

许多特征可以提高 CNN 的准确率,然而真正实行起来,还需要在大型数据集上对这些特征组合进行实际测试,并且对测试结果进行理论验证。某些特征仅在某些模型上运行,并且仅限于特定的问题,或是只能在小型数据集上运行;而另外有些特征(如批归一化和残差连接)则适用于大多数模型、任务和数据集。
YOLOv4 使用了以下特征组合,实现了新的 SOTA 结果:

  • 加权残差连接(WRC)
  • Cross-Stage-Partial-connection,CSP
  • Cross mini-Batch Normalization,CmBN
  • 自对抗训练(Self-adversarial-training,SAT)
  • Mish 激活(Mish-activation)
  • Mosaic 数据增强
  • DropBlock 正则化
  • CIoU 损失

据介绍,YOLOv4 在 MS COCO 数据集上获得了 43.5% 的 AP 值 (65.7% AP50),在 Tesla V100 上实现了 ∼65 FPS 的实时速度。
YOLO v4 与其他 SOTA 目标检测器的对比结果如下图所示。从图上可以看出,YOLOv4 位于帕累托最优曲线上,并在速度和准确性上都优于最快和最精准的检测器。

Alexey Bochkovskiy实在太牛了...

posted @ 2020-05-05 21:22  fzu_Y  阅读(224)  评论(0编辑  收藏  举报