Deep Learning for Computer Vision with Python 第1章:整个内容简介
0、以作者的书籍开篇之语开始:
“The secret of getting ahead is to get started.” – Mark Twain
本书指导深度学习应用到实践、真实的计算机视觉问题中,利用python语言和keras+mxnet库。
1、全书分为三卷:
第一卷:Starter Bundle:
对于首次接触将深度学习应用到图像识别理论的人来是是至关重要的。
在这里将学习到:
(1)机器学习
(2)深度学习
(3)CNN网络
(4)怎样从自定义的数据集开始项目工作。
第二卷:Practitioner Bundle
这一卷在第一卷基础上,对于更进一步学习深度学习、理解高级技术、并且发现最佳的实践和经验规则的人来说,是非常适合的。
第三卷:ImageNet Bundle
这一卷是用于计算机视觉的完整深度学习经验。在这一卷中,我演示了如何在海量图像集数据集上训练大型神经网络以及解决现实世界的案例研究,包括年龄+性别预测、汽车制造+模型识别、面部表情识别、等等。
2、python、Keras、mxnet介绍
书中所有示例都用python语言。
主要的深度学习库使用Keras。Keras是一种深度学习库,而TensorFlow和theano作为计算引擎来使用,物尽其用,各司其职。
第二种深度学习库使用mxnet,仅在ImageNet Bundle卷中使用。
最后,我们将使用较少的计算机视觉、图像处理和机器学习库,如opencv、scikit-image、scikit-learn等等。
3、开发自己的深度学习工具集
学习本书的一大动力是,利用现有的深度学习库,开发一套自己的基于python的工具集,能够让我们训练自己的深度学习网络。
在学习完该书之后,我们的工具集将具备的功能:
(1)从磁盘加载数据集、存储到内存中、或者将它们写入优化的数据库格式中。
(2)预处理图像,使它能够适合于CNN的训练。
(3)创建一个蓝图类,使它能够应用于我们自定义的CNNs的应用。
(4)手动实现流行的CNN架构,如AlexNet、VGGNet、GoogLeNet、ResNet和SqueezeNet(且从零开始训练它们)。
(5)更多,可见该书内容。
4、总结:
我们生活在机器学习、神经网络和深度学习的历史时刻。
不要错过历史上的这一时刻——你不仅应该成为深度学习的一部分,而且那些过早投资的人肯定会从他们所投入的时间、资源和创造力中获得巨大的回报。
下面尽情享受这本书吧。
5、附加说明:
除了书籍之外的资源以及运行环境配置,见http://pyimg.co/fnkxk
这几卷文章更新:如若需要更新,进入网站http://www.pyimagesearch.com/contact/