摘要:
一个比较大的项目总是会涉及到很多的参数,最好的方法就是在一个地方统一管理这些参数。最近看了不少的python项目,总结了两种很有意思的配置管理方法。 第一种 基于easydict实现的配置管理 首先需要安装numpy、easydict以及yaml: 就可以了。 然后定义配置类 : 使用的时候很简单, 阅读全文
摘要:
OCR的全称是Optical Character Recoginition,光学字符识别技术。目前应用于各个领域方向,甚至这些应用就在我们的身边,比如身份证的识别、交通路牌的识别、车牌的自动识别等等。本篇就先讲一下基于开源软件和大厂服务的文字识别效果,后续会陆续讲解一下机器学习和深度学习实现的方案和 阅读全文
摘要:
本章讲述了SVM,相比于《统计学习方法》,从逻辑回归的角度更容易理解了。 更多内容参考 "机器学习&深度学习" 从逻辑回归来看,看损失值与Z的值的关系: 代入原来的是指,可以化简公式: 总结来说:如果y=1,我们希望z的值大于等于1,如果y=0,我们希望z的值小于 1,这样损失函数的值都会为0. 线 阅读全文
摘要:
本章讲了梯度下降的几种方式:batch梯度下降、mini batch梯度下降、随机梯度下降。也讲解了如何利用mapreduce或者多cpu的思想加速模型的训练。 更多内容参考 "机器学习&深度学习" 有的时候数据量会影响算法的结果,如果样本数据量很大,使用梯度下降优化参数时,一次调整参数需要计算全量 阅读全文
摘要:
之前一直在CPU上跑深度学习,由于做的是NLP方向所以也能勉强忍受。最近在做图像的时候,实在是扛不住了...还好领导们的支持买个虚拟机先体验下。由于刚买的机器,环境都得自己摸索,瞎搞过很多次,也走过很多弯路,所以我就记录下从裸机安装深度学习环境的正确过程。(全程root用户哦!) 裸机简介 服务器是 阅读全文
摘要:
本章讲述了推荐系统相关的知识,比如基于内容的推荐算法、基于协同过滤的推荐算法以及实践中遇到的问题。 更多内容参考 "机器学习&深度学习" 推荐系统是机器学习在工业界应用最广泛的方向,很多电子商务类、咨询类的平台都在做个性化推荐的工作,通过机器学习的算法让自己的平台个性定制,千人千面。 比如我们拥有这 阅读全文
摘要:
本篇介绍了异常点检测相关的知识 更多内容参考 "机器学习&深度学习" 我感觉这篇整理的很好很用心,可以详细参考: https://blog.csdn.net/Snail_Moved_Slowly/article/details/78826088 什么是异常点检测?比如针对飞机的引擎做测试,x1代表温 阅读全文
摘要:
本章重点讲述了降维方法以及其中最主要的PCA主成分分析的原理、使用 更多内容参考 "机器学习&深度学习" 降维的作用:数据压缩与可视化 降维的第一个作用就是进行数据的压缩,解决磁盘和计算的问题。比如把二维数据降维到一维: 或者数据从三维降维到2维。 降维的另一个作用就是进行可视化,比如我们的数据有很 阅读全文
摘要:
本章讲述的是一个复杂的机器学习系统,通过它可以看到机器学习的系统是如何组装起来的;另外也说明了一个复杂的流水线系统如何定位瓶颈与分配资源。 更多内容参考 "机器学习&深度学习" OCR的问题就是根据图片识别图片中的文字: 这种OCR识别的问题可以理解成三个步骤: 1. 文本检测 2. 字符切分 3. 阅读全文
摘要:
本章讲述的是第一个无监督的机器学习算法,在无监督的算法中,样本数据只有特征向量,并没有标注的y值。比如聚类算法,它可以用在市场分类、社交网络分析、天体数据分析等等。 更多内容参考 "机器学习&深度学习" 在做聚类时,最简单的算法就是k means,一般的流程是: 1. 首先随机选择k个聚类中心点 2 阅读全文