摘要:
以前买英语书,最喜欢的就是《xx英语高频词汇手册》之类,仿佛只需要背过这些词,考试就没问题了。 基于相同的理念,我也写一个机器学习领域的"高频功能手册"吧。 作为一枚机器学习的新手,我在这两年中看了不少的书籍,有的侧重原理和理论,有的侧重工具和实现。 先列出一份书单,虽说不上什么权威推荐,但我觉得适 阅读全文
摘要:
前言:机器学习所使用的数据大多具有很多的特征,想要直观的对数据的分布和特征之间的关系进行观测,需要将数据的主要特征提取出来,降低到三维及三维以下的空间来展示。 PCA(主成分分析)是常用的用于降维的方法,本文通过PCA对数据进行降维,再对降维后的数据用K-means算法聚类,以达到在低维空间可直观观 阅读全文
摘要:
前言:聚类是非监督学习的主要任务之一,根据原理可分为:基于质心、基于密度、基于连通性、基于概率以及基于神经网络等多种类型。 本文汇总了常用聚类算法及其评价指标,方便快速查询使用。(本文使用波士顿房价数据集,可用于回归) 以下为试验结果: 阅读全文