摘要:
原题是写一个BP神经网络来拟合西瓜数据集,西瓜数据集我已经数值化了如下: 而后调用pybrain的库建立具有50个单元的单隐层神经网络,如下 下面分别是训练10000次和1000次的效果对比: 可以看到10000次的训练误差明显要低的多,但是有可能有过拟合问题。 参考文章:http://www.ze 阅读全文
摘要:
原题:线性判别分析仅在线性可分数据上能获得理想结果,试设计一个改进方法,使其能够用于非线性可分数据。 这里我采用二次判别分析来对原来的西瓜数据集进行分类,同样采用sklearn里的二次判别库。 二次判别分析结果和线性判别分析结果分别如下: 可以看到对于线性不可分数据,二次判别分析的效果非常好。 阅读全文
摘要:
编程实现判别分析,并给出西瓜数据集上的结果。 数据集如下 Python代码实现方式如下:调用了sklearn中的线性判别分析模块。 结果如下: 其中红色的蓝色的分别是两种西瓜。小红色的点和小蓝色的点表示区分错误。中间的横线是分界线。 阅读全文
摘要:
PCA 主成分分析方法,LDA 线性判别分析方法,可以认为是有监督的数据降维。下面的代码分别实现了两种降维方式: 结果如下 阅读全文
摘要:
平台:win64+anaconda 1. 如何查看已安装的库 打开 Anaconda Command Prompt ,在命令提示符窗口中输入以下命令: 其中,pip list 只能查看库,而 conda list 则可以查看库以及库的版本 2. 如何安装或更新库 以安装 更新 scipy 为例 阅读全文
摘要:
3.3 编程实现对率回归,并给出西瓜数据集3.0α上的结果。 本题我就调用了sklearn的逻辑回归库来测试。 结果如下: 西瓜数据集如下: 阅读全文
摘要:
首先,你应该已经安装了 java 的 JDK 了,笔者安装的是:jdk-7u7-windows-x64 接下来主要讲怎么配置 java 的环境变量,也是为了以后哪天自己忘记了做个备份 1、进入“计算机”的“属性”选项,选择“高级系统设置”,如下图所示: 2、点击“高级系统设置”后,会看到如下图所示的 阅读全文
摘要:
优点:容易实现缺点:可能收敛到局部最小值,在大规模数据集上收敛较慢使用数据类型:数值型数据 k-means算法实际上就是通过计算不同样本间的距离来判断他们的相近关系的,相近的就会放到同一个类别中去。 1.首先我们需要选择一个k值,也就是我们希望把数据分成多少类,这里k值的选择对结果的影响很大,Ng的 阅读全文
摘要:
DBSCAN简介: 1.简介 DBSCAN 算法是一种基于密度的空间聚类算法。该算法利用基于密度的聚类的概念,即要求聚类空间中的一定区域内所包含对象(点或其它空间对象)的数目不小于某一给定阀值。DBSCAN 算法的显著优点是聚类速度快且能够有效处理噪声点和发现任意形状的空间聚类。但是由于它直接对整个 阅读全文
摘要:
聚类算法总结:---------------------------------------------------------聚类算法的种类:基于划分聚类算法(partition clustering) k-means: 是一种典型的划分聚类算法,它用一个聚类的中心来代表一个簇,即在迭代过程中选择 阅读全文