机器人小z

2016年7月2日

摘要：原题是写一个BP神经网络来拟合西瓜数据集，西瓜数据集我已经数值化了如下：而后调用pybrain的库建立具有50个单元的单隐层神经网络，如下下面分别是训练10000次和1000次的效果对比：可以看到10000次的训练误差明显要低的多，但是有可能有过拟合问题。参考文章：http://www.ze 阅读全文

posted @ 2016-07-02 01:04 机器人小z 阅读(1688) 评论(0) 推荐(0) 编辑

2016年6月28日

《机器学习》周志华习题答案3.6

摘要：原题：线性判别分析仅在线性可分数据上能获得理想结果，试设计一个改进方法，使其能够用于非线性可分数据。这里我采用二次判别分析来对原来的西瓜数据集进行分类，同样采用sklearn里的二次判别库。二次判别分析结果和线性判别分析结果分别如下：可以看到对于线性不可分数据，二次判别分析的效果非常好。阅读全文

posted @ 2016-06-28 18:05 机器人小z 阅读(1850) 评论(0) 推荐(0) 编辑

2016年6月27日

《机器学习》周志华习题答案3.5

摘要：编程实现判别分析，并给出西瓜数据集上的结果。数据集如下 Python代码实现方式如下：调用了sklearn中的线性判别分析模块。结果如下：其中红色的蓝色的分别是两种西瓜。小红色的点和小蓝色的点表示区分错误。中间的横线是分界线。阅读全文

posted @ 2016-06-27 23:42 机器人小z 阅读(2505) 评论(0) 推荐(0) 编辑

2016年6月25日

PCA和LDA降维的比较

摘要： PCA 主成分分析方法，LDA 线性判别分析方法，可以认为是有监督的数据降维。下面的代码分别实现了两种降维方式: 结果如下阅读全文

posted @ 2016-06-25 14:24 机器人小z 阅读(3713) 评论(0) 推荐(0) 编辑

Anaconda安装更新库

摘要：平台：win64+anaconda 1. 如何查看已安装的库打开 Anaconda Command Prompt ,在命令提示符窗口中输入以下命令：其中，pip list 只能查看库，而 conda list 则可以查看库以及库的版本 2. 如何安装或更新库以安装更新 scipy 为例阅读全文

posted @ 2016-06-25 11:50 机器人小z 阅读(17598) 评论(2) 推荐(3) 编辑

《机器学习》周志华习题答案3.3

摘要： 3.3 编程实现对率回归，并给出西瓜数据集3.0α上的结果。本题我就调用了sklearn的逻辑回归库来测试。结果如下：西瓜数据集如下：阅读全文

posted @ 2016-06-25 09:53 机器人小z 阅读(4395) 评论(3) 推荐(1) 编辑

2016年3月24日

windows7设置java的环境变量

摘要：首先，你应该已经安装了 java 的 JDK 了，笔者安装的是：jdk-7u7-windows-x64 接下来主要讲怎么配置 java 的环境变量，也是为了以后哪天自己忘记了做个备份 1、进入“计算机”的“属性”选项，选择“高级系统设置”，如下图所示： 2、点击“高级系统设置”后，会看到如下图所示的阅读全文

posted @ 2016-03-24 00:11 机器人小z 阅读(11724) 评论(0) 推荐(0) 编辑

2016年3月23日

Kemans算法及其Python 实现

摘要：优点：容易实现缺点：可能收敛到局部最小值，在大规模数据集上收敛较慢使用数据类型：数值型数据 k-means算法实际上就是通过计算不同样本间的距离来判断他们的相近关系的，相近的就会放到同一个类别中去。 1.首先我们需要选择一个k值，也就是我们希望把数据分成多少类，这里k值的选择对结果的影响很大，Ng的阅读全文

posted @ 2016-03-23 11:38 机器人小z 阅读(1582) 评论(0) 推荐(0) 编辑

DBscan算法及其Python实现

摘要： DBSCAN简介： 1.简介 DBSCAN 算法是一种基于密度的空间聚类算法。该算法利用基于密度的聚类的概念，即要求聚类空间中的一定区域内所包含对象(点或其它空间对象)的数目不小于某一给定阀值。DBSCAN 算法的显著优点是聚类速度快且能够有效处理噪声点和发现任意形状的空间聚类。但是由于它直接对整个阅读全文

posted @ 2016-03-23 10:59 机器人小z 阅读(15180) 评论(1) 推荐(0) 编辑

2016年3月6日

【转载】聚类算法小结

摘要：聚类算法总结：---------------------------------------------------------聚类算法的种类：基于划分聚类算法（partition clustering) k-means：是一种典型的划分聚类算法，它用一个聚类的中心来代表一个簇，即在迭代过程中选择阅读全文

posted @ 2016-03-06 23:04 机器人小z 阅读(478) 评论(0) 推荐(0) 编辑

公告