摘要: 特征选择常用算法综述 特征选择的一般过程: 1.生成子集:搜索特征子集,为评价函数提供特征子集 2.评价函数:评价特征子集的好坏 3.停止准则:与评价函数相关,一般是阈值,评价函数达到一定标准后就可停止搜索 4.验证过程:在验证数据集上验证选出来的特征子集的有效性 1.生成子集 搜索算法有 完全搜索 阅读全文
posted @ 2017-03-09 15:10 崔小宁的数据之旅 阅读(853) 评论(0) 推荐(0) 编辑
摘要: argument of the maximum/minimum arg max f(x): 当f(x)取最大值时,x的取值 arg min f(x):当f(x)取最小值时,x的取值 表示使目标函数取最小值时的变量值From Wikipedia In mathematics, arg max (or  阅读全文
posted @ 2017-03-08 17:19 崔小宁的数据之旅 阅读(736) 评论(0) 推荐(0) 编辑
摘要: 贝叶斯法则 贝叶斯法则又被称为贝叶斯定理、贝叶斯规则,是指概率统计中的应用所观察到的现象对有关概率分布的主观判断(即先验概率)进行修正的标准方法。当分析样本大到接近总体数时,样本中事件发生的概率将接近于总体中事件发生的概率。 贝叶斯统计中的两个基本概念是先验分布和后验分布: 1、先验分布。总体分布参 阅读全文
posted @ 2017-03-08 17:13 崔小宁的数据之旅 阅读(276) 评论(0) 推荐(0) 编辑
摘要: 判别分析又称“分辨法”,是在分类确定的条件下,根据某一研究对象的各种特征值判别其类型归属问题的一种多变量统计分析方法。其基本原理是按照一定的判别准则,建立一个或多个判别函数,用研究对象的大量资料确定判别函数中的待定系数,并计算判别指标。据此即可确定某一样本属于何类。当得到一个新的样品数据,要确定该样 阅读全文
posted @ 2017-03-08 09:52 崔小宁的数据之旅 阅读(1263) 评论(0) 推荐(0) 编辑
摘要: 今天下午码了一下午代码,初学Python,希望通过自己敲代码能够学的更快,事实证明,自己敲代码的确是值得的,编译的时候出现很多错误,有漏掉字母,逗号句号混乱等等低级错误,通过软件给的提示,慢慢找,也解决了,这个是一个游戏的代码,大家可以稍微感受下,下面来几张图: 上面是部分代码,下面看下运行后的图: 阅读全文
posted @ 2016-12-27 21:18 崔小宁的数据之旅 阅读(452) 评论(0) 推荐(0) 编辑
摘要: 最近在学习父与子的编程之旅,书上有一个关于猜数的游戏代码,自己敲了以后老是不对,仔细检查后发现是对齐问题。 废话不说了,直接上图: 上面是正确的,下面这个是有问题的,大家可以看下Python代码如果没对齐产生的问题: 这个错误是误以为下面的if和else属于上面的while块,这个和C,C++不一样 阅读全文
posted @ 2016-12-26 21:19 崔小宁的数据之旅 阅读(4724) 评论(0) 推荐(0) 编辑
摘要: 运行下面两句后,显示错误 import easygui easygui.msgbox("Hello There!") 错误: Traceback (most recent call last): File "<stdin>", line 1, in <module> AttributeError: 阅读全文
posted @ 2016-12-25 20:54 崔小宁的数据之旅 阅读(6461) 评论(0) 推荐(0) 编辑