摘要: 利用Logistic回归进行分类的主要思想是:根据现有数据对分类边界线建立回归公式,以此进行分类。训练分类器时的做法就是寻找最佳拟合参数,使用的是最优化算法。Logistic回归的一般过程收集数据:采用任意方法收集数据。准备数据:由于需要进行距离计算,因此要求数据类型为数值型。另外,结构化数据格式则最佳。分析数据:采用任意方法对数据进行分析。训练算法:大部分时间将用于训练,训练的目的是为了找到最佳... 阅读全文
posted @ 2016-05-09 10:42 woaielf 阅读(263) 评论(0) 推荐(0) 编辑
摘要: 优点:精度高、对异常值不敏感、无数据输入假定。缺点:计算复杂度高、空间复杂度高。 适用数据范围:数值型和标称型。k近邻算法的一般流程收集数据:可以使用任何方法。准备数据:距离计算所需要的数值,最好是结构化的数据格式。分析数据:可以使用任何方法。训练算法:此步骤不适用于k近邻算法。测试算法:计算错误率。使用算法:首先需要输入样本数据和结构化的输出结果,然后运行k近邻算法判定输入数据分别属于哪个分类,... 阅读全文
posted @ 2016-04-28 20:37 woaielf 阅读(383) 评论(0) 推荐(0) 编辑
摘要: 优点:在数据较少的情况下仍然有效,可以处理多类别问题。 缺点:对于输入数据的准备方式较为敏感。 适用数据类型:标称型数据。 条件概率:p(x,y|c₁) 需要先验知识和逻辑推理 频数概率:从数据本身获得结论,并不考虑逻辑推理及先验知识 贝叶斯决策理论的核心思想,即选择具有最高概率的决策。 朴素贝叶斯 阅读全文
posted @ 2016-04-28 10:42 woaielf 阅读(380) 评论(0) 推荐(0) 编辑