04 2019 档案
摘要:利用logistic回归进行分类的主要思想:根据现有数据对分类边界建立回归公式,并以此进行分类。 logistic优缺点: 优点:计算代价不高,易于理解和实现。缺点:容易欠拟合,分类精度可能不高。 .适用数据类型:数值型和标称型数据。 sigmoid函数: 梯度上升法: 梯度: 该公式将一直被迭代执
阅读全文
摘要:首先了解一下三个比较重要的公式: 条件概率公式:P(A|B)=P(AB)/P(B) 全概率公式: 贝叶斯:P(B|A) = P(A|B)P(B)/P(A) 优 点 :在数据较少的情况下仍然有效,可以处理多类别问题。缺 点 :对于输入数据的准备方式较为敏感。适用数据类型:标称型数据。 朴素贝叶斯中朴素
阅读全文
摘要:决策树优特点:优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据。缺点:可能会产生过度匹配问题。适用数据类型:数值型和标称型 使用ID3算法划分数据集并构建决策树: 利用matplotlib注解绘制树形图: 数据集下载以及完整jupyter notebook 代码下
阅读全文
摘要:KNN也称K-近邻算法,简单来说,KNN采用测量不同特征值之间的距离的方法进行分类。 优点:精度高,对异常值不敏感,无数据输入假定。 确定:时间复杂度、空间复杂度较高 适用数据范围:数值型和标称型 工作原理简介:存在一个样本数据集合,并且每个样本数据集中都存在标签。输入没有标签的数据集之后,将新数据
阅读全文
摘要:队名:西北小靓仔 初赛成绩:西北21名 复赛成绩:西北24名 决赛无缘参加。。。 代码GitHub:https://github.com/qwqwqw110/2019CodeCraft 赛后总结:https://www.cnblogs.com/qiang-wei/p/10705479.html 求轻
阅读全文
摘要:先报一下最终成绩吧: 初赛西北赛区21名。 复赛西北赛区24名。 决赛与我无缘。 代码GitHub:https://github.com/qwqwqw110/2019CodeCraft 思路分析:https://www.cnblogs.com/qiang-wei/p/10705503.html 以下
阅读全文