摘要: 北京理工大学在线课程: http://www.icourse163.org/course/BIT 1001872001 机器学习分类 监督学习 无监督学习 半监督学习 强化学习 深度学习 Scikit learn算法分类 sklearn自带的标准数据集 sklearn的六大任务:分类、回归、聚类、降 阅读全文
posted @ 2020-02-27 16:41 自由民 阅读(358) 评论(0) 推荐(0) 编辑
摘要: 之前一段时间学习了线性回归,逻辑回归,支持向量机和朴素贝叶斯几个机器学习的算法,并用kaggle的泰坦尼克号问题做了实操。 我很早就想学习机器学习了,因为是非专业人士,一直畏难没有开始学习。拜疫情“所赐”,终于开始动手了。几个算法学下来,感觉并没有我想象那么难,当然那些数学推导我很多都没有看懂,但关 阅读全文
posted @ 2020-02-26 18:05 自由民 阅读(542) 评论(0) 推荐(0) 编辑
摘要: 参考: https://blog.csdn.net/qian99/article/details/77916806 数据载入和清洗跟前面文章一样的。 进行朴素贝叶斯模型建模 模型评分: 0.7755331088664422 提交一下看看。 结果还不如之前的逻辑回归,支持向量机呢!尝试再改进一下看看, 阅读全文
posted @ 2020-02-26 11:59 自由民 阅读(619) 评论(0) 推荐(0) 编辑
摘要: 随机试验:可重复性,可观察性,不确定性。 条件概率 P(B|A) = P(AB)/P(A),为事件A发生的条件下事件B的发生概率。 概率乘法公式: P(AB) = P(B|A)P(A) = P(A|B)P(B) 事件独立:两事件的发生没有影响。P(B|A) = P(B)。 P(AB) = P(B|A 阅读全文
posted @ 2020-02-26 09:37 自由民 阅读(833) 评论(0) 推荐(0) 编辑
摘要: 用刚学的支持向量机来解决一下泰坦尼克号问题。 数据的载入,清洗完全跟之前的一样,直接复制粘贴。从建模开始。 代码 建模,使用SVM模型 划分训练集和测试集 结果 建模的结果 训练集: 0.9569288389513109 测试集: 0.6190476190476191 在测试集上效果不好啊。换个核函 阅读全文
posted @ 2020-02-25 12:03 自由民 阅读(711) 评论(0) 推荐(0) 编辑
摘要: 因为新冠肺炎疫情,诊所还没复工。这是在家用手机敲的,代码显示有问题。等复工以后在电脑上改,各位先凑和看吧。 支持向量机(Support Vector Machine, SVM)是一种基于统计学习的模式识别的分类方法,主要用于模式识别。所谓支持向量指的是在分割区域边缘的训练样本点,机是指算法。就是要找 阅读全文
posted @ 2020-02-24 19:24 自由民 阅读(693) 评论(0) 推荐(0) 编辑
摘要: 阿里云的课程有逻辑回归的内容的,学一下。 原理 分类变量:又称定性变量或离散变量,观察个体只能属于互不相容的类别中的一组。一般用非数字表达。与之相对的是定量变量或连续变量,变量具有数值特征。 常见的有有序变量(年龄等级,收入等级等),名义变量(性别,天气,职业等)。 自变量包含分类变量:名义变量通常 阅读全文
posted @ 2020-02-23 22:47 自由民 阅读(1122) 评论(0) 推荐(0) 编辑
摘要: 这次尝试用逻辑回归来解决泰坦尼克号的问题。本文参考了https://zhuanlan.zhihu.com/p/28408516 和 https://www.cnblogs.com/BYRans/p/4713624.html 逻辑回归(Logistic Regression)是一种用于解决二分类(0 阅读全文
posted @ 2020-02-22 17:15 自由民 阅读(458) 评论(0) 推荐(0) 编辑
摘要: 用kaggle上的泰坦尼克的数据来实操。 https://www.kaggle.com/c/titanic/overview 在主页上下载了数据。 任务:使用泰坦尼克号乘客数据建立机器学习模型,来预测乘客在海难中是否生存。 在实际海难中,2224位乘客中有1502位遇难了。似乎有的乘客比其它乘客更有 阅读全文
posted @ 2020-02-21 19:23 自由民 阅读(1032) 评论(0) 推荐(0) 编辑
摘要: 如果模型包含了所有影响因素,称为全模型。如果只包含部分影响因素,称为选模型。 影响:①未选入的参数不全为0时,选模型的回归参数为有偏估计。②选模型的预测结果是有偏预测。③选模型的参数估计有较小的方差。④选模型的预测残差有较小的方差。⑤选模型预测的均方误差比全模型小。 自变量选择的准则: ①残差平方和 阅读全文
posted @ 2020-02-17 19:30 自由民 阅读(1014) 评论(0) 推荐(0) 编辑