随笔分类 -  AI 机器学习

摘要:引言 将一枚硬币随机投掷N次,其中正面朝上的次数为yN次,请估计硬币在一次随机投掷中,正面向上的概率r为多少 频率学派:概率就是频率的极限,因此r的估计值就是yNN 贝叶斯学派:根据r的先验分布、似然函数和观测值,再利用贝叶斯公式,就可以得到r的后验 阅读全文
posted @ 2022-05-07 17:13 Bill_H 阅读(540) 评论(0) 推荐(0) 编辑
摘要:该项目主要包含以下四个步骤步骤 1.数据理解 2.数据预处理 3.数据建模 数据集可以在kaggle网站下载,也可以到博主的网盘下载 背景介绍 根据titanic乘客的信息预测其是否能存活 titanic数据集的样本共有11个特征,分别为 PassengerId:乘客的编号Pclass:船舱的等级N 阅读全文
posted @ 2020-07-18 16:07 Bill_H 阅读(427) 评论(0) 推荐(0) 编辑
摘要:特征选择 特征选择的原因:在数据集的多个特征中,可能存在一些特征属于冗余(意义重复的特征)或噪声(与标签无关的特征) 阅读全文
posted @ 2020-07-13 21:41 Bill_H 阅读(116) 评论(0) 推荐(0) 编辑
摘要:交叉验证:为了得到较为可靠的测试结果,测试集的样本数量不能太少,但在总体样本数量较少的情况下,如果拿出足够数量的样本组成测试集,则训练集样本会不足,此时可以使用交叉验证的方法(轮流取不同的样本做测试集),就不必担心测试集样本太少,极端情况下可取测试集样本数量为一,称为留一法。使用交叉验证可以在总样本 阅读全文
posted @ 2020-07-10 10:02 Bill_H 阅读(146) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示